主頁 > 知識(shí)庫 > GO語言利用K近鄰算法實(shí)現(xiàn)小說鑒黃

GO語言利用K近鄰算法實(shí)現(xiàn)小說鑒黃

熱門標(biāo)簽:浙江人工智能外呼管理系統(tǒng) 電銷機(jī)器人可以補(bǔ)救房產(chǎn)中介嗎 百度地圖標(biāo)注搜索關(guān)鍵詞 ?兓? 電梯外呼訪客系統(tǒng) 谷歌便利店地圖標(biāo)注 成都呼叫中心外呼系統(tǒng)平臺(tái) 騰訊外呼系統(tǒng)價(jià)格 最短的地圖標(biāo)注

Usuage:
  go run kNN.go --file="data.txt"

關(guān)鍵是向量點(diǎn)的選擇和閾值的判定
樣本數(shù)據(jù)來自國(guó)家新聞出版總署發(fā)布通知公布的《40部淫穢色情網(wǎng)絡(luò)小說名單》

package main
 
import (
  "bufio"
  "flag"
  "fmt"
  "io"
  "log"
  "math"
  "os"
  "path"
  "path/filepath"
)
 
var debug bool = false
var data_dir string = "./moyan"    //文件存放目錄
var limen float64 = 0.1159203888322267 //閾值
 
const (
  MIN_HANZI rune = 0x3400
  MAX_HANZI rune = 0x9fbb
)
 
var labels []rune = []rune{
  0x817f, 0x80f8, 0x4e73, 0x81c0,
  0x5c41, 0x80a1, 0x88f8, 0x6deb,
}
 
func errHandle(err error) {
  if err != nil {
    log.Fatal(err)
  }
}
 
func load(name string) (m map[rune]int, err error) {
  f, err := os.Open(name)
  if err != nil {
    return nil, err
  }
  defer f.Close()
  buf := bufio.NewReader(f)
  m = make(map[rune]int)
  var r rune
  for {
    r, _, err = buf.ReadRune()
    if err != nil {
      if err == io.EOF {
        break
      }
      return nil, err
    }
    if r >= MIN_HANZI  r = MAX_HANZI {
      m[r] += 1
    }
  }
  return m, nil
}
func classify(m map[rune]int) (idv []float64, dis float64) {
  len_m := len(m)
  for i, v := range labels {
    if debug {
      fmt.Println(i, m[v], string(v), float64(m[v])/float64(len_m))
    }
    idv = append(idv, float64(m[v])/float64(len_m))
  }
  for _, v := range idv {
    dis += math.Pow(v, 2)
  }
  dis = math.Sqrt(dis)
  return
}
func check(fp string, dis float64) {
  switch {
  case dis >= limen:
    fmt.Println(fp, dis, "涉黃")
  case dis == 1.0:
    fmt.Println(fp, dis, "你在作弊嗎")
  case dis == 0:
    fmt.Println(fp, dis, "檢查一下文件字符編碼是不是utf8格式吧")
  default:
    fmt.Println(fp, dis, "正常")
  }
}
 
func walkFunc(fp string, info os.FileInfo, err error) error {
  if path.Ext(fp) == ".txt" {
    m, err := load(fp)
    errHandle(err)
    _, dis := classify(m)
    check(fp, dis)
  }
  return err
}
 
var file string
 
func init() {
  _, err := os.Stat(data_dir)
  if err != nil {
    err = os.Mkdir(data_dir, os.ModePerm)
    errHandle(err)
  }
  flag.StringVar(file, "file", "", "file read in,if you don't give the file read in,"+
    "it will create a data dictionary,just pust your files in it")
}
 
func main() {
  flag.Parse()
  if file == "" {
    filepath.Walk(data_dir, walkFunc)
    return
  }
  m, err := load(file)
  errHandle(err)
  _, dis := classify(m)
  check(file, dis)
 
}

以上所述就是本文的全部?jī)?nèi)容了,希望大家能夠喜歡。

您可能感興趣的文章:
  • Golang排列組合算法問題之全排列實(shí)現(xiàn)方法
  • Golang算法問題之整數(shù)拆分實(shí)現(xiàn)方法分析
  • Golang算法問題之?dāng)?shù)組按指定規(guī)則排序的方法分析
  • Golang算法之田忌賽馬問題實(shí)現(xiàn)方法分析
  • Golang最大遞減數(shù)算法問題分析
  • Golang正整數(shù)指定規(guī)則排序算法問題分析
  • Go語言實(shí)現(xiàn)的樹形結(jié)構(gòu)數(shù)據(jù)比較算法實(shí)例
  • Go語言算法之尋找數(shù)組第二大元素的方法
  • go語言睡眠排序算法實(shí)例分析
  • golang實(shí)現(xiàn)分頁算法實(shí)例代碼

標(biāo)簽:眉山 邢臺(tái) 紹興 上海 宜昌 雅安 七臺(tái)河 盤錦

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《GO語言利用K近鄰算法實(shí)現(xiàn)小說鑒黃》,本文關(guān)鍵詞  語言,利用,近鄰,算法,實(shí)現(xiàn),;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《GO語言利用K近鄰算法實(shí)現(xiàn)小說鑒黃》相關(guān)的同類信息!
  • 本頁收集關(guān)于GO語言利用K近鄰算法實(shí)現(xiàn)小說鑒黃的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章