精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

詳解知乎反作弊垃圾文本識別的深度學習實踐

原創
人工智能 深度學習
截止今年 8 月,知乎注冊用戶量已突破 2 億。對于垃圾信息的治理,我們面臨著更大的挑戰和考驗。過去我們通過不斷升級「悟空」的策略引擎,通過在行為、環境、資源、文本等多維度組合應用,已經取得了非常不錯的效果。近期我們嘗試引入深度學習識別垃圾文本,「悟空」對 Spam 的治理能力又邁上了一個新的臺階。

背景

截止今年 8 月,知乎注冊用戶量已突破 2 億。對于垃圾信息的治理,我們面臨著更大的挑戰和考驗。過去我們通過不斷升級「悟空」的策略引擎,通過在行為、環境、資源、文本等多維度組合應用,已經取得了非常不錯的效果。近期我們嘗試引入深度學習識別垃圾文本,「悟空」對 Spam 的治理能力又邁上了一個新的臺階。

問題分析

我們對當前站內垃圾文本進行了梳理,發現目前主要包括四種形式:

  • 導流內容:這類內容大概能占到社區中垃圾文本的 70%-80%,比較典型的包括培訓機構,美容,保險,代購相關的。導流內容會涉及到 QQ,手機號,微信,URL甚至座機,在一些特殊時間節點還會出現各類的專項垃圾文本,比如說世界杯,雙十一,雙十二,都是黑產大賺一筆的好時機。
  • 品牌內容:這類內容會具有比較典型的 SEO 特色,一般內容中不會有明顯的導流標識,作弊形式以一問一答的方式出現,比如提問什么牌子怎么樣?哪里的培訓學校怎么樣?然后在對應的回答里面進行推薦。
  • 詐騙內容:這類內容一般以冒充名人,機構的方式出現,比如單車退款類,在內容中提供虛假的客服電話進行詐騙。
  • 騷擾內容:比如一些誘導類,調查類的批量內容,非常嚴重影響知友體驗。

知乎反作弊垃圾文本識別的深度學習實踐

這些垃圾文本的核心獲益點一方面是面向站內的傳播,另一方面,面向搜索引擎,達到 SEO 的目的。

算法介紹

從算法角度可以把這個問題看做一個文本分類問題,把站內的內容分為垃圾文本和正常文本兩個類別。常用文本分類算法有很多,我們不打算詳細介紹每一個分類算法,只是分享我們在處理實際問題中遇到的一些問題和權衡。

我們遇到的第一個問題是使用CNN 還是 RNN。一般來說,CNN 是分層架構,RNN 是連續結構。CNN 適合由一些關鍵詞來決定的任務;RNN適合順序建模任務 ,例如語言建模任務,要求在了解上下文的基礎上靈活建模。這一結論非常明顯,但是目前的 NLP 文獻中并沒有支持性的文章。

另外一般來說,CNN 訓練速度和預測速度都快于RNN。考慮到上述站內垃圾文本的主要形式,導流和品牌內容中都會出現關鍵詞,同時對于垃圾文本檢測的速度要求比較高,我們最終使用 CNN。一個典型的 CNN 文本分類模型如下圖所示。

知乎反作弊垃圾文本識別的深度學習實踐

接下來,我們遇到的一個問題是,使用字還是詞語作為輸入。詞語具有比字更高的抽象等級,更豐富的含義。但是導流內容中的 QQ、手機號、微信、URL、座機等,通常不會出現在已有詞庫中,品牌詞也具有類似的特點,一般是未登錄詞。而且,導流內容通常會出現變體詞,使用詞語作為輸入,不能很好地捕捉類似特征。所以,我們最終使用的是字作為輸入。

在決定使用字作為輸入之后,需要考慮使用在知乎站內語料上預訓練的字向量初始化模型的Embedding層,還是直接在分類模型中隨機生成初始字向量。這里考慮的是垃圾文本的數據分布和知乎站內文本的數據分布具有比較大的區別,垃圾文本相對于站內正常文本是一個比較特定的領域。因此我們使用隨機初始化字向量。

在決定使用字向量之后,我們觀察到“有意者加我咨詢:2839825539”、“找北京·合·合·天·下”等關鍵信息,按字來計算通常都很長。因此,CNN需要更大的感受域來提取相關文本特征,如果簡單增加卷積核大小,會增加參數數量。我們考慮使用空洞卷積(Dilated Convolution),來增加卷積的感受域,同時不增加網絡參數數量。一個典型的空洞卷積如下圖所示。

另外我們觀察到需要識別的垃圾文本并不都是短文本,還有一部分是長文本。由于文本長度的關系,如果簡單將卷積層的輸出取平均,輸出到全連接層,那么文本能決定是否是垃圾文本的關鍵特征很可能被其他特征所淹沒,導致模型精度難以提升。因此,我們加入了一個 Attention 層,通過它給予關鍵特征更大的權重。Attention 計算方法如下圖所示。

 

通過上述分析,我們最終采用的模型結構如下圖所示。

垃圾文本分類算法結構

模型效果

目前,垃圾文本模型會對知乎站內的所有內容進行評分,輸出 0-1 之間的分數,系統會對高分內容進行處理。

模型分數在知乎部分業務線上的表現:  

文本分數

>=0.9準確率

>=0.8準確率

>=0.7準確率

回答

100.0%

99.8%

95.6%

提問

100.0%

99.1%

97.7%

評論

100.0%

99.6%

98.0%

當前情況下,模型結合其他反作弊維度,可實現對垃圾評分 0.5 分以上的內容進行刪除,同時準確率達到 97% 以上。上線以來,每天刪除垃圾內容數千條。

模型實時處理

另外值得一提的是端午期間,知乎站內涌現了一波違法違規的 spam,垃圾文本模型覆蓋了 98% 以上內容,使得這波攻擊大概持續了 1000 條左右就停了。

端午 spam 攻擊

后續計劃

垃圾文本識別是一個長期攻防的過程,站內垃圾文本會隨著時間不斷演變,現有模型的效果也會隨之變化。為了應對站內垃圾文本的挑戰,我們將一直收集 badcase,進一步優化模型的效果。

最后

由于本人的水平有限,如有錯誤和疏漏,歡迎各位同學指正。

作者:孫俊,知乎內容質量團隊的算法工程師。主要負責導流信息識別,垃圾文本識別和文本情感分析模型的開發和維護。 

責任編輯:龐桂玉 來源: 51CTO
相關推薦

2025-02-11 09:12:55

2023-06-15 07:49:33

2016-10-13 16:20:11

2017-06-16 21:00:02

Python爬蟲

2014-12-25 16:02:55

TalkingData

2023-07-18 18:14:51

云原生軟件架構

2016-12-12 09:01:47

Amazon Go核心技術

2022-02-25 11:07:19

計算機圖像識別深度學習

2023-02-15 21:49:55

2022-07-07 10:19:05

數據畫像

2018-09-03 08:36:04

知乎容器大數據

2016-01-27 13:34:07

開源語音識別CNTK

2020-12-17 10:58:43

2019-11-25 11:03:19

互聯網數據技術

2020-12-10 15:28:29

知乎CTO平臺

2023-08-21 07:55:32

2018-12-13 11:32:55

知乎裁員調整

2021-06-23 15:10:18

Epic反作弊網絡安全

2017-07-26 09:39:58

點贊
收藏

51CTO技術棧公眾號

日韩欧美精品一区| 成人av影院在线观看| 精品一区中文字幕| 欧美韩国理论所午夜片917电影| 妖精视频一区二区| 国产精品久久久久久久久免费高清| 中文字幕日本乱码精品影院| 国产精品成人一区二区三区| 精品成人无码久久久久久| 国产高清一区| 亚洲白拍色综合图区| 亚洲精品一二三四五区| 伊人影院蕉久影院在线播放| 国产亚洲综合av| 91黄色精品| 久久精品视频2| 国产综合色产| 中文字幕一区二区精品| 中文字幕在线观看91| 欧美影视资讯| 精品久久久久久中文字幕一区奶水 | 久久久精品福利| 精品国产乱码久久久久久1区2匹| 欧美久久久一区| 久久久999视频| 免费网站黄在线观看| 91视频免费播放| 91观看网站| 97视频免费在线| 玖玖视频精品| 97精品国产97久久久久久春色| 日韩一区二区三区四区视频| 欧美猛男做受videos| 精品日产卡一卡二卡麻豆| 国产又大又黄又猛| 欧美大片免费| 精品国产乱码久久久久久虫虫漫画 | 国产一区二区黑人欧美xxxx| 男女性杂交内射妇女bbwxz| 久久91导航| 欧美日韩午夜激情| 成人午夜精品久久久久久久蜜臀| av观看在线| 中文字幕色av一区二区三区| 视频三区二区一区| 你懂的视频在线播放| 99re热这里只有精品免费视频| 翡翠波斯猫1977年美国| 丰满肉肉bbwwbbww| 国产精品夜夜爽| 亚洲一区二区三区乱码aⅴ| 在线视频精品免费| 日韩电影免费在线看| 全亚洲最色的网站在线观看| 久久狠狠高潮亚洲精品| 在线日韩电影| 97超级碰碰碰久久久| 国产午夜久久久| 亚洲黄色免费| 97成人精品区在线播放| www.国产成人| 中文在线一区| 欧美在线视频免费播放| 天天干天天色综合| 青青草国产成人av片免费| 国产精品人成电影| 91久久久久国产一区二区| 看电视剧不卡顿的网站| 91免费视频网站| 性一交一乱一色一视频麻豆| 丁香五精品蜜臀久久久久99网站| 国产精品一区二区三区在线| 欧美一级特黄aaaaaa大片在线观看| 成人国产视频在线观看| 久久精品国产精品国产精品污| 欧美黄色小说| 国产精品国产三级国产普通话99 | 国内综合精品午夜久久资源| 欧美高清视频在线观看| 精品91久久久| 日本大胆欧美人术艺术动态| 成人女保姆的销魂服务| www.国产黄色| 91看片淫黄大片一级| 亚洲v国产v| 色呦呦在线资源| 亚洲国产日韩av| 国内性生活视频| 黄色精品视频网站| 欧美成人一级视频| 亚洲永久精品ww.7491进入| 久久中文亚洲字幕| 久久久亚洲国产天美传媒修理工| 成人精品免费在线观看| 麻豆免费看一区二区三区| 97影院在线午夜| 欧美18xxxxx| 亚洲丝袜精品丝袜在线| 亚洲午夜精品久久久久久人妖| 精品裸体bbb| 精品国产凹凸成av人网站| 中文字幕国产专区| 欧美成人一区二免费视频软件| 91精品国产91久久久久久久久| 中文字幕一级片| av在线播放成人| 宅男在线精品国产免费观看| 国产亚洲成av人片在线观看| 欧美精品一二三| 玖草视频在线观看| 亚洲视频在线免费| 日韩男女性生活视频| av官网在线观看| 国产视频一区不卡| www国产精品内射老熟女| 国内自拍亚洲| 亚洲精品少妇网址| 五月天综合在线| 国产一区二区伦理| 亚欧精品在线| 瑟瑟视频在线看| 精品国免费一区二区三区| 天天操天天摸天天舔| 国产精品亚洲欧美| 国产精品久久久久久久久久久久冷| 欧美96在线| 在线观看区一区二| 午夜理伦三级做爰电影| 国产一区观看| 91视频99| caopen在线视频| 欧美日韩大陆在线| 性少妇xx生活| 日韩有码一区二区三区| 九色91在线视频| 国产亚av手机在线观看| 91精品国产欧美一区二区18 | 亚洲欧美日韩综合aⅴ视频| www.欧美日本| 免费短视频成人日韩| 欧美一级在线亚洲天堂| 天天操天天操天天操| 亚洲综合丝袜美腿| 色男人天堂av| 希岛爱理一区二区三区| 成人黄色片在线| 成人黄视频在线观看| 51精品久久久久久久蜜臀| 日韩av片在线免费观看| 免费成人在线观看| 亚洲人成人77777线观看| 欧美不卡高清一区二区三区| 亚洲最新av在线网站| 国产精品无码一区| 国产精品免费观看视频| 日本不卡一区二区在线观看| 91视频精品| 亚洲综合在线小说| 中日韩高清电影网| 欧美成人r级一区二区三区| 免费中文字幕视频| 99re这里只有精品6| 精品视频一区二区在线| 国产一区二区三区不卡视频网站| 日韩免费在线看| 色哟哟免费在线观看| 正在播放亚洲一区| 久久无码精品丰满人妻| 97精品国产97久久久久久久久久久久| 国产免费黄色小视频| 亚洲妇女av| 国产精品亚发布| av毛片在线免费看| 亚洲国产精品小视频| 在线观看免费av片| 国产欧美日韩在线看| 涩涩网站在线看| 狠狠综合久久av一区二区老牛| 狠狠干一区二区| 日韩免费小视频| 久热在线中文字幕色999舞| 六月婷婷中文字幕| 一本到一区二区三区| 少妇视频一区二区| 成人福利在线看| 少妇一级淫免费放| 欧美久久久久| 日产精品一线二线三线芒果| 国产亚洲高清一区| 欧亚精品中文字幕| www.在线视频| 日韩精品中文在线观看| 国产免费的av| 欧美日韩日本国产| 草视频在线观看| 久久久www成人免费毛片麻豆| 色婷婷综合在线观看| 美女日韩在线中文字幕| 二级片在线观看| 亚洲宅男一区| 福利视频一区二区三区| 韩国成人在线| 亚洲91av视频| 久久77777| 亚洲日韩中文字幕| 男人天堂一区二区| 欧美日韩国产综合视频在线观看| 日本一级一片免费视频| 亚洲视频一区二区在线观看| 熟女俱乐部一区二区视频在线| 国产精品一区二区不卡| 丁香婷婷激情网| 亚洲美女黄网| 国产成人三级视频| 国产一区二区三区网| 国产日韩欧美一区二区| 日韩一级视频| 国产国语刺激对白av不卡| 69av成人| 久久久久亚洲精品| 在线观看男女av免费网址| 一区二区三区www| 神马电影在线观看| 亚洲第一网站免费视频| 国产孕妇孕交大片孕| 精品视频在线免费| 无码人妻熟妇av又粗又大| 午夜精品久久久久久| 青娱乐国产精品| 亚洲精品视频一区二区| 亚洲色图27p| 国产日韩v精品一区二区| 人妻少妇精品视频一区二区三区| 波多野结衣中文字幕一区二区三区| 99九九精品视频| 麻豆精品国产传媒mv男同| 色综合天天色综合| 全部av―极品视觉盛宴亚洲| 日日碰狠狠躁久久躁婷婷| 国产欧美亚洲一区| 日韩精品 欧美| 亚洲精品偷拍| 一区二区传媒有限公司| 午夜在线精品偷拍| 日日碰狠狠添天天爽超碰97| 亚洲精品字幕| 777精品久无码人妻蜜桃| 在线精品一区| 色综合久久久久无码专区| 亚洲色诱最新| 任你操这里只有精品| 老牛国产精品一区的观看方式| 黄色a级片免费| 日韩国产欧美三级| xx欧美撒尿嘘撒尿xx| 六月丁香婷婷色狠狠久久| www.亚洲高清| 国产一区二区三区四区五区入口 | 波多野结衣乳巨码无在线| 午夜一区不卡| 韩国视频一区二区三区| 九色综合国产一区二区三区| 国产福利精品一区二区三区| 国产不卡视频在线观看| 成年人的黄色片| 久久久久9999亚洲精品| 国产美女网站视频| 亚洲欧美乱综合| 日韩aaaaaa| 日本乱人伦aⅴ精品| 亚洲天堂网视频| 日韩久久精品一区| 五月天婷婷在线播放| 亚洲色图综合久久| 国产网友自拍视频导航网站在线观看| 久久综合久久八八| 九色porny丨国产首页在线| 日本欧美国产在线| 日日夜夜精品| 国产一区二区无遮挡| 精品久久美女| 黄色片免费在线观看视频| 免播放器亚洲| 午夜激情影院在线观看| av毛片久久久久**hd| 日韩黄色中文字幕| 亚洲国产日韩精品| 中文字幕福利视频| 精品少妇一区二区三区免费观看| 五月婷婷丁香网| 久久精品视频播放| 免费在线小视频| 91精品中国老女人| 五月天亚洲一区| 成人手机在线播放| 免费看黄裸体一级大秀欧美| 中文字幕avav| 国产欧美日韩综合精品一区二区| 久久久久久久久久99| 欧美三级欧美一级| 手机在线不卡av| 久久精品成人欧美大片| 久久毛片亚洲| www日韩av| 欧美一级精品片在线看| www.日本少妇| 精品一区二区三区视频| 日本丰满少妇裸体自慰| 亚洲欧美日韩国产综合在线| 五月婷婷激情视频| 精品国产乱码久久久久久闺蜜 | 国产精品传媒视频| 日韩特级黄色片| 日韩色视频在线观看| 91在线品视觉盛宴免费| 欧洲永久精品大片ww免费漫画| 在线综合色站| 大桥未久一区二区| 日本不卡一区二区| 美女又爽又黄视频毛茸茸| 亚洲成av人片| 精品二区在线观看| 日韩视频永久免费观看| 欧美xxxx做受欧美护士| 久草精品电影| 影院欧美亚洲| av天堂一区二区| 亚洲狠狠丁香婷婷综合久久久| 伊人网免费视频| 一区二区三区 在线观看视| 特黄毛片在线观看| 久久99精品久久久久久秒播放器 | 拔插拔插华人永久免费| 国产日韩视频一区二区三区| 日韩精品在线免费视频| 亚洲精品久久久久| 中文在线最新版地址| 国产乱码一区| 精品96久久久久久中文字幕无| 制服下的诱惑暮生| 亚洲免费在线观看| 99riav国产| 欧美日本高清一区| 一区二区网站| 一卡二卡三卡视频| 成人avav在线| 中文字幕在线字幕中文| 日韩精品在线电影| 国偷自产一区二区免费视频| 欧美日韩高清在线一区| 三级久久三级久久久| 摸摸摸bbb毛毛毛片| 欧洲亚洲国产日韩| 日韩黄色影院| 91在线无精精品一区二区| 伊人久久大香线蕉综合四虎小说| 国内av免费观看| 亚洲一区二区三区美女| 天天操天天操天天| 欧美最猛性xxxxx免费| 激情综合网站| 在线播放黄色av| 亚洲制服丝袜在线| 婷婷在线免费视频| 欧美在线欧美在线| 欧美理论电影大全| www,av在线| 亚洲一区二区高清| 免费资源在线观看| 成人av番号网| 亚洲国产网站| 女女互磨互喷水高潮les呻吟| 欧美日韩国产美女| 视频在线观看入口黄最新永久免费国产| 国产伦精品一区二区三区照片91 | 国产福利小视频在线观看| 国产精品永久免费在线| 你懂的成人av| 亚洲欧美视频在线播放| 欧美日韩中字一区| 手机av免费在线| 日本高清久久一区二区三区| 激情欧美一区二区三区在线观看| 国产一二三四在线| 尤物九九久久国产精品的分类| 二区三区精品| 国产又黄又大又粗视频| 亚洲私人黄色宅男| 色视频免费在线观看| 成人欧美一区二区三区在线 | 亚洲最大的成人av| 欧洲毛片在线| 999热视频| 日韩vs国产vs欧美| 国产小视频在线看| 中文字幕日韩欧美在线| 成人性生交大片免费看中文视频| 亚洲综合在线网站| 亚洲国产日韩av| 国产精品实拍|