精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

除了自然語言處理,你還可以用Word2Vec做什么?

開發 開發工具 自然語言處理
這篇文章的目標是展示我們如何能夠使用一種詞嵌入方法,Word2Vec(2013,Mikolov 等),來把一個具有大量模態的分類特征轉換為一組較小的易于使用的數字特征。

當使用機器學習方法來解決問題的時候,擁有合適的數據是非常關鍵的。不幸的是,通常情況下的原始數據是「不干凈」的,并且是非結構化的。自然語言處理(NLP)的從業者深諳此道,因為他們所用的數據都是文本的。由于大多數機器學習算法不接受原始的字符串作為輸入,所以在輸入到學習算法之前要使用詞嵌入的方法來對數據進行轉換。但這不僅僅存在于文本數據的場景,它也能夠以分類特征的形式存在于其他標準的非自然語言處理任務中。事實上,我們很多人都在苦苦研究這種分類特征過程,那么詞嵌入方法在這種場景中有什么作用呢?

這篇文章的目標是展示我們如何能夠使用一種詞嵌入方法,Word2Vec(2013,Mikolov 等),來把一個具有大量模態的分類特征轉換為一組較小的易于使用的數字特征。這些特征不僅易于使用,而且能夠成功學習到若干個模態之間的關系,這種關系與經典詞嵌入處理語言的方式很相似。

Word2Vec

觀其伴,知其意。(Firth, J. R. 1957.11)

上述內容準確地描述了 Word2Vec 的目標:它嘗試通過分析一個詞的鄰詞(也稱作語境)來確定該詞的含義。這個方法有兩種不同風格的模型:CBOW 模型和 Skip-Gram 模型。在給定語料庫的情況下,模型在每個語句的詞上循環,要么根據當前單詞來預測其鄰詞(語境),要么根據當前的語境來預測當前的詞,前者所描述的方法被稱作「Skip-Gram」,后者被稱作「連續性詞包,continuous bag of words(CBOW)」。每個語境中單詞數目的極限是由一個叫做「窗大小,Window Size」的參數來決定的。

兩種 Word2Vec 結構,其中 w(t) 代表的是當前單詞,w(t-2)..w(t+2) 代表的是語境單詞。(Mikolov 等人. 2013)

因此,如果你選擇了 Skip-Gram 方法,Word2Vec 就會使用一個淺層的神經網絡,也就是說,用一個只具有一個隱藏層的神經網絡來學習詞嵌入。網絡首先會隨機地初始化它的權重,然后使用單詞來預測它的語境,在最小化它所犯錯誤的訓練過程中去迭代調整這些權重。有望在一個比較成功的訓練過程之后,能夠通過網絡權重矩陣和單詞的 one-hot 向量的乘積來得到每一個單詞的詞向量。

注意:除了能夠允許將文本數據進行數字表征之外,結果性嵌入還學習到了單詞之間的而一些有趣的關系,可以被用來回答類似于下面的這種問題:國王之于王后,正如父親之于......?

如果你想了解更多的關于 Word2Vec 的細節知識,你可以看一下斯坦福大學的課程(https://www.youtube.com/watch?v=ERibwqs9p38),或者 TensorFlow 的相關教程(https://www.tensorflow.org/tutorials/word2vec)。

應用

我們在 Kwyk 平臺上(https://www.kwyk.fr/)上提供在線的數學練習。老師給他們的學生布置作業,每次練習完成的時候都會有一些數據被存儲下來。然后,我們利用收集到的數據來評價每個學生的水平,并且給他們量身制作對應的復習來幫助他們進步。對于每一個被解答的練習作業,我們都保存了一系列的標識符來幫助我們區分以下信息:這是什么練習?作答的學生是誰?屬于哪一個章節?....... 除此之外,我們還會根據學生是否成功地解答了這個題目來保存一個分數,要么是 0,要么是 1。然后,為了評價學生的分數,我們必須預測這個分數,并且從我們的分類器中得到學生成功的概率。

正如你所看到的,我們的很多特征都是可以分類的。通常情況下,當模態的數目足夠小的時候,你可以簡單地將 n 模態的分類特征轉換為 n-1 維的啞變量,然后用它們去訓練。但是當模態是成千上萬級別的時候——就像在我們應用中的一些情況一樣——依靠啞變量就顯得沒有效率并且不切實際。

為了解決這個問題,我們通過一個小技巧采用 Word2Vec 把分類特征轉換為數量相當少的可用連續特征。為了闡述這個想法,我們以「exercise_id」為例來說明:exercise_id 是一個分類特征,它能夠告訴我們被解答過的練習題是哪一個。為了能夠使用 Word2Vec,我們提供一個語料庫,也就是將要輸入到我們的算法中的一系列句子。然而,原始的特征只是一個 ID 的列表而已,它本質上并不是語料庫:它的順序完全是隨機的,相近的 ID 也并沒有攜帶著其相鄰的 ID 任何信息。我們的技巧包括把某個老師布置的一次作業看做一個「句子」,也就是一連串的 exercise_id。結果就是,所有的 ID 會很自然地以等級、章節等標簽被收集在一起,然后 Word2Vec 可以直接在這些句子上面開始學習練習的嵌入(exercise embedding,對應于 Word embedding)。

事實上,正是由于這些人為的句子我們才得以使用 Word2Vec,并得到了很漂亮的結果:

 Word2Vec

根據級別著色的練習嵌入(exercise embedding)(用 PCA 方法得到了 3 個主成分,就是圖中的 3 維空間);圖中的 6e, 5e, 4e, 3e, 2e, 1e 以及 tm 是法國學生的水平,與美國的 6th, 7th, 8th, 9th, 10th,11th 和 12th 等價。

如我們所看到的的,結果性嵌入是有結構的。事實上,練習的 3D 投影云是螺旋形的,高級別的練習緊跟在較低級別的后面。這也意味著嵌入成功地學會了區分不同級別的練習題目,并且把練習題目重新分組,具有相似級別的被放在了一起。但是這還不是全部,使用非線性的降維技術之后,我們可以將整個嵌入降維成一個具有相同特征的實值變量。換句話說,我們得到了一個關于練習復雜度的特征,6 年級(6th)最小,隨著練習越來越復雜,這個變量越來越大,直到 12 年級達到該變量的***值。

更有甚者,正如 Mikolov 在英語單詞上做到的一樣,嵌入還習得了練習之間的關系:

嵌入能夠學習到的關系的一些實例

上圖展示了我們的嵌入能夠學習到的關系的一些實例。所以當我們問「一個數字相加的練習之于一個數字相減的練習,正如一個時間相加的練習之于......?」之后,嵌入給出了如下的答案:「一個時間相減的練習」。具體而言,這意味著如果我們提出這個問題:嵌入 [減(數字)Substract(Numbers)] --嵌入 [加(數字),Add(Numbers)],并把它添加到學生練習的嵌入中,其中學生被要求來做時間的加法(例如,小時、分鐘等等),那么與之最接近的一個嵌入就是包含時間減法的練習。

結論

總之,詞嵌入技術在將文本數據轉換成便于機器學習算法直接使用的實值向量時是有用的,盡管詞嵌入技術主要用在自然語言處理的應用中,例如機器翻譯,但是我們通過給出特定的用在 Kwyk 中的例子展示了這些技術在分類特征處理中也有用武之地。然而,為了使用諸如 Word2Vec 這樣的技術,你必須建立一個語料庫——也就是說,一組句子,其中的標簽已經被排列好了,所以其語境也是已經隱式創建好了。上述實例中,我們使用在網站上給出的作業來創建練習的「句子」,并且學習練習嵌入。結果就是,我們能夠得到新的數字特征,這些特征能夠成功地學習練習之間的關系,比它們被打上的那組原始標簽更加有用。

向 Christophe Gabar 致謝,他是我們 Kwyk 的開發人員之一,他提出了把 word2vec 用在分類特征上的思想。

原文:https://medium.com/towards-data-science/a-non-nlp-application-of-word2vec-c637e35d3668

【本文是51CTO專欄機構“機器之心”的原創譯文,微信公眾號“機器之心( id: almosthuman2014)”】

 

戳這里,看該作者更多好文

責任編輯:趙寧寧 來源: 51CTO專欄
相關推薦

2017-08-04 10:16:52

自然語言處理嵌入機器學習

2018-08-05 07:50:22

自然語言Word2Vec深度學習

2021-05-17 09:00:00

自然語言人工智能技術

2021-05-13 07:17:13

Snownlp自然語言處理庫

2024-10-09 08:00:00

2018-08-08 14:25:17

2020-04-24 10:53:08

自然語言處理NLP是人工智能

2024-02-05 14:18:07

自然語言處理

2022-03-29 09:58:15

自然語言處理人工智能技術

2021-01-21 10:28:16

自然語言NLP人工智能

2020-08-24 07:19:13

主鍵自增數據庫

2017-10-19 17:05:58

深度學習自然語言

2017-03-30 14:52:34

自然語言商業智能

2017-03-28 17:52:58

自然語言處理商業智能

2018-04-04 12:00:00

2021-05-18 07:15:37

Python

2024-04-24 11:38:46

語言模型NLP人工智能

2017-10-19 15:09:10

Word2vecskip-gram模型

2019-07-22 09:13:50

Nginx算法瀏覽器

2022-02-09 10:56:09

ReactJS組件前端
點贊
收藏

51CTO技術棧公眾號

好吊一区二区三区| 久久精品女人天堂av免费观看| 麻豆一区二区三区| 久久成人精品电影| 欧美久久久久久久久久久| 欧美xxxxhdvideosex| 99久久国产综合精品女不卡| 日韩av免费看| 亚洲最大的黄色网址| 精品午夜电影| 欧美亚洲免费在线一区| 999久久欧美人妻一区二区| 婷婷在线观看视频| 免费观看在线综合| 欧美激情久久久久| 欧美日韩生活片| jizz性欧美2| 91久久国产综合久久| 黄色特一级视频| 撸视在线观看免费视频| 国产精品白丝av| 国产成人91久久精品| 麻豆视频在线观看| 成人羞羞网站| 亚洲国内高清视频| 一卡二卡三卡四卡五卡| 欧美动物xxx| 一区二区三区欧美久久| 日韩久久久久久久| 刘玥91精选国产在线观看| 乱一区二区av| 人体精品一二三区| 日本三级午夜理伦三级三| 欧美好骚综合网| 日韩久久午夜影院| 日批免费观看视频| www.久久草.com| 一本久久综合亚洲鲁鲁五月天| 91大学生片黄在线观看| 888av在线| 久久久久久久久久电影| 国产精品果冻传媒潘| 亚洲一区在线观| 视频一区视频二区在线观看| 97视频免费在线看| 欧美精品一级片| 欧美另类69xxxxx| 日韩国产一区三区| 天天躁日日躁狠狠躁av| 欧美电影在线观看一区| 欧美精品777| 一区二区三区 日韩| 大胆人体一区| 色综合色狠狠天天综合色| 日本网站免费在线观看| 国产丝袜在线观看视频| 一区二区三区免费网站| 奇米777四色影视在线看| 浪潮av一区| 亚洲欧洲精品天堂一级 | 亚洲男人的天堂网站| 亚洲欧美高清在线| 国产精品毛片久久久| 欧美大片在线观看| 日本黄色大片在线观看| 91麻豆精品激情在线观看最新| 日韩一区二区中文字幕| 中文写幕一区二区三区免费观成熟| 韩国一区二区三区视频| 91精品国产麻豆国产自产在线 | 欧美91看片特黄aaaa| 欧美日韩在线另类| 免费裸体美女网站| 日本精品另类| 欧美亚洲尤物久久| 一起操在线视频| 国产不卡精品| 欧美电影精品一区二区| 亚洲一级Av无码毛片久久精品| 91亚洲无吗| 日韩成人av在线| 久久国产柳州莫菁门| 成人激情诱惑| 久久中国妇女中文字幕| 日本免费在线播放| 亚洲免费婷婷| 国产精品视频免费在线| 国产成人免费看一级大黄| 丁香天五香天堂综合| 久久久精品动漫| 电影在线一区| 亚洲精品日韩专区silk| 日本中文字幕在线视频观看| 神马久久午夜| 精品视频999| 深夜视频在线观看| 亚洲精品国产setv| www.久久色.com| 精品在线视频免费| 丝袜美腿成人在线| 69堂成人精品视频免费| 欧美高清成人| 亚洲精品国产精华液| 99福利在线观看| 欧美另类激情| 亚洲福利视频在线| 四虎影视1304t| 国产视频aaa| 国内黄色精品| 欧美精品一区在线播放| 国产成人在线视频观看| 国产综合色精品一区二区三区| 国产aⅴ精品一区二区三区黄| 欧美色视频免费| 最新中文字幕一区二区三区| heyzo国产| av在线精品| 亚洲欧美国产精品| 精品97人妻无码中文永久在线| 视频精品一区二区| 福利视频一区二区三区| 最新97超碰在线| 欧美日韩黄色大片| 久久久久亚洲av片无码v| 最近国产精品视频| 欧美激情亚洲自拍| 91丨九色丨丰满| 久久蜜桃av一区二区天堂| 成人小视频在线观看免费| 国产综合色激情| 亚洲精品资源美女情侣酒店| 欧美成人手机视频| 久久av资源站| 日本一区二区三区视频在线播放| 国产福利电影在线播放| 欧美一区二视频| 9.1片黄在线观看| 亚洲欧美久久| 国产精品国产亚洲精品看不卡15| 高h视频在线观看| 欧美日韩久久久| 一区二区三区伦理片| 一区二区三区导航| 国产有色视频色综合| 欧美6一10sex性hd| 日韩欧美一区电影| 日韩欧美综合视频| 美日韩一级片在线观看| 欧美污视频久久久| 亚洲精品88| 日韩精品亚洲元码| av资源免费观看| av资源网一区| 欧美深夜福利视频| 国产精品久av福利在线观看| 九九久久综合网站| jizz中国少妇| 亚洲黄色尤物视频| 国产人妻精品午夜福利免费| 欧美91福利在线观看| 91牛牛免费视频| 国产色在线观看| 3d动漫精品啪啪| 免费高清在线观看电视| 国产原创一区二区| 国产日产欧美一区二区| 视频精品一区二区三区| 久久99热精品这里久久精品| 精品国产av一区二区| 一区二区三区在线播放| 亚洲啪av永久无码精品放毛片| 亚洲网站啪啪| 国产一区不卡在线观看| 在线男人天堂| 亚洲性av在线| 一级黄色大片免费观看| 亚洲人成亚洲人成在线观看图片| 在线观看日本www| 欧美激情五月| 国模一区二区三区私拍视频| 国产剧情av在线播放| 亚洲男人av在线| 一区二区久久精品66国产精品| 亚洲天堂精品在线观看| 国产亚洲精品成人a| 亚洲一区不卡| 亚洲精品一区二区三区四区五区| 99精品视频在线免费播放| 欧美日产国产成人免费图片| 视频二区在线| 欧美精品1区2区| 日韩成人在线免费视频| 国产欧美一区二区精品婷婷| 国产精品嫩草影院8vv8| 欧美日韩国产亚洲一区| 九色一区二区| 青春草在线视频| www视频在线看| 内衣办公室在线| 青青青青在线| 五月天av在线| 黑人久久a级毛片免费观看| 日韩免费在线| 乱码第一页成人| 成人国产电影网| 国产成人综合自拍| 91免费电影网站| 黄色美女视频在线观看| 亚洲日韩第一页| 国产女同91疯狂高潮互磨| 精品女厕一区二区三区| 成年人视频软件| av在线不卡免费看| 激情五月婷婷基地| 亚洲综合不卡| 色婷婷777777仙踪林| 欧美禁忌电影| 99re6热在线精品视频播放速度| 亚洲精品成人图区| 蜜臀久久99精品久久久无需会员| 亚州av在线播放| 欧美一卡二卡三卡四卡| 四虎影院在线免费播放| 一区二区三区美女| 91制片厂在线| 国产欧美一区二区精品忘忧草| 久草视频福利在线| 国产精品一区二区果冻传媒| 亚洲天堂网一区| 欧美一级二区| 日韩中字在线观看| 欧美激情日韩| 伊人久久大香线蕉av一区| 亚洲亚洲免费| 久久久久久一区| 成人涩涩网站| 999日本视频| 日韩精品一页| 国产精品普通话| 激情亚洲影院在线观看| 日本欧美一二三区| 校园春色亚洲| 韩国精品久久久999| 色呦呦呦在线观看| 欧美成人性色生活仑片| 毛片在线不卡| 久久久极品av| 理论片午午伦夜理片在线播放| 在线亚洲午夜片av大片| 成人18在线| 国产一区二区三区精品久久久 | 日韩亚洲精品在线| 丁香色欲久久久久久综合网| 在线中文字幕第一区| 欧美性受xxxx黑人猛交88| 国产精品久久久久久影院8一贰佰 国产精品久久久久久麻豆一区软件 | 三级精品在线观看| 男女午夜激情视频| 日韩在线观看一区二区| 99久久国产宗和精品1上映| 免费日韩精品中文字幕视频在线| 男人天堂a在线| 极品av少妇一区二区| 欧美午夜小视频| 99国产精品视频免费观看一公开| 久久久性生活视频| 一区二区三区国产盗摄| 18禁男女爽爽爽午夜网站免费| 免费亚洲网站| 一区二区三区韩国| 狠狠久久亚洲欧美| 国产亚洲精品成人a| 99免费精品在线| 亚洲AV无码国产成人久久| 国产欧美一区二区三区沐欲 | 一区二区三区四区激情| 免费一级a毛片夜夜看| 午夜欧美视频在线观看| 国产91国语对白在线| 欧美日韩国产a| www.日韩高清| 日韩激情av在线免费观看| 国产视频福利在线| 日韩一区二区三区在线播放| 2020国产在线视频| 久久久久久久999| 蜜臀国产一区| 91色中文字幕| 欧美一级全黄| 一本一生久久a久久精品综合蜜| 欧美精品九九| 韩国一区二区av| 国产精品影视天天线| 成人影视免费观看| 亚洲欧洲日产国码二区| 日本少妇全体裸体洗澡| 欧美日韩一区二区三区高清| 亚洲av无码国产精品久久不卡| 亚洲精品一区二三区不卡| 国产美女福利在线| 欧美一级在线亚洲天堂| aa亚洲一区一区三区| 美日韩免费视频| 亚洲综合色站| 亚洲精品乱码久久久久久自慰| 久久狠狠亚洲综合| 日本一区二区在线免费观看| 国产精品免费免费| 国产又黄又粗又爽| 91精品国产综合久久小美女| 欧美美女搞黄| 欧美激情xxxx性bbbb| 黑人一区二区三区| 久久精品日产第一区二区三区乱码 | 特黄视频免费观看| 不卡影院免费观看| 黄色a级片在线观看| 在线视频国产一区| 天天干视频在线| 日韩中文字幕精品视频| 成人免费看视频网站| 97在线电影| 亚洲中无吗在线| 国产一二三四在线视频| 99久久久免费精品国产一区二区| 成年人免费视频播放| 一本色道**综合亚洲精品蜜桃冫| 黑人乱码一区二区三区av| 日韩亚洲欧美成人| 国产电影一区二区三区爱妃记| 国模一区二区三区私拍视频| 狠色狠色综合久久| 两性午夜免费视频| 中文字幕在线不卡视频| 天天爱天天做天天爽| 日韩精品高清在线观看| 福利影院在线看| 国产精品亚洲一区| 欧美视频一区| 污视频在线观看免费网站| 国产精品美女久久久久高潮| 天天干天天操天天操| 亚洲女人被黑人巨大进入al| 男女羞羞在线观看| 久久精品五月婷婷| 在线亚洲激情| 野外性满足hd| 色婷婷精品久久二区二区蜜臂av| 视频福利在线| 日本成人激情视频| 九九久久婷婷| 91热这里只有精品| 欧美极品美女视频| 怡红院男人的天堂| 日日骚久久av| 亚洲综合资源| 97精品国产97久久久久久粉红| 精品制服美女丁香| 中文字幕av播放| 日韩欧美一二三四区| 青春草免费在线视频| 国产精品白丝jk白祙| 亚洲成人直播| 国产传媒第一页| 91福利社在线观看| 幼a在线观看| 亚洲自拍欧美色图| 一区二区视频欧美| 亚洲黄色免费在线观看| 91久久精品午夜一区二区| 欧美性videos| 国产精品久久九九| 久久一区二区三区四区五区 | 亚欧美在线观看| 日韩毛片在线免费观看| 亚洲AV无码一区二区三区少妇| 国外成人免费在线播放| 蜜桃成人av| 三上悠亚在线一区| 亚洲已满18点击进入久久| 熟妇高潮一区二区三区| 国产97色在线| 久久精品青草| 亚洲精品国产成人av在线| 色8久久精品久久久久久蜜| 麻豆视频在线| 国产区一区二区三区| 日韩av在线发布| 欧美成人黄色网| 亚洲片国产一区一级在线观看| 欧洲精品久久久久毛片完整版| 路边理发店露脸熟妇泻火| 久久婷婷国产综合国色天香| 97视频免费在线| 久久久久久久爱| 少妇人妻丰满做爰xxx| 亚洲激情专区| 美女又黄又免费的视频| 黑人精品xxx一区| 老司机午夜在线|