精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Word2vec算法原理詳解

發布于 2025-1-9 12:57
瀏覽
0收藏

        今天我們要講解的算法是Word2vec。Word2vec(word to vector)顧名思義,這是一個將單詞轉換成向量形式的工具。通過轉換,可以把對文本內容的處理簡化為向量空間中的向量運算,計算出向量空間上的相似度,來表示文本語義上的相似度。

        Word2vec主要分為CBOW(Continuous Bag of Words)又叫連續詞袋和Skip-Gram兩種模式,今天我們主要講解的就是CBOW,接下來我們將從頭到尾的詳細講解Word2vec算法流程。

        先來講解一個背景知識:one-hot向量。獨熱向量是指使用N位0或1來對N個狀態進行編碼,每個狀態都有它獨立的表示形式,并且其中只有一位為1,其他位都為0。

        比如我們現在要編碼apple\bag\cat\dog\elephant這五個單詞,我們用5位向量來進行編碼,如下所示:

apple [1 0 0 0 0]

bag [0 1 0 0 0]

cat [0 0 1 0 0]

dog [0 0 0 1 0]

elephant [0 0 0 0 1]

如果我們現在想要編碼其他另外的單詞,那就需要更多位參與編碼,但是這五個單詞的編碼前5位仍然能夠是這樣,只不過后面省略號省略的部分都為0罷了。

Word2vec算法原理詳解-AI.x社區圖片

同時使用獨熱向量形成的特征矩陣會非常的稀疏,占用的空間非常的大。

        而Word2vec就可以解決這個問題,其核心思想是:上下文語境相似的詞,其語義也相似。Word2vec采用的是n元語法模型(n-gram model),即假設一個詞只與周圍n個詞有關,而與文本中的其他詞無關。所以Word2vec就是把這n個詞作為一個目標詞的特征,那么就可以把特征映射到 K 維向量空間,可以為文本數據尋求更加深層次的特征表示 。所以 Word2vec的基本思想是 通過訓練將每個詞映射成 K 維實數向量(K 一般為模型中的超參數),通過詞之間的距離(比如 cosine 相似度、歐氏距離等)來判斷它們之間的語義相似度。

        接下來看一看CBOW的結構。分為三層:輸入層,隱藏層和輸出層。

Word2vec算法原理詳解-AI.x社區圖片

        這里對傳統的神經網絡做了以下一些改造:

1. 首先,對于從輸入層到隱藏層的映射,沒有采取神經網絡的線性變換加激活函數的方法,而是采用簡單的對所有輸入詞向量求和并取平均的方法。比如輸入的是三個4維詞向量:(1,2,3,4),(9,6,11,8),(5,10,7,12),那么我們word2vec映射后的詞向量就是(5,6,7,8)。由于這里是從多個詞向量變成了一個詞向量。

2. 第二個改進就是從隱藏層到輸出的softmax層這里的計算量個改進。為了避免要計算所有詞的softmax概率,word2vec采樣了霍夫曼樹來代替從隱藏層到輸出softmax層的映射。

        說到哈夫曼樹,我們都不陌生,它是一種帶權路徑最短的二叉樹,也叫做最優二叉樹。如下圖,b是哈夫曼樹,他的帶權路徑只有48

Word2vec算法原理詳解-AI.x社區圖片

        哈夫曼樹的構造方法如下圖所示:先用權重最小的兩個作為最底層葉子結點,然后權重次小的,以此類推。保證權重越大的越早被遍歷到,節省時間和空間。同時遍歷葉子結點的路徑我們也可以用哈夫曼編碼表示,例如左節點是0,右節點是1,那么葉子結點c的哈夫曼編碼就是110。

Word2vec算法原理詳解-AI.x社區圖片

        使用霍夫曼樹有什么好處呢?首先,由于是二叉樹,之前計算量為V,現在變成了log2V。第二,由于使用霍夫曼樹是高頻的詞靠近樹根,這樣高頻詞需要更少的時間會被找到,這符合我們的貪心優化思想。

        有了哈夫曼樹,就有了哈夫曼編碼,我們這整個算法的核心就是:即對于給定的上下文,使得預測詞的哈夫曼編碼概率最大。如果你現在感到很疑惑,我來舉個例子:

        假設我們現在的語境是這一個簡單的只有四個單詞的document:{I drink coffee everyday}

我們選coffee作為中心詞,我們要根據單詞"I","drink"和"everyday"來預測一個單詞,并且我們希望這個單詞是coffee。將"I""drink""everyday"的one-hot向量作為輸入層的輸入

Word2vec算法原理詳解-AI.x社區圖片

    最開始輸入層的權重w參數是隨機生成的,接下來將這三個向量x初始乘以初始權重:w*x=v

Word2vec算法原理詳解-AI.x社區圖片

    將向量v求和并平均得到隱藏層的輸出向量c它:

Word2vec算法原理詳解-AI.x社區圖片

        從輸入層到隱藏層的邏輯過程講解完畢,接下來講解隱藏層到輸出層。

        我們在這一層用語料庫中所有的詞根據詞頻(就是哈夫曼中的權重)構建了哈夫曼樹,這樣每個詞 w 都可以從樹的根結點root沿著唯一一條路徑被訪問到,其路徑也就形成了其全局唯一的二進制編碼code,如"010011"。而我們從根結點開始走左子樹還是右子樹的概率是根據邏輯回歸二分類算法判斷的,邏輯回歸算法sigmoid,輸入是負無窮到正無窮,輸出是0到1之前的概率,sigmoid g函數和其導數如下圖所示:

Word2vec算法原理詳解-AI.x社區圖片

那么我們的輸出層的哈夫曼樹就可以表示成下圖:

Word2vec算法原理詳解-AI.x社區圖片

        假設目標詞是足球,那么足球的哈夫曼編碼是1001。這里我們指定負例是1,正例是0,那么我們可以得到上圖的第1次,第2次直到第四次的結果,那么足球的概率就是前面所有結點的概率相乘。d是每個結點的哈夫曼編碼,那么我們目標詞的概率可以寫成如下似然函數p,取對數,d=1就是負例,d=0就是正例:

Word2vec算法原理詳解-AI.x社區圖片

上面就是做了簡單的化簡,log連乘變成連加,log里面的指數放到log前面。接下來就是求這個似然函數的最大值,求極大值,我們都用梯度上升算法,那么下一步就是分別對變量x和c它求偏導數:

Word2vec算法原理詳解-AI.x社區圖片

        求導很簡單,上面有詳細的求導過程,由此我們就得到了參數c它的更新公式,同樣再對x求偏導也可以得到x的更新公式。

        不過我們知道隱藏層的x是上下文詞向量的和,不是上下文單個單詞的詞向量,怎么把這個更新量應用到單個單詞的詞向量上去呢?這里我們采用的是直接將更新量應用到每個詞向量上去:

Word2vec算法原理詳解-AI.x社區圖片

        還有一種提升訓練速度的方法就是負采樣,我們知道對于訓練語言模型來說,softmax層非常難算,畢竟你要預測的是當前位置是哪個詞,那么這個類別數就等同于詞典規模,因此動輒幾萬幾十萬的類別數,算softmax函數當然很費力啦。
        但是,如果我們的目標不在于訓練一個精準的語言模型,而只是為了訓練得到語言模型的副產物-詞向量,那么其實只需要用這里隱含的一個計算代價更小的“子任務”就好啦。想一想,給你10000張寫有數字的卡片,讓你找出其中的最大值,是不是特別費力?但是如果把里面的最大值事先抽出來,跟五張隨機抽取的卡片混到一起,讓你選出其中的最大值,是不是就容易多啦?
        負采樣就是這個思想,即不直接讓模型從整個詞表找最可能的詞了,而是直接給定這個詞(即正例)和幾個隨機采樣的噪聲詞(即采樣出來的負例),只要模型能從這里面找出正確的詞就認為完成目標啦。

        那么我們選擇哪些作為噪音呢?

        word2vec常用的負采樣策略有均勻負采樣、按詞頻率采樣等等。比較常用的采樣方法是一元分布模型的3/4次冪。該方法中,一個詞被采樣的概率,取決于這個詞在語料中的詞頻 ,其滿足一元分布模型(Unigram Model).

Word2vec算法原理詳解-AI.x社區圖片

其中V為整個詞表大小,   f(wi)為詞wi的詞頻。

至于為什么選擇3/4呢?其實是由論文作者的經驗所決定的。

假設由三個詞,,”我“,”和平“,”覬覦“ 權重分別為 0.9 ,0.01,0.003;經過3/4冪后:

我: 0.9^3/4 = 0.92

和平:0.01^3/4 = 0.03

覬覦:0.003^3/4 = 0.012

對于”覬覦“而言,權重增加了4倍;”和平“增加3倍;”我“只有輕微增加。

可以認為:在保證高頻詞容易被抽到的大方向下,通過權重3/4次冪的方式,適當提升低頻詞、罕見詞被抽到的概率。如果不這么做,低頻詞,罕見詞很難被抽到,以至于不被更新到對應的Embedding。

        所以我們可以得到如下公式g,w表示正確的預測詞,u表示錯誤的負采樣,那么1-預測中心詞u的概率還是預測正確的概率,所以我們的目標還是使得g最大化,那么還是求似然函數,并求導:

Word2vec算法原理詳解-AI.x社區圖片

那么求導還是一樣的方式,如下所示,對似然函數求偏導,然后得出更新的步長

Word2vec算法原理詳解-AI.x社區圖片

Word2vec算法原理詳解-AI.x社區圖片

本文轉載自 ??人工智能訓練營??,作者: 小A學習

收藏
回復
舉報
回復
相關推薦
亚洲视频导航| 欧美激情视频一区| 日本999视频| 国产小视频在线播放| 爽好久久久欧美精品| 亚洲欧美日韩视频一区| 亚洲精品中文字幕无码蜜桃| 在线观看h片| 视频一区二区三区在线| 日韩在线视频观看| 老熟女高潮一区二区三区| 日产福利视频在线观看| 国产精品免费视频观看| 97久久人人超碰caoprom欧美| 九九视频免费看| 色老板在线视频一区二区| 欧美午夜精品理论片a级按摩| 亚洲 欧洲 日韩| 免费观看国产视频| 日本va欧美va精品发布| 欧美国产中文字幕| 国产精品无码午夜福利| 亚洲欧美综合久久久久久v动漫| 亚洲成人激情综合网| 色视频一区二区三区| aaa一区二区三区| 久久激情综合| 精品视频9999| 大胸美女被爆操| 国产一级成人av| 精品视频一区二区三区免费| 久草免费福利在线| 中文日本在线观看| 97精品电影院| 5g国产欧美日韩视频| 天堂网中文字幕| 国产伊人精品| 最近中文字幕2019免费| 男人女人拔萝卜视频| jizz内谢中国亚洲jizz| 亚洲欧美国产高清| 日韩久久不卡| 日韩美女一级视频| 国产91丝袜在线18| 成人观看高清在线观看免费| 精品美女久久久久| 欧美日本不卡| 久久色免费在线视频| av中文字幕免费观看| 国内精品偷拍| 欧美一区二区三区在线观看视频| 欧在线一二三四区| 咪咪网在线视频| 夜夜嗨av一区二区三区| 亚洲国产精品影视| 日韩精品黄色| 欧美国产禁国产网站cc| 欧美日本韩国一区二区三区| 亚洲AV无码国产精品午夜字幕| 日韩精品亚洲一区| 久久免费高清视频| 中文字幕手机在线观看| 99久久夜色精品国产亚洲狼 | 国产乱淫a∨片免费视频| 丝袜美腿亚洲综合| 日韩av免费一区| 久久久久久少妇| 国产亚洲亚洲| 51午夜精品视频| 日韩乱码一区二区| 99香蕉国产精品偷在线观看| 久久免费精品日本久久中文字幕| 国产1区2区3区4区| 欧美a级一区| 久热精品在线视频| 丝袜 亚洲 另类 欧美 重口| 亚洲一区欧美| 久久99国产精品自在自在app | 成人免费观看在线视频| 国产福利精品一区| 国产日韩欧美一区二区| 天堂网www中文在线| 99re亚洲国产精品| 欧美日韩最好看的视频| 精品视频三区| 欧美国产日本韩| 天天干天天操天天干天天操| 黄色网址免费在线观看| 中文字幕不卡一区| 性生活免费观看视频| 青草影视电视剧免费播放在线观看| 亚洲精品国产无套在线观| 青少年xxxxx性开放hg| 国产香蕉视频在线看| 久久综合狠狠综合久久激情 | 国产精品免费大片| 日韩专区中文字幕| 久久久久久欧美精品se一二三四| 99av国产精品欲麻豆| 欧美综合一区第一页| 中文字幕av久久爽| 国产精品自拍一区| 另类小说综合网| av在线播放av| 一区二区免费看| 国产精品沙发午睡系列| 久久久久伊人| 精品美女在线播放| 国产一区二区三区四区五区六区| 日韩伦理视频| 欧美精品国产精品日韩精品| 在线观看免费av片| 久热成人在线视频| 国产私拍一区| 天堂资源在线中文| 亚洲风情在线资源站| 爱情岛论坛成人| 麻豆国产一区| 亚洲日韩欧美视频一区| 亚洲最大的黄色网址| 国产视频一区免费看| 国产精品99久久久久久人| 国产高清免费观看| 国产农村妇女毛片精品久久麻豆 | 久操视频在线播放| 精品久久久一区| 欧美视频亚洲图片| 国产成人短视频在线观看| 欧美成人在线免费| 这里只有精品999| 99热精品国产| 中国女人做爰视频| 精品亚洲美女网站| 亚洲第一av在线| 91麻豆精品成人一区二区| 欧美日韩少妇| 91精品国产综合久久久久久久久 | 日韩一级黄色av| 色一情一乱一伦| 成人性色生活片免费看爆迷你毛片| 五月天丁香综合久久国产| 麻豆视频在线观看免费网站黄| 91精品国产综合久久精品图片| 日韩中文字幕电影| 亚洲看片免费| 国产精品免费一区二区三区观看 | 国产伦精品一区二区三区免.费| 久久久噜噜噜久久人人看 | 欧洲杯什么时候开赛| 91精品成人久久| 精品乱子伦一区二区| 椎名由奈av一区二区三区| wwwwxxxx日韩| 欧洲毛片在线视频免费观看| 青青草成人在线| 天天干天天草天天射| 亚洲综合自拍偷拍| 亚洲国产日韩在线一区| 亚洲国产日韩欧美在线| 成人网在线观看| 免费在线毛片网站| 欧美日韩高清在线| 日韩欧美在线视频播放| 另类调教123区| 三区精品视频观看| 电影在线观看一区二区| 一区二区三区高清国产| 真实的国产乱xxxx在线91| 国产亚洲综合av| 欧美综合在线观看视频| 精品国产一区二区三区噜噜噜 | 国产乱人伦精品一区二区在线观看| 亚洲精品乱码视频| 久久人体av| 日韩亚洲一区二区| 97在线公开视频| 亚洲乱码国产乱码精品精的特点| 久久久久久久高清| 国产精品啊啊啊| 国产精品国模大尺度私拍| 国产传媒在线| 亚洲欧美日韩图片| 伊人久久成人网| 亚洲精选一二三| 亚洲最大视频网| 国产精品一二| 日韩国产一区久久| 亚洲欧洲专区| 久久99视频免费| 先锋av资源站| 欧日韩精品视频| 可以免费看av的网址| 国产成人免费高清| 国产成人精品视频免费看| japanese国产精品| 亚洲在线免费视频| 国产传媒在线观看| 在线视频欧美性高潮| 国产成人免费看一级大黄| 亚洲国产日韩在线一区模特| 亚洲av片不卡无码久久| 麻豆精品一区二区| www.欧美黄色| 精品久久网站| 97中文在线观看| 亚洲欧洲自拍| 久久的精品视频| 亚洲av成人精品一区二区三区在线播放| 色哟哟欧美精品| 手机在线免费看片| 久久综合九色综合欧美就去吻| 91亚洲精品久久久蜜桃借种| 亚洲大胆在线| 青娱乐一区二区| 亚洲天堂av资源在线观看| 日韩免费在线免费观看| 八戒八戒神马在线电影| 亚洲欧美精品在线| 成人激情四射网| 欧美午夜寂寞影院| 五月天综合在线| 国产精品久久久久久妇女6080| 欧美日韩人妻精品一区在线| 美国av一区二区| 国产特级黄色大片| 亚洲欧美伊人| 日本精品二区| 风间由美一区二区av101 | 日韩免费一区二区三区| 大奶在线精品| 91免费的视频在线播放| 亚洲欧洲自拍| 久久久久久久电影一区| 1024视频在线| 亚洲色图五月天| 欧美一区二区黄片| 欧美一二三四区在线| 中文字幕乱码人妻二区三区| 精品久久久一区二区| 91在线播放观看| 亚洲欧美综合在线精品| 亚洲色成人网站www永久四虎 | 色中色综合网| 欧美综合激情| 秋霞在线一区| 国产精品免费一区二区三区四区| 国产精品亚洲综合在线观看| 国产精品色悠悠| 韩国三级一区| 国产精品成人一区二区三区吃奶| 女厕盗摄一区二区三区| 97精品久久久中文字幕免费| 日本性爱视频在线观看| 久久国产精彩视频| 亚洲综合影视| 久久精品人人爽| 成人ww免费完整版在线观看| 色多多国产成人永久免费网站| 福利成人在线观看| 一区二区欧美在线| aaa在线免费观看| 一区二区亚洲精品国产| www.在线视频.com| 一区二区三区www| 自拍视频在线免费观看| 日韩在线视频中文字幕| 香蕉视频国产在线观看| 日韩中文字幕网址| 国产在线观看免费麻豆| 久久视频免费在线播放| 污影院在线观看| 欧美激情在线有限公司| av影视在线看| 欧美极品xxxx| 亚洲私拍视频| 国产精品观看在线亚洲人成网| 日韩一区二区三区在线免费观看 | 亚洲电影成人av99爱色| 五月天婷婷在线观看| 亚洲精品色婷婷福利天堂| 免费在线观看一级毛片| 国产一区二区三区18| 日本三级在线视频| 久久伊人精品视频| heyzo高清国产精品| 3344国产精品免费看| 四虎4545www国产精品| 91香蕉电影院| 老司机凹凸av亚洲导航| 欧美一区二区三区四区夜夜大片| 不卡中文字幕| 蜜臀av.com| 国产日韩欧美三区| 亚洲欧美自偷自拍另类| 国产精品1区二区.| 亚洲欧美视频在线播放| 国产农村妇女毛片精品久久麻豆| 少妇被躁爽到高潮无码文| 亚洲午夜激情网站| 91在线视频免费播放| 在线播放亚洲一区| 手机在线精品视频| 精品国模在线视频| 黄色激情在线播放| 国产在线视频欧美| 开心激情综合| 中文精品一区二区三区| 一区在线免费| 色婷婷综合网站| www.成人在线| 91制片厂在线| 欧美性猛交xxxx免费看| 国产又粗又猛又爽又黄的| 亚洲国产精品成人一区二区| 992tv免费直播在线观看| 久久免费少妇高潮久久精品99| 日韩精品第二页| 久久久神马电影| 亚洲精品a级片| 午夜激情福利在线| 成a人片国产精品| 日本一级特级毛片视频| 日韩欧中文字幕| 亚洲爱情岛论坛永久| 中文日韩在线视频| 高潮在线视频| 91香蕉视频在线下载| 精品一区电影| 日韩欧美视频网站| 国产精品一区二区男女羞羞无遮挡| 亚洲国产av一区| 亚洲男人的天堂在线aⅴ视频| 国产一区二区视频免费| 亚洲国内高清视频| 免费网站成人| 国产精品美女999| 亚洲影院天堂中文av色| 欧美大黑帍在线播放| 精品影院一区二区久久久| xxxx日本黄色| 欧美性xxxxxxx| 欧洲精品久久一区二区| 欧美成人亚洲成人| 激情久久免费视频| 亚洲欧美一区二区原创| 日韩国产在线一| 免费观看av网站| 亚洲国产乱码最新视频| 亚洲成人第一区| 九九热这里只有精品6| 国产精品色婷婷在线观看| 伊人久久av导航| 久久国产精品99久久久久久老狼| 香蕉视频久久久| 欧美亚洲高清一区| 成年人在线视频| 国产精品午夜一区二区欲梦| heyzo久久| 国产视频手机在线播放| 国产日韩欧美一区二区三区乱码 | 亚洲成人动漫精品| 亚洲精品字幕在线观看| 欧美人在线观看| av成人男女| 久久手机在线视频| 成人av网址在线| 999这里只有精品| 亚洲人成电影网站色…| 日韩欧美一区二区三区在线观看 | 欧美电影《轻佻寡妇》| 在线观看免费av网址| 亚洲三级在线播放| 国产视频第二页| 欧美高清在线观看| 久久精品色综合| 久久精品香蕉视频| 国产精品女主播在线观看| 国产又粗又猛又爽又黄91| 九九热精品视频在线播放| 国产丝袜一区| 日本成人在线免费视频| 国产精品二三区| 国产熟女一区二区丰满| 欧美精品久久久久久久久| 在线日韩成人| 日韩国产小视频| 国产成人免费在线视频| 国产在线精品观看| 亚洲午夜精品久久久久久久久久久久 | 国产另类ts人妖一区二区| 国内外成人免费在线视频| 国产精品视频一区二区三区不卡| a天堂中文在线观看| 欧美一级免费视频| 91精品动漫在线观看| 泷泽萝拉在线播放| 欧美成va人片在线观看| 日韩中文视频| 国产美女主播在线| 中文字幕一区在线观看视频|