精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

入門GPT | 詞的向量表示(Word2Vec和Embedding)

發布于 2025-6-18 06:44
瀏覽
0收藏

在自然語言處理(NLP)領域,我們面臨的第一個挑戰就是如何讓計算機理解人類的語言。

計算機不認識漢字或字母,它們只懂數字。

因此,我們需要一種方法,將詞語轉換成計算機可以處理的數字形式。

1. 什么是詞向量?

我們不能直接把"蘋果"這兩個字輸入到機器學習模型中。模型無法進行任何計算。我們需要先把它變成一組數字。

早期的方法

早期自然語言處理方法,如獨熱編碼和詞袋模型,雖然對某些機器學習任務有用,但并不能捕捉到詞的意義或上下文信息。這意味著潛在的關系,如語境相近性,無法在詞集合中捕捉到。

例如,獨熱編碼無法捕捉到"狗"和"貓"都指的是經常在家庭寵物上下文中討論的動物這類簡單關系。這類編碼通常為簡單的自然語言處理任務提供了基準(例如,電子郵件垃圾郵件分類器),但對于更復雜的任務,如翻譯和語音識別,則缺乏足夠的復雜性。

本質上,這些傳統的自然語言處理方法并不能捕捉詞組之間語法(結構)和語義(意義)的關系,因此它們是以一種非常簡單的方式來表示語言。

現代的方法:分布式表示 (Distributed Representation)

為了解決以上問題,研究者們提出了"分布式表示"的思想。這種方法不再使用稀疏的高維向量(如獨熱編碼),而是用一個稠密的、低維的向量來表示一個詞,這就是詞向量,或者叫詞嵌入(Word embedding)

分布式表示 (Distributed Representation) 是?種表示?法,它將離散的符號(如單詞)映射到連續的向量空間中。在這個空間中,每個維度不是對應單個符號,?是表示符號的某種特征或屬性。分布式表示通過捕獲單詞之間的相似性和關系,能更好地描述和處理?然語?數據。

分布式表示這個概念最早可以追溯到1986年,當時,杰弗?·?頓、?衛·魯梅爾哈特和羅納德· 威廉姆斯在?篇名為《Learning representations by back-propagating errors》(通過反向傳播誤差進?表示學習)的論?中描述了?種通過反向傳播(backpropagation)算法訓練多層神經?絡的?法,這種?法使得神經?絡能夠學到輸?數據的分布式表示。

然?,分布式表示很晚才在NLP領域得到應?。20世紀90年代,約書亞·本吉奧和其他研究?員開始嘗試將神經?絡應?于詞匯和句?表示的學習,推進了神經?絡語?模型的發展,以及后來的Word2Vec等詞嵌?技術的出現。

稀疏向量中,?部分元素的值為0,只有少數元素的值?零。稀疏向量通常?于表示?維數據,其中許多維度的值為零。

詞袋模型就是?種稀疏向量表示。在詞袋模型中,每個?檔??個向量表示,向量的?度等于詞匯表中的詞數量,向量的每個元素表示相應詞在?檔中出現的次數。由于?部分單詞可能不會出現在給定?檔中,因此詞袋模型中的向量通常是稀疏的。?我們常?的One-Hot編碼,當然更是稀疏了,每?個One-Hot編碼中,都有?量的0,?只有?個1。

稠密向量中的元素?部分為?零值。稠密向量通常具有較低的維度,同時能夠捕捉到更豐富的信息。Word2Vec就是?種典型的稠密向量表示。稠密向量能夠捕捉詞與詞之間的語義和語法關系,使得具有相似含義或相關性的詞在向量空間中距離較近。

相比之下,詞向量將單詞表示為多維連續的浮點數,其中語義相似的單詞被映射到幾何空間中的鄰近點。

簡單來說,一個詞向量是一行實數值,其中每個數值捕捉單詞意義的一個維度,而語義相似的單詞具有相似的向量。

這意味著像輪子和發動機這樣的詞應該與汽車有相似的詞向量(因為它們的意義相似),而香蕉則應該相距甚遠。換句話說,語義上相似的詞會在一個鄰近的向量空間中被映射。

將單詞表示為向量的美妙之處在于,它們可以應用于數學運算。例如,我們可以對向量進行加減運算——這里的一個經典例子是通過使用詞向量,我們可以確定:

king - man + woman = queen

我們可以從"king"(即男性)的詞向量中減去一個含義,再加上另一個含義(女性),從而顯示這個新的詞向量(king - man + woman)與"queen"的詞向量最為接近。

詞向量中的數字代表該詞在各個維度上的分布權重。簡單來說,每個維度代表一個含義,詞在該維度上的數值權重反映了其與該含義的相關性。因此,詞的語義是嵌入在向量的各個維度中的。

入門GPT | 詞的向量表示(Word2Vec和Embedding)-AI.x社區

那么,我們如何才能得到這種神奇的詞向量呢?這就引出了 Word2Vec。

2. 什么是 Word2Vec?

Word2vec 是自然語言處理(NLP)中用于獲取詞向量表示的技術。這些向量通過周圍詞匯來捕捉詞義信息。word2vec 算法通過建模大規模語料庫中的文本來估算這些表示。一旦訓練完成,此類模型可以檢測同義詞或為不完整句子提供額外詞匯建議。

Word2vec 是在 2013 年由 Mikolov 領導的谷歌研究團隊創建、專利并發布的,基于兩篇論文

《Efficient Estimation of Word Representations in Vector Space》:???https://arxiv.org/abs/1301.3781??

《Distributed Representations of Words and Phrases and their Compositionality》:???https://arxiv.org/abs/1310.4546??

Word2vec 可以使用兩種模型架構來生成詞的分布式表示(distributed representations):CBOW 和 Skip-gram。

入門GPT | 詞的向量表示(Word2Vec和Embedding)-AI.x社區

使用 Word2vec 算法創建的嵌入向量相比于早期算法(例如使用 n-grams 和潛在語義分析的算法)具有一些優勢。

Word2vec 將一個詞表示為捕捉詞間關系的高維數字向量。特別是,出現在相似上下文中的詞會被映射到通過余弦相似度衡量的鄰近向量。這表明詞之間的語義相似程度,例如 walk 和 ran 的向量相近,"but"和"however"的向量相近。

這個算法?以前的?法更加?效,能夠輕松地處理?規模的?本數據。因此,Word2Vec迅速流?起來。

截至 2022 年,傳統的 Word2vec 方法被描述為"過時"。

基于Transformer的模型,如 ELMo 和 BERT,在類似于 Word2vec 的詞嵌入模型上增加了多個神經網絡注意力層,已被認為是自然語言處理領域的最先進技術。

3. CBOW (Continuous Bag-of-Words) 連續詞袋模型

CBOW 的目標是根據上下文來預測中心詞

想象一句話:"the quick brown fox jumps over the lazy dog"。我們的任務是根據 ??fox??? 前后各兩個詞(即 ??{quick, brown, jumps, over}???)來預測 ??fox??。

工作原理:

CBOW模型的核心思想是利用周圍的上下文詞匯來預測目標中心詞。

具體來說,首先選擇一個中心詞(Target Word)并定義一個"窗口大小"(Window Size),比如窗口大小為2,那么對于中心詞 ??fox???,它的上下文(Context)就是它前后各2個詞:??{quick, brown, jumps, over}??。

接下來,模型將上下文中所有詞的詞向量提取出來,通過求和或平均的方式將這些上下文詞向量合并成一個綜合的上下文向量,然后將這個綜合向量輸入到神經網絡中,網絡會輸出一個概率分布,表示詞匯表中每個詞作為中心詞的可能性。

訓練過程中,模型不斷調整詞向量的參數,使得根據上下文 ??{quick, brown, jumps, over}??? 預測出 ??fox?? 的概率達到最高,通過這種方式,語義相似的詞會在向量空間中聚集在一起。

入門GPT | 詞的向量表示(Word2Vec和Embedding)-AI.x社區

4. Skip-gram (跳字模型)

Skip-gram 的思路和 CBOW 正好相反,它的目標是根據中心詞來預測上下文。

還是用那句話:"the quick brown fox jumps over the lazy dog"。

工作原理:

Skip-gram模型的核心思想是利用中心詞來預測其周圍的上下文詞匯。

具體來說,首先選擇一個中心詞作為輸入,比如 ??fox???,然后定義一個窗口大?。╓indow Size),假設窗口大小為2,那么模型需要預測的上下文就是中心詞前后各2個詞:??{quick, brown, jumps, over}??。

模型將中心詞 ??fox?? 的詞向量輸入到神經網絡中,網絡會為每個可能的上下文位置輸出一個概率分布,分別預測在這些位置上出現各個詞匯的可能性。

訓練過程中,模型不斷調整詞向量的參數,使得根據中心詞 ??fox??? 能夠準確預測出其真實的上下文詞匯 ??{quick, brown, jumps, over}?? 的概率達到最高。

與CBOW不同的是,Skip-gram為每個中心詞-上下文詞對都進行獨立的學習,這使得它能夠更好地處理低頻詞,因為即使是生僻詞也能通過多個上下文位置得到充分的訓練。

入門GPT | 詞的向量表示(Word2Vec和Embedding)-AI.x社區

Word2Vec對整個?然語?處理領域產?了巨?的影響。

后來的許多詞嵌??法,如GloVe和fastText這兩種被?泛應?的詞向量,都受到了Word2Vec的啟發。

如今,Word2Vec已經成為詞嵌?領域的基?。它的出現使得更復雜的NLP任務,如?本分類、情感分析、命名實體識別、機器翻譯等,處理起來更輕松。這主要是因為Word2Vec?成的詞向量能夠捕捉到單詞之間的語義和語法關系。

值得注意的是,Word2Vec本身并不是?個完善的語?模型,盡管CBOW和Skip-Gram模型在訓練過程中學習了單詞之間的關系,但它們并未直接對整個句?的概率分布進?建模。?后來的模型,如基于循環神經?絡、?短期記憶?絡和Transformer的模型,則通過對上下?進?建模,更好地捕捉到了語?結構,從?成為更為強?的語?模型。

本文轉載自??AI取經路??,作者:AI取經路

已于2025-6-18 09:38:28修改
收藏
回復
舉報
回復
相關推薦
国产一区二三区好的| 日韩中文首页| 欧美制服丝袜第一页| 一区二区三区不卡在线| 亚洲精品国产一区二| 欧美亚洲一区二区三区| 日韩一级黄色av| 艳妇乳肉豪妇荡乳xxx| 福利一区二区免费视频| 亚洲一区二区三区小说| 亚洲精品中字| 日韩午夜影院| 国产精品1区2区3区| 国产成人精品一区二区三区| 久久久国产精品黄毛片| 日韩大片在线| 日韩精品在线观看一区| 先锋资源在线视频| 美女久久久久久| 欧美日韩综合视频| 国产成人艳妇aa视频在线 | 欧美大黑帍在线播放| 国产日本在线| 97se亚洲国产综合自在线| 亚洲自拍欧美色图| 91精品国产乱码久久久| 午夜一区在线| 97精品免费视频| 黄色一级视频免费| 最新精品国产| 久久亚洲国产精品成人av秋霞| 非洲一级黄色片| 天海翼精品一区二区三区| 日韩精品资源二区在线| 欧美一级视频在线| 欧美韩国日本| 欧美三级蜜桃2在线观看| 久久久久狠狠高潮亚洲精品| 女厕盗摄一区二区三区| 亚洲 欧美综合在线网络| 国产黄色激情视频| 最新国产在线拍揄自揄视频| 亚洲欧美一区二区在线观看| 伊人色综合影院| 91porn在线观看| 国产精品另类一区| 亚洲一区二区三区精品视频| h视频网站在线观看| 国产日韩视频一区二区三区| 日本成人黄色| 91青青在线视频| 国产精品久线观看视频| 综合网五月天| av免费在线网站| 亚洲最快最全在线视频| 欧美大黑帍在线播放| 98色花堂精品视频在线观看| 大伊人狠狠躁夜夜躁av一区| 国产av人人夜夜澡人人爽| 色香欲www7777综合网| 在线观看www91| 在线观看国产一级片| 免费一区二区三区四区| 日韩一区二区三区av| 日本wwww色| 青青草这里只有精品| 亚洲深夜福利视频| 99久久久无码国产精品不卡| 久久久久午夜电影| 国产69精品99久久久久久宅男| 在线观看黄网站| 青娱乐精品在线视频| 成人av在线天堂| 亚洲精品视频网| 久久综合色婷婷| 亚洲一区精品视频| 国产福利在线免费观看| 欧美性开放视频| 最新天堂中文在线| 国产精品色在线网站| 亚洲欧美国内爽妇网| 国产麻豆视频在线观看| 影音先锋亚洲电影| 国产精品永久免费| 日本黄色不卡视频| 日本一区二区三区国色天香| 精品欧美一区二区久久久伦| 人妻精品久久久久中文| 国产精品久久久久久久久久10秀 | 91视频最新| 日本中文字幕一区二区有码在线| 国产精品亲子乱子伦xxxx裸| 久久精品xxx| 成人在线视频免费看| 精品欧美一区二区在线观看| 免费看污片的网站| 欧美三级免费| 国产精品美女呻吟| 男人天堂网在线视频| 国产精品亲子伦对白| 成人一对一视频| 91精品福利观看| 亚洲精品中文字幕女同| 波多野结衣爱爱视频| 久久夜色精品| 国产高清精品一区二区三区| 一级毛片视频在线观看| 欧美日韩在线免费| 国产人妻精品午夜福利免费| 日本a级不卡| 奇米四色中文综合久久| 精品久久国产视频| 国产精品久久综合| 粉嫩虎白女毛片人体| 99re8这里有精品热视频免费| 色一情一乱一区二区| 色av性av丰满av| 成人午夜视频福利| 91麻豆天美传媒在线| 九色成人搞黄网站| 亚洲奶大毛多的老太婆| 国产第一页在线播放| 国产一区二区三区四| 亚洲狠狠婷婷综合久久久| 欧美私密网站| 亚洲成avwww人| 精品人妻伦九区久久aaa片| 热久久免费视频| 麻豆视频成人| 女厕盗摄一区二区三区| 亚洲高清在线观看| 国产精品成人久久| 盗摄精品av一区二区三区| 99热在线播放| 国产一级在线观看| 欧美日韩中文在线观看| 91视频在线免费| 黄色欧美日韩| 国产99午夜精品一区二区三区| 成人免费网址| 91精品国产福利| 三级影片在线看| 国产精品一区二区在线观看不卡| 国产精品美女在线播放| 精品176极品一区| 色老头一区二区三区| 在线观看亚洲一区二区| 国产精品色一区二区三区| 91n.com在线观看| 国产高清一区二区| 成人网在线观看| 女同视频在线观看| 亚洲国产精品一区二区三区| 国产综合精品视频| 久久九九影视网| 可以看污的网站| 久久久9色精品国产一区二区三区| 91久久嫩草影院一区二区| 18视频在线观看网站| 欧美精品一区二区三区四区| 久久精品视频8| 91影院在线观看| 国内自拍视频网| 亚洲免费二区| 精品国产乱码一区二区三区四区| 深夜福利视频一区二区| 亚洲一区二区国产| 国产丝袜视频在线观看| 亚洲国产精品综合小说图片区| 熟妇高潮精品一区二区三区| 日韩中文字幕av电影| 91麻豆天美传媒在线| 精品亚洲自拍| 国产精品欧美一区二区| caopon在线免费视频| 亚洲国产高清福利视频| 亚洲av无码不卡| 亚洲久草在线视频| 精品无码在线视频| 加勒比av一区二区| 午夜免费福利小电影| 精品久久网站| 不卡一区二区三区视频| 欧美大电影免费观看| 久久精品夜夜夜夜夜久久| 理论片中文字幕| 日本精品视频一区二区三区| 欧美成人国产精品高潮| 久久久www免费人成精品| 免费网站在线观看黄| 国产日韩综合| 国产成人精品免费看在线播放 | 亚洲欧洲综合网| av亚洲精华国产精华精华| 国产三级三级看三级| 日韩天堂av| 国产精品久久成人免费观看| 亚洲v天堂v手机在线| 97在线中文字幕| 成人午夜毛片| 欧洲午夜精品久久久| 欧洲在线视频| www.国产一区| 美女做暖暖视频免费在线观看全部网址91 | 精品人妻少妇嫩草av无码专区| 欧美网站在线观看| 久久成人在线观看| 椎名由奈av一区二区三区| 国产jk精品白丝av在线观看| 国产91高潮流白浆在线麻豆| 久热精品在线播放| 日韩二区三区四区| 97国产精东麻豆人妻电影| 欧美不卡一区| 在线无限看免费粉色视频| 奇米亚洲欧美| 久久国产精品久久精品国产| 8848成人影院| 99re国产在线播放| 二区三区精品| 成人激情黄色网| 国产成人精选| 国产精品电影网站| 成人勉费视频| 情事1991在线| 小视频免费在线观看| 久久久久久久激情视频| av网站免费在线观看| 久久亚洲精品国产亚洲老地址| 91伦理视频在线观看| 国产一区二区欧美日韩| 美州a亚洲一视本频v色道| 亚洲男女性事视频| 免费在线一级视频| 亚洲精品久久久久中文字幕二区| 国产刺激高潮av| 亚洲激情第一页| 人妻夜夜爽天天爽| 欧美精品一区二区三区在线播放 | 在线播放国产精品| 国产片在线观看| 中文字幕av日韩| 中文日本在线观看| 日韩中文理论片| 黄色成人在线| 精品少妇v888av| 91av久久| 日本亚洲欧美成人| 99riav视频一区二区| 91精品久久久久久久久久入口| 亚洲一区二区小说| 女女互磨互喷水高潮les呻吟| 国产在线一区不卡| 成人福利视频在线观看| 国产不卡精品在线| 亚洲自拍另类欧美丝袜| 一区二区中文字幕在线观看| 国产欧美一区二区视频| 婷婷成人在线| 日韩欧美精品久久| 五月开心六月丁香综合色啪| 男同互操gay射视频在线看| 欧美精品日韩| 无码人妻丰满熟妇区96| 久久综合图片| 久久成年人网站| 成人午夜私人影院| 欧美特黄一区二区三区| 国产精品免费av| 久久精品这里有| 日本韩国一区二区三区| 91丨porny丨在线中文 | 国产精品美女网站| 国产视频一区二区在线播放| 国产无套精品一区二区| 激情五月综合网| 美女av免费观看| 国产精品久久久久久久免费软件| 国产精品久久久毛片| 国产成人精品一区二| 国产成人av一区二区三区不卡| 国产精品电影一区二区| 精品少妇爆乳无码av无码专区| 一本色道久久综合狠狠躁的推荐| 91国在线视频| 国产视频亚洲精品| 精品美女在线观看视频在线观看 | 亚洲欧美中文日韩v在线观看| 日本高清中文字幕在线| 国产69精品久久久| 亚洲精品tv| 久久久久一区二区三区| 婷婷中文字幕一区| 黄色高清无遮挡| 成人夜色视频网站在线观看| 久久久精品成人| 午夜精品爽啪视频| 国产精品乱码一区二区| 亚洲精品一区在线观看香蕉| 新版中文在线官网| 国产日韩在线看片| 亚洲系列另类av| 日本精品久久久久久久久久| 美女视频黄免费的久久 | 99久久99久久精品国产片桃花| 337p粉嫩大胆噜噜噜鲁| 丁香六月久久综合狠狠色| 国产精品69久久久久孕妇欧美| 欧美午夜宅男影院在线观看| 精品国产亚洲一区二区麻豆| 日韩小视频网址| 免费成人美女女| 欧美激情专区| 日韩亚洲国产精品| 黄色国产在线视频| 一区二区三区在线视频免费观看| 又色又爽又黄无遮挡的免费视频| 亚洲欧美在线磁力| www成人免费观看| 高清视频一区二区三区| 最新国产精品久久久| 国产女同无遮挡互慰高潮91| 国产精品久久三| 一级α片免费看刺激高潮视频| 亚洲一区二区久久| 高清电影一区| 青青草原成人| 日韩精品亚洲一区| 性欧美精品中出| 色婷婷综合五月| 国内在线精品| 国产极品精品在线观看| 免费成人av| 亚洲成人福利在线观看| 国产欧美精品区一区二区三区| 天天干天天操天天爱| 亚洲欧洲日产国码av系列天堂| 日本乱码一区二区三区不卡| 免费亚洲一区二区| 日韩电影在线观看网站| 欧美丰满老妇熟乱xxxxyyy| 在线亚洲免费视频| 97在线观看免费观看高清| 国产精品日日做人人爱| 欧美gvvideo网站| 亚洲欧美手机在线| 亚洲免费成人av| 二区三区在线视频| 欧美性视频精品| 欧美日韩高清| 潘金莲激情呻吟欲求不满视频| 亚洲免费大片在线观看| 刘玥91精选国产在线观看| 性色av一区二区三区红粉影视| 日韩高清成人在线| 国产xxxxx视频| 中文字幕一区二区三区四区不卡 | 日韩欧美视频在线免费观看| 日韩精品福利网站| 日本在线中文字幕一区二区三区| 一区二区视频在线播放| 国产美女视频一区| 国产一国产二国产三| 亚洲视频日韩精品| 伊人久久一区| 人妻av中文系列| 国产欧美精品区一区二区三区| 91在线视频国产| 国内免费久久久久久久久久久 | 黄色一级大片免费| av爱爱亚洲一区| 中文字幕视频一区二区| 久久夜色精品国产| 欧美做受69| www.久久av.com| 午夜精品视频一区| 中文日本在线观看| 国产偷国产偷亚洲高清97cao| 日韩成人一级大片| 久久视频免费看| 一区二区三区视频免费在线观看| 日韩三级网址| 色一情一乱一伦一区二区三区日本| 自拍偷拍亚洲欧美日韩| 青青久在线视频| 97se国产在线视频| 久色成人在线| 欧美日韩国产精品综合| 亚洲最大中文字幕| 麻豆成人入口| 波多野结衣国产精品| 欧美视频13p| 2024最新电影免费在线观看 | 求av网址在线观看| 久久av一区二区三区亚洲| 久久av资源站| 7799精品视频天天看| 色综合天天狠天天透天天伊人| 成人精品视频| 中文精品在线观看|