精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

關(guān)于自然語言處理之One Hot模型

人工智能 自然語言處理
顧名思義,單熱表示從一個零向量開始,如果單詞出現(xiàn)在句子或文檔中,則將向量中的相應條目設(shè)置為 1。

[[421481]]

本文轉(zhuǎn)載自微信公眾號「python與大數(shù)據(jù)分析」,作者 一只小小鳥鳥 。轉(zhuǎn)載本文請聯(lián)系python與大數(shù)據(jù)分析公眾號。

最近工作實在有點忙,前陣子關(guān)于梯度和導數(shù)的事情把人折騰的夠嗆,數(shù)學學不好,搞機器學習和神經(jīng)網(wǎng)絡真是頭疼;想轉(zhuǎn)到應用層面輕松一下,想到了自然語言處理,one hot模型是基礎(chǔ)也是入門,看起來很簡單的一個列表轉(zhuǎn)矩陣、詞典的功能,想著手工實現(xiàn)一下,結(jié)果看了一下CountVectorizer,發(fā)現(xiàn)不是那么回事兒,還是放棄了。

顧名思義,單熱表示從一個零向量開始,如果單詞出現(xiàn)在句子或文檔中,則將向量中的相應條目設(shè)置為 1。

對句子進行標記,忽略標點符號,并將所有的單詞都用小寫字母表示,就會得到一個大小為 8 的詞匯表: {time, fruit, flies, like, a, an, arrow, banana} 。所以,我們可以用一個八維的單熱向量來表示每個單詞。在本書中,我們使用 1[w] 表示標記/單詞 w 的單熱表示。

對于短語、句子或文檔,壓縮的單熱表示僅僅是其組成詞的邏輯或的單熱表示。短語 like a banana 的單熱表示將是一個 3×8 矩陣,其中的列是 8 維的單熱向量。通常還會看到“折疊”或二進制編碼,其中文本/短語由詞匯表長度的向量表示,用 0 和 1 表示單詞的缺失或存在。like a banana 的二進制編碼是: [0,0,0,1,1,0,0,1] 。

  1. from sklearn.feature_extraction.text import CountVectorizer, TfidfVectorizer 
  2. import seaborn as sns 
  3. import matplotlib.pyplot as plt 
  4. import jieba 
  5. import jieba.analyse 
  6.  
  7. # 單熱表示從一個零向量開始,如果單詞出現(xiàn)在句子或文檔中,則將向量中的相應條目設(shè)置為 1。 
  8. # 英文的處理和展示 
  9. corpus = ['Time flies flies like an arrow.''Fruit flies like a banana.'
  10. one_hot_vectorizer = CountVectorizer(binary=True
  11. one_hot = one_hot_vectorizer.fit_transform(corpus).toarray() 
  12. sns.heatmap(one_hot, annot=True, cbar=False, yticklabels=['Sentence 1''Sentence 2']) 
  13. plt.show() 

  1. # 中文的處理和展示 
  2. # 獲取停用詞列表 
  3. def get_stopwords_list(stopwordfile): 
  4.     stopwords = [line.strip() for line in open(stopwordfile, encoding='UTF-8').readlines()] 
  5.     return stopwords 
  6.  
  7. # 移除停用詞 
  8. def movestopwords(sentence): 
  9.     stopwords = get_stopwords_list('stopwords.txt')  # 這里加載停用詞的路徑 
  10.     santi_words = [x for x in sentence if len(x) > 1 and x not in stopwords] 
  11.     return santi_words 
  12.  
  13. # 語料 
  14. corpus = ["小明碩士畢業(yè)于中國科學院計算所,后在日本京都大學深造。"
  15.           "小王本科在清華大學,后在南京計算所工作和深造,后在日本早稻田大學深造"
  16.           "小李本科在清華大學,碩士畢業(yè)于中國科學院計算所,博士在南京大學"
  17. newcorpus = [] 
  18. for str in corpus: 
  19.     orgwordlist = jieba.lcut(str)  # jieba分詞 
  20.     wordlist = movestopwords(orgwordlist)  # 移除停用詞 
  21.     newword = " ".join(wordlist)  # 按照語料庫要求進行空格分隔 
  22.     newcorpus.append(newword)  # 按照語料庫要求轉(zhuǎn)換成列表 
  23. # newcorpus 
  24. # ['小明 碩士 畢業(yè) 中國科學院 計算所 日本京都大學 深造'
  25. '小王 本科 清華大學 南京 計算所 工作 深造 日本早稻田大學 深造'
  26. '小李 本科 清華大學 碩士 畢業(yè) 中國科學院 計算所 博士 南京大學'
  27. one_hot_vectorizer = CountVectorizer(binary=True)  # 創(chuàng)建詞袋數(shù)據(jù)結(jié)構(gòu) 
  28. one_hot = one_hot_vectorizer.fit_transform(newcorpus).toarray()  # 轉(zhuǎn)換語料,并矩陣化 
  29. # 下面為熱詞的輸出結(jié)果 
  30. # one_hot_vectorizer.vocabulary_ 
  31. # {'小明': 4, '碩士': 14, '畢業(yè)': 11, '中國科學院': 0, '計算所': 15, '日本京都大學': 8, '深造': 12, '小王': 6, '本科': 10, '清華大學': 13, '南京': 1, '工作': 7, '日本早稻田大學': 9, '小李': 5, '博士': 3, '南京大學': 2} 
  32. # one_hot_vectorizer.get_feature_names() 
  33. # ['中國科學院''南京''南京大學''博士''小明''小李''小王''工作''日本京都大學''日本早稻田大學''本科''畢業(yè)''深造''清華大學''碩士''計算所'
  34. # one_hot 
  35. # [[1 0 0 0 1 0 0 0 1 0 0 1 1 0 1 1] 
  36. #  [0 1 0 0 0 0 1 1 0 1 1 0 1 1 0 1] 
  37. #  [1 0 1 1 0 1 0 0 0 0 1 1 0 1 1 1]] 
  38. sns.set_style({'font.sans-serif': ['SimHei''Arial']}) 
  39. sns.heatmap(one_hot, annot=True, cbar=False, xticklabels=one_hot_vectorizer.get_feature_names(), 
  40.             yticklabels=['語句1''語句2''語句3']) 
  41. plt.show() 

IDF 表示懲罰常見的符號,并獎勵向量表示中的罕見符號。符號 w 的 IDF(w) 對語料庫的定義為其中 n[w] 是包含單詞 w 的文檔數(shù)量, N 是文檔總數(shù)。TF-IDF 分數(shù)就是 TF(w) * IDF(w) 的乘積。首先,請注意在所有文檔(例如, n[w] = N ), IDF(w) 為 0, TF-IDF 得分為 0,完全懲罰了這一項。其次,如果一個術(shù)語很少出現(xiàn)(可能只出現(xiàn)在一個文檔中),那么 IDF 就是 log n 的最大值

  1. tfidf_vectorizer = TfidfVectorizer()  # 創(chuàng)建詞袋數(shù)據(jù)結(jié)構(gòu) 
  2. tfidf = tfidf_vectorizer.fit_transform(newcorpus).toarray()  # 轉(zhuǎn)換語料,并矩陣化 
  3. # 下面為熱詞的輸出結(jié)果 
  4. # tfidf_vectorizer.vocabulary_ 
  5. '小明': 4, '碩士': 14, '畢業(yè)': 11, '中國科學院': 0, '計算所': 15, '日本京都大學': 8, '深造': 12, '小王': 6, '本科': 10, '清華大學': 13, '南京': 1, '工作': 7, '日本早稻田大學': 9, '小李': 5, '博士': 3, '南京大學': 2} 
  6. # tfidf_vectorizer.get_feature_names() 
  7. # ['中國科學院''南京''南京大學''博士''小明''小李''小王''工作''日本京都大學''日本早稻田大學''本科''畢業(yè)''深造''清華大學''碩士''計算所'
  8. # tfidf 
  9. # [[0.35221512 0.         0.         0.         0.46312056 0.  0.         0.         0.46312056 0.         0.        0.35221512  0.35221512 0.         0.35221512 0.27352646] 
  10. #  [0.         0.35761701 0.         0.         0.         0.  0.35761701 0.35761701 0.         0.35761701 0.27197695 0.  0.54395391 0.27197695 0.         0.21121437] 
  11. #  [0.30443385 0.         0.40029393 0.40029393 0.         0.40029393  0.         0.         0.         0.         0.30443385 0.30443385  0.         0.30443385 0.30443385 0.23642005]] 
  12. sns.heatmap(tfidf, annot=True, cbar=False, xticklabels=tfidf_vectorizer.get_feature_names(), 
  13.             yticklabels=['語句1''語句2''語句3'], vmin=0, vmax=1, cm 

 

責任編輯:武曉燕 來源: python與大數(shù)據(jù)分析
相關(guān)推薦

2021-05-18 07:15:37

Python

2021-05-13 07:17:13

Snownlp自然語言處理庫

2018-02-27 09:32:13

神經(jīng)網(wǎng)絡自然語言初探

2022-04-22 09:00:00

自然語言處理HMMCRF

2022-04-11 09:30:00

自然語言HMM深度學習

2020-04-24 10:53:08

自然語言處理NLP是人工智能

2024-02-05 14:18:07

自然語言處理

2021-05-17 09:00:00

自然語言人工智能技術(shù)

2017-10-19 17:05:58

深度學習自然語言

2023-08-07 08:41:45

自然語言模型因果推理

2024-04-24 11:38:46

語言模型NLP人工智能

2025-05-28 01:50:00

2021-06-28 10:10:42

人工智能AI自然語言

2017-04-17 15:03:16

Python自然語言處理

2020-02-25 12:00:53

自然語言開源工具

2021-11-12 15:43:10

Python自然語言數(shù)據(jù)

2023-05-30 14:39:34

ChatGPT-4NLP

2017-05-05 15:34:49

自然語言處理

2020-02-25 23:28:50

工具代碼開發(fā)

2023-08-04 10:18:15

點贊
收藏

51CTO技術(shù)棧公眾號

伊人在线视频| 手机av免费观看| 无码国模国产在线观看| 亚瑟在线精品视频| 日韩三级电影网站| 国产sm主人调教女m视频| 亚洲作爱视频| 日韩在线中文字幕| 国产极品一区二区| 亚洲我射av| 精品久久久一区二区| 亚洲一区二区三区涩| 好男人www在线视频| 日韩精品每日更新| 久久久久久久国产| 精品手机在线视频| 欧美激情极品| 91精选在线观看| 日韩免费毛片视频| 羞羞的网站在线观看| 久久精品日产第一区二区三区高清版| 91网在线免费观看| 一级一级黄色片| 亚洲高清成人| 最近更新的2019中文字幕| 日本不卡视频一区| 精品国产一级| 欧美性受xxxx黑人xyx性爽| www.射射射| 午夜国产福利在线| 久久九九影视网| 国产亚洲二区| 亚洲精品成av人片天堂无码 | 亚洲欧美一区二区三区久久 | 99在线观看视频网站| 欧美在线观看不卡| 悠悠资源网久久精品| 久久天天躁狠狠躁夜夜躁2014| 亚洲午夜久久久久久久久红桃| 成人黄色av网址| 日韩一区二区三区免费看 | 国产91精品在线观看| 国产精品午夜国产小视频| 一级黄色免费网站| 亚洲黄色av| 欧美激情中文网| 欧美色图亚洲视频| 中文无码久久精品| 精品国产欧美一区二区五十路| 国产又粗又猛又爽又黄av| 亚洲理论电影| 日韩国产中文字幕| 欧美做受喷浆在线观看| 国产精品极品| 亚洲护士老师的毛茸茸最新章节| 欧美人与性动交α欧美精品| 精品三级久久久| 5858s免费视频成人| 制服丝袜中文字幕第一页| 欧美一区二区三区婷婷| 欧美三级视频在线观看| 黄色手机在线视频| 美女久久久久久| 欧美日韩高清影院| 91香蕉视频在线观看视频| 国产日本亚洲| 欧美va日韩va| 波多野结衣一二三区| 欧美人妖在线观看| 亚洲视频国产视频| 国产精品情侣呻吟对白视频| 久久资源中文字幕| 欧美大胆a视频| 久久婷婷综合国产| 国产精品三上| 国产精品久久久亚洲| 国产精品久久久久毛片| 国产一区999| 国产日韩欧美一区二区| 免费黄色在线视频网站| 国产欧美日韩在线看| 中文视频一区视频二区视频三区| 欧美成人hd| 亚洲v精品v日韩v欧美v专区| 成人观看免费完整观看| 99视频这里有精品| 亚洲成人av在线播放| 欧美一级黄色片| 内射国产内射夫妻免费频道| 日韩精品99| 777欧美精品| 无码人妻精品一区二区三区99不卡| 日韩aaa久久蜜桃av| 亚洲天堂男人的天堂| 99自拍视频在线| 99精品福利视频| 国产免费一区视频观看免费| 午夜久久久久久久久久| 久久久精品tv| 日韩中文字幕亚洲精品欧美| 欧美粗大gay| 欧美一区二区三区精品| 爱爱的免费视频| 天天影视欧美综合在线观看| 国内精品视频久久| 一本色道久久综合无码人妻| 成人中文字幕电影| 亚洲一区二区在| 182在线视频观看| 欧美色老头old∨ideo| 国产在线不卡av| 国产精品久久久乱弄 | 久久99国内精品| 国产亚洲欧美另类一区二区三区| 成人影院免费观看| 午夜精品免费在线观看| 不卡的在线视频| 亚洲精品进入| 久久免费精品日本久久中文字幕| 中文有码在线播放| 91蝌蚪国产九色| 欧美中文字幕在线观看视频| 国产精品99| 亚洲欧美日韩一区二区三区在线| 国产一级黄色av| 精品亚洲成a人| 日韩在线三区| 欧美电影免费观看高清完整| 亚洲国产天堂久久综合网| 91香蕉视频在线播放| 日本成人超碰在线观看| 久久精品国产第一区二区三区最新章节 | 欧美极品视频在线观看| 美女在线视频一区| 日韩一区二区电影在线观看| 成人爽a毛片免费啪啪| 亚洲国产精品悠悠久久琪琪 | 国产精品毛片一区二区三区四区| 亚洲成av人综合在线观看| 人妻精品久久久久中文字幕69| 婷婷综合久久| 91精品国产综合久久香蕉| porn亚洲| 欧美亚洲图片小说| 免费看的黄色网| 日本特黄久久久高潮| 色吧亚洲视频| 欧美成人一二区| 色妞久久福利网| 一区二区日韩在线观看| 国产精品二三区| 亚洲国内精品在线| 四虎国产精品永久免费观看视频| 久久国产成人午夜av影院宅| 91精品国产综合久久香蕉最新版 | 精品久久久久久久无码 | 国产成人在线视频播放| 久久久久亚洲av无码专区喷水| 欧美一级做a| 久久综合久久八八| 精品黑人一区二区三区在线观看| 亚洲精品久久久久久国产精华液| 欧美xxxx黑人| 亚洲黄色在线| 国产区一区二区| 国模冰冰炮一区二区| 亚洲图片欧美午夜| 最近中文字幕免费观看| 亚洲欧美综合色| 免费欧美一级片| 亚洲精品影院在线观看| 美国av一区二区三区| 韩国精品主播一区二区在线观看 | 九色一区二区| 亚洲国产尤物| 久久手机精品视频| 可以免费看毛片的网站| 日本乱人伦aⅴ精品| 成年人免费视频播放| 国产一区在线看| 青草视频在线观看视频| 亚洲a级精品| 国产日韩av高清| 日本在线视频网址| 亚洲欧美激情一区| 国产精品欧美亚洲| 午夜久久久影院| 亚洲天堂精品一区| 处破女av一区二区| 91人人澡人人爽人人精品| 欧美不卡一区| 日韩国产欧美一区| 欧美h版在线观看| 欧美在线激情网| а√天堂8资源在线官网| 亚洲国产小视频在线观看| 中文无码av一区二区三区| 亚洲一区二区视频在线| 亚洲女优在线观看| 丁香天五香天堂综合| 最近中文字幕一区二区| 亚洲激情精品| 中日韩在线视频| 伊人精品一区| 粉嫩av四季av绯色av第一区| 电影亚洲精品噜噜在线观看| 欧美大胆a视频| 福利小视频在线观看| 日韩视频一区二区三区在线播放| 成年人视频免费| 亚洲午夜激情网页| 色老板免费视频| 久久精品亚洲一区二区三区浴池| 久久久久无码精品| 美女网站在线免费欧美精品| 每日在线观看av| 久久久久久美女精品| 蜜桃免费一区二区三区| xxxx日韩| 114国产精品久久免费观看| av有声小说一区二区三区| 97精品一区二区视频在线观看| 二区在线播放| 中文欧美在线视频| 黄色美女网站在线观看| 亚洲国产精品女人久久久| 草逼视频免费看| 欧美久久久久中文字幕| 中文有码在线播放| 在线欧美日韩国产| 东京热一区二区三区四区| 亚洲国产欧美日韩另类综合| 91久久国产综合| 国产精品乱人伦| 中文字幕伦理片| 国产性天天综合网| 精品人妻互换一区二区三区| 99麻豆久久久国产精品免费| 中文字幕乱码在线人视频| 国产麻豆精品一区二区| 国产大片一区二区三区| 国模娜娜一区二区三区| 青青草原国产在线视频| 奇米精品一区二区三区在线观看 | 国产在线成人精品午夜| 亚洲女子a中天字幕| 天天操天天操天天操天天操天天操| 国产精品久久网站| 日韩欧美在线视频播放| 国产精品久久久久久久第一福利| 国产精品美女高潮无套| 欧美激情一区二区| www.97视频| 亚洲精品视频在线看| 青春草免费视频| 亚洲综合色在线| 久草视频精品在线| 欧美日韩国产中字| 潘金莲一级淫片aaaaaa播放| 日本乱码高清不卡字幕| 中文字幕二区三区| 欧美一区二区三区四区久久| www.天天干.com| 亚洲精品久久久久久下一站| 日本免费不卡| 永久免费精品影视网站| 日本免费视频在线观看| 欧美大片免费观看| 天堂av在线网| 国产精品入口免费视| 国产精久久一区二区| ts人妖另类在线| 欧美久久精品| 亚洲v日韩v欧美v综合| 国产精品久久久久久久免费观看| 国产黄色激情视频| 欧美亚洲三级| 污污的视频免费观看| 福利电影一区二区| 少妇按摩一区二区三区| 中文字幕一区在线观看视频| 欧美片一区二区| 欧美日韩亚洲成人| 夜夜嗨aⅴ一区二区三区| 精品欧美久久久| 国产粉嫩一区二区三区在线观看| 久久精品久久久久久国产 免费| 牛牛精品视频在线| 国产精品18久久久久久麻辣| 欧美国产亚洲精品| 欧美在线3区| 欧美fxxxxxx另类| 亚洲色图38p| 国产成人免费在线| 精品亚洲aⅴ无码一区二区三区| 一区二区三区免费在线观看| 精品免费囯产一区二区三区| 91.com视频| 精品福利视频导航大全| 欧美xxxx做受欧美| 黑人巨大精品欧美一区二区桃花岛| 91视频8mav| 成人精品影院| 奇米影视亚洲色图| 久久99热这里只有精品| 国产麻豆天美果冻无码视频| 亚洲婷婷在线视频| 天天操天天干天天摸| 亚洲福利在线看| 顶级网黄在线播放| 国产精品美女久久久免费| 岛国精品一区| 91视频成人免费| 麻豆91小视频| 亚洲熟妇无码av| 亚洲综合激情网| 国产精品国产三级国产aⅴ| 日韩激情视频在线| 男女视频在线| 91精品在线国产| 99国产精品免费视频观看| 可以免费观看av毛片| 97精品久久久久中文字幕| 久草免费新视频| 91精品国产入口在线| 调教视频免费在线观看| 日韩免费黄色av| 天天久久夜夜| 国产午夜大地久久| 成人免费电影视频| 国产亚洲第一页| 日韩三级视频在线看| 老司机在线看片网av| 国产精品丝袜一区二区三区| 国产亚洲一区二区三区不卡| 国产男女无遮挡| 99精品欧美一区二区三区综合在线| 久久老司机精品视频| 欧美xfplay| 久久亚洲导航| 国产精品亚洲综合| 影音国产精品| 日韩Av无码精品| 亚洲成人av电影在线| 免费国产精品视频| 久久久这里只有精品视频| 另类图片第一页| 国产特级黄色大片| 久久亚洲综合av| 波多野结衣一本一道| 中文字幕日韩欧美| 欧美xxxx网站| 青青草影院在线观看| 国产91精品露脸国语对白| 久久午夜无码鲁丝片| 亚洲国产欧美一区| 亚洲wwww| 日韩欧美在线一区二区| 精品制服美女久久| 波多野结衣爱爱视频| 精品国产91洋老外米糕| 1区2区3区在线| 欧美精品久久久| 蜜臀国产一区二区三区在线播放 | 天堂在线中文字幕| 国产97色在线|日韩| 成人影院在线| 色姑娘综合天天| 午夜激情综合网| 你懂的视频在线免费| 国产精品久久久| 希岛爱理av一区二区三区| 能看毛片的网站| 欧美日韩一区二区在线| 国产高清一级毛片在线不卡| 国产欧美精品一区二区三区-老狼| 911久久香蕉国产线看观看| 亚洲av午夜精品一区二区三区| 欧美日韩国产综合新一区 | 国产欧美日韩一区二区三区在线观看| 中文字幕乱码视频| 九九热99久久久国产盗摄| 女同一区二区三区| 日本 片 成人 在线| 亚洲网友自拍偷拍| 国产视频第一区| 91在线国产电影| 亚洲影院一区| 中日韩一级黄色片| 亚洲精品丝袜日韩| 亚洲精品三区| 欧美女人性生活视频| 最新日韩av在线| 邻居大乳一区二区三区| 成人福利免费观看| 亚洲一区二区三区免费在线观看| 亚洲熟女少妇一区二区| 亚洲精品在线三区| 日韩国产91| 黄在线观看网站|