精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

入門GPT | 詞袋模型(Bag of Words)輔助提升餐廳滿意度

發布于 2025-1-8 12:58
瀏覽
0收藏

Bag-of-Words 將文本看作由單詞構成的無序集合,通過統計單詞在文本中出現的頻次來表示文本。因此,Bag-of-Words主要用于文本分類、情感分析、信息檢索等自然語言處理任務中

  • 1. 什么是詞袋模型(Bag of Words)
  • 2. 實現 Bag of Words 的步驟

2.1 文本預處理

2.2 構建詞匯表

2.3 向量化文本(詞袋表示)

2.4 通過文本的向量表示,使用余弦相似度分析句子相似度

  • 3. 統計詞頻,通過評論提升餐廳滿意度

在自然語言處理領域,如何將人類語言轉化為機器能夠理解和處理的結構化數據,是解決文本問題的關鍵。

Bag of Words(簡稱 BoW)是一種經典的文本表示方法,憑借其簡單性和易實現性,在文本分析中被廣泛應用。從情感分析到文檔分類,BoW 都扮演著重要角色

1. 什么是詞袋模型(Bag of Words) 

Bag of Words 的核心思想是將文本看作一個“詞袋”,不關注單詞的順序,僅統計每個單詞在文本中出現的頻率。它將一段文本轉化為一個固定長度的向量,其中每個元素代表詞匯表中一個單詞的出現次數。雖然簡單,但 BoW 能有效地將自然語言處理任務轉化為標準的機器學習問題。

入門GPT | 詞袋模型(Bag of Words)輔助提升餐廳滿意度-AI.x社區

BoW 的特點是只關注詞匯的頻率,因此它特別適合于情感分析、文本分類、文檔聚類等任務。然而,BoW 也有一些缺點,比如忽略了單詞之間的順序和上下文語義信息,這會導致對語義敏感的任務(如句子生成)性能不足。盡管如此,其簡單高效的特性使其成為入門自然語言處理的理想方法。

2. 實現 Bag of Words 的步驟 

2.1 文本預處理

文本預處理是實現 BoW 的第一步。原始文本通常包含噪聲,例如標點符號、停用詞和大小寫的混亂。清理文本能夠減少噪聲,提高模型的性能。對于中文,還需要進行分詞,因為中文沒有天然的單詞分隔符。

以下是 Python 實現中文分詞和停用詞去除的代碼:

"""
scikit-learn
"""
import jieba
from sklearn.feature_extraction.text import CountVectorizer
import numpy as np

# 客戶評論
reviews = [
    "食物非常美味,配送速度也很快!",
    "配送太慢了,食物已經涼了。",
    "食物很棒,服務也不錯,就是價格稍貴。",
    "從未見過這么差的服務,食物送得又慢又難吃!",
    "這家餐廳的食物真是太美味了,值得推薦!",
    "雖然配送慢,但食物的味道讓我感到驚喜。",
    "食物美味可口,配送速度也有待提高。",
    "我覺得這道菜非常美味,值得再點一次。",
    "配送速度慢得讓人失望,但食物的味道彌補了這一點。",
    "這道菜的味道真是美味無比,令人回味無窮。",
    "雖然等了很久,但食物的美味讓我覺得值得。",
    "每次來這家店,食物的美味總是讓我驚喜。",
    "配送的速度實在太慢,影響了我的用餐體驗。"
]

# 分詞預處理
# 停用詞列表
stop_words = ["了", "的", "也", "從未", "這么", "但", "就是"]

# 分詞與去停用詞
def preprocess_text(corpus):
    processed_corpus = []
    for text in corpus:
        words = jieba.lcut(text)  # 使用 jieba 分詞
        words = [word for word in words if word notin stop_words]  # 去停用詞
        processed_corpus.append(" ".join(words))  # 拼接成字符串
    return processed_corpus

preprocessed_reviews = preprocess_text(reviews)
print("分詞后的評論:")
print(preprocessed_reviews)

運行這段代碼后,我們會得到預處理后的文本,如下所示:

分詞后的評論:
['食物 非常 美味 , 配送 速度 很快 !', '配送 太慢 , 食物 已經 涼 。', '食物 很棒 , 服務 不錯 , 價格 稍貴 。', '從未見過 差 服務 , 食物 送得 又 慢 又 難吃 !', '這家 餐廳 食物 真是太 美味 , 值得 推薦 !', '雖然 配送 慢 , 食物 味道 讓 我 感到 驚喜 。', '食物 美味可口 , 配送 速度 有待 提高 。', '我 覺得 這 道菜 非常 美味 , 值得 再點 一次 。', '配送 速度慢 得 讓 人 失望 , 食物 味道 彌補 這 一點 。', '這 道菜 味道 真是 美味 無比 , 令人 回味無窮 。', '雖然 等 很 久 , 食物 美味 讓 我 覺得 值得 。', '每次 來 這家 店 , 食物 美味 總是 讓 我 驚喜 。', '配送 速度 實在 太慢 , 影響 我 用餐 體驗 。']

2.2 構建詞匯表

接下來需要構建一個詞匯表,包含所有預處理后的評論中出現的唯一單詞。詞匯表是向量化的基礎,每個單詞會被分配一個固定的索引。

以下是構建詞匯表的代碼:

from sklearn.feature_extraction.text import CountVectorizer

# 構建 BoW 模型
vectorizer = CountVectorizer()
bow_matrix = vectorizer.fit_transform(preprocessed_reviews)

# 輸出詞匯表
print("\n詞匯表:")
print(vectorizer.get_feature_names_out())

結果中,??vectorizer.get_feature_names_out()?? 會輸出詞匯表:

詞匯表:
['一次''一點''不錯''從未見過''令人''價格''體驗''值得''再點''味道''回味無窮''太慢''失望''實在'
'已經''彌補''影響''很快''很棒''總是''驚喜''感到''推薦''提高''無比''有待''服務''每次'
'用餐''真是''真是太''稍貴''美味''美味可口''雖然''覺得''這家''送得''速度''速度慢''道菜''配送'
'難吃''非常''食物''餐廳']

2.3 向量化文本(詞袋表示)

利用構建好的詞匯表,我們可以將每條評論轉化為一個稀疏向量。每個向量的長度等于詞匯表的大小,每個元素代表該詞匯在文本中出現的次數。

以下是生成 BoW 矩陣的代碼:

# 輸出 BoW 矩陣
print("\nBoW 矩陣:")
print(bow_matrix.toarray())

運行結果會生成一個稀疏矩陣,例如:

BoW 矩陣:
[[000000000000000001000000000000001000
0010010110]
 [000000000001001000000000000000000000
0000010010]
 [001001000000000000100000001000010000
0000000010]
 [000100000000000000000000001000000000
0100001010]
 [000000010000000000000010000000101000
1000000011]
 [000000000100000000001100000000000010
0000010010]
 [000000000000000000000001010000000100
0010010010]
 [100000011000000000000000000000001001
0000100100]
 [010000000100100100000000000000000000
0001010010]
 [000010000110000000000000100001001000
0000100000]
 [000000010000000000000000000000001011
0000000010]
 [000000000000000000011000000100001000
1000000010]
 [000000100001010010000000000010000000
0010010000]]

每一行是一個評論的 BoW 向量,每一列對應詞匯表中的一個單詞,元素值為該單詞的出現次數。

2.4 通過文本的向量表示,使用余弦相似度分析句子相似度

余弦相似度是衡量兩個向量之間夾角余弦值的指標,可以用于比較文本的內容相似程度

假設兩個向量為 A 和 B,其余弦相似度定義為:

入門GPT | 詞袋模型(Bag of Words)輔助提升餐廳滿意度-AI.x社區

余弦相似度的值在 [?1,1] 之間:

  • 1 表示兩個向量方向完全一致(文本非常相似)。
  • 0 表示向量正交(無相似性)。
  • -1 表示兩個向量方向完全相反(完全不相似)。

余弦相似度:???人工智能小白到高手:余弦相似度(Cosine Similarity)的簡單理解??

from sklearn.metrics.pairwise import cosine_similarity
# 計算余弦相似度
cos_sim_matrix = cosine_similarity(bow_matrix)
# 熱力圖的繪制
import matplotlib.pyplot as plt
import seaborn as sns

# 設置中文字體
plt.rcParams['font.sans-serif'] = ['SimHei']  # 使用黑體
plt.rcParams['axes.unicode_minus'] = False# 解決負號顯示問題

plt.figure(figsize=(12, 10))
sns.heatmap(cos_sim_matrix, annot=True, cmap='coolwarm', 
            xticklabels=[reviews[i] for i in range(len(reviews))],
            yticklabels=[reviews[i] for i in range(len(reviews))], fmt=".2f", 
            cbar_kws={"shrink": .8})

plt.title("評論之間的余弦相似度熱力圖", fontsize=16)
plt.xlabel("評論", fontsize=14)
plt.ylabel("評論", fontsize=14)

# 調整標簽的字體大小和旋轉角度
plt.xticks(rotation=45, ha='right', fontsize=10)
plt.yticks(rotation=0, fontsize=10)
plt.tight_layout()
plt.show()

矩陣圖中每個單元格表示兩個句子之間的余弦相似度,顏色越深,句子在語義上越相似。

例如,“食物非常美味,配送速度也很快”和“食物美味可口,配送速度也有待提高”交叉處的單元格顏色相對較深,說明它們具有較高的余弦相似度0.50,這意味著它們在語義上較為相似。

入門GPT | 詞袋模型(Bag of Words)輔助提升餐廳滿意度-AI.x社區

通過余弦相似度矩陣,可以進行以下分析:

  • 找出最相似的評論對,例如通過矩陣中非對角線的最大值。
  • 為新評論尋找最相近的現有評論,作為推薦系統的一部分。
  • 根據相似度對評論進行聚類或分類。

3. 統計詞頻,通過評論提升餐廳滿意度 

這些評論混合了正面和負面的反饋,統計矩陣中詞頻最高的詞,可以分析客戶關注的核心問題

# 計算詞頻
word_counts = np.asarray(bow_matrix.sum(axis=0)).flatten()
word_freq = dict(zip(vectorizer.get_feature_names_out(), word_counts))

# 按詞頻排序并輸出前10個詞
sorted_word_freq = sorted(word_freq.items(), key=lambda x: x[1], reverse=True)[:10]

print("\n詞頻最高的前10個詞:")
for word, freq in sorted_word_freq:
    print(f"{word}: {freq}")

通過對生成的 BoW 矩陣計算詞頻,進行分析,我們可以發現一些有趣的現象。

例如,詞匯“美味”、“值得”和“驚喜”在正面評論中出現頻率較高,而“太慢”在負面評論中更常見。這些詞的分布可以幫助我們快速定位客戶滿意和不滿的關鍵點。正面評論中的高頻詞可能表明用戶對食物質量滿意,而負面評論中的詞則表明配送慢是主要問題。

詞頻最高的前10個詞:
食物: 10
美味: 6
配送: 6
值得: 3
味道: 3
速度: 3
太慢: 2
驚喜: 2
服務: 2
雖然: 2

詞袋模型是早期的一種模型,相對簡單,存在兩個主要問題:

第一,它使用高維稀疏向量來表示文本,每個單詞對應詞匯表中的一個維度。這導致模型更適用于高維空間,而且計算效率低。

第二,詞袋模型在表示單詞時忽略了它們在文本中的上下文信息

Bag-of-Words 將文本看作由單詞構成的無序集合,通過統計單詞在文本中出現的頻次來表示文本。因此,Bag-of-Words主要用于文本分類、情感分析、信息檢索等自然語言處理任務中,在需要捕捉詞序信息的任務中表現較差,如機器翻譯和命名實體識別。

本文轉載自 ??AI取經路??,作者: AI取經路

收藏
回復
舉報
回復
相關推薦
开心色怡人综合网站| 一区二区三区在线播放欧美| 国产精品国色综合久久| 久久久精品成人| www.久久99| 亚洲国产va精品久久久不卡综合| 国产中文字幕亚洲| 久久久.www| 九色精品91| 欧美一级黄色大片| 欧美污视频网站| 二区三区在线观看| 97久久综合区小说区图片区| 亚洲一区二区三区四区不卡 | 好看的中文字幕在线播放| 久久综合久久久久88| 国产综合视频在线观看| 日本va欧美va国产激情| 天天久久综合| 亚洲精品视频中文字幕| 日韩av福利在线观看| 日韩成人动漫| 亚洲自拍偷拍九九九| 日韩高清专区| 国产免费一区二区三区最新不卡| 久久中文字幕av| 亚洲国内精品在线| 91网址在线观看精品| 成人开心激情| 天天综合色天天综合色h| 青青草原国产免费| 国产系列在线观看| 久久草av在线| 45www国产精品网站| 一色道久久88加勒比一| 亚洲一区网址| 欧美一区二区三区四区视频| 福利在线一区二区三区| 亚洲综合电影| 欧美日韩精品中文字幕| 国产a级黄色大片| 毛片激情在线观看| 中文字幕中文字幕在线一区| 日本一区高清不卡| 污污网站免费在线观看| 久久免费高清| 2020久久国产精品| 日本黄色片视频| 亚洲私拍自拍| 欧美激情一区二区三区高清视频| 法国伦理少妇愉情| 国产无遮挡裸体免费久久| 日韩免费在线观看| 国产又粗又猛又爽又黄| 自拍网站在线观看| 欧美天天综合色影久久精品| 久久久一本二本三本| 神马午夜精品95| 成人avav影音| 国产一区二区黄色| 天天综合在线视频| 91免费国产在线观看| 就去色蜜桃综合| 亚洲欧洲综合在线| 久久久精品免费免费| 日韩理论片在线观看| 成人高清免费观看mv| 国产精品1区2区3区在线观看| 日本高清久久天堂| 波多野结衣一区二区三区在线| 国产精品v日韩精品v欧美精品网站| 日韩国产欧美精品一区二区三区| www.日本一区| 亚洲精品福利电影| 色94色欧美sute亚洲13| 亚州精品一二三区| 国产一区二区三区免费观看在线| 91久久一区二区| 另类小说色综合| 精品中文字幕一区二区三区| 欧美三级电影网| 亚洲欧美日韩网站| 超碰精品在线| 一本色道久久88综合亚洲精品ⅰ | 一级做a爰片久久| 超碰在线最新| 欧美日韩精品在线视频| 久久久性生活视频| 日韩电影大全网站| 91精品国产91综合久久蜜臀| 亚洲一区二区在线免费| 欧美大片91| 91精品国产综合久久久蜜臀粉嫩| 欧美性猛交xxx乱久交| 国产精品中文| 精品五月天久久| 免费成人深夜夜行网站| 成人系列视频| 久久久欧美精品| 国模私拍一区二区| 国产不卡在线一区| 日本一区高清在线视频| 国产第一页在线视频| 日本精品一区二区三区高清| 一区二区三区四区毛片| 美女久久久久久| 亚洲精品91美女久久久久久久| yjizz视频| 99久久免费精品国产72精品九九| 日韩精品一区二区三区中文不卡 | 色噜噜狠狠狠综合曰曰曰 | 青青国产在线视频| 国产福利精品一区| 亚洲一区在线免费| 不卡av播放| 欧美成人r级一区二区三区| 欧美老女人bb| 成人在线国产| 97avcom| 国产xxxx在线观看| 欧美国产欧美亚州国产日韩mv天天看完整 | 日韩在线欧美在线| 日韩精品视频播放| 国产成人午夜99999| 亚洲精品久久区二区三区蜜桃臀| 日本综合在线| 在线看日韩精品电影| 黄色av网址在线观看| 亚洲欧美综合| 成人做爰www免费看视频网站| 国产黄色免费大片| 国产精品美女一区二区| 国产成人无码av在线播放dvd| 欧美国产日韩电影| 日韩精品在线免费观看| 日韩av在线播| 日本在线播放一区二区三区| 久久99久久精品国产| 97在线观看免费观看高清| 亚洲精品成人悠悠色影视| 污污网站免费观看| 成人午夜av| 91精品久久久久久久久久另类 | 欧美欧美午夜aⅴ在线观看| theav精尽人亡av| 在线亚洲成人| 久久国产精品久久精品国产| 99re6在线精品视频免费播放| 在线一区二区观看| 亚洲综合20p| 天堂美国久久| 人人澡人人澡人人看欧美| 色香蕉在线视频| 综合在线观看色| 九九九九九九九九| 91精品99| 成人免费在线一区二区三区| 天使と恶魔の榨精在线播放| 日韩欧美精品三级| 亚洲精品成人av久久| 日本成人在线不卡视频| 国产在线一区二区三区播放| 免费a级人成a大片在线观看| 欧美人牲a欧美精品| 欧洲猛交xxxx乱大交3| 成人手机在线视频| 成人av一级片| 成人女性视频| 成人av片网址| 日本黄色免费在线| 中文字幕亚洲欧美日韩2019| 国产免费无遮挡| 国产精品色噜噜| а 天堂 在线| 一区二区亚洲| 日韩欧美三级电影| 91九色成人| 91国产美女视频| www.五月激情| 五月天精品一区二区三区| 亚洲国产天堂av| 国内精品国产成人| 六月丁香激情网| 久久视频精品| 国产精品有限公司| 影音成人av| 亚洲欧洲一区二区三区久久| 日本中文字幕免费| 国产嫩草影院久久久久| 丰满人妻一区二区三区53视频| 99久久婷婷国产综合精品电影√| 国产精品高潮呻吟视频| av网站在线免费看推荐| 日韩av在线精品| 国产精品国产精品国产专区| 国产女优一区| 亚洲激情啪啪| 国产成人aa在线观看网站站| 国产成人拍精品视频午夜网站 | 99riav视频一区二区| 久久不射热爱视频精品| 黄色在线网站| 一区av在线播放| 亚洲综合欧美综合| 成人看片黄a免费看在线| 中文字幕第21页| 亚洲先锋成人| 一区不卡字幕| 男人亚洲天堂| 26uuu久久噜噜噜噜| 人妻91麻豆一区二区三区| 欧美三级中文字幕在线观看| 国产精品theporn动漫| 中文字幕一区二区三| 女尊高h男高潮呻吟| 高清不卡一区二区在线| 亚洲精品www.| 日韩国产一区二| 99久久国产综合精品五月天喷水| 国产调教精品| 亚洲影院高清在线| 手机在线免费看av| www.日韩不卡电影av| 欧美理论在线观看| 亚洲国产三级网| 丁香六月天婷婷| 日韩一区二区三区在线视频| 中文字幕+乱码+中文| 自拍偷拍欧美激情| 美女伦理水蜜桃4| 精品亚洲成a人在线观看 | 女人天堂在线| 亚洲国产精品资源| 亚洲国产精品无码久久| 91精品国产91综合久久蜜臀| 亚洲天堂一二三| 欧美在线观看视频一区二区三区| 91麻豆精品久久毛片一级| 久久久噜噜噜久噜久久综合| 国产精品久久AV无码| 日韩电影免费在线观看网站| av免费中文字幕| 久久久青草婷婷精品综合日韩| 午夜久久资源| 成人av资源电影网站| 日产精品一线二线三线芒果| 亚洲日日夜夜| 成人黄色av免费在线观看| 日日夜夜综合| 91天堂在线观看| 欧美午夜在线播放| 99久久精品无码一区二区毛片 | 国产精品亚洲a| 日韩精品第一区| 亚洲国产成人不卡| 久久国产精品亚洲人一区二区三区| 91精品在线播放| 国产精品亚洲欧美日韩一区在线| 亚洲91精品在线观看| 99热99re6国产在线播放| 久久久在线观看| 岛国大片在线观看| 在线观看成人黄色| 久久精品视频观看| 欧美精品aaa| 日本蜜桃在线观看视频| 日韩免费观看高清| 91成人短视频在线观看| 亚洲影院在线看| 欧美电影免费网站| 欧美日韩综合另类| 久久国产精品成人免费观看的软件| 成人在线激情视频| 一区二区三区欧洲区| 国产一区在线观| 91视频亚洲| 粉嫩av四季av绯色av第一区 | 国产精品一区二区三区免费观看 | 99久久99| 欧美日韩123| 在线观看日韩羞羞视频| 国产电影一区二区| av一区二区三区免费| 中文幕av一区二区三区佐山爱| 青青久久av北条麻妃黑人| av今日在线| 国产精品福利网站| 亚洲国产欧美国产第一区| 精品一区二区三区国产| 欧美综合一区| 国产黄色片免费在线观看| 日韩av成人高清| 美女黄色片视频| 成人一区在线看| 毛茸茸free性熟hd| 国产欧美一区二区精品秋霞影院| 中文字幕 自拍| 亚洲蜜臀av乱码久久精品 | 国产精品毛片高清在线完整版| 国产小视频自拍| 亚洲综合一区二区三区| 劲爆欧美第一页| 亚洲影院免费观看| 国产精品欧美综合| 日韩av影视在线| av片在线观看| 国产精品久久久久免费a∨| 亚洲成av人片在线观看www| 日本精品一区| 精品99视频| 999久久久精品视频| 国产一区二区h| 99久久人妻无码精品系列| 亚洲综合色婷婷| 国产一区二区在线视频观看| 精品一区二区电影| 国产九色在线| 91国语精品自产拍在线观看性色 | 国产精品免费网站| 亚洲国产一区二区久久| 欧美动漫一区二区| 好吊日精品视频| 欧美三级在线观看视频| 国产一区美女在线| 亚洲精品国产精品乱码在线观看| 亚洲免费观看高清在线观看| 久久精品偷拍视频| 日韩一区二区三区在线观看 | 东方欧美亚洲色图在线| 久久精品一区二区三区四区五区| 亚洲一二三四久久| 国产男女猛烈无遮挡| 北条麻妃一区二区三区中文字幕| 黄色动漫在线观看| 国产欧美日韩最新| 国产人妖ts一区二区| 97免费视频观看| 丰满岳乱妇一区二区三区| 中文字幕在线有码| 日韩亚洲电影在线| 国产在线观看高清视频| 91国内精品久久| 日韩高清一级| 日日鲁鲁鲁夜夜爽爽狠狠视频97 | 91国偷自产一区二区三区的观看方式| 伊人久久在线| 免费在线国产精品| 久久久久99| 国产一级久久久久毛片精品| 色88888久久久久久影院野外 | 国产成人a视频高清在线观看| 91视频最新| 欧美激情1区2区| 国产视频精品视频| 五月天丁香久久| 黄色大片在线看| 午夜精品久久久久久久99黑人| 日韩制服一区| 伊人天天久久大香线蕉av色| 激情综合五月婷婷| 欧美色图一区二区| 欧美日韩国产综合视频在线观看| 午夜视频在线播放| 国产成人福利网站| 美女av一区| 日韩视频 中文字幕| 成人午夜电影久久影院| 久久夜靖品2区| 亚洲天堂久久av| 国产精品99久久免费| 精品国产av无码一区二区三区| 国内成人自拍视频| 国产乡下妇女做爰| 亚洲一级一级97网| 成人短视频软件网站大全app| 欧美一区三区二区在线观看| 美女爽到高潮91| 免费在线观看黄视频| 精品伊人久久97| 亚洲久草在线| 男女猛烈激情xx00免费视频| 久久夜色精品一区| 久久久久久久黄色片| 亚洲色图国产精品| 亚洲精品影片| 少妇人妻互换不带套| 亚洲日本中文字幕区| 一二三四区在线| 久久久女女女女999久久| 欧美精品一区二区久久| 玩弄japan白嫩少妇hd| 亚洲天堂久久久久久久| 婷婷在线观看视频| 国产精品一区二区三区毛片淫片| 欧美日韩有码| 污网站免费在线| 亚洲成人免费av| 1024免费在线视频| 久久精品二区| 国产伦精品一区二区三区视频青涩|