精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

在少樣本學習中,用SetFit進行文本分類

譯文 精選
人工智能
在本文中,我將向您介紹“少樣本(Few-shot)學習”的相關概念,并重點討論被廣泛應用于文本分類的SetFit方法。

譯者 | 陳峻

審校 | 重樓

在本文中,我將向您介紹“少樣本(Few-shot)學習”的相關概念,并重點討論被廣泛應用于文本分類的SetFit方法。

傳統的機器學習(ML)

在監督(Supervised)機器學習中,大量數據集被用于模型訓練,以便磨練模型能夠做出精確預測的能力。在完成訓練過程之后,我們便可以利用測試數據,來獲得模型的預測結果。然而,這種傳統的監督學習方法存在著一個顯著缺點:它需要大量無差錯的訓練數據集。但是并非所有領域都能夠提供此類無差錯數據集。因此,“少樣本學習”的概念應運而生。

在深入研究Sentence Transformer fine-tuningSetFit)之前,我們有必要簡要地回顧一下自然語言處理(Natural Language Processing,NLP)的一個重要方面,也就是:“少樣本學習”。

少樣本學習

少樣本學習是指:使用有限的訓練數據集,來訓練模型。模型可以從這些被稱為支持集的小集合中獲取知識。此類學習旨在教會少樣本模型,辨別出訓練數據中的相同與相異之處。例如,我們并非要指示模型將所給圖像分類為貓或狗,而是指示它掌握各種動物之間的共性和區別。可見,這種方法側重于理解輸入數據中的相似點和不同點。因此,它通常也被稱為元學習(meta-learning)、或是從學習到學習(learning-to-learn)。

值得一提的是,少樣本學習的支持集,也被稱為k向(k-way)n樣本(n-shot)學習。其中“k”代表支持集里的類別數。例如,在二分類(binary classification)中,k 等于 2。而“n”表示支持集中每個類別的可用樣本數。例如,如果正分類有10個數據點,而負分類也有10個數據點,那么 n就等于10??傊?,這個支持集可以被描述為雙向10樣本學習。

既然我們已經對少樣本學習有了基本的了解,下面讓我們通過使用SetFit進行快速學習,并在實際應用中對電商數據集進行文本分類。

SetFit架構

Hugging Face和英特爾實驗室的團隊聯合開發的SetFit,是一款用于少樣本照片分類的開源工具。你可以在項目庫鏈接--https://github.com/huggingface/setfit?ref=hackernoon.com中,找到關于SetFit的全面信息。

就輸出而言,SetFit僅用到了客戶評論(Customer Reviews,CR)情感分析數據集里、每個類別的八個標注示例。其結果就能夠與由三千個示例組成的完整訓練集上,經調優的RoBERTa Large的結果相同。值得強調的是,就體積而言,經微優的RoBERTa模型比SetFit模型大三倍。下圖展示的是SetFit架構:

圖片來源:https://www.sbert.net/docs/training/overview.html?ref=hackernoon.com

SetFit實現快速學習

SetFit的訓練速度非常快,效率也極高。與GPT-3T-FEW等大模型相比,其性能極具競爭力。請參見下圖:

SetFit與T-Few 3B模型的比較SetFit與T-Few 3B模型的比較

如下圖所示,SetFit在少樣本學習方面的表現優于RoBERTa。

SetFit與RoBERT的比較,圖片來源:https://huggingface.co/blog/setfit?ref=hackernoon.com

數據集

下面,我們將用到由四個不同類別組成的獨特電商數據集,它們分別是:書籍、服裝與配件、電子產品、以及家居用品。該數據集的主要目的是將來自電商網站的產品描述歸類到指定的標簽下。

為了便于采用少樣本的訓練方法,我們將從四個類別中各選擇八個樣本,從而得到總共32個訓練樣本。而其余樣本則將留作測試之用。簡言之,我們在此使用的支持集是48樣本學習。下圖展示的是自定義電商數據集的示例:

自定義電商數據集樣本自定義電商數據集樣本

我們采用名為“all-mpnet-base-v2”的Sentence Transformers預訓練模型,將文本數據轉換為各種向量嵌入。該模型可以為輸入文本,生成維度為768的向量嵌入。

如下命令所示,我們將通過在conda環境(是一個開源的軟件包管理系統和環境管理系統)中安裝所需的軟件包,來開始SetFit的實施。

!pip3 install SetFit 
!pip3 install sklearn 
!pip3 install transformers 
!pip3 install sentence-transformers

安裝完軟件包后,我們便可以通過如下代碼加載數據集了。

from datasets import load_dataset
dataset = load_dataset('csv', data_files={
"train": 'E_Commerce_Dataset_Train.csv',
"test": 'E_Commerce_Dataset_Test.csv'
})

我們來參照下圖,看看訓練樣本和測試樣本數。

訓練和測試數據訓練和測試數據

我們使用sklearn軟件包中的LabelEncoder,將文本標簽轉換為編碼標簽。

from sklearn.preprocessing import LabelEncoder 
le = LabelEncoder()

通過LabelEncoder,我們將對訓練和測試數據集進行編碼,并將編碼后的標簽添加到數據集的“標簽”列中。請參見如下代碼:

Encoded_Product = le.fit_transform(dataset["train"]['Label']) 
dataset["train"] = dataset["train"].remove_columns("Label").add_column("Label", Encoded_Product).cast(dataset["train"].features)
Encoded_Product = le.fit_transform(dataset["test"]['Label']) 
dataset["test"] = dataset["test"].remove_columns("Label").add_column("Label", Encoded_Product).cast(dataset["test"].features)

下面,我們將初始化SetFit模型和句子轉換器(sentence-transformers)模型。

from setfit import SetFitModel, SetFitTrainer 
from sentence_transformers.losses import CosineSimilarityLoss
model_id = "sentence-transformers/all-mpnet-base-v2" 
model = SetFitModel.from_pretrained(model_id)
trainer = SetFitTrainer( 
 model=model,
 train_dataset=dataset["train"],
 eval_dataset=dataset["test"],
 loss_class=CosineSimilarityLoss,
 metric="accuracy",
 batch_size=64,
 num_iteratinotallow=20,
 num_epochs=2,
 column_mapping={"Text": "text", "Label": "label"}
)

初始化完成兩個模型后,我們現在便可以調用訓練程序了。

trainer.train()

在完成了2個訓練輪數(epoch)后,我們將在eval_dataset上,對訓練好的模型進行評估。

trainer.evaluate()

經測試,我們的訓練模型的最高準確率為87.5%。雖然87.5%的準確率并不算高,但是畢竟我們的模型只用了32個樣本進行訓練。也就是說,考慮到數據集規模的有限性,在測試數據集上取得87.5%的準確率,實際上是相當可觀的。

此外,SetFit還能夠將訓練好的模型,保存到本地存儲器中,以便后續從磁盤加載,用于將來的預測。

trainer.model._save_pretrained(save_directory="SetFit_ECommerce_Output/")
model=SetFitModel.from_pretrained("SetFit_ECommerce_Output/", local_files_notallow=True)

如下代碼展示了根據新的數據進行的預測結果:

input = ["Campus Sutra Men's Sports Jersey T-Shirt Cool-Gear: Our Proprietary Moisture Management technology. Helps to absorb and evaporate sweat quickly. Keeps you Cool & Dry. Ultra-Fresh: Fabrics treated with Ultra-Fresh Antimicrobial Technology. Ultra-Fresh is a trademark of (TRA) Inc, Ontario, Canada. Keeps you odour free."]
output = model(input)

可見,其預測輸出為1,而標簽的LabelEncoded值為“服裝與配件”。由于傳統的AI模型需要大量的訓練資源(包括時間和數據),才能有穩定水準的輸出。而我們的模型與之相比,既準確又高效。

至此,相信您已經基本掌握了“少樣本學習”的概念,以及如何使用SetFit來進行文本分類等應用。當然,為了獲得更深刻的理解,我強烈建議您選擇一個實際場景,創建一個數據集,編寫對應的代碼,并將該過程延展到零樣本學習、以及單樣本學習上。

譯者介紹

陳峻(Julian Chen),51CTO社區編輯,具有十多年的IT項目實施經驗,善于對內外部資源與風險實施管控,專注傳播網絡與信息安全知識與經驗。

原文標題:Mastering Few-Shot Learning with SetFit for Text Classification,作者:Shyam Ganesh S)


責任編輯:華軒 來源: 51CTO
相關推薦

2024-10-30 16:59:57

Python機器學習

2020-12-31 05:37:05

HiveUDFSQL

2022-10-09 08:00:00

機器學習文本分類算法

2020-09-25 09:58:37

谷歌Android開發者

2022-10-30 15:00:40

小樣本學習數據集機器學習

2021-12-26 22:57:57

Java開發深度學習

2017-04-13 09:18:02

深度學習文本分類

2023-03-13 14:41:22

機器學習算法

2017-08-04 14:23:04

機器學習神經網絡TensorFlow

2023-11-13 18:37:44

2018-03-27 13:33:48

百度

2021-08-30 07:57:26

OpenAttack文本對抗攻擊

2018-04-09 10:20:32

深度學習

2020-03-23 08:00:00

開源數據集文本分類

2024-09-29 09:32:58

2023-06-11 17:00:06

2016-11-16 15:05:42

情感分析

2020-10-10 12:53:57

邏輯回歸機器學習分析

2017-08-25 14:23:44

TensorFlow神經網絡文本分類

2024-12-20 16:00:00

Python文本分類聚類
點贊
收藏

51CTO技術棧公眾號

最好看的2019的中文字幕视频| 国产三级精品三级在线专区| 欧美国产激情18| 久久久老熟女一区二区三区91| 色老头在线一区二区三区| 国产午夜精品一区二区三区视频 | 欧美18视频| 中文字幕观看视频| 国产精品扒开腿做爽爽爽软件| 51国偷自产一区二区三区的来源| 丰满少妇一区二区三区专区| 成人bbav| 欧美国产乱子伦| 成人黄色片视频网站| 中文字幕黄色片| 91九色精品| 亚洲欧美国产日韩天堂区| 最新免费av网址| 在线中文字幕播放| 亚洲欧美国产三级| 裸模一区二区三区免费| 国产模特av私拍大尺度| 久久人人精品| 欧美不卡视频一区发布| 欧美福利第一页| 国产精品乱战久久久| 欧美日韩五月天| 成年人观看网站| 免费在线观看av电影| 中文字幕精品综合| 欧美深深色噜噜狠狠yyy| 丰满人妻一区二区三区无码av| 免费人成在线不卡| 国产97色在线| 二区视频在线观看| 亚洲激情综合| 久久久久久久久久久成人| 天天干天天操天天拍| 你懂的视频欧美| 亚洲国产天堂久久综合| 一级全黄裸体片| 精品国产麻豆| 欧美剧在线免费观看网站| 91淫黄看大片| 欧美aa视频| 欧美香蕉大胸在线视频观看| 777久久精品一区二区三区无码 | 97久久精品人人澡人人爽| 国产精品裸体一区二区三区| www.超碰在线.com| 国产福利视频一区二区三区| 亚洲一区二区三区xxx视频| 888奇米影视| 极品少妇一区二区三区精品视频| 国产精品视频播放| 亚洲天堂中文在线| 狠狠色丁香婷婷综合| 91精品国产自产在线老师啪 | 日韩精品人妻中文字幕有码| 亚洲天堂网av在线| 精品视频97| 亚洲香蕉成人av网站在线观看| 人人妻人人藻人人爽欧美一区| 亚瑟一区二区三区四区| 亚洲美女www午夜| 色一情一交一乱一区二区三区| 国产日产一区| 日韩视频中文字幕| 国产午夜手机精彩视频| 欧美精品啪啪| 91av在线播放视频| 最新中文字幕在线观看视频| 精品中文av资源站在线观看| 91中文在线视频| 亚洲精品97久久中文字幕无码 | 亚洲一区二区三区在线视频 | 国产高清成人在线| 国产日韩欧美亚洲一区| 欧美女v视频| 国产精品福利在线播放| www国产免费| 热色播在线视频| 欧美性猛片aaaaaaa做受| 性生活免费在线观看| 一区二区三区四区高清视频 | 欧美极品一区| 麻豆av在线导航| 亚洲成人自拍一区| 国产精品乱码久久久久| 国产一区二区三区| 日韩电影中文字幕在线观看| 国产福利在线导航| 亚洲第一黄网| 国产精品夜间视频香蕉| 亚洲精华国产精华精华液网站| 久久久国际精品| 狠狠精品干练久久久无码中文字幕 | 久久久91精品国产一区不卡| 亚洲人体一区| 一级少妇精品久久久久久久| 欧美人与动xxxxz0oz| 中文字幕不卡在线视频极品| 欧美高清视频一区二区三区| 久久午夜影视| 成人免费91在线看| 国产免费av高清在线| 夜夜揉揉日日人人青青一国产精品| 波多野结衣50连登视频| 久久精品一级| 国产一区二区三区在线免费观看| 久久久久亚洲AV成人| 天堂av在线一区| 超碰97在线资源| 在线视频二区| 欧美色播在线播放| 女女调教被c哭捆绑喷水百合| 国产亚洲一卡2卡3卡4卡新区 | 麻豆成人免费视频| 国产69精品久久久久毛片| 亚洲 日韩 国产第一区| 国产美女高潮在线观看| 欧美一二区视频| 成年人视频软件| 久久久亚洲人| 国产精品久久久久久免费观看| 日韩精品黄色| 色综合久久久网| 欧美日韩人妻精品一区在线| 亚洲国产一成人久久精品| 国产精品久久久久999| 四虎永久在线精品免费网址| 亚洲精品中文字幕在线观看| 伊人影院综合在线| 国产精品嫩模av在线| 91精品国产91久久久久久久久 | 亚洲色图13p| 男女视频免费看| 成人免费福利片| wwwwww欧美| 亚洲超碰在线观看| 超在线视频97| 国产aⅴ爽av久久久久成人| 国产一区二区在线| 亚洲欧美在线高清| 怡红院av亚洲一区二区三区h| 日韩精品免费视频一区二区三区 | 视频精品一区二区| 免费毛片一区二区三区久久久| ririsao久久精品一区| 精品乱码亚洲一区二区不卡| 中文字幕影音先锋| 国产成人自拍网| 欧美成人精品免费| 国产精品任我爽爆在线播放| 久久久久久av| 亚洲av毛片成人精品| 欧美日韩亚洲视频一区| mm131美女视频| 日韩va欧美va亚洲va久久| 色噜噜色狠狠狠狠狠综合色一 | 91传媒视频免费| 性欧美videos高清hd4k| 欧美成人一级视频| www.国产成人| 日本一区二区三区免费乱视频| 天天操天天爽天天射| 羞羞答答成人影院www| 91久久在线视频| 黑人精品视频| 亚洲精品美女久久久| 亚洲国产精品无码久久久| 国产精品久久免费看| www.成人黄色| 亚洲第一黄色| 色涩成人影视在线播放| 99er精品视频| 性欧美视频videos6一9| 国产一级网站视频在线| 在线电影一区二区三区| 国产亚洲精品女人久久久久久| 91在线精品秘密一区二区| 少妇性l交大片| 亚洲女同一区| 久久久久久99| 成人免费观看49www在线观看| 久久久久女教师免费一区| 青青草在线免费视频| 777午夜精品免费视频| 国产精品18p| 欧美国产精品一区二区三区| 中国特级黄色片| 日韩高清在线观看| 黄色a级片免费看| 欧美日韩在线二区| 免费成人在线网站| 亚洲综合成人婷婷小说| 欧美男男tv网站在线播放| 色老头一区二区三区| 天堂av一区二区三区| 欧美私人免费视频| 日本熟妇色xxxxx日本免费看| 国产欧美久久久精品影院| 下面一进一出好爽视频| 丝袜国产日韩另类美女| 91成人综合网| 欧美电影免费观看高清| 免费av在线一区二区| 香港久久久电影| 国产精品久久久久久影视 | 精品美女久久久| 国产99在线免费| 青青伊人久久| 日韩av不卡电影| av资源在线看片| 久久久国产视频91| 黄上黄在线观看| 亚洲精品久久久久久久久久久| 国产精品羞羞答答在线| 欧美无砖砖区免费| 亚洲另类在线观看| 亚洲成人免费看| 九九视频在线观看| 亚洲欧美日韩在线| 纪美影视在线观看电视版使用方法| 97国产一区二区| 少妇熟女视频一区二区三区 | 岛国视频一区免费观看| 四虎精品永久免费| 国产极品jizzhd欧美| 中文字幕在线直播| 97精品在线视频| 国产蜜臀在线| 欧美激情在线狂野欧美精品| 制服丝袜在线播放| 久久天天躁日日躁| 久草资源在线观看| 久久精品国产亚洲精品2020| 亚洲欧美视频一区二区| 伊人伊成久久人综合网小说 | 欧美成人午夜激情| av在线官网| 久久福利视频网| av在线免费网站| 欧美高跟鞋交xxxxxhd| 欧美videossex另类| 欧美另类交人妖| 青草影视电视剧免费播放在线观看| 久久久精品2019中文字幕神马| 91福利入口| ****av在线网毛片| 久久久久久亚洲精品不卡| av有码在线观看| 高清欧美性猛交xxxx黑人猛交| 亚洲精品高清国产一线久久| 色豆豆成人网| 国产精品久久久久久久久久久久| 搜成人激情视频| 国产精品揄拍500视频| 亚洲一区导航| 97人人模人人爽人人少妇| 91精品国产自产在线丝袜啪| 国产日韩欧美一区二区| 色婷婷精品视频| 日韩影片在线播放| 91精品久久久久久久蜜月| 亚洲精品天堂成人片av在线播放| 国产精品v亚洲精品v日韩精品| 国产自产在线视频| 亚洲欧美高清| 一区二区三区 欧美| 国产一区二区三区在线看麻豆| 国内自拍偷拍视频| 久久亚洲欧美国产精品乐播| 夫妇露脸对白88av| 一区二区三区日韩欧美| 日本中文字幕第一页| 欧美日韩免费高清一区色橹橹 | 精品日本一线二线三线不卡| 免费a级片在线观看| 一级做a爰片久久毛片美女图片| 日本在线看片免费人成视1000| 欧美成人激情在线| 在线免费三级电影网站| 成人国产精品日本在线| 精品伊人久久久| 一本久道久久综合狠狠爱亚洲精品| 欧美国产另类| 免费国产成人av| 国产精品一区久久久久| 人妻丰满熟妇av无码久久洗澡| 国产精品美女一区二区三区| 精品无码一区二区三区电影桃花| 色综合一区二区| 国产极品久久久| 亚洲无亚洲人成网站77777| 美足av综合网| 国产精品亚洲欧美导航| 日韩丝袜视频| 青草全福视在线| 免费日本视频一区| 日韩网站在线播放| 亚洲欧洲制服丝袜| 波多野结衣av无码| 精品国产欧美一区二区| 在线观看麻豆| 奇米四色中文综合久久| 秋霞一区二区| 亚洲一区二区不卡视频| 亚洲在线黄色| 无码人妻久久一区二区三区蜜桃| 国产精品久久久久久久裸模| www.av麻豆| 精品欧美久久久| 麻豆tv入口在线看| 国产精品九九九| 日韩动漫一区| 久久精品无码中文字幕| 国产在线视视频有精品| 美国黑人一级大黄| 欧美性猛交xxxx乱大交3| 韩国av永久免费| 欧美日本精品在线| 国产乱码精品一区二区三区亚洲人| 欧美在线一二三区| 午夜亚洲性色福利视频| 国产日韩视频一区| 一区二区三区在线免费播放| 一级片视频网站| 日韩中文字幕国产精品| av免费在线一区| 热re99久久精品国产99热| 亚洲一区二区三区免费在线观看| 成年人小视频在线观看| 一区二区三区四区五区视频在线观看| 在线观看视频二区| 中文字幕日韩精品在线| 国产成人福利夜色影视| 日韩高清在线播放| 日本在线播放一区二区三区| 少妇大叫太粗太大爽一区二区| 欧美日韩加勒比精品一区| 人妻精品无码一区二区| 午夜精品三级视频福利| 黄色免费大全亚洲| 日韩欧美国产免费| 久久免费视频一区| 亚洲午夜无码久久久久| 在线观看久久久久久| 九七电影院97理论片久久tvb| 日韩精品一区二区三区外面| 日本不卡123| 黄色精品视频在线观看| 7777精品久久久大香线蕉| 在线免费观看的av| 国产精品sss| 国产精品久久久久久久免费软件| 在线观看福利片| 日本丰满少妇一区二区三区| √天堂资源地址在线官网| 亚洲xxxx3d| 亚洲福利免费| 亚洲а∨天堂久久精品2021| 欧美日韩视频在线一区二区| 国产网友自拍视频导航网站在线观看| 91精品久久久久久久久久入口| 影视一区二区| 国产精品一区二区人妻喷水| 欧美视频中文在线看| eeuss影院在线观看| 91久久精品美女| 99日韩精品| 欧美a在线播放| 欧美α欧美αv大片| 九色porny丨国产首页在线| 日韩精品久久久| 国模无码大尺度一区二区三区| 久久香蕉精品视频| 亚洲欧美三级伦理| 久久gogo国模啪啪裸体| 欧美日韩性生活片| 中文成人av在线| 成人爽a毛片一区二区| 国产成人免费av| 欧美福利在线| 日本成人午夜影院| 精品奇米国产一区二区三区| 日韩av大片站长工具| 国产精品夜夜夜爽张柏芝| 99久久久精品| 97人妻精品一区二区三区视频| 久久久女人电视剧免费播放下载| 少妇精品久久久| 成人一区二区三区仙踪林| 在线免费观看视频一区| 欧美日韩经典丝袜| 五月天亚洲综合| 97精品久久久久中文字幕| 精品国自产拍在线观看| 国产成人拍精品视频午夜网站| 极品av少妇一区二区|