精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

從零實現大模型-BERT微調 原創 精華

發布于 2024-6-24 16:05
瀏覽
0收藏

按照順序,輪也該輪到BERT指令微調了吧!

是微調,但不是指令微調!

我們在之前的文章介紹過大模型的多種微調方法,指令微調只是其中一種,就像訓犬一樣,讓它坐就坐,讓它臥就臥,同理,你讓LLM翻譯,它不是去總結,你讓它總結,它不是去情感分析。

指令微調在像GPT這種自回歸的模型中應用多一些。我們在前一篇文章中基于GPT-2預訓練模型進行了指令微調。

除了指令微調,還有一種比較常用的是任務微調,預訓練模型雖然具備一定的知識,但尚不能直接用于某些具體任務。

例如,雖然在BERT的預訓練過程中,通過Masked Language Model (MLM)和Next Sentence Prediction (NSP)使其學習了語言的基本特征。

從零實現大模型-BERT微調 -AI.x社區

Masked Language Model (MLM)


從零實現大模型-BERT微調 -AI.x社區

Next Sentence Prediction (NSP)

但它仍不能直接用于自然語言推理(NLI)和問答(QA)等具體任務。因此,今天我們將對之前的BERT預訓練模型進行進一步微調,使其能夠更好地適應這些具體任務。

但完整代碼如下,請結合代碼閱讀本文。

https://github.com/AIDajiangtang/LLM-from-scratch/blob/main/Bert_fine_tune_from_scratch.ipynb

在正式開始之前,有幾點需要注意:

1.在微調階段,模型架構與預訓練要一致,2.使用預訓練模型的權重進行初始化而非隨機初始化,3.使用預訓練相同的分詞方法和詞表,4.輸入數據的格式與預訓練階段一致。例如,BERT模型通常要求輸入序列包含[CLS]和[SEP]標記。

所以在下載預訓練模型時,除了下載模型參數,通常還要下載配套的詞表和模型超參數。

['bert_config.json',
 'bert_model.ckpt.data-00000-of-00001',
 'bert_model.ckpt.index',
 'vocab.txt']

如果要擴充詞表來支持多語言,那模型結構中的嵌入層和輸出層也需要更改,所以往往需要重新預訓練。

有了前面四篇文章的烘托,本篇文章會忽略重復內容。

01、微調任務1:自然語言推理

自然語言推理任務通常是判斷兩個句子之間的邏輯關系(如蘊涵、矛盾或中立)。

從零實現大模型-BERT微調 -AI.x社區

Next Sentence Prediction (NSP)可以看作是一種特殊的自然語言推理任務。

1.訓練數據

本次微調用的數據來自GLUE MRPC,數據由成對的句子構成,并且還有一個人工標注的標簽,表示兩個句子是否語義相似。

FeaturesDict({
    'idx': int32,
    'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'sentence1': Text(shape=(), dtype=string),
    'sentence2': Text(shape=(), dtype=string),
})

下面打印一條數據。

idx      : 1680
label    : 0
sentence1: b'The identical rovers will act as robotic geologists , searching for evidence of past water .'
sentence2: b'The rovers act as robotic geologists , moving on six wheels .'


  • 對于每個樣本中的句子對,拼接成一個輸入序列,格式為:[CLS] 句子A [SEP] 句子B [SEP]。
  • 使用BERT的分詞器將輸入序列分詞,并將其轉換為輸入ID、注意力掩碼和類型ID。

詞表參數:
{'vocab_size': 30522,
 'start_of_sequence_id': 101,
 'end_of_segment_id': 102,
 'padding_id': 0,
 'mask_id': 103}

設置batch_size=32,max_seq_length = 128。

則輸入ID:

模型的輸入X。

'input_word_ids': <tf.Tensor: shape=(32, 128), dtype=int32, numpy=
 array([[ 101, 1996, 7235, ...,    0,    0,    0],
        [ 101, 2625, 2084, ...,    0,    0,    0],
        [ 101, 6804, 1011, ...,    0,    0,    0],
        ...,
        [ 101, 2021, 2049, ...,    0,    0,    0],
        [ 101, 2274, 2062, ...,    0,    0,    0],
        [ 101, 2043, 1037, ...,    0,    0,    0]], dtype=int32)>

注意力掩碼:

注意力掩碼用于區分實際的 token 和填充的 token,1表示實際的 token,0表示填充的 token。

在多頭注意力計算時,注意力掩碼會將填充位置對應的注意力權重設置為負無窮(通常是一個非常大的負數,如 -10^9),這樣在通過 softmax 計算時,這些位置的權重就會接近于零,從而使這些填充位置不會對注意力分數產生影響。

在計算損失時,通常會忽略填充位置對應的 token。

'input_mask': <tf.Tensor: shape=(32, 128), dtype=int32, numpy=
 array([[1, 1, 1, ..., 0, 0, 0],
        [1, 1, 1, ..., 0, 0, 0],
        [1, 1, 1, ..., 0, 0, 0],
        ...,
        [1, 1, 1, ..., 0, 0, 0],
        [1, 1, 1, ..., 0, 0, 0],
        [1, 1, 1, ..., 0, 0, 0]], dtype=int32)>,

類型ID:

表示token屬于哪個句子,0表示屬于句子A,1表示數據句子B。

'input_type_ids': <tf.Tensor: shape=(32, 128), dtype=int32, numpy=
 array([[0, 0, 0, ..., 0, 0, 0],
        [0, 0, 0, ..., 0, 0, 0],
        [0, 0, 0, ..., 0, 0, 0],
        ...,
        [0, 0, 0, ..., 0, 0, 0],
        [0, 0, 0, ..., 0, 0, 0],
        [0, 0, 0, ..., 0, 0, 0]], dtype=int32)>

在將token id轉換成詞嵌入向量時,會將類型id視為segment Embedding。

從零實現大模型-BERT微調 -AI.x社區

標簽:

['not_equivalent', 'equivalent']->[0,1]

0:表示兩個句子語義不相似。

1:表示兩個句子語義相似。

<tf.Tensor: shape=(32,), dtype=int64, numpy=
array([0, 0, 1, 1, 0, 0, 1, 1, 1, 1, 1, 1, 0, 1, 1, 0, 1, 1, 1, 0, 1, 1,
       1, 1, 1, 1, 1, 0, 0, 1, 0, 1])>

到此,我們就構造了模型輸入和標簽。

input_word_ids  shape: (32, 128)
input_mask      shape: (32, 128)
input_type_ids  shape: (32, 128)
labels          shape: (32,)

2.模型

在模型架構上,相對于BERT預訓練,在微調過程中,會在模型的輸出層添加一個分類層。這個分類層的輸入是[CLS]標記對應的隱藏狀態,其輸出是表示類別概率的logits。

因為EMB_SIZE = 768,所以分類層的輸入(32, 768),輸出(32, 768,2)。

3.微調

超參數
EMB_SIZE = 768//詞嵌入維度
HIDDEN_SIZE = 768 
BATCH_SIZE = 32 #batch size
NUM_HEADS = 4 //頭的個數


3.1.詞嵌入

接下來將token ids轉換成embedding,在Bert中,每個token都涉及到三種嵌入,第一種是Token embedding,token id轉換成詞嵌入向量,第二種是位置編碼。還有一種是Segment embedding。用于表示哪個句子,0表示第一個句子,1表示第二個句子。

從零實現大模型-BERT微調 -AI.x社區

根據超參數EMB_SIZE = 768,所以詞嵌入維度768,Token embedding通過一個嵌入層[30522,768]將輸入[32,128]映射成[32,128,768]。

30522是詞表的大小,[30522,768]的嵌入層可以看作是有30522個位置索引的查找表,每個位置存儲768維向量。

位置編碼可以通過學習的方式獲得,也可以通過固定計算方式獲得,本次采用固定計算方式。

Segment embedding和輸入X大小一致,第一個句子對應為0,第二個位置為1。

最后將三個embedding相加,然后將輸出的embedding[32,128,768]輸入到編碼器中。

3.2.多頭注意力

編碼器的第一個操作是多頭注意力,與Transformer和GPT中不同的是,不計算[PAD]的注意力,會將[PAD]對應位置的注意力分數設置為一個非常小的值,使之經過softmax后為0。

多頭注意力的輸出維度[32,128,768]。

3.3.MLP

與Transformer和GPT中的一致,MLP的輸出維度[32,128,768]。

3.4.輸出

編碼器的輸出[32,128,768],但我們只需要[CLS]對應的輸出[32,768]。

二分類損失

通過另一個線性層[768,2]將開頭的[CLS]的輸出[32,768]映射成[32,2],表示屬于正負類的概率,然后與標簽[32,]計算交叉熵損失。

02、微調任務2:問答

問答任務通常是給定一個段落和一個問題,模型需要從段落中找出答案的起始位置和結束位置。

從零實現大模型-BERT微調 -AI.x社區

示例

假設我們有一個段落和一個問題:

段落:"BERT is a model developed by Google for natural language processing tasks. It stands for Bidirectional Encoder Representations from Transformers."

問題:"Who developed BERT?"

我們需要從段落中找出答案的起始位置和結束位置。在這個例子中,答案是 "Google",它在段落中的位置如下:

  • 起始位置:6 (第7個詞,"Google")
  • 結束位置:6 (第7個詞,"Google")

超參數
max_seq_length = 128
EMB_SIZE = 768//詞嵌入維度
HIDDEN_SIZE = 768 
BATCH_SIZE = 32 #batch size
NUM_HEADS = 4 //頭的個數

1.訓練數據

  • 輸入預處理
  • 將段落和問題轉換為BERT的輸入格式:[CLS] 問題 [SEP] 段落 [SEP]。

從零實現大模型-BERT微調 -AI.x社區

  • 例如:[CLS] Who developed BERT? [SEP] BERT is a model developed by Google for natural language processing tasks. It stands for Bidirectional Encoder Representations from Transformers. [SEP]
  • 分詞和ID轉換
  • 使用BERT的分詞器將輸入序列分詞,并將其轉換為輸入ID、注意力掩碼和類型ID。

本文轉載自公眾號人工智能大講堂 

原文鏈接:??https://mp.weixin.qq.com/s/6MRC88ICo9yR7w1eOeTZiA??

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
收藏
回復
舉報
回復
相關推薦
日本亚洲不卡| 羞羞的视频在线看| 精品亚洲欧美一区| 久久免费少妇高潮久久精品99| 国产精品久久久久久亚洲色| 成人日韩在线| 亚洲狼人国产精品| 奇米影视首页 狠狠色丁香婷婷久久综合 | 国产一区二区在线播放视频| 国产一区激情| 国产亚洲精品日韩| 久久人妻少妇嫩草av蜜桃| 黄瓜视频成人app免费| 一区二区三区美女| 视频一区二区在线| 天天综合在线视频| 国产在线精品国自产拍免费| 日本精品性网站在线观看| 日韩在线中文字幕视频| 国产91一区| 精品国产乱子伦一区| 亚洲欧美手机在线| 欧美粗大gay| 亚洲福利一区二区| 国产免费一区二区三区四在线播放| 色综合888| 粉嫩aⅴ一区二区三区四区| 国产乱人伦真实精品视频| 日韩欧美三级视频| 欧美精品一卡| 久久精品中文字幕电影| 精品人妻一区二区三区四区| 久久精品凹凸全集| 日韩欧美123| 日韩av片免费观看| 51一区二区三区| 日韩欧美在线国产| 福利在线一区二区| 91网在线看| 亚洲少妇屁股交4| 亚洲国产高清国产精品| 黄视频在线播放| 91尤物视频在线观看| 懂色一区二区三区av片| 99热这里只有精品66| 日本最新不卡在线| 国产精品福利久久久| 在线免费观看av网址| 久久国产一二区| 18久久久久久| 中文字幕精品三级久久久| 亚洲精选久久| 羞羞色国产精品| 五月婷婷开心网| 一本色道88久久加勒比精品| 97在线观看视频国产| 国产中文字字幕乱码无限| 国产精品99免费看| 久久久久久com| 国产精品99精品| 亚洲毛片播放| 欧美一级在线亚洲天堂| 无码人妻精品一区二区三区9厂| 亚洲欧美日韩一区在线观看| 日av在线播放中文不卡| 精品人妻一区二区色欲产成人| 天堂一区二区在线免费观看| 国产精品网址在线| 91成人一区二区三区| 韩国av一区二区三区四区 | 国产一区二区三区亚洲| 欧美本精品男人aⅴ天堂| 69亚洲乱人伦| 九九精品久久| 视频在线观看一区二区| 少妇高潮一区二区三区喷水| 午夜精品国产| 97在线免费观看视频| 99超碰在线观看| 免费成人av在线播放| 91美女片黄在线观| 日本黄视频在线观看| 国产午夜精品久久久久久久| 在线视频亚洲自拍| 免费网站在线观看人| 黑人巨大精品欧美一区二区免费| 黄色三级视频片| 97久久精品一区二区三区的观看方式 | 久久不射电影网| 日韩免费一二三区| 日韩激情av在线| 91精品网站| 日本天堂在线| 亚洲欧美国产高清| av观看免费在线| 在线高清欧美| 日韩电影在线观看中文字幕| www.4hu95.com四虎| 影院欧美亚洲| 国产精品午夜一区二区欲梦| 蜜桃视频在线观看www| 国产色一区二区| 成人av在线播放观看| 91久久国产综合久久91猫猫| 欧美一级片在线| 男女黄床上色视频| 欧美在线播放| 国产精品99久久久久久久久久久久| 精品女同一区二区三区| 国产欧美一二三区| 久久黄色片视频| 国产人与zoxxxx另类91| 尤物99国产成人精品视频| 久视频在线观看| 久久成人麻豆午夜电影| 免费久久一级欧美特大黄| av毛片在线免费| 欧洲色大大久久| 亚洲精品乱码久久久久久久| 欧美国产日本| 国产精品亚洲аv天堂网| 亚洲av片一区二区三区| 一区二区三区欧美日| 伊人国产在线视频| 亚洲人成亚洲精品| 久久久久久久亚洲精品| www.香蕉视频| 国产精品家庭影院| 国内自拍视频网| 一区三区在线欧| 久久久视频精品| 精品人妻一区二区三区三区四区 | 日本少妇性高潮| 国产精选一区二区三区| 亚洲日本无吗高清不卡| 欧美va视频| 亚洲午夜久久久久久久| www亚洲视频| 91啪亚洲精品| 大j8黑人w巨大888a片| 国产伦乱精品| 国内精久久久久久久久久人| 亚洲精品免费在线观看视频| 亚洲精品一二三区| 熟妇无码乱子成人精品| 亚洲综合色网| 98国产高清一区| 污的网站在线观看| 欧美www视频| 国产一级淫片免费| 高清国产一区二区| 僵尸世界大战2 在线播放| 98视频精品全部国产| 欧美精品电影在线| 欧美一级免费片| 精品久久久国产| 精品人妻一区二区三区香蕉| 亚洲综合另类| 日韩av在线电影观看| 日韩毛片一区| 久久精品亚洲一区| 丰满岳乱妇国产精品一区| 亚洲电影一区二区三区| 亚洲视频在线播放免费| 久久成人在线| 深田咏美在线x99av| 国产极品一区| 久99久在线视频| 六月丁香色婷婷| 色哟哟精品一区| 日本美女黄色一级片| 国产高清精品在线| 欧美一级在线看| 加勒比久久综合| 亚洲一区精品电影| 成人影院在线视频| 最近2019年手机中文字幕| 国产成人毛毛毛片| 欧美日韩亚洲激情| 老司机精品免费视频| 国产福利一区二区三区视频| 国产一区二区网| 成人精品视频| 国产精品久久久对白| 樱桃视频成人在线观看| 中文字幕日韩欧美在线视频| www.天堂av.com| 欧美性感美女h网站在线观看免费| 黄色片在线观看免费| 国产乱对白刺激视频不卡| 国产素人在线观看| 日韩欧美一区二区三区在线视频| 91在线在线观看| 色吧亚洲日本| 日韩一区在线视频| 天堂成人在线| 91精品国产综合久久精品图片| 国产在线视频二区| 中日韩免费视频中文字幕| 丰满人妻一区二区三区大胸| 国产精品一区毛片| 成人免费看片视频在线观看| 亚洲传媒在线| 亚洲aⅴ日韩av电影在线观看| 卡通欧美亚洲| 久久久久久美女| 国产cdts系列另类在线观看| 亚洲人成网站在线播| 亚洲免费国产视频| 欧美日韩国产精品成人| 中文字幕黄色片| 亚洲精品日韩一| 欧美aaa级片| 91蝌蚪国产九色| 美女露出粉嫩尿囗让男人桶| 精品一区二区三区影院在线午夜| 国产成人精品视频免费看| 中文字幕日韩一区二区不卡 | 欧美午夜影院在线视频| 久久久综合久久| 综合电影一区二区三区| 懂色av蜜桃av| 久久人人爽爽爽人久久久| 日本一区二区免费视频| 国产在线精品一区二区三区不卡| 日av中文字幕| 亚洲一区亚洲| 国产 日韩 亚洲 欧美| 欧美精品啪啪| 九一免费在线观看| 亚洲一本二本| 免费看啪啪网站| 日本精品黄色| 日韩尤物视频| 最新国产精品视频| 久久综合九色欧美狠狠| 麻豆一区二区| 精品久久久久久乱码天堂| 第四色在线一区二区| 成人动漫在线视频| 国产一区二区三区亚洲综合| 成人精品在线视频| 日韩五码电影| 国产伦精品免费视频| 欧美国产视频| 成人精品久久一区二区三区| 日韩国产一二三区| 国产视频福利一区| 不卡精品视频| 亚洲精品欧美一区二区三区| 国产高清日韩| 成人性色av| 国产无遮挡裸体免费久久| 精品日本一区二区三区| 亚洲精品推荐| 日韩精品另类天天更新| 日韩精品不卡一区二区| 少妇熟女一区二区| 最新国产精品| 中文精品无码中文字幕无码专区| 1024成人| 超碰97人人射妻| 人人爽香蕉精品| 99re6在线观看| 国产乱码字幕精品高清av| 国产香蕉精品视频| 久久尤物电影视频在线观看| 制服 丝袜 综合 日韩 欧美| 国产精品久久三| 国产a免费视频| 午夜精品福利一区二区三区蜜桃| www.国产com| 欧美日本乱大交xxxxx| 国产色综合视频| 亚洲国产欧美久久| 懂色av中文在线| 久久香蕉国产线看观看网| wwwwxxxx在线观看| 国产精品成av人在线视午夜片 | 糖心vlog免费在线观看| 亚洲一区在线电影| 羞羞影院体验区| 91麻豆精品国产91久久久资源速度 | 亚洲男人天堂古典| 老司机在线永久免费观看| 久久男人的天堂| 97人人做人人爽香蕉精品| 97视频资源在线观看| 九色精品91| 欧洲精品视频在线| 天堂一区二区在线| 图片区乱熟图片区亚洲| 久久众筹精品私拍模特| 日韩视频中文字幕在线观看| 欧美日韩在线看| 国产精品探花视频| 亚洲欧美日韩直播| 在线欧美三级| 国产精品永久免费观看| 红杏成人性视频免费看| 亚洲一区综合| 国产偷自视频区视频一区二区| 日本人69视频| 2024国产精品视频| 青娱乐91视频| 欧美剧在线免费观看网站| 天堂视频中文在线| 欧美多人爱爱视频网站| 欧美videos粗暴| 欧美不卡三区| 亚洲国产1区| 天堂av.com| 国产精品久久久久久久久免费丝袜 | 性少妇xx生活| 欧美性xxxx在线播放| 亚洲h视频在线观看| 日韩小视频网址| 中文字幕系列一区| 久久久久一区二区| 亚洲午夜电影| 无套内谢丰满少妇中文字幕| 国产欧美一区二区三区在线老狼| 日本视频免费在线| 日韩三级中文字幕| 成人毛片av在线| 国产免费一区二区三区香蕉精| 精品在线播放| 久久网站免费视频| 99精品欧美一区二区三区综合在线| 超碰在线国产97| 欧美精品色综合| 亚洲精品传媒| 国产精品偷伦视频免费观看国产| 国产一区二区三区四区二区| 成年网站在线免费观看| 菠萝蜜视频在线观看一区| 国产一级久久久| 精品美女在线观看| 牛牛精品视频在线| 国产成人免费电影| 亚洲一级电影| 天天躁日日躁狠狠躁av| 午夜久久久久久| 丰满肉肉bbwwbbww| 午夜精品久久久久久久久久久久| 国产精品香蕉| 男人日女人视频网站| 成人美女视频在线看| 国产在线精品观看| 亚洲精品久久久久久久久久久久久| 97在线超碰| 精品欧美一区二区三区久久久| 国产精品久久久久9999高清| 五十路六十路七十路熟婆| 精品久久久久久| 激情综合闲人网| 国产欧美日韩丝袜精品一区| 久久久久久影院| 岛国大片在线免费观看| 亚洲国产日韩综合久久精品| 手机在线观看毛片| 国产成+人+综合+亚洲欧洲| 成人精品中文字幕| 1314成人网| 午夜精品久久久久久不卡8050| 免费成人av电影| 国产精品一区二区三区免费视频 | 欧美一区二区三区……| 亚洲最好看的视频| 超碰在线公开97| 亚洲欧美成人一区二区三区| 国产综合视频在线| 日韩美女视频中文字幕| 91综合久久一区二区| av地址在线观看| 五月婷婷久久丁香| www.亚洲资源| 97中文在线| 久久一区二区三区四区五区| 在线观看美女av| 日韩国产高清污视频在线观看| 亚洲伦乱视频| 国产精品igao激情视频| 久久蜜桃香蕉精品一区二区三区| 中文字幕在线视频免费| 国a精品视频大全| 国内黄色精品| 激情av中文字幕| 在线观看亚洲成人| 欧美xxxx黑人又粗又长| 日本婷婷久久久久久久久一区二区| 国产一区二区三区久久久| 国产成人精品一区二三区| yw.139尤物在线精品视频| 精品中国亚洲| 91aaa精品| 色婷婷综合激情| 黄色在线看片| 亚洲午夜精品福利| 26uuu亚洲综合色欧美 |