精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

騰訊屠榜MTEB,嵌入模型告別BERT,擁抱LLM

發(fā)布于 2025-4-25 06:47
瀏覽
0收藏

  • 訓練一個好的向量模型的重點在于最大限度地利用了更多、更高質量的負樣本,來訓練模型。
  • 騰訊提出的Conan-embedding,采用了動態(tài)硬負樣本挖掘方法,以便在整個訓練過程中向模型展示更多具有挑戰(zhàn)性的負樣本。
  • 最近發(fā)布Conan-embedding-V2版本,在MTEB榜單上已經(jīng)超越了BGE等一眾傳統(tǒng)豪強。

騰訊屠榜MTEB,嵌入模型告別BERT,擁抱LLM-AI.x社區(qū)

  • 支持中、英雙語

騰訊屠榜MTEB,嵌入模型告別BERT,擁抱LLM-AI.x社區(qū)

騰訊屠榜MTEB,嵌入模型告別BERT,擁抱LLM-AI.x社區(qū)

一、Conan-embedding-V2

  • V1版本主要基于通用預訓練的雙向Bert模型進行Embedding任務的訓練。
  • V2版本從頭訓練了原創(chuàng)詞表和模型結構的大模型基座——Conan-1.4B,在此基礎上進行了中、英、多語言的Embedding任務的訓練。
  • 上下文長度從v1版本的512,提升到了32k。

騰訊屠榜MTEB,嵌入模型告別BERT,擁抱LLM-AI.x社區(qū)

訓練的4個階段

  • 第1和第2階段,大語言模型(LLM)訓練階段

加入嵌入數(shù)據(jù),以更好地使LLM與嵌入任務對齊

設計了Conan-1.4B,包含8層Attention Layers,Hidden Size為3584,最長上下文32k。

參數(shù)量是1.4B,能夠在較少的參數(shù)下提供更大的Embedding維度。

從基礎的字母、符號上,在約40萬條多語言語料上訓練了Conan的BBPE分詞器,目標詞表大小15萬,完成了詞表訓練。

  • 第3階段,弱監(jiān)督訓練階段

使用與LLM監(jiān)督微調(SFT)相同的配對數(shù)據(jù),并應用軟掩碼來彌合LLM與嵌入模型之間的差距。

使用gte-Qwen2-7B-instruct模型進行評分,并丟棄得分低于0.4的數(shù)據(jù)

訓練中采用了InfoNCE損失函數(shù),并結合In-Batch Negative采樣

  • 第4階段,監(jiān)督訓練階段

引入了跨語言檢索數(shù)據(jù)集和動態(tài)硬負例挖掘方法,以提高數(shù)據(jù)的多樣性和價值

針對不同的下游任務進行任務特定的微調。

將任務分為四類:檢索、跨語言檢索、分類和語義文本相似度(STS)。

前三類任務:包括一個查詢、一個正例文本和一些負例文本,使用經(jīng)典的InfoNCE損失函數(shù)。

STS任務涉及區(qū)分兩個文本之間的相似度,采用CoSENT損失來優(yōu)化。

為了更好的對比Conan-embedding提升了哪些內(nèi)容,下面也簡單介紹一下Conan-embeddingV1,尤其注意一下難例數(shù)據(jù)挖掘的方法,v2版本也是用同樣的方法

二、Conan-embeddingV1

騰訊屠榜MTEB,嵌入模型告別BERT,擁抱LLM-AI.x社區(qū)

總共分為:預訓練和微調兩個階段

2.1 預訓練階段

  • 篩選數(shù)據(jù):bge-large-zh-v1.5模型評分,丟棄所有得分低于 0.4 的數(shù)據(jù)。
  • 使用帶批內(nèi)負樣本的 InfoNCE 損失進行訓練,它利用小批量內(nèi)的其他樣本作為負樣本優(yōu)化模型。
  • 即,在每個小批量中,除了目標樣本的正樣本對之外的所有樣本都被視為負樣本。
  • 通過最大化正樣本對的相似性并最小化負樣本對的相似性,批內(nèi)負樣本 InfoNCE 損失可以有效地提高模型的判別能力和表示學習性能。
  • 此方法通過充分利用小批量內(nèi)的樣本,提高了訓練效率,減少了生成額外負樣本的需求。

騰訊屠榜MTEB,嵌入模型告別BERT,擁抱LLM-AI.x社區(qū)

騰訊屠榜MTEB,嵌入模型告別BERT,擁抱LLM-AI.x社區(qū)

2.2 監(jiān)督微調

監(jiān)督微調時對不同的下游任務執(zhí)行特定的微調任務。將任務分為兩類:

  • 檢索任務:

包括查詢、正文本和負文本,經(jīng)典的損失函數(shù)是 InfoNCE 損失。

  • STS 任務:

涉及區(qū)分兩個文本之間的相似性,經(jīng)典的損失函數(shù)是交叉熵損失。

CoSENT 損失略優(yōu)于交叉熵損失,因此采用 CoSENT 損失來優(yōu)化 STS 任務。

騰訊屠榜MTEB,嵌入模型告別BERT,擁抱LLM-AI.x社區(qū)

騰訊屠榜MTEB,嵌入模型告別BERT,擁抱LLM-AI.x社區(qū)

三、難例數(shù)據(jù)挖掘

一種動態(tài)難樣本挖掘方法介紹:

  • 對于每個數(shù)據(jù)點,記錄當前相對于查詢的難樣本的平均分數(shù)。
  • 每 100 次迭代,如果分數(shù)乘以 1.15 小于初始分數(shù),并且分數(shù)的絕對值小于 0.8,將認為負樣本不再困難,并進行新一輪的難樣本挖掘。
  • 在每次動態(tài)困難負例挖掘過程中,如果需要替換困難負例,使用 (i-1)\times n + 10到i\times n +10 的案例作為負例,其中 i表示第 i次替換,而 n表示每次使用的困難負例數(shù)量。

騰訊屠榜MTEB,嵌入模型告別BERT,擁抱LLM-AI.x社區(qū)

  • 上圖展示了動態(tài)困難負例挖掘與標準困難負例挖掘中正例和負例的得分-步數(shù)曲線
  • 隨著步驟的增加,標準困難負例挖掘中負例的得分停止下降并開始振蕩,表明模型已經(jīng)完成了從該批負例中學習。
  • 相反,動態(tài)困難負例挖掘一旦檢測到負例不再對模型構成挑戰(zhàn),就會替換這些困難負例。

??https://arxiv.org/pdf/2408.15710??

??https://huggingface.co/TencentBAC/Conan-embedding-v2??

??https://zhuanlan.zhihu.com/p/1897675709696149020??

本文轉載自??CourseAI??,作者:CourseAI

已于2025-4-25 10:09:37修改
收藏
回復
舉報
回復
相關推薦
乱人伦中文视频在线| 亚洲黄色免费观看| 成人知道污网站| 欧美日韩国产黄| 日韩欧美第二区在线观看| 一区二区在线播放视频| 丰满人妻妇伦又伦精品国产| 亚洲人体大胆视频| 亚洲视频精品在线| 999热精品视频| 性欧美18xxxhd| 1区2区3区精品视频| 国产乱码精品一区二区三区不卡| 国产第一页精品| 亚洲国产欧美国产第一区| 精品久久久一区二区| 一区二区在线不卡| 成人午夜淫片100集| 97品白浆高清久久久久久| 色一情一乱一乱一91av| 视色,视色影院,视色影库,视色网 日韩精品福利片午夜免费观看 | 一级黄色大片免费| 9久re热视频在线精品| 色999日韩欧美国产| 日本护士做爰视频| 懂色av色香蕉一区二区蜜桃| 欧美色道久久88综合亚洲精品| 青少年xxxxx性开放hg| 九色视频成人自拍| 成人v精品蜜桃久久一区| 久久精品久久久久电影| 波多野结衣福利| 澳门精品久久国产| 欧美妇女性影城| www.日本xxxx| 三上悠亚国产精品一区二区三区| 一区二区三区欧美视频| 一本一道久久久a久久久精品91| 天堂中文网在线| 国产成人精品综合在线观看| 成人自拍性视频| 黄色大全在线观看| 久久男女视频| 欧美一性一乱一交一视频| 99re久久精品国产| 一区中文字幕电影| 欧美一区二区三区在线观看视频| 免费国产成人av| 亚洲淫成人影院| 中文字幕 久热精品 视频在线| 久久草视频在线看| 日色在线视频| 久久影院午夜片一区| 韩国成人动漫在线观看| 国产 欧美 精品| 处破女av一区二区| 国产青春久久久国产毛片| 亚洲精品久久久久久久久久久久久久| 国产剧情一区二区| 成人18视频| 麻豆精品久久久久久久99蜜桃| 1024日韩| 7777精品视频| 一级黄色在线视频| 麻豆精品网站| 国产精品美乳一区二区免费| 依依成人在线视频| 久久99久久99精品免视看婷婷| 国产伦精品免费视频| 91肉色超薄丝袜脚交一区二区| 老司机一区二区| 成人在线视频网| 国产同性人妖ts口直男| 国产成人综合自拍| 国产在线精品一区二区三区》| 亚欧在线观看视频| 国产偷v国产偷v亚洲高清| 亚洲mv在线看| 最新超碰在线| 欧美日韩激情视频8区| 成人免费xxxxx在线视频| 国产成人久久精品麻豆二区| 欧美一区二区日韩一区二区| 国产熟女高潮一区二区三区| 欧美日中文字幕| 欧美大尺度激情区在线播放| 一级片中文字幕| 蜜桃精品视频在线观看| 成人国产精品免费网站| 超碰在线观看97| 欧美精品久久久久久久久久丰满| 日韩精品午夜视频| 国产精品视频网址| 亚洲AV无码精品色毛片浪潮| 91原创在线视频| 亚洲一区二区不卡视频| 日本片在线观看| 色综合久久久久综合体| 天天影视色综合| aaa国产精品视频| 中文字幕日韩视频| 五月天婷婷综合网| 老鸭窝一区二区久久精品| 国产精品综合久久久久久| 91啦中文在线| 婷婷久久综合九色综合绿巨人| 一区二区三区韩国| 都市激情久久| 久久精品成人欧美大片古装| 国产一级片毛片| 国产精品夜夜爽| 午夜精品美女久久久久av福利| 欧美xxxx少妇| 亚洲天天做日日做天天谢日日欢| 欧美乱大交xxxxx潮喷l头像| 成人国产精品一区二区免费麻豆| 精品成人在线观看| 很污很黄的网站| 久久久精品日韩| 国产伦精品一区二区三区免| 亚洲乱亚洲乱妇| 欧美日韩一区二区在线| 中文字幕avav| 五月久久久综合一区二区小说| 88国产精品欧美一区二区三区| 国产三级伦理片| 亚洲国产成人私人影院tom| 可以看毛片的网址| 欧美影院在线| 最近2019中文字幕大全第二页| 日韩成人一区二区三区| 国产成人av一区二区三区在线 | 伊人久久大香线蕉av超碰演员| 国产美女被下药99| 国产午夜在线观看| 精品久久久免费| 中文字幕天堂网| 韩国在线视频一区| 日韩中文字幕网址| 中文字幕在线播| 久久中文字幕电影| 成人一级片网站| 日本一区福利在线| 91大神福利视频在线| 蜜桃91麻豆精品一二三区| 一区二区免费视频| 波多野结衣三级视频| 国产精品美女在线观看直播| 久久99国产精品自在自在app | 三级成人黄色影院| 亚洲欧美制服另类日韩| 亚洲天堂视频网站| 91日韩一区二区三区| 99视频在线免费播放| 亚洲精品.com| 亚洲天堂久久av| av首页在线观看| 国产精品久久午夜夜伦鲁鲁| 精品视频在线观看一区二区| 国产午夜久久av| 欧美大片欧美激情性色a∨久久| 99国产精品99| 亚洲一级二级在线| 女性隐私黄www网站视频| 亚洲专区视频| 国产精品欧美风情| 国产最新在线| 色狠狠av一区二区三区| 先锋影音av在线| 蜜桃av一区二区在线观看| 国产成年人在线观看| 一本一道久久a久久| 97不卡在线视频| 国产在线观看网站| 91超碰这里只有精品国产| 欧美精品成人久久| 91在线视频播放地址| 五月天婷婷激情视频| 羞羞色午夜精品一区二区三区| 97人人模人人爽人人喊38tv| www.九色在线| 中文字幕亚洲在线| 欧美性受xxxx狂喷水| 91福利区一区二区三区| av成人免费网站| www久久精品| 亚洲xxx在线观看| 亚洲激情网站| 中文字幕在线亚洲三区| 黑色丝袜福利片av久久| 国产精品久久久久久久久男 | 97超级碰在线看视频免费在线看 | 国产精品你懂的在线欣赏| 久久综合桃花网| 亚洲欧美日韩视频二区| 国产又黄又爽免费视频| 日韩美脚连裤袜丝袜在线| 成人xxxxx| 亚洲天堂免费电影| 成人444kkkk在线观看| 欧洲亚洲精品视频| 日韩欧美美女一区二区三区| 日韩精品一区二区亚洲av观看| 亚洲女爱视频在线| 韩国三级hd中文字幕| 国产成人精品三级| 欧美精品aaaa| 一区二区国产在线观看| 99久久久无码国产精品性色戒| 欧美久久精品| 91视频在线免费观看| 国产综合色在线观看| 韩国国内大量揄拍精品视频| 免费观看在线午夜影视| 亚洲欧美在线x视频| 亚洲精品911| 51精品久久久久久久蜜臀| 中文字幕在线播| 婷婷激情综合网| www青青草原| 中文字幕av一区二区三区高| 少妇毛片一区二区三区| av成人动漫在线观看| 亚洲热在线视频| 美女国产一区二区| 黄色av免费在线播放| 99这里有精品| 无码中文字幕色专区| 欧美日本一区二区高清播放视频| 成人国产在线激情| 免费成人直播| 77777亚洲午夜久久多人| av老司机免费在线| 欧美激情视频在线| 欧美xxxx性xxxxx高清| 欧美成人三级视频网站| 国产在线激情| 久久久精品网站| 成人福利网站| 美女少妇精品视频| www免费在线观看| 美女啪啪无遮挡免费久久网站| 久久99精品久久久久久野外| 日韩在线视频国产| 欧美日韩视频在线播放| 日韩视频在线观看免费| 麻豆免费在线视频| 久久五月天色综合| 超碰超碰在线| 欧美激情综合亚洲一二区| 欧美黑人猛交的在线视频| 欧美日韩高清区| 51漫画成人app入口| 国外成人性视频| 中文字幕资源网在线观看免费 | 日本少妇xxxx动漫| 偷拍亚洲欧洲综合| 特级西西444www大精品视频免费看| 黄色一区二区三区| 国产无套丰满白嫩对白| 色嗨嗨av一区二区三区| 亚洲最大成人av| 日韩一级大片在线观看| 国产视频91在线| 欧美日韩一区二区精品| 伊人久久中文字幕| 91精品国产黑色紧身裤美女| 亚洲AV无码精品自拍| 国产视频精品xxxx| 1024国产在线| 九九热这里只有在线精品视| av中文字幕电影在线看| 日韩av片电影专区| 91成人短视频在线观看| 国产精品有限公司| 国产精品一线天粉嫩av| 少妇熟女一区二区| 亚洲福利国产| 午夜免费一区二区| 国产精品888| 色婷婷在线影院| 自拍偷拍亚洲欧美日韩| 久久草视频在线| 欧美日韩在线三级| 懂色av成人一区二区三区| 亚洲视频综合网| 伊人春色在线观看| 国产成人精品日本亚洲| 精品视频一区二区三区| 国产精品黄页免费高清在线观看| heyzo一区| 国产精品美腿一区在线看| 9l视频自拍蝌蚪9l视频成人| 日韩精品一区二区三区四区五区| 亚洲视频电影在线| 丰满少妇被猛烈进入高清播放| 久久精品噜噜噜成人av农村| 在线免费看黄色片| 中文字幕一区二区三区精华液| 欧美一级高潮片| 欧美喷水一区二区| 三区在线视频| 欧美俄罗斯性视频| 精品美女一区| 久久视频在线观看中文字幕| 亚洲成人99| 成年人在线观看视频免费| av在线不卡免费看| 成人免费黄色小视频| 在线亚洲欧美专区二区| 五月婷在线视频| 欧美久久久精品| 欧美极品在线| 日韩国产欧美一区| 一本久道久久综合婷婷鲸鱼| 欧洲在线免费视频| 国产精品无码永久免费888| 色网站在线播放| 日韩美女视频在线| 岛国中文字幕在线| 国产精品入口日韩视频大尺度| 一本色道久久综合亚洲精品酒店 | 国产一二精品视频| 日韩精品电影一区二区三区| 日韩欧美中文免费| 日本国产在线观看| 久久99热精品| 麻豆精品国产| 99久re热视频精品98| 久久99久久久久久久久久久| 日本黄区免费视频观看| 日本韩国一区二区三区视频| 日本一区视频| 日本a级片电影一区二区| 日韩欧美四区| 欧美性久久久久| 久久久青草青青国产亚洲免观| 国产一级在线视频| 精品免费国产二区三区| 久草在线视频网站| 成人黄动漫网站免费| 亚洲午夜极品| 午夜剧场免费看| 性感美女久久精品| 亚州视频一区二区三区| 91av在线免费观看视频| 日韩mv欧美mv国产网站| 亚洲欧洲日产国码无码久久99| 99精品欧美一区二区三区小说 | 中文字幕免费高清电视剧网站在线观看 | 亚洲精品日韩在线观看| 免费在线视频一区| 欧美大片xxxx| 日韩精品一区二区三区在线 | 色av综合在线| 成人在线高清视频| 国产在线98福利播放视频| 亚洲h色精品| 一级全黄裸体片| 婷婷久久综合九色综合绿巨人 | 中文字幕亚洲综合久久菠萝蜜| 97成人免费视频| 久久99热精品| 亚洲日本三级| 国产精品区在线| av爱爱亚洲一区| 亚洲视频 欧美视频| 这里只有精品丝袜| 视频成人永久免费视频| 奇米影视亚洲色图| 久久午夜国产精品| 一区二区久久精品66国产精品| 久久国产精品偷| 日本欧美韩国国产| 欧美女同在线观看| 一区二区不卡在线播放| 四虎精品在线| 欧美精品久久久久久久免费观看| 加勒比视频一区| 亚洲色图久久久| 亚洲午夜国产一区99re久久| 男男激情在线| 96sao精品视频在线观看| av成人毛片| 亚洲欧美另类日本| 亚洲国产精品va在线观看黑人| 日韩成人动漫| 日韩视频 中文字幕| 久久亚洲综合色| 99riav国产| 国产国语刺激对白av不卡| 欧美黄色精品| 性欧美在线视频| 偷窥少妇高潮呻吟av久久免费 | 久久99久久亚洲国产| 国产伦精品一区二区三区千人斩| 中文字幕剧情在线观看| 韩曰欧美视频免费观看| 国产激情视频在线观看| 欧美18视频|