精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

智源開源最強語義向量模型BGE!中英文測評全面超過OpenAI、Meta

人工智能 新聞
智源大模型技術版圖再填一員——BAAI General Embedding,中英文測評全面超過OpenAI、Meta等。

語義向量模型(Embedding Model)已經被廣泛應用于搜索、推薦、數據挖掘等重要領域。

在大模型時代,它更是用于解決幻覺問題、知識時效問題、超長文本問題等各種大模型本身制約或不足的必要技術。然而,當前中文世界的高質量語義向量模型仍比較稀缺,且很少開源。

為加快解決大模型的制約問題,近日,智源發布最強開源可商用中英文語義向量模型BGE(BAAI General  Embedding),在中英文語義檢索精度與整體語義表征能力均超越了社區所有同類模型,如OpenAI 的text embedding 002等。此外,BGE 保持了同等參數量級模型中的最小向量維度,使用成本更低。

FlagEmbedding:https://github.com/FlagOpen/FlagEmbedding

BGE 模型鏈接:https://huggingface.co/BAAI/

BGE 代碼倉庫:https://github.com/FlagOpen/FlagEmbedding

C-MTEB 評測基準鏈接:https://github.com/FlagOpen/FlagEmbedding/tree/master/benchmark

本次BGE模型相關代碼均開源于FlagOpen飛智大模型技術開源體系旗下FlagEmbedding項目,一個聚焦于Embedding技術和模型的新版塊。智源研究院將持續向學術及產業界開源更為完整的大模型全棧技術。

與此同時,鑒于當前中文社區缺乏全面的評測基準,智源團隊發布了當前最大規模、最為全面的中文語義向量表征能力評測基準C-MTEB(Chinese Massive Text Embedding Benchmark),包含6大類評測任務和31個數據集,為評測中文語義向量的綜合表征能力奠定可靠的基礎,全部測試數據以及評測代碼已開源。

值得大模型應用開發者關注的好消息:將 LangChain 與智源BGE結合,可以輕松定制本地知識問答助手,而不需要花較高的成本訓練垂類大模型。

檢索精度大幅領先,中英文共87個任務上表現優異

BGE 是當前中文任務下最強語義向量模型,各項語義表征能力全面超越同類開源模型。

中文語義向量綜合表征能力評測 C-MTEB 的實驗結果顯示(Table 1),BGE中文模型(BGE-zh)在對接大語言模型最常用到的檢索能力上領先優勢尤為顯著,檢索精度約為 OpenAI Text Embedding 002 的1.4倍。

Table 1. 中文語義向量綜合表征能力評測(C-MTEB)

注:Model Size一列中Base ~100M,Large ~300M,XXL ~11BBGE w.o. Instruct: BGE輸入端沒有使用instruction

與中文能力相類似,BGE 英文模型(BGE-en)的語義表征能力同樣出色。根據英文評測基準 MTEB 的評測結果(Table 2),盡管社區中已有不少優秀的基線模型,BGE 依然在總體指標(Average)與檢索能力(Retrieval)兩個核心維度超越了此前開源的所有同類模型。

同時,BGE 的各項能力都顯著超越社區中最為流行的選項:OpenAI Text Embedding 002。

圖片Table 2. 英文語義向量綜合表征能力評測(MTEB)注:Model Size一列中 Base ~100M,Large ~300M,XXL ~11B

Figure 1. 中文C-MTEB(左)、英文MTEB(右)注:BGE為紅色,OpenAI Text Embedding 002為藍色

中文語義向量,全面評測基準 C-MTEB  

此前,中文社區一直缺乏全面、有效的評測基準,BGE 研究團隊依托現有的中文開源數據集構建了針對中文語義向量的評測基準 C-MTEB(Chinese Massive Text Embedding Benchmark,如 Table 3所示)。

C-MTEB 的建設參照了同類別英文基準 MTEB [12],總共涵蓋6大類評測任務(檢索、排序、句子相似度、推理、分類、聚類),涉及31個相關數據集。

C-MTEB 是當前最大規模、最為全面的中文語義向量評測基準,為可靠、全面的測試中文語義向量的綜合表征能力提供了實驗基礎。

目前,C-MTEB 的全部測試數據以及評測代碼已連同 BGE 模型一并開源。

Table 3. C-MTEB 評測任務維度及數據集

技術亮點:高效預訓練+大規模文本對微調

BGE 出色的語義表征能力源于兩方面要素:1)針對表征的預訓練,2)大規模文本對訓練。

BGE 在悟道 [10]、Pile [11] 兩個大規模語料集上采取了針對表征的預訓練算法 RetroMAE [5,6](Figure 2):將低掩碼率的輸入編碼為語義向量(Embed),再將高掩碼率的輸入與語義向量拼接以重建原始輸入。這樣一來,BGE 得以利用無標簽語料實現語言模型基座對語義表征任務的適配。

Figure 2. RetroMAE 預訓練算法示意

BGE 針對中文、英文分別構建了多達120M、232M的樣本對數據,從而幫助模型掌握實際場景中各種不同的語義匹配任務,并借助負采樣擴增 [7] 與難負樣例挖掘 [8] 進一步提升對比學習的難度,實現了多達65K的負樣本規模,增強了語義向量的判別能力。

另外,BGE 借鑒 Instruction Tuning [9] 的思想,采取了非對稱的指令添加方式,在問題端添加場景描述, 提升了語義向量在多任務場景下的通用能力,如Figure 3所示:

Figure 3. 注入場景提示提升多任務通用能力

綜上,BGE 是當前性能最佳的語義向量模型,尤其在語義檢索能力上大幅領先。

其卓越的能力為構建大語言模型應用(如閱讀理解、開放域問答、知識型對話)提供了重要的功能組件。相較于此前的開源模型,BGE 并未增加模型規模與向量的維度,因而保持了相同的運行、存儲效率。

目前,BGE 中英文模型均已開源,代碼及權重均采用 MIT 協議,支持免費商用。

作為智源「FlagOpen大模型技術開源體系」的重要組成部分,BGE 將持續迭代和更新,賦能大模型生態基礎設施建設。

BGE 模型鏈接:https://huggingface.co/BAAI/

BGE 代碼倉庫:https://github.com/FlagOpen/FlagEmbedding

FlagOpen官網:https://flagopen.baai.ac.cn/

語義向量模型知識拓展

1. 語義向量模型是什么?

語義向量模型(Embedding Model)被廣泛應用于搜索、推薦、數據挖掘等重要領域,將自然形式的數據樣本(如語言、代碼、圖片、音視頻)轉化為向量(即連續的數字序列),并用向量間的“距離”衡量數據樣本之間的“相關性” 。

2. 大模型時代,幫助緩解幻覺問題、長期記憶挑戰等的必要技術

- 與時俱進獲取知識

只能基于模型訓練中的階段性「死板」知識儲備,是導致大模型在回答問題時出現幻覺的重要因素。而借助語義向量模型的幫助,大模型可以獲取與時俱進的「活知識」,答案又新又準。具體而言,通過語義向量模型建立某個垂直領域的知識庫索引(Index),可以為大模型高效補充世界知識、本地知識:當用戶向LLM提問時,LLM 會從最新最全知識庫中獲取答案。

- 提升大模型長期記憶

大模型困長期記憶久已,現有LLM存在上下文輸入長度限制,制約了長文本方面的處理能力。利用語義向量模型,可將長文檔結構化,與LLM更好地直接交互,從而彌補長文本處理能力短板。

3. LangChain等大模型明星應用的關鍵力量

OpenAI、Google、Meta 等廠商均推出了針對大模型的語義向量模型及API服務,直接促進了全球大模型開發者社區誕生了眾多有影響力的大模型應用框架及工具:諸如大模型應用框架 LangChain、向量存儲數據庫Pinecone、文檔格式化索引工具Llama Index、自主「思考」步驟并完成任務的助手AutoGPT 等。

責任編輯:張燕妮 來源: 新智元
相關推薦

2023-09-16 13:31:25

模型訓練

2023-09-15 13:08:56

AI訓練

2025-03-19 09:30:00

2025-05-21 08:35:00

2015-08-18 15:19:51

2025-03-11 10:00:00

圖片模型數據

2020-07-16 13:00:18

人工智能機器學習技術

2020-07-20 09:49:56

開源技術 趨勢

2021-10-15 15:26:10

AI 數據人工智能

2020-06-08 11:16:06

百度

2024-05-14 16:58:05

騰訊混元大模型文生圖

2015-12-01 11:17:41

Windows 10Version 151鏡像

2023-10-12 14:40:10

AI模型

2013-06-21 10:48:18

WP7Windows Pho中英文互翻譯

2009-10-20 14:07:00

CCIE必讀書籍

2010-04-06 09:33:37

CentOS系統

2009-08-13 09:26:14

.NET正則表達式

2009-03-17 09:52:22

Unicode中英文Python

2023-12-25 13:24:00

模型OCR頁面

2025-04-14 09:17:00

點贊
收藏

51CTO技術棧公眾號

黄色成人在线网址| 欧美电影院免费观看| 国产欧美日韩不卡免费| 国产啪精品视频| 免费人成在线观看| 男男gay无套免费视频欧美| 欧美日韩亚洲另类| 蜜臀av色欲a片无码精品一区 | 99久久99久久精品国产| ccyy激情综合| 欧美网站大全在线观看| 日韩视频在线视频| 尤物网址在线观看| 成人av网站免费| 国产日韩欧美电影在线观看| 精品一区二区三区人妻| 日韩电影免费在线观看| 亚洲国产精品中文| 中文字幕在线视频精品| 中文字幕在线视频久| 一区二区理论电影在线观看| 日本一区二区三区在线视频| 好吊视频一区二区三区| 美国欧美日韩国产在线播放| 97在线看免费观看视频在线观看| 少妇视频一区二区| 亚洲影院天堂中文av色| 精品欧美久久久| 91小视频网站| 中文字幕在线直播| 亚洲国产精品久久人人爱| 一区二区三区四区视频在线| 四虎在线观看| 成人午夜视频福利| 91久久精品国产91久久性色| 欧美另类高清videos的特点| 国产日韩1区| 欧美激情国内偷拍| 欧美精品久久久久性色| 93在线视频精品免费观看| 国产香蕉一区二区三区在线视频| 黄色污在线观看| 国产精品视频3p| 日韩欧美高清在线| 在线观看网站黄| 国产剧情一区二区在线观看| 欧美喷潮久久久xxxxx| 国产一级不卡毛片| 日韩一区精品| 欧美色欧美亚洲另类二区| 日韩欧美黄色大片| 国精产品一区一区三区四川| 色88888久久久久久影院野外| 国产免费一区二区三区视频| 51国偷自产一区二区三区的来源| 美女伦理水蜜桃4| 欧美日韩国产一区二区在线观看| 欧美日韩1234| 97超碰成人在线| 视频91a欧美| 制服丝袜一区二区三区| 亚洲无在线观看| 国产精品视频一区二区三区| 欧美一区二区性放荡片| 男人女人拔萝卜视频| 91国内精品白嫩初高生| 亚洲风情亚aⅴ在线发布| 亚洲av成人精品一区二区三区| 国产精品17p| 日韩av在线看| 人与嘼交av免费| 香蕉视频官网在线观看日本一区二区| 久久av在线播放| 国产精品电影在线观看| 永久免费看片在线观看| 成人av激情人伦小说| 亚洲国产91色在线| 四虎永久免费在线观看| 久久亚洲成人| 欧美华人在线视频| 综合激情网五月| 蜜臂av日日欢夜夜爽一区| 91视频国产精品| 男人天堂网在线视频| 2020日本不卡一区二区视频| 伊人情人网综合| 国产丝袜在线播放| 色综合久久久久综合体桃花网| 亚洲无吗一区二区三区| 国产精品久久久久久av公交车| 精品国产人成亚洲区| 男人操女人动态图| 综合在线视频| 日韩av电影手机在线| 国产精品国产精品国产专区| 99久久国产综合精品麻豆| 婷婷四月色综合| 91破解版在线观看| 欧美丝袜自拍制服另类| 9.1在线观看免费| 成人vr资源| 97在线看免费观看视频在线观看| 中文字幕人成人乱码亚洲电影| 岛国av在线一区| 午夜精品区一区二区三| av中文字幕在线观看第一页| 欧美日韩性生活| 一本加勒比北条麻妃| 伊人成综合网| 国产精品精品一区二区三区午夜版| 亚洲av无码乱码国产精品| 国产拍揄自揄精品视频麻豆| 99热久久这里只有精品| 色综合久久久| 一区二区中文字幕| 国产精品美女久久久久av爽| 国产一区二区不卡老阿姨| 日本一区免费看| 国产三线在线| 日韩一级视频免费观看在线| 五月婷婷婷婷婷| 亚洲欧美网站| 狠狠色狠狠色综合人人| 国产在线激情| 欧美美女网站色| 久久精品—区二区三区舞蹈| 日韩一级大片| 国产高清精品一区二区三区| 看女生喷水的网站在线观看| 欧美视频一区二区三区四区| 精品国产无码在线观看| 亚洲影院免费| 国产欧美一区二区视频| 成人性生交大片免费看网站 | 污视频网址在线观看| 国产毛片一区二区三区| 茄子视频成人在线| 深夜福利视频一区| 天天av天天翘天天综合网色鬼国产| 中文字幕第六页| 欧美国产91| 91国产在线免费观看| 超碰公开在线| 欧美一区二区网站| 久久久久亚洲天堂| 风间由美性色一区二区三区| 欧美狂野激情性xxxx在线观| 成人黄色av网址| 久久久久久久久久久av| 日本免费一区视频| 精品福利在线看| 免费成人深夜夜行p站| 亚洲专区一区| 日本黄网免费一区二区精品| 日韩欧美一区二区三区在线观看 | 国产偷国产偷亚洲高清97cao| 羞羞电影在线观看www| 日韩美女视频在线| 伊人365影院| 99九九99九九九视频精品| 国产老熟妇精品观看| 台湾佬综合网| 国产精品福利网站| 久做在线视频免费观看| 日韩一级高清毛片| 丰满少妇乱子伦精品看片| 91色在线porny| 88av.com| 欧美在线免费一级片| 国产91亚洲精品一区二区三区| 爱草tv视频在线观看992| 精品亚洲一区二区三区在线播放| 无码人妻精品一区二区蜜桃色欲| 中文字幕不卡在线| 性色av浪潮av| 亚欧美中日韩视频| 资源网第一页久久久| 伊人精品久久| 浅井舞香一区二区| av电影高清在线观看| 亚洲精品国精品久久99热| 人人妻人人爽人人澡人人精品| 日韩理论片中文av| 手机在线成人av| 蜜桃视频在线观看一区二区| 99久久免费观看| 国产精品密蕾丝视频下载| 91网站在线看| 亚洲天堂免费电影| 久久九九有精品国产23| 亚洲人在线观看视频| 欧美日韩三级一区| 日韩美女黄色片| 中文字幕日本不卡| 艳妇乳肉亭妇荡乳av| 久久激五月天综合精品| 欧美变态另类刺激| 久久久久久久久国产一区| 久久久久九九九| 国产精品一区三区在线观看| 国产999在线观看| 美足av综合网| 日韩视频在线免费观看| 色屁屁草草影院ccyycom| 欧美精品色一区二区三区| 国产一级片毛片| 一区二区三区在线免费| jizz日本在线播放| 久久综合视频网| 第一页在线视频| 久久国产尿小便嘘嘘| 亚洲国产精品久久久久爰色欲| 亚洲视频在线免费| 亚洲电影一二三区| 一区二区三区四区在线看| 岛国视频一区免费观看| 在线观看欧美| 国产精品一区二区三区毛片淫片 | a毛片毛片av永久免费| 国产不卡在线播放| 国产精品久久久久久9999| 久久综合九色| 欧美激情国产精品日韩| 日韩午夜av在线| 国产av熟女一区二区三区| 久久久久久免费视频| 色综合久久久久久久久五月| 西野翔中文久久精品国产| 风间由美久久久| 疯狂欧洲av久久成人av电影| 国产欧美日韩视频| 成人1区2区| 国产精品久久二区| 欧美日韩成人影院| 国产成+人+综合+亚洲欧美丁香花| bl视频在线免费观看| 欧美激情综合亚洲一二区| 丝袜国产在线| 久久久久久成人精品| 免费不卡av| 97高清免费视频| 丁香花在线影院| 久久久综合av| freexxx性亚洲精品| 午夜精品一区二区三区在线视频| 男女在线视频| 午夜精品一区二区三区在线播放| 6699嫩草久久久精品影院| 91精品国产91久久久久久最新| 超碰在线公开| 清纯唯美亚洲综合| 韩国三级一区| 国产精品美女久久久久久免费| 粉嫩av一区二区三区四区五区| 国产精品高精视频免费| 九七影院97影院理论片久久| 成人精品aaaa网站| 久久久久亚洲精品中文字幕| 91九色蝌蚪嫩草| 国产精品chinese在线观看| 久久久婷婷一区二区三区不卡| 伊人久久大香线蕉综合网蜜芽| 日韩精品一区二区三区丰满| 欧美疯狂party性派对| 国产香蕉一区二区三区| 亚洲第一黄网| 狠狠热免费视频| 国产一区二区视频在线播放| 日批视频免费看| 久久亚洲综合av| 国产视频123区| 一个色妞综合视频在线观看| 亚洲天堂一区在线观看| 欧美探花视频资源| 丰满人妻一区二区三区四区53| 日韩av中文字幕在线| av片在线看| 欧美人在线观看| 欧美成人h版| 97久久精品午夜一区二区| 香蕉久久夜色精品国产使用方法 | 欧美三级电影一区| 超碰免费在线97| 亚洲人成亚洲人成在线观看| 黄色网页在线播放| 国产69精品久久久久久| 在线日韩三级| 麻豆精品视频| 欧美精品国产| 日韩免费毛片视频| 国产成人欧美日韩在线电影| 色噜噜日韩精品欧美一区二区| 亚洲欧洲中文日韩久久av乱码| 天天综合网久久综合网| 69堂亚洲精品首页| 欧美拍拍视频| 欧美黑人巨大精品一区二区| 亚洲成人短视频| 国产精品久久精品国产| 久久一区二区三区电影| 日本免费不卡一区二区| 国产精品资源网站| 中文字幕精品亚洲| 欧美日韩免费看| 亚洲av无码一区二区乱子伦| 在线激情影院一区| 成人免费图片免费观看| 91最新国产视频| 成人综合久久| 中文字幕乱码人妻综合二区三区| 丁香天五香天堂综合| 免费中文字幕日韩| 欧美视频一二三区| 国内av一区二区三区| 久久久久久网站| 色播一区二区| ijzzijzzij亚洲大全| 美女网站一区二区| 亚洲欧洲久久久| 日韩欧美极品在线观看| 日本xxxx人| 久久久久久久影院| 亚洲免费一区三区| 麻豆传媒网站在线观看| 久久精品久久综合| 成人免费视频入口| 欧美日韩在线播放三区四区| 国产中文字幕在线| 日韩av日韩在线观看| 宅男在线一区| 日韩毛片在线免费看| 91麻豆产精品久久久久久| 欧美一级视频免费观看| 精品国产1区2区3区| 美女精品视频| 国产欧美在线一区二区| 雨宫琴音一区二区在线| 在线精品视频播放| 亚洲五码中文字幕| 人妻无码中文字幕免费视频蜜桃| 欧美激情国内偷拍| 老司机成人在线| 欧美日韩成人免费视频| 久久影院视频免费| 久久国产乱子伦精品| 亚洲最新中文字幕| 韩日一区二区| 一区二区三区不卡在线| 黄网站免费久久| 久久久久黄色片| 亚洲第一视频网| 免费成人在线电影| 欧美日韩电影一区二区| 日韩av中文字幕一区二区三区 | 成人av动漫在线观看| 天天色综合社区| 尤物视频一区二区| 色网站免费观看| 日韩av高清不卡| 日韩欧美一区二区三区在线视频| 日本中文字幕观看| 一区二区三区日韩| 天堂av在线免费观看| 国产精品中文久久久久久久| 亚洲最新色图| 无码人妻精品一区二区三| 日韩欧美国产视频| 黄色成年人视频在线观看| 国产精品二区二区三区| 国产欧美精品久久| 少妇的滋味中文字幕bd| 日韩欧美高清在线| 欧美电影免费观看高清完整| 制服诱惑一区| 不卡的av在线| 中国a一片一级一片| 色综合久久88| 精品国产精品国产偷麻豆| 欧美性受xxxx黒人xyx性爽| 亚洲国产日韩a在线播放性色| 免费黄色片在线观看| 91久久国产精品| 西西人体一区二区| 久久嫩草捆绑紧缚| 日韩av资源在线播放| 伊人久久大香| 精品一区二区中文字幕| 亚洲三级理论片| 青青草免费在线视频| 亚洲影影院av| 日韩在线卡一卡二| 久久久久香蕉视频| 日韩中文字幕免费看| 欧美综合精品| 天天色天天综合网| 色狠狠桃花综合| 精精国产xxxx视频在线中文版| 天堂va久久久噜噜噜久久va| av网站免费线看精品| 国产青青草视频|