精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

智源發(fā)布全球最大中英文向量模型訓(xùn)練數(shù)據(jù)集!規(guī)模高達(dá)3億文本對(duì)

人工智能 新聞
為推動(dòng)大模型開(kāi)源生態(tài),智源研究院發(fā)布全球最大面向中英文語(yǔ)義向量模型訓(xùn)練數(shù)據(jù)集。

9月15日,北京人工智能產(chǎn)業(yè)峰會(huì)暨中關(guān)村科學(xué)城科創(chuàng)大賽頒獎(jiǎng)典禮現(xiàn)場(chǎng),智源研究院發(fā)布面向中英文語(yǔ)義向量模型訓(xùn)練的大規(guī)模文本對(duì)數(shù)據(jù)集MTP(massive text pairs)。

這是全球最大的中、英文文本對(duì)訓(xùn)練數(shù)據(jù)集,數(shù)據(jù)規(guī)模達(dá)3億對(duì),具有規(guī)模巨大、主題豐富、數(shù)據(jù)質(zhì)量高三大特征,進(jìn)而可以推動(dòng)解決中文模型訓(xùn)練數(shù)據(jù)集缺乏問(wèn)題。

圖片

通用語(yǔ)義向量模型是決定大模型性能的關(guān)鍵組件,可以鏈接外模型與外部知識(shí);由「關(guān)聯(lián)文本」為基本元素的優(yōu)質(zhì)訓(xùn)練數(shù)據(jù),是構(gòu)建通用語(yǔ)義向量模型的核心要素。

本次開(kāi)源的MTP數(shù)據(jù)集,正是智源BGE中英文語(yǔ)義向量模型訓(xùn)練所用中英文數(shù)據(jù)。

3億中英向量模型訓(xùn)練數(shù)據(jù)開(kāi)放

數(shù)據(jù)在大模型訓(xùn)練中至關(guān)重要,構(gòu)建高質(zhì)量開(kāi)源數(shù)據(jù)集,特別是用于訓(xùn)練基礎(chǔ)模型的開(kāi)源數(shù)據(jù)集對(duì)大模型發(fā)展意義重大,然而中文社區(qū)卻鮮少數(shù)據(jù)開(kāi)源貢獻(xiàn)者。

圖片

本次發(fā)布的全球最大語(yǔ)義向量模型訓(xùn)練數(shù)據(jù)MTP,具備如下特征:

- 規(guī)模巨大:

3億文本對(duì),中文1億,英文2億。

- 主題豐富:

源自海量?jī)?yōu)質(zhì)文本數(shù)據(jù),涉及搜索、社區(qū)問(wèn)答、百科常識(shí)、科技文獻(xiàn)等多種主題。

- 數(shù)據(jù)質(zhì)量高:

數(shù)據(jù)經(jīng)過(guò)必要的采樣、抽取、過(guò)濾獲得;由該數(shù)據(jù)訓(xùn)練得到的語(yǔ)義向量模型BGE (BAAI General Embedding)性能大幅領(lǐng)先同類(lèi)別模型。

圖片

MTP數(shù)據(jù)集鏈接:https://data.baai.ac.cn/details/BAAI-MTP

BGE 模型鏈接:https://huggingface.co/BAAI

BGE 代碼倉(cāng)庫(kù):https://github.com/FlagOpen/FlagEmbedding

鑒于數(shù)據(jù)的重要性,智源在2021年就推出了全球最大語(yǔ)料庫(kù)WuDaoCorpora,開(kāi)放200GB高質(zhì)量低風(fēng)險(xiǎn)中文語(yǔ)料,由400余個(gè)產(chǎn)學(xué)研單位合作,已有770多個(gè)研發(fā)團(tuán)隊(duì)申請(qǐng),為微軟、哈佛大學(xué)、斯坦福大學(xué)、華為、阿里巴巴、騰訊、鵬城實(shí)驗(yàn)室等提供數(shù)據(jù)服務(wù),有效支撐全球大模型相關(guān)研究。

今年開(kāi)放的最大規(guī)模、可商用、持續(xù)更新的中文開(kāi)源指令數(shù)據(jù)集COIG,由來(lái)自全球40余個(gè)機(jī)構(gòu)的100多名工程師共同參與,創(chuàng)造了跨越國(guó)界、緊密合作的全球數(shù)據(jù)開(kāi)源動(dòng)人故事。

下載達(dá)數(shù)十萬(wàn),廣受歡迎的BGE模型升級(jí)更新

BGE 語(yǔ)義向量模型一經(jīng)發(fā)布就備受大模型開(kāi)發(fā)者社區(qū)關(guān)注,目前Hugging Face累計(jì)下載量達(dá)到數(shù)十萬(wàn),且已被LangChain, LangChain-Chatchat, llama_index 等知名開(kāi)源項(xiàng)目集成。

中文語(yǔ)義向量模型評(píng)測(cè)(C-MTEB)  

 英文語(yǔ)義向量模型評(píng)測(cè)榜(MTEB)

 Langchain官方推文:「BGE模型在MTEB基準(zhǔn)上排名第一」

 LangChain聯(lián)合創(chuàng)始人兼首席執(zhí)行官Harrison Chase推薦

基于社區(qū)反饋,BGE進(jìn)一步優(yōu)化更新,表現(xiàn)更加穩(wěn)健、出色。具體升級(jí)如下:

- 模型更新:

BGE-*-zh-v1.5緩解了相似度分布問(wèn)題,通過(guò)對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行過(guò)濾,刪除低質(zhì)量數(shù)據(jù),提高訓(xùn)練時(shí)溫度系數(shù)temperature至0.02,使得相似度數(shù)值更加平穩(wěn) 。

- 新增模型:

開(kāi)源BGE-reranker 交叉編碼器模型,可更加精準(zhǔn)找到相關(guān)文本,支持中英雙語(yǔ)。不同于向量模型需要輸出向量,BGE-reranker直接文本對(duì)輸出相似度,排序準(zhǔn)確度更高,可用于對(duì)向量召回結(jié)果的重新排序,提升最終結(jié)果的相關(guān)性。

- 新增功能:

BGE1.1增加難負(fù)樣本挖掘腳本,難負(fù)樣本可有效提升微調(diào)后檢索的效果;在微調(diào)代碼中增加在微調(diào)中增加指令的功能;模型保存也將自動(dòng)轉(zhuǎn)成 sentence transformer 格式,更方便模型加載。

值得一提的是,日前智源聯(lián)合Hugging Face發(fā)布了一篇技術(shù)報(bào)告,報(bào)告提出用C-Pack增強(qiáng)中文通用語(yǔ)義向量模型。

圖片

報(bào)告地址:https://arxiv.org/abs/2309.07597

構(gòu)建大模型時(shí)代的類(lèi)Linux生態(tài)

伴隨2022年末ChatGPT 橫空出世,全球大模型研發(fā)進(jìn)入如火如荼的爆發(fā)期,而激烈的競(jìng)爭(zhēng)與高昂的成本,也同時(shí)推動(dòng)著開(kāi)源崛起成為人工智能發(fā)展的關(guān)鍵推動(dòng)力量。

標(biāo)志性的事件是今年5月在全球人工智能圈廣為流傳的一篇Google內(nèi)部文件,聲稱(chēng)「開(kāi)源AI將擊敗谷歌和OpenAI」;來(lái)自Meta的代表性開(kāi)源模型 Llama則對(duì)當(dāng)前產(chǎn)業(yè)發(fā)展起到至關(guān)重要的作用。

作為中國(guó)大模型開(kāi)源生態(tài)圈的代表機(jī)構(gòu),智源正在著力打造FlagOpen飛智大模型技術(shù)開(kāi)源體系,引領(lǐng)共建共享大模型時(shí)代的「類(lèi)Linux」開(kāi)源開(kāi)放生態(tài)。

上線于2022年11月,正式發(fā)布于2023年2月,F(xiàn)lagOpen大模型技術(shù)開(kāi)源體系先見(jiàn)性地預(yù)見(jiàn)大模型開(kāi)源建設(shè)這一大勢(shì)所趨。

現(xiàn)在,智源大模型技術(shù)開(kāi)體系 FlagOpen 新增 FlagEmbedding 版塊,聚焦于 Embedding 技術(shù)和模型,BGE 是其中首個(gè)開(kāi)源模型。

FlagEmbedding:https://github.com/FlagOpen/FlagEmbedding

在BGE項(xiàng)目之外,F(xiàn)lagOpen還有包括大模型算法、模型、數(shù)據(jù)、工具、評(píng)測(cè)等重要組成部分。

其中,F(xiàn)lagEval(天秤)大模型評(píng)測(cè)體系及開(kāi)放平臺(tái),構(gòu)建3維評(píng)測(cè)體系、覆蓋600余項(xiàng)全面能力評(píng)測(cè),旨在建立科學(xué)、公正、開(kāi)放的評(píng)測(cè)基準(zhǔn)、方法、工具集,協(xié)助研究人員全方位評(píng)估基礎(chǔ)模型及訓(xùn)練算法的性能。

每月發(fā)布的FlagEval大模型評(píng)測(cè)榜單,對(duì)主流模型進(jìn)行多維評(píng)測(cè)解讀,打造公正全面金標(biāo)準(zhǔn),正在愈來(lái)愈成為大模型能力評(píng)價(jià)的風(fēng)向標(biāo)。

責(zé)任編輯:張燕妮 來(lái)源: 新智元
相關(guān)推薦

2023-08-09 10:08:00

模型AI

2023-09-15 13:08:56

AI訓(xùn)練

2020-11-18 10:29:07

模型人工智能開(kāi)源

2021-06-04 10:34:19

AI

2015-08-18 15:19:51

2021-09-30 11:20:01

AI 數(shù)據(jù)人工智能

2025-09-17 14:47:51

2020-07-20 09:49:56

開(kāi)源技術(shù) 趨勢(shì)

2020-07-16 13:00:18

人工智能機(jī)器學(xué)習(xí)技術(shù)

2021-03-22 11:16:50

人工智能應(yīng)用基礎(chǔ)設(shè)施

2020-09-10 08:54:09

全球消費(fèi)電子CE智能家居

2021-06-02 00:03:02

人工智能悟道2.0

2020-06-08 11:16:06

百度

2021-10-15 15:26:10

AI 數(shù)據(jù)人工智能

2015-12-01 11:17:41

Windows 10Version 151鏡像

2024-05-15 17:30:51

開(kāi)源模型

2024-06-11 08:40:00

2025-03-10 09:30:00

2009-08-13 09:26:14

.NET正則表達(dá)式

2009-03-17 09:52:22

Unicode中英文Python
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

欧美在线国产| 日韩三级不卡| 国产精品久久久久久久久免费丝袜| 国产精品免费网站| 久久影院一区二区| 欧美猛男男男激情videos| 欧美色成人综合| www.国产在线视频| 成全电影播放在线观看国语| 精品一区二区三区免费毛片爱| 欧美精品18videos性欧| 四虎永久免费影院| 国产亚洲久久| 色天使色偷偷av一区二区| 992tv成人免费观看| 天天干天天做天天操| 久久99精品久久久久| 久久久久久午夜| 亚洲精品电影院| 欧美日韩导航| 日韩欧美国产wwwww| 粉嫩虎白女毛片人体| 日韩激情美女| 国产精品免费aⅴ片在线观看| 国产精品制服诱惑| 国产色片在线观看| 日韩电影免费一区| 欧美国产视频一区二区| 男女男精品视频网站| 国内精品偷拍| 欧美日韩一区二区电影| 亚洲 高清 成人 动漫| 四虎影院观看视频在线观看 | 久久精品综合一区| а√天堂资源在线| 国产一区二区0| 国产日韩欧美日韩大片| 日本视频网站在线观看| 亚洲日韩成人| 久久人91精品久久久久久不卡| 日韩三级在线观看视频| 日韩精品四区| 国产亚洲日本欧美韩国| 女~淫辱の触手3d动漫| 久久中文字幕导航| 亚洲国产精品va在线| 精品人妻一区二区乱码| 日韩中文字幕一区二区高清99| 欧美日韩高清在线播放| 免费看污污网站| 欧美成a人片在线观看久| 精品国产999| 日韩国产欧美亚洲| 欧亚av在线| 色综合久久久久| av天堂永久资源网| 吞精囗交69激情欧美| 色8久久精品久久久久久蜜| 激情深爱综合网| 在线播放高清视频www| 黑丝美女久久久| 六月丁香婷婷激情| 国产综合色区在线观看| 在线观看国产91| 天天爱天天操天天干| 最新日韩一区| 欧美肥胖老妇做爰| 欧美熟妇另类久久久久久多毛| 涩爱av色老久久精品偷偷鲁 | 无码国产精品96久久久久| 成人精品视频一区二区三区 | 五月综合激情网| 国产免费毛卡片| 色尼玛亚洲综合影院| 欧美中文字幕一区二区三区| 亚洲欧美偷拍另类| 日本一区二区三区播放| 精品国产免费人成电影在线观看四季 | 超黄网站在线观看| 日韩欧美精品网站| 一道本在线免费视频| 国产一区二区久久久久| 亚洲第一区在线| 亚洲一区二区三区日韩 | 日韩美女爱爱视频| 中老年在线免费视频| 在线视频国内一区二区| 一级片黄色免费| 精品人人人人| 丝袜一区二区三区| 激情五月婷婷小说| 老牛影视一区二区三区| 91在线免费视频| 天天干天天插天天操| 国产精品免费aⅴ片在线观看| 8x8ⅹ国产精品一区二区二区| 国产精品论坛| 欧美电影一区二区三区| 呦呦视频在线观看| 色97色成人| 69久久夜色精品国产69乱青草| 中文字幕日本视频| 成人精品一区二区三区四区 | 日韩精品视频一区二区| 日本午夜一区| 91国产高清在线| 国产尤物在线观看| 久久青草欧美一区二区三区| 男女h黄动漫啪啪无遮挡软件| 国产精品论坛| 日韩欧美在线综合网| 久久亚洲无码视频| 亚洲区欧美区| 91精品视频在线免费观看| 日韩一二三四| 亚洲午夜激情av| 色综合五月婷婷| 国产永久精品大片wwwapp| 欧美激情区在线播放| 一区二区 亚洲| 国产丝袜美腿一区二区三区| 青草视频在线观看视频| 亚洲午夜剧场| 在线免费观看羞羞视频一区二区| 日本免费在线播放| 国产丶欧美丶日本不卡视频| 亚洲国产精品毛片| 欧美xxx性| 亚洲国产日韩一区| 欧美日韩精品一区二区三区视频播放| 日本欧美在线观看| 欧美日韩亚洲一区二区三区四区| 天使と恶魔の榨精在线播放| 欧美日韩成人一区| 国产伦理片在线观看| 一道本一区二区| 成人动漫视频在线观看免费| 超碰在线网址| 69堂国产成人免费视频| 2017亚洲天堂| 久久精品久久久精品美女| 欧洲av一区| 欧美日韩国产v| 亚洲午夜国产成人av电影男同| 成年免费在线观看| 99免费精品视频| 成人免费播放器| 牛牛影视一区二区三区免费看| 欧美激情视频一区二区| 亚洲精品国产av| 亚洲一区二区欧美激情| 亚洲视频天天射| 亚洲精品乱码久久久久久蜜桃麻豆| 成人午夜电影在线播放| 男女视频在线| 亚洲成人久久网| 国产一级18片视频| 久久亚洲一级片| 美女黄色片视频| 久久精品高清| 亚洲综合中文字幕在线| 丝袜中文在线| 日韩av在线免费播放| 日本视频网站在线观看| 亚洲国产精品av| 亚洲免费av一区| 欧美激情自拍| 精品久久精品久久| 久久91导航| 萌白酱国产一区二区| 成人午夜视频一区二区播放| 欧美日韩中文在线观看| 神马久久久久久久久久久| 久久99精品久久久久婷婷| 国产911在线观看| 果冻天美麻豆一区二区国产| 欧洲精品毛片网站| 97人人在线| 精品久久国产字幕高潮| 国产精品视频免费播放| 国产精品少妇自拍| 日本美女视频网站| 视频一区视频二区中文| 在线观看视频黄色| 欧美久久精品| 国产人妖伪娘一区91| 日韩成人伦理| 在线免费观看羞羞视频一区二区| 国产高潮在线观看| 日韩欧美在线一区| 国产成人自拍网站| 久久久久久免费毛片精品| 91丝袜超薄交口足| 麻豆精品网站| 97在线免费视频观看| 伊人久久大香线蕉av不卡| 国产中文字幕亚洲| 毛片电影在线| 久久av在线播放| 黄网在线观看| 精品国产凹凸成av人网站| 真实新婚偷拍xxxxx| 亚洲尤物在线视频观看| 91激情视频在线观看| 国产ts人妖一区二区| 丰满人妻中伦妇伦精品app| 91精品啪在线观看国产81旧版| 久久综合一区| 亚洲精品一区二区三区中文字幕| 青青精品视频播放| 丰满大乳少妇在线观看网站| 中文字幕在线成人| 色久视频在线播放| 欧美成人伊人久久综合网| 免费黄色一级大片| 精品欧美aⅴ在线网站| www.av免费| 国产精品三级av| 日本xxx在线播放| 成人午夜看片网址| 污免费在线观看| 麻豆精品国产传媒mv男同| 亚洲色成人一区二区三区小说| 你懂的国产精品| 在线视频精品一区| 韩日一区二区三区| 久久涩涩网站| 精品精品精品| 成人在线免费观看一区| 国产午夜亚洲精品一级在线| 国产精品永久免费观看| 欧美影视资讯| 国产97免费视| 天堂中文在线播放| 国模私拍一区二区三区| 伦理在线一区| 九色成人免费视频| sm国产在线调教视频| 久久久国产视频| av在线第一页| 在线色欧美三级视频| 国产在线91| 伊人亚洲福利一区二区三区| 日韩大片b站免费观看直播| 亚洲精品按摩视频| 色av男人的天堂免费在线| 亚洲精品第一页| 亚洲日本国产精品| 日韩电影中文字幕在线观看| 日本免费一区视频| 亚洲精品美女久久久| 亚洲AV成人无码一二三区在线| 亚洲成人av在线播放| 四季av日韩精品一区| 亚洲国产精品久久久久| 无码精品人妻一区二区| 日韩电影大全免费观看2023年上| 午夜视频在线免费播放| 亚洲男人天堂久| 国产高清一区在线观看| 中文字幕亚洲情99在线| 美女羞羞视频在线观看| 欧美成aaa人片在线观看蜜臀| 精品国产一区二| 日韩在线不卡视频| 秋霞午夜在线观看| 欧美成年人在线观看| 新版中文在线官网| 久久久久亚洲精品国产| 松下纱荣子在线观看| 国产精品啪视频| 国产麻豆一区二区三区| 成人av免费电影| 羞羞色国产精品网站| 亚洲不卡1区| 99久久九九| 91动漫在线看| 久久亚洲图片| 亚洲无在线观看| 成人激情黄色小说| 影音先锋制服丝袜| 亚洲男人的天堂在线观看| 国产一级中文字幕| 色噜噜狠狠成人中文综合| 一级片aaaa| 亚洲福利影片在线| 91在线观看| 欧美精品成人91久久久久久久| 成人直播视频| 成人网在线免费看| 免费观看成人www动漫视频| 亚洲视频在线观看日本a| 国精品一区二区| 性刺激的欧美三级视频| 福利一区福利二区| 亚洲第一综合网| 亚洲国产一二三| 中国精品一区二区| 亚洲成人久久网| 女女色综合影院| 青草热久免费精品视频 | 亚洲自拍av在线| 精品一区在线| 亚洲国产一二三精品无码| 久久成人亚洲| 亚洲av综合色区无码另类小说| 久久综合av免费| 国产一级视频在线观看| 欧美男男青年gay1069videost | 日韩中文字幕视频在线| а√在线中文在线新版| 国产日韩欧美日韩大片| 九九精品在线| 免费一级特黄毛片| 韩国成人在线视频| 国产aⅴ激情无码久久久无码| 亚洲一区二区在线观看视频 | 一区二区冒白浆视频| 夜夜嗨av一区二区三区网站四季av| 爱爱爱爱免费视频| 国产偷v国产偷v亚洲高清| 99视频在线看| 欧美v日韩v国产v| 久做在线视频免费观看| 国产91在线播放九色快色| 美女视频亚洲色图| 日韩欧美精品免费| 国产精品一区二区免费不卡 | 国内av一区二区三区| 国内精品久久久久影院优| 免费精品一区二区三区在线观看| 亚洲bbw性色大片| 男女视频一区二区| 免费人成又黄又爽又色| 懂色aⅴ精品一区二区三区蜜月| 精品人妻少妇AV无码专区| 日韩中文字幕免费看| 成人国产综合| 亚州欧美一区三区三区在线| 日日嗨av一区二区三区四区| 在线免费观看成年人视频| 亚洲成av人片| 日韩中文字幕综合| 91干在线观看| 日本亚洲不卡| 亚洲精品无码久久久久久| 99在线精品观看| 天天综合网久久综合网| 精品亚洲va在线va天堂资源站| а√天堂中文在线资源8| 国产精品欧美久久| 国产欧美精品久久| 97人妻精品一区二区免费| 一本久道久久综合中文字幕| 日本成人一区| 国产精品白嫩美女在线观看| 欧美综合在线视频观看| jizz18女人| 亚洲另类春色国产| 亚洲乱码精品久久久久..| 国语自产在线不卡| 色88888久久久久久影院| 黄色一级免费大片| 国产精品麻豆视频| 国产v片在线观看| 久久久久久久久久久91| 台湾佬综合网| 手机在线看福利| 综合色天天鬼久久鬼色| 国产成人av免费看| 午夜精品免费视频| 精品国产一区一区二区三亚瑟| 国产成人黄色网址| 夜夜嗨av一区二区三区| 天堂av在线7| 国产精品亚洲片夜色在线| 亚洲精品小说| 免费无码一区二区三区| 欧洲一区二区三区在线| 国产网友自拍视频导航网站在线观看| 99久久99| 视频一区二区中文字幕| 日日噜噜夜夜狠狠久久波多野| 亚洲成人中文字幕| 欧美在线va视频| av日韩在线看| 国产日韩视频一区二区三区| 国产精品天天操| 欧美一级免费视频| 香蕉国产精品| 深爱五月激情网| 91精品国产乱码| 免费电影日韩网站| 成人在线免费观看网址| 久久亚洲一区二区三区四区| 国产区精品在线| 日本91av在线播放| 欧美日本一区二区视频在线观看| 人人妻人人藻人人爽欧美一区| 制服丝袜亚洲网站|