精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

谷歌DeepMind發布Gecko:專攻檢索,與大7倍模型相抗衡

人工智能 新聞
Gecko 是一種通用的文本嵌入模型,可用于訓練包括文檔檢索、語義相似度和分類等各種任務。

想了解更多AIGC的內容,請訪問:

51CTO AI.x社區

http://m.jxzklqfsx.com/aigc/

文本嵌入模型在自然語言處理中扮演著重要角色,為各種文本相關任務提供了強大的語義表示和計算能力。

在語義表示上,文本嵌入模型將文本轉換為高維向量空間中的向量表示,其中語義上相似的文本在向量空間中距離較近,從而捕捉了文本的語義信息,這種表示有助于計算機更好地理解和處理自然語言;在文本相似度計算上,基于文本嵌入的向量表示,可以輕松地計算文本之間的相似度,從而支持各種應用,如信息檢索、問答系統和推薦系統;在信息檢索上,文本嵌入模型可以用于改善信息檢索系統,通過將查詢與文檔嵌入進行比較,找到最相關的文檔或段落;在文本分類和聚類上,通過將文本嵌入到向量空間中,可以進行文本分類和聚類任務。

不同于以往,最近的研究重點不是為每個下游任務構建單獨的嵌入模型,而是尋求創建支持多個任務的通用嵌入模型。

然而,通用文本嵌入模型面臨這樣一個挑戰:這些模型需要大量的訓練數據才能全面覆蓋所需的領域,研究主要集中在使用大量的訓練示例來解決所面臨的挑戰。

LLM 的出現提供了一種強大的替代方案,因為 LLM 包含跨各個領域的大量知識,并且被認為是出色的小樣本學習者。最近的研究已經證明了使用 LLM 進行合成數據生成的有效性,但重點主要是增強現有的人類標記數據或提高特定領域的性能。

這就促使研究者開始審視這一問題:我們可以在多大程度上直接利用 LLM 來改進文本嵌入模型。

為了回答這一問題,本文來自谷歌 DeepMind 的研究者提出了 Gecko,這是一種從 LLM 中蒸餾出來的多功能文本嵌入模型,其在 LLM 生成的合成數據集 FRet 上進行訓練,并由 LLM 提供支持。

通過將 LLM 的知識進行提煉,然后融入到檢索器中,Gecko 實現了強大的檢索性能。在大規模文本嵌入基準(MTEB,Massive Text Embedding Benchmark)上,具有 256 個嵌入維度的 Gecko 優于具有 768 個嵌入尺寸的現有模型。具有 768 個嵌入維度的 Gecko 的平均得分為 66.31,在與 7 倍大的模型和 5 倍高維嵌入進行比較時,取得了相競爭的結果。

  • 論文地址:https://arxiv.org/pdf/2403.20327.pdf
  • 論文標題:Gecko: Versatile Text Embeddings Distilled from Large Language Models

方法介紹

Gecko 是一個基于 1.2B 參數預訓練的 Transformer 語言模型,該模型經歷了兩個額外的訓練階段:預微調和微調。

預微調

該研究使用兩個預微調數據集。首先是使用 Ni 等人提出的大規模社區 QA 數據集,該數據集包括來自在線論壇和 QA 網站的文本對。接下來,研究者從 Web 上抓取標題 - 正文文本對,這些文本對可以從網站上獲得。

對大量無監督文本對進行預微調已被證明可以提高小型雙編碼器在各種下游任務中的性能,包括文檔檢索和語義相似性 。預微調階段的目標是讓模型接觸大量的文本多樣性,這對于訓練緊湊型文本嵌入模型是必要的。

FRet :兩步蒸餾

使用 LLM 生成 FRet 的兩階段方法。一般來講,訓練嵌入模型的傳統方法依賴于大型的、手動標記的數據集。然而,創建此類數據集既耗時又昂貴,并且常常會導致不良偏差和缺乏多樣性。在這項工作中,本文提出了一種生成合成數據來訓練多任務文本嵌入模型的新方法,該方法通過兩步蒸餾可以全面利用 LLM 掌握的知識。生成 FRet 的整體流程如圖 2 所示:

統一微調混合

接下來,本文將 FRet 與其他學術訓練數據集以相同的格式結合起來:任務描述、輸入查詢、正向段落(或目標)和負向段落(或干擾項),從而創建一種新穎的微調混合。然后,本文使用這種混合與標準損失函數來訓練嵌入模型 Gecko。

除了 FRet 之外,學術訓練數據集包括:Natural Questions 、HotpotQA、FEVER、MedMCQA、MedMCQA、SNLI、MNLI 以及來自 Huggingface 的幾個分類數據集。對于多語言模型,本文添加了來自 MIRACL 的訓練集。所有數據集都經過預處理,具有統一的編碼格式,包含任務描述、查詢、正向段落和負向段落。

實驗

該研究在 MTEB 基準上評估了 Gecko。表 1 總結了 Gecko 和其他基線的比較結果。

Gecko 在每個文本嵌入任務上都顯著超越了所有類似大小的基線模型(<= 1k 嵌入尺寸,<= 5B 參數)。與 text-embedding-3-large-256(OpenAI)、GTR 和 Instructor 研究相比,Gecko-1b-256 性能更好。Gecko-1b-768 通常可以匹配或超過更大模型的性能,包括 text-embedding-3-large (OpenAI)、E5-mistral、GRit 和 Echo 嵌入。值得注意的是,這些模型都使用 3-4k 嵌入維度并且參數均超過 7B。此外,該研究還觀察到 Gecko 在分類、STS 和摘要方面達到了新的 SOTA 水平。

多語言檢索結果。表 2 總結了 Gecko 和其他基線在 MTEB 上的性能比較。

表 3 總結了不同的標記策略用于 FRet 的結果,實驗過程中使用了不同的正樣本和負樣本段落。從結果可以發現使用 LLM 選擇的最相關段落總是優于使用原始段落。表 5 也說明了這種情況經常發生。

圖片

圖片

FRet 提供了對多種任務的查詢結果,包括問答、搜索結果、事實檢查和句子相似度。表 4 測試了 FRet 的多樣性如何影響 MTEB 中任務之間的模型泛化性。首先,該研究使用來自特定任務(例如,FRet 問答)的 30 萬個數據來訓練各個模型。此外,研究者還使用原始采樣分布或均勻采樣分布從所有四個任務中抽取的 300k 樣本(每個任務 75k;FRet-all-task)來訓練模型。觀察到 FRet-all-tasks 模型的卓越性能,特別是當任務被均勻采樣時。該研究還發現統一格式顯著影響嵌入的質量,因為它有助于模型更好地分離不同的任務。

表 4 的最后幾行展示了 Gecko 如何學習更好的語義相似性和分類。

圖片

了解更多內容,請參考原論文。

想了解更多AIGC的內容,請訪問:

51CTO AI.x社區

http://m.jxzklqfsx.com/aigc/

責任編輯:張燕妮 來源: 機器之心
相關推薦

2023-10-31 19:20:29

語言模型英偉達芯片

2023-02-27 09:48:30

谷歌模型

2024-04-01 07:00:00

模型AI

2025-05-06 09:08:00

2024-04-07 08:50:00

谷歌框架

2022-08-22 15:47:48

谷歌模型

2012-03-03 20:22:07

Siri

2024-06-03 06:49:53

2024-03-29 13:55:05

AI模型

2024-08-02 13:14:51

2019-04-10 15:54:30

谷歌Android技術

2025-04-08 00:40:00

谷歌合成數據大模型

2023-05-08 15:14:38

技術AI

2022-05-23 15:35:11

字節跳動語音識別

2023-09-21 10:29:01

AI模型

2023-09-03 12:56:43

2025-05-15 09:17:00

2023-07-31 10:56:02

ChatGPTAI

2024-09-11 12:31:59

2024-08-01 13:30:00

點贊
收藏

51CTO技術棧公眾號

在线观看一区视频| 亚洲 美腿 欧美 偷拍| 久9久9色综合| 在线观看视频一区二区| 日本不卡二区高清三区| 进去里视频在线观看| 日韩综合一区| 欧美一区二区免费视频| 妞干网在线播放| 色视频精品视频在线观看| 首页综合国产亚洲丝袜| 综合网中文字幕| 九九视频精品在线观看| 免费日本一区二区三区视频| 国产成人免费视频一区| 欧美在线观看一区二区三区| 日本一道本视频| 亚洲精品高潮| 欧美视频在线播放| 国产精品国产亚洲精品看不卡| 日产精品久久久久久久性色| 激情综合色综合久久综合| 久久久在线视频| www.黄色com| www.神马久久| 欧美肥胖老妇做爰| 日本www在线视频| 日本在线观看网站| 91麻豆福利精品推荐| 亚洲一区二区三区乱码aⅴ| 成人午夜视频在线播放| 欧美黄色免费| 亚洲天堂网在线观看| 精品一区二区三区四区五区六区| 一区二区国产精品精华液| 国产欧美精品xxxx另类| 久久这里只有精品6| 三级成人在线| 777777国产7777777| 国产专区一区二区三区| 亚洲人成网站在线| 国产一区二区色噜噜| 国产精品天天干| 青草成人免费视频| 91色九色蝌蚪| 成人免费高清在线播放| 成年人视频观看| 日韩人体视频一二区| 97久久网站| 日韩性xxxx| av伊人久久| 欧美综合视频| 久久久久久亚洲综合影院红桃| 国产欧美日韩综合精品| 久久99久久久| 先锋资源久久| 日韩中文理论片| 亚洲一区二区三区日韩| 日韩精品免费一区二区夜夜嗨| 欧美mv日韩mv国产网站| www.cao超碰| 91精品美女| 欧美日韩一区国产| 男女无套免费视频网站动漫| 中文字幕在线官网| 欧美性猛交xxxx乱大交蜜桃| 久久国产精品网| 毛片在线网址| 亚洲美女精品一区| aaa免费在线观看| 日本中文字幕在线视频| 国产校园另类小说区| 免费av一区二区三区| 午夜av免费观看| 99久久精品国产一区二区三区| 91精品久久久久久蜜桃| 国产色综合视频| 日本成人超碰在线观看| 国产精品看片资源| 中文字幕日产av| 日韩av一区二区三区| 国产精品av免费在线观看| 国产一级片免费在线观看| 久久精品午夜| 91精品国产乱码久久久久久蜜臀| 五月天婷婷网站| 亚洲精选久久| 38少妇精品导航| 中文人妻av久久人妻18| 日韩精品一级中文字幕精品视频免费观看 | 国产男人精品视频| 瑟瑟视频在线免费观看| 老汉av免费一区二区三区| 国产在线精品一区免费香蕉| 国产又色又爽又黄又免费| 国产一区二区三区在线观看精品| 91九色对白| 亚洲色偷精品一区二区三区| 久久九九久久九九| 神马影院午夜我不卡| 香蕉视频网站在线观看| 亚洲伦理在线精品| 老太脱裤让老头玩ⅹxxxx| 在线看的毛片| 欧美日韩一区二区三区不卡| 成人性生交视频免费观看| 成人av影音| 一区二区三区回区在观看免费视频| 乱老熟女一区二区三区| 欧美精品色网| 欧美与欧洲交xxxx免费观看| 亚洲一卡二卡在线| 国产精品一区不卡| 精品视频高清无人区区二区三区| 国产精品视频一区二区久久| 亚洲欧美韩国综合色| 7777在线视频| 在线观看欧美日韩电影| 欧美美女bb生活片| 男女性杂交内射妇女bbwxz| 国内黄色精品| 欧美裸身视频免费观看| 免费污污视频在线观看| 国产一区二区剧情av在线| 久久久一本精品99久久精品| 黄色大片在线看| 亚洲色图第一区| 久久久免费视频网站| 91丨精品丨国产| 亚洲美女性生活视频| 日韩精品一区二区在线| 黑人性生活视频| 国产一区二区亚洲| 欧美极品在线播放| 毛片在线免费播放| 国产不卡视频一区| 麻豆91av| 欧美xxxx视频| 欧美精选一区二区| 在线免费观看成年人视频| 亚洲男女av一区二区| 国产成人在线一区| 日韩在线观看视频一区| 亚洲视频 欧洲视频| 狠狠热免费视频| 美女av一区| 日韩在线观看免费网站| 激情五月色婷婷| 九九视频精品免费| 色阁综合av| japanese23hdxxxx日韩 | 国产精品黄色网| 国产精品一二三| 日本午夜一区二区三区| 国产在线精彩视频| 日韩欧美国产麻豆| 在线视频这里只有精品| 日韩avvvv在线播放| 欧美人xxxxx| 久草在线资源福利站| 在线电影一区二区三区| 2019男人天堂| 日韩av一区二| 亚洲国产精品日韩| 最新中文字幕在线播放| 亚洲精品国产精品国产自| 精品深夜av无码一区二区老年| 国产综合久久久久久久久久久久| 亚洲一区三区电影在线观看| 另类图片综合电影| 亚洲欧美国产另类| av毛片在线免费观看| www.66久久| 免费看又黄又无码的网站| 超碰cao国产精品一区二区| 欧美激情国产精品| 高潮一区二区三区乱码| 亚洲欧洲av一区二区三区久久| 国产成人精品视频ⅴa片软件竹菊| 51亚洲精品| 国内精品免费午夜毛片| 香港三日本三级少妇66| 欧美日韩在线免费| 亚洲永久无码7777kkk| 免费视频一区| 日韩欧美在线一区二区| 久久久加勒比| 久久电影一区二区| 91国产精品一区| √…a在线天堂一区| 中文字幕在线视频一区二区| 黄色欧美日韩| 精品蜜桃传媒| 成人免费网站黄| 93在线视频精品免费观看| 国产精品视频网| 在线网址91| 亚洲精品之草原avav久久| 日韩精品一区二区亚洲av观看| 欧美激情自拍偷拍| 男插女视频网站| 国产精品久久久久久久免费软件| 91久久久久久久久| 蜜桃av在线| 最近2019中文字幕mv免费看 | 蜜臀av在线播放| 亚洲视频电影图片偷拍一区| 在线观看视频中文字幕| 亚洲一区二区三区国产| 国产 中文 字幕 日韩 在线| 蜜桃视频一区二区三区| www.在线观看av| 国内成人精品| 亚洲一区免费网站| 国产精品av一区二区三区| 久久精品国产成人| 天堂成人在线视频| 欧美另类一区二区三区| 中文字幕激情小说| 亚洲精品va在线观看| 欧洲熟妇的性久久久久久| 人妖欧美一区二区| 正在播放一区二区三区| 黄色美女久久久| 成人免费高清完整版在线观看| 伊人网在线播放| 九九久久精品一区| 伊人免费在线| 亚洲免费视频在线观看| 国产老妇伦国产熟女老妇视频| 黑人精品xxx一区| 久久久久久成人网| 99精品视频在线观看免费| 色网站在线视频| 日韩福利电影在线观看| 色综合天天综合网天天看片| 噜噜噜在线视频| 国产精品77777竹菊影视小说| 国产精品第12页| 成人三级视频| 欧美精品成人一区二区在线观看| 久久久香蕉视频| 国产主播第一页| 国产在线拍揄自揄拍视频| 亚洲精品555| 在线亚洲a色| 久久这里只有| 岛国av在线一区| 亚洲精品免费一二三区| 欧美高清视频一二三区| 色yeye香蕉凹凸一区二区av| 日韩免费在线观看av| 99精品国产高清一区二区麻豆| 国产精品人人做人人爽| 亚洲日本天堂| 2018日韩中文字幕| av网站在线免费观看| 亚洲视频日韩精品| 亚州男人的天堂| 欧美日韩中文字幕一区| 青青草免费观看视频| 婷婷中文字幕一区三区| 黄色激情视频在线观看| 亚洲一区二区在线免费观看视频| 午夜激情福利电影| 国产精品久久国产精麻豆99网站 | 久草在线视频福利| 日韩精品中文字幕在线播放| japanese国产| 一本色道亚洲精品aⅴ| 国产精品一区二区3区| 97人妻精品一区二区三区动漫| 色综合天天综合网国产成人综合天| 欧美成人aaa片一区国产精品| 亚洲色大成网站www久久九九| 免费三级在线观看| 亚洲欧美偷拍三级| 538任你躁在线精品视频网站| 亚洲欧美激情在线| 99热国产在线观看| 色婷婷综合久久久中文字幕| 日本成人一级片| 欧美猛男gaygay网站| 亚洲欧美激情另类| 日韩精品视频在线| 国产在线观看网站| 日韩一级黄色av| a天堂资源在线| 欧美一级大片视频| 精品国产欧美日韩一区二区三区| 国产精品久久久久久久美男 | 欧美~级网站不卡| 青草视频在线观看视频| 久久亚洲二区| 久久久久久久久久一区二区| 国产91丝袜在线播放0| 97人妻天天摸天天爽天天| 国产精品久久一级| 免费观看一级视频| 91国偷自产一区二区开放时间 | 色综合久久精品| 97久久人国产精品婷婷| 欧美成人r级一区二区三区| 天天摸天天碰天天爽天天弄| 亚洲欧洲高清在线| 欧美人体视频xxxxx| 床上的激情91.| 99视频在线免费播放| 久久激情综合| 五月天av在线播放| 26uuu精品一区二区在线观看| 天堂网av2018| 五月天激情小说综合| 一级做a爱片久久毛片| 亚洲第一区中文99精品| 成av人电影在线观看| 九九精品视频在线| 99久久精品一区二区成人| 99在线观看视频网站| av中文一区| r级无码视频在线观看| 国精品**一区二区三区在线蜜桃| 国模无码视频一区| 亚洲欧洲日韩女同| 精产国品一区二区| 日韩久久免费视频| а√天堂8资源在线官网| 国产成人av在线| 国产精品99久久免费| 一区二区不卡在线视频 午夜欧美不卡'| 亚洲精品乱码| 亚洲一区二区偷拍| 国产精品美女一区二区| 欧美一级片免费在线观看| 91麻豆精品91久久久久久清纯 | 天然素人一区二区视频| 国产精品日韩一区二区免费视频| 98精品久久久久久久| 日韩精品久久一区二区| 极品少妇xxxx精品少妇偷拍| 黄瓜视频污在线观看| 亚洲一区二区欧美激情| 一区二区视频网站| 中日韩美女免费视频网址在线观看| 国产高潮在线| 99超碰麻豆| 久久伦理在线| 色七七在线观看| 26uuu精品一区二区三区四区在线| 久草福利资源在线观看| 欧美一级黄色录像| 毛片网站在线免费观看| 国产精品男人爽免费视频1| 自拍偷拍一区| 久久影视电视剧免费网站| 国产激情无套内精对白视频| 久久久精品美女| 久久免费影院| 水蜜桃一区二区| 久久97超碰国产精品超碰| 免费网站在线高清观看| 91福利国产成人精品照片| 日韩一级片免费在线观看| 欧美一区三区三区高中清蜜桃| 风间由美性色一区二区三区四区 | 日本精品视频网站| 一本色道久久综合亚洲精品酒店| 91九色在线观看视频| 97精品久久久久中文字幕| 粉嫩aⅴ一区二区三区| 亚洲色图日韩av| 成人观看网址| 国产麻豆乱码精品一区二区三区 | 日韩中文视频免费在线观看| 亚洲免费一区| 中文字幕av导航| 国产一区在线观看视频| 三上悠亚作品在线观看| 欧美精品一区男女天堂| 草草在线观看| 欧美另类一区| 国产一区二区三区四区五区入口| 久久99久久99精品免费看小说| 91精品国产一区二区三区蜜臀| av免费在线观| 国产日韩欧美一区二区三区四区| 国产欧美在线| 插我舔内射18免费视频| 在线亚洲精品福利网址导航| 91官网在线| 成人欧美一区二区三区黑人免费| 性xx色xx综合久久久xx| 51妺嘿嘿午夜福利| 欧美久久一区二区| www.欧美日本韩国| 国产亚洲一区二区三区在线播放| 国产日韩欧美| 蜜臀久久99精品久久久久久| 欧美一区二区成人| 欧美办公室脚交xxxx|