精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

大模型應(yīng)用落地:如何選擇合適的 Embedding 模型? 原創(chuàng)

發(fā)布于 2024-6-28 10:28
瀏覽
0收藏

0、背景落地

在生成式人工智能(GenAI)領(lǐng)域,檢索增強(qiáng)生成(RAG)作為一種策略脫穎而出,它通過(guò)集成外部數(shù)據(jù)來(lái)擴(kuò)充像 ChatGPT 這樣的大型語(yǔ)言模型(LLM)的現(xiàn)有知識(shí)庫(kù)。

RAG 系統(tǒng)核心涉及三種關(guān)鍵的人工智能模型組件:嵌入(Embedding)模型負(fù)責(zé)將信息轉(zhuǎn)化為數(shù)學(xué)向量,重排名(Reranker)模型則用于優(yōu)化搜索結(jié)果,而強(qiáng)大的基礎(chǔ)語(yǔ)言模型確保了豐富的語(yǔ)境理解和生成。

本篇文章旨在指導(dǎo)您依據(jù)數(shù)據(jù)特性及目標(biāo)領(lǐng)域,比如:金融專業(yè),來(lái)挑選最合適的嵌入模型,從而最大化 RAG 系統(tǒng)的效能與準(zhǔn)確性。

1、文本數(shù)據(jù):MTEB 排行榜

HuggingFace 推出的 MTEB leaderboard 是一個(gè)綜合性的文本嵌入模型比較平臺(tái),讓您可以一覽各模型的綜合性能表現(xiàn)。

為了滿足向量搜索的需求,建議優(yōu)先關(guān)注“Retrieval Average”這一列,并按降序排列,以識(shí)別在檢索任務(wù)中表現(xiàn)最優(yōu)的模型。在此基礎(chǔ)上,尋找那些內(nèi)存占用小、效率高的佼佼者。

  • 嵌入向量維度指的是模型輸出向量的長(zhǎng)度,即函數(shù) f 將輸入 x 轉(zhuǎn)化為向量 y 的 y 部分,體現(xiàn)了模型對(duì)文本特征的編碼深度。
  • 而最大 Token 數(shù)則是模型能夠處理的文本片段的最大長(zhǎng)度,相當(dāng)于函數(shù) f中的輸入 x,影響著單次請(qǐng)求能包含的信息量。

在篩選理想模型時(shí),您不僅可根據(jù)檢索性能排序,還能夠依據(jù)特定條件進(jìn)一步篩選:

  • 語(yǔ)言支持:涵蓋法語(yǔ)、英語(yǔ)、中文、波蘭語(yǔ)等多語(yǔ)種。(示例篩選:task=retrieval, Language=chinese)
  • 領(lǐng)域適應(yīng):針對(duì)法律文本的專業(yè)應(yīng)用。(如:task=retrieval, Domain=law)

值得注意的是,MTEB上的排名可能因新公開的訓(xùn)練數(shù)據(jù)而有所偏差,某些模型的評(píng)分可能存在虛高現(xiàn)象。因此,參考 HuggingFace 的官方博客,學(xué)習(xí)如何辨別模型排名的真實(shí)可靠性顯得尤為重要。在訪問(wèn)每個(gè)模型的“模型卡片”頁(yè)面時(shí),以下幾個(gè)步驟至關(guān)重要:

  • 深入探究訓(xùn)練詳情:查找相關(guān)博客和研究論文,這些資料會(huì)詳細(xì)介紹模型的訓(xùn)練數(shù)據(jù)、任務(wù)設(shè)定等關(guān)鍵信息。
  • 留意模型來(lái)源:知名機(jī)構(gòu)或公司的模型往往更值得信賴。比如:voyage-lite-02-instruct 模型的卡片缺少與其同系列其他模型的關(guān)聯(lián)信息,暗示其可能存在過(guò)擬合問(wèn)題,不推薦實(shí)際部署。

基于上述考量,我建議使用 Snowflake 新推出的“snowflake-arctic-embed-1”模型。該模型不僅在排名上表現(xiàn)搶眼,而且以其較小的體積適合在有限資源的設(shè)備上運(yùn)行,此外,模型卡片提供的博客和論文鏈接也增加了其透明度和可信度。

2、圖像數(shù)據(jù):ResNet50

如果您希望查找與某張圖片風(fēng)格或內(nèi)容相似的其他圖片,比如:搜尋更多關(guān)于蘇格蘭折耳貓的圖像資料,一種方法是上傳一張?jiān)撈贩N貓的照片,并利用圖像搜索引擎去發(fā)掘類似圖片。

ResNet50 作為一種廣泛采納的卷積神經(jīng)網(wǎng)絡(luò)(CNN)模型,自2015年微軟基于 ImageNet 數(shù)據(jù)集的訓(xùn)練成果以來(lái),便成為了圖像識(shí)別領(lǐng)域的基石之一。

類似地,在面對(duì)視頻搜索需求時(shí),ResNet50 能夠發(fā)揮作用,通過(guò)將視頻分解成一系列靜態(tài)幀,對(duì)每一幀應(yīng)用模型以生成對(duì)應(yīng)的嵌入向量。隨后,基于這些向量進(jìn)行相似性比對(duì),系統(tǒng)能夠甄選出與查詢視頻最為接近的視頻內(nèi)容,從而為用戶提供高度匹配的搜索結(jié)果。

3、音頻數(shù)據(jù):PANNs

就如同圖像搜索一樣,您也能夠依據(jù)提供的音頻片段去探尋類似的音頻內(nèi)容。

PANNs(預(yù)訓(xùn)練音頻神經(jīng)網(wǎng)絡(luò))作為一種主流的音頻檢索 Embedding 模型,其優(yōu)勢(shì)在于它基于龐大的音頻資料庫(kù)進(jìn)行了預(yù)先訓(xùn)練,對(duì)此在音頻分類與標(biāo)簽分配等任務(wù)上展現(xiàn)出卓越的能力。

4、多模態(tài)圖像與文本數(shù)據(jù):SigLIP 或 Unum

近年來(lái),一系列旨在對(duì)文本、圖像、音頻及視頻等多種非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行綜合訓(xùn)練的 Embedding 模型應(yīng)運(yùn)而生。這些創(chuàng)新模型能夠在統(tǒng)一的向量空間框架下,有效把握并表達(dá)不同形態(tài)的非結(jié)構(gòu)數(shù)據(jù)所蘊(yùn)含的深層語(yǔ)義信息。

多模態(tài) Embedding 技術(shù)的發(fā)展,使得跨領(lǐng)域的應(yīng)用如文本導(dǎo)向的圖像檢索、圖像內(nèi)容的自動(dòng)生成描述,乃至圖像間的相似性搜索成為可能,極大地拓寬了人工智能的應(yīng)用范疇。

2021年,OpenAI 發(fā)布的 CLIP 作為 Embedding 模型的典范,開辟了新領(lǐng)域,盡管其定制化微調(diào)的需求增加了使用的復(fù)雜度。這一挑戰(zhàn)隨后在2024年迎來(lái)了轉(zhuǎn)機(jī),谷歌推出了 SigLIP(Sigmoidal-CLIP),該模型憑借在 zero-shot prompt 任務(wù)上的出色表現(xiàn),顯著降低了部署難度,提升了用戶體驗(yàn)。

與此同時(shí),輕量級(jí)的小型 LLM(語(yǔ)言模型)日益受到青睞。它們的吸引力在于能夠擺脫對(duì)高端云計(jì)算資源的依賴,輕松實(shí)現(xiàn)在個(gè)人筆記本上的運(yùn)行。這些“小而美”的模型,因內(nèi)存占用低、響應(yīng)速度快以及處理效率高的特點(diǎn),正逐步改變著 AI 應(yīng)用的格局。Unum 等平臺(tái)更是提供了集成多模態(tài)功能的小型 Embedding 模型,進(jìn)一步推動(dòng)了 AI 技術(shù)的普及與應(yīng)用便捷性。

5、多模態(tài)文本、音頻、視頻數(shù)據(jù)

多模態(tài)的文本-音頻 RAG(檢索增強(qiáng)的生成)系統(tǒng)廣泛采納了多模態(tài)生成型 LLMs。此過(guò)程啟始于音頻信息的文本化轉(zhuǎn)換,創(chuàng)造音頻-文本配對(duì),繼而將文本內(nèi)容編碼為 Embedding 形式的向量,以便利用 RAG 機(jī)制進(jìn)行常規(guī)的文本查詢。最終階段涉及將檢索到的文本逆向關(guān)聯(lián)回相應(yīng)的音頻片段。

OpenAI 的 Whisper 技術(shù)在這方面起到了橋接作用,它能夠?qū)崿F(xiàn)語(yǔ)音到文本的高效轉(zhuǎn)寫。相反地,OpenAI 還開發(fā)了 Text-to-Speech(TTS)模型,完成了從文本到語(yǔ)音的逆向轉(zhuǎn)換,豐富了多模態(tài)交互的閉環(huán)。

至于多模態(tài)文本-視頻的 RAG 應(yīng)用,則采取了類似的策略,先將復(fù)雜的視頻內(nèi)容簡(jiǎn)化為可處理的文本描述,經(jīng) Embedding 轉(zhuǎn)化后執(zhí)行文本查詢,最后輸出相關(guān)的視頻片段作為檢索成果。

OpenAI 的創(chuàng)新工具 Sora,則在文本到視頻的生成領(lǐng)域展現(xiàn)了非凡能力,與 Dall-E 在圖像生成領(lǐng)域的成就相似,Sora 僅需用戶輸入文本提示,即可借助強(qiáng)大的 LLM 生成對(duì)應(yīng)的視頻內(nèi)容。Sora 的靈活性不僅限于文本,還能基于靜態(tài)圖像或現(xiàn)有視頻進(jìn)行視頻的衍生創(chuàng)作,進(jìn)一步拓展了多模態(tài)內(nèi)容生成的邊界。

Milvus目前已經(jīng)集成了主流的Embedding模型,體驗(yàn)鏈接:???https://milvus.io/docs/embeddings.md??


本文轉(zhuǎn)載自公眾號(hào)玄姐聊AGI  作者:玄姐

原文鏈接:????https://mp.weixin.qq.com/s/IKyF7k_vswDnaCosylw2kA???

?著作權(quán)歸作者所有,如需轉(zhuǎn)載,請(qǐng)注明出處,否則將追究法律責(zé)任
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
做爰无遮挡三级| 九九九久久久久久久| 天堂av手机版| 亚洲乱码视频| 日韩精品免费在线播放| 日本wwww视频| 岛国在线大片| 久久机这里只有精品| 精品国偷自产在线| 久久aaaa片一区二区| 欧美极品少妇videossex| 波多野洁衣一区| 青草青草久热精品视频在线观看| 九九久久久久久| 91在线视频| 国产综合久久久久影院| 欧美极品第一页| 不卡一区二区在线观看| 亚洲成人1区| 国产精品乱人伦| 国产精品视频内| 国产又粗又猛又爽又黄的视频小说| 日韩网站中文字幕| 亚洲精品日产精品乱码不卡| 99蜜桃在线观看免费视频网站| 成人免费视频网站入口::| 99国产精品久久一区二区三区| 亚洲午夜羞羞片| 欧美极品色图| 91tv国产成人福利| 永久亚洲成a人片777777| 亚洲国产精品久久91精品| 能在线观看的av网站| 99免在线观看免费视频高清| 国产乱码精品一区二区三区av| 久久国产一区二区三区| 一女三黑人理论片在线| 粉嫩一区二区三区在线观看| 亚洲激情综合网| 日本精品一区二区| 国产精品无码天天爽视频| 日韩午夜免费| 中文字幕综合在线| 日韩免费高清一区二区| 国产精品第一国产精品| 一区二区三区免费在线观看| 日韩理论片在线观看| 丰满少妇在线观看bd| 久久人人97超碰国产公开结果| 日韩中文在线观看| 91丨porny丨九色| 日韩中文视频| 精品久久久国产精品999| 国产四区在线观看| 91精品国产综合久久久久久豆腐| 国产麻豆一精品一av一免费| 国产精品免费在线免费| 69视频免费在线观看| 亚洲午夜电影| 欧美精品中文字幕一区| 天堂网av2018| 亚洲免费成人av在线| 精品国产乱码久久久久久图片 | 6080成人| 欧美巨大另类极品videosbest| 免费 成 人 黄 色| 丁香高清在线观看完整电影视频| 中文字幕在线免费不卡| 日韩免费三级| 国产经典自拍视频在线观看| 26uuu欧美日本| 国产精品日韩欧美一区二区三区| 亚洲视屏在线观看| 久久综合九色| 国产成人精品免费久久久久| 在线观看亚洲天堂| 欧美日韩网站| 久久天堂av综合合色| 久草福利资源在线| 热久久天天拍国产| 色噜噜久久综合伊人一本| av男人的天堂av| 亚洲涩涩av| 亚洲欧美综合v| 少妇毛片一区二区三区| 欧美热在线视频精品999| 精品在线观看国产| 免费看91的网站| 亚洲国产网址| 日韩精品在线视频美女| 特大黑人巨人吊xxxx| 免费观看不卡av| 一区二区三区国产视频| 3d动漫精品啪啪一区二区下载 | 欧美网站大全在线观看| 日本人视频jizz页码69| 四虎影视精品永久在线观看| 欧美日韩黄色影视| 欧美性受xxxx黒人xyx性爽| 婷婷综合国产| 亚洲黄色片网站| 一本加勒比波多野结衣| 亚洲精品**不卡在线播he| 亚洲欧洲日产国产网站| 91禁男男在线观看| 91精品啪在线观看国产81旧版| 亚洲乱亚洲乱妇无码| 国产精品无码一区二区三区| 日韩大片在线| 久久99亚洲热视| 久久久久久久久久久久久女过产乱| 色欲狠狠躁天天躁无码中文字幕 | 97精品在线| 久久久久999| 波多野结衣亚洲色图| 亚洲人体大胆视频| 国产精品女视频| 精品国产乱码一区二区三 | 亚洲一区 二区| 日韩精品福利在线| 欧洲av一区二区三区| 日韩久久综合| 久久久影视精品| 最新中文字幕免费| 波多野结衣一区二区三区| 亚洲视频sss| 超碰在线网站| 欧美三级电影网| 日本性生活一级片| 日韩精品一区二区久久| 97久久精品在线| 亚洲av无码精品一区二区| 国产高清不卡二三区| 丁香五月网久久综合| 国产美女性感在线观看懂色av | 四虎在线精品| 亚洲女成人图区| 国产性猛交普通话对白| 亚洲综合国产| 91久久国产婷婷一区二区| 全部免费毛片在线播放一个| 国产精品久久国产精麻豆99网站| 欧美精品一区二区性色a+v| 中文日产幕无线码一区二区| 欧美人狂配大交3d怪物一区| 精品少妇人妻一区二区黑料社区| 红杏一区二区三区| 久久人人爽亚洲精品天堂| 99久久精品国产亚洲| 国产麻豆精品theporn| 欧美精品免费观看二区| 欧美人与性动交α欧美精品济南到| 在线观看欧美黄色| japanese在线观看| 综合视频在线| 成人国内精品久久久久一区| 福利在线播放| 欧美视频在线观看 亚洲欧| 男女性杂交内射妇女bbwxz| 在线精品国产| 国产精品国产自产拍高清av水多 | 亚洲人metart人体| 国产成人在线播放| 色就是色亚洲色图| 精品福利免费观看| 女同性恋一区二区三区| 一区二区不卡| 亚洲v日韩v综合v精品v| 黄色在线播放网站| 正在播放亚洲一区| 三级黄色在线观看| 免费看黄色91| 欧美亚洲免费高清在线观看| 波多野结衣中文在线| 精品美女一区二区| 国产在线综合网| 狠狠色综合日日| av动漫免费观看| 国产在线一区不卡| 欧美大片欧美激情性色a∨久久| 在线观看视频中文字幕| 国产精品久久久一区麻豆最新章节| 国产av无码专区亚洲精品| 妖精视频一区二区三区| 欧美一区二区视频97| 加勒比一区二区三区在线| 欧美一a一片一级一片| 欧美激情aaa| 久久精品国产一区二区| 亚洲自拍偷拍一区二区三区| 日韩欧美中文字幕一区二区三区| 久久影院中文字幕| 亚洲精品成av人片天堂无码 | 国产成人精品自拍| free性欧美16hd| 日韩精品福利在线| 亚洲 欧美 日韩 在线| 国产精品成人午夜| 国产探花在线观看视频| 黄色另类av| 欧美精品成人一区二区在线观看| 在线天堂中文资源最新版| 亚洲欧洲在线看| 91丨porny丨在线中文 | 亚洲国产成人高清精品| 巨胸大乳www视频免费观看| 老司机免费视频一区二区| 可以在线看黄的网站| 精品国产18久久久久久洗澡| 国产99久久精品一区二区永久免费 | 亚洲精品乱码久久| 久久亚洲二区| 中文一区一区三区免费| 亚洲一区电影| 欧美性做爰毛片| 欧美成人xxx| 欧美一级日韩不卡播放免费| 国产成人亚洲精品自产在线| 国产偷v国产偷v亚洲高清| 一级 黄 色 片一| 日韩视频一区| 亚洲日本欧美在线| 日韩有码av| 亚洲一区二区在线| 香蕉视频亚洲一级| 久久久久国产精品www| lutube成人福利在线观看| 日韩精品一区二区三区视频| 亚洲综合成人av| 亚洲一级二级三级| 天天操天天干天天操天天干| 懂色中文一区二区在线播放| 亚洲涩涩在线观看| 日本强好片久久久久久aaa| www.com毛片| 一区二区三区四区五区精品视频| 亚洲第一综合网站| 亚洲国产精品久久久天堂| 亚洲精品视频一二三| av一区二区在线观看| 欧美一区1区三区3区公司 | 5566中文字幕一区二区电影| 一区精品在线观看| 欧美午夜寂寞影院| 中文字幕永久在线观看| 欧美午夜在线一二页| 一级久久久久久| 在线精品国精品国产尤物884a| 好吊操这里只有精品| 亚洲成人精品影院| 精品在线播放视频| 欧美日韩免费看| 丁香六月婷婷综合| 日韩欧美国产黄色| 欧美成人一区二区三区四区| 一本大道综合伊人精品热热| av一级在线观看| 在线免费不卡电影| 在线观看免费视频一区| 69堂亚洲精品首页| 性生活视频软件| 亚洲精品一区二区三区蜜桃下载 | 精品乱码亚洲一区二区不卡| 午夜免费福利视频| 亚洲二区中文字幕| 你懂的在线看| 中文字幕欧美在线| 超鹏97在线| 国内精品国产三级国产在线专| 欧美激情成人动漫| 欧美一区二区三区免费视| 欧美不卡高清一区二区三区| 国产欧美日韩高清| 经典三级久久| 狠狠色狠狠色综合人人| 女优一区二区三区| 一区二区日本| 亚洲午夜一级| 日韩手机在线观看视频| 久久精品91| 五月天婷婷在线观看视频| 成人深夜在线观看| 91成人在线免费视频| 一区在线观看视频| 日韩免费不卡视频| 欧美色图天堂网| 亚洲国产精品久久久久久久| 亚洲精品国产综合区久久久久久久 | 国产成人精品午夜| 欧美一级做一级爱a做片性| 成人国产一区二区| 色棕色天天综合网| 日日噜噜夜夜狠狠久久丁香五月| 婷婷激情图片久久| 欧美成人三级在线视频| 毛片一区二区三区| 999精品免费视频| 国产精品盗摄一区二区三区| 97免费在线观看视频| 欧美日韩中文另类| 少妇精品视频一区二区| 中文字幕亚洲欧美在线| 黄色大片在线| 国产精品吴梦梦| 欧美深夜视频| 亚洲自拍偷拍一区二区三区| 久久一区二区三区超碰国产精品| 免费黄频在线观看| 久久久国产午夜精品| 精品无码久久久久久久| 欧美视频在线播放| 青青青免费视频在线2| 欧美裸体xxxx极品少妇| 免费污视频在线一区| 国产主播一区二区三区四区| 香蕉综合视频| 日韩精品一区中文字幕| 成人av免费观看| 乱h高h女3p含苞待放| 在线观看网站黄不卡| 亚洲av片在线观看| 欧美激情视频一区二区| 日韩一级特黄| 日韩精品另类天天更新| 亚洲欧美日韩国产一区二区| 国产chinesehd精品露脸| 国产精品免费丝袜| 99成人精品视频| 精品亚洲一区二区三区| 欧美sm一区| 国产伦精品一区二区三区高清版| 久久综合av| 亚洲无吗一区二区三区| 久久日韩精品一区二区五区| 国产一级淫片免费| 日韩午夜激情电影| a级网站在线播放| 91午夜理伦私人影院| 91一区二区三区四区| 中文字幕网av| 中文字幕精品三区| 中文字幕一二三四| 日韩亚洲精品电影| 国产美女久久| 一个色的综合| 久久精品国产亚洲一区二区三区| 亚洲精品午夜视频| 欧洲av一区二区嗯嗯嗯啊| 精品成人一区二区三区免费视频| 97碰碰碰免费色视频| 老牛国内精品亚洲成av人片| 阿v天堂2018| 91在线播放网址| 日韩精品在线免费视频| 亚洲精品视频在线观看视频| 性欧美18~19sex高清播放| 久久久综合亚洲91久久98| 亚洲综合二区| 在线观看日本中文字幕| 欧美亚洲一区二区在线| www.亚洲资源| 91精品国产自产在线| 午夜欧美精品| 在线看黄色的网站| 精品久久久久久电影| 麻豆国产在线播放| 成人免费直播live| 国产精品多人| 亚洲精品成人无码熟妇在线| 在线观看视频一区二区欧美日韩| 国产区在线视频| 92国产精品久久久久首页 | 日韩精品一区不卡| 日韩在线播放一区| 日韩三级久久| 18禁免费观看网站| 中文字幕+乱码+中文字幕一区| 免费一级a毛片| 爱福利视频一区| 精品人人人人| 国产一二三区av| 亚洲综合在线五月| 国产三级电影在线观看| 97神马电影| 老鸭窝91久久精品色噜噜导演| 91成年人网站| 欧美一区二区人人喊爽| 伊人久久av| 国产精品一二三在线观看| 久久伊99综合婷婷久久伊| 97成人在线观看| 4438全国成人免费| 午夜精品一区二区三区国产| xxxxxx黄色| 91精品国产黑色紧身裤美女| 日本免费一区二区六区| 婷婷视频在线播放| 91视视频在线观看入口直接观看www| 日批视频免费观看| 午夜精品久久久久久久99黑人|