精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

OpenAI最新套娃嵌入模型分析:256維的MTEB效果超過1536維 精華

發布于 2024-6-20 10:47
瀏覽
0收藏

一月份,OpenAI發布了兩種新的嵌入模型:text-embedding-3-small和text-embedding-3-large。這些模型采用套娃表示學習技術(MRL:Matryoshka Representation Learning)進行訓練,這使得開發者可以在嵌入中權衡性能和成本。

什么是套娃表示學習?

套娃表示學習是一種用于訓練嵌入模型的技術。它允許在犧牲少量準確性的情況下換取更小的嵌入尺寸。因此,可以以更低的成本存儲更多的信息,并更快地搜索它。

嵌入通過從序列末尾移除維度,并且只使用嵌入向量的子集維度來縮短。例如,你可以只使用原本具有1536維度向量的前8、16、32等維度(或任何其他維度的切片)。

與常見的向量嵌入不同,其中所有維度都同等重要,在套娃嵌入中,向量前面的維度存儲的信息比后面的維度更多,后者只是添加了更多細節。可以通過嘗試在多個分辨率下對圖像進行分類的類比來理解這一點:較低的分辨率提供了更多高層次的信息,而較高的分辨率則添加了更多細節

因此,檢索性能隨著表示大小的增加而提高。然而,OpenAI報告說,text-embedding-3-large嵌入可以縮短到256的大小,同時在MTEB基準測試上仍然優于未縮短的、大小為1536的text-embedding-ada-002嵌入

套娃嵌入的表示大小與檢索性能

OpenAI最新套娃嵌入模型分析:256維的MTEB效果超過1536維-AI.x社區

MRL(Matryoshka Representation Learning,套娃表示學習)實現的魔力全部在于訓練這些模型時優化的損失函數!如果之前損失函數是L,對于MRL,將損失函數分解為各個向量維度范圍上的損失之和:Loss_Total = L(upto 8d) + L(upto 16d) + L(upto 32d) + ... + L(upto 2048d)。有了這個新的嵌套損失函數,模型就有動力在向量的每個子部分捕捉信息。

修改損失函數后,可以免費獲得這些可截斷的向量,無需任何額外成本——這幾乎適用于所有損失函數,并且可以對現有的預訓練模型進行微調以輸出MRL向量!這意味著MRL非常容易采用并應用于預訓練模型。

套娃嵌入詳細分析

下面將使用來自DBpedia的100萬個對象的數據集進行工作,這些對象已使用新的OpenAI套娃text-embedding-3-large模型和舊的ada-002模型進行了嵌入。這將理解信息是如何在套娃向量中與它們的非套娃前身不成比例地存儲的。

在下面的分析中,從上述數據集中隨機抽取了1萬個向量,并繪制了每個維度上觀察到的值的標準差。一個維度上看到的方差或標準差是衡量該維度相對于其他維度攜帶多少信息的良好指標。

顯示了使用新text-emb3-large模型和舊ada-002模型嵌入的DBpedia中的10,000個隨機樣本,每個維度的標準差平滑值。

OpenAI最新套娃嵌入模型分析:256維的MTEB效果超過1536維-AI.x社區

可以看到,標準差是維度索引的多步函數——早期維度捕獲更多信息,而后面的維度捕獲較少。圖表還顯示,OpenAI嵌入模型在維度={512d, 1024d, 1536d, 3072d}處使用了4個聚合損失函數,按照上面詳細描述的MRL風格進行訓練。

更有趣的是,這些步驟內的信息(512d, 1024d, 1536d, 3072d)在各個維度之間或多或少地均勻擴散。這也解釋了MRL論文中的神奇發現,即你可以實際上取這些預指定塊之間的維度(例如750d),仍然可以獲得增量效益?

可視化套娃向量空間

還可以問一個有趣的問題:當你使用越來越多的套娃嵌入維度時,底層數據表示/向量空間會如何變化

下面的視頻中,每一幀都是使用僅使用一定數量的MRL向量維度的主成分分析(PCA)生成的3D向量空間。

從上面鏈接的相同數據集中取了10,000個隨機樣本,使用OpenAI text-embed-3-large模型進行嵌入,然后使用PCA將它們縮減到3D空間;從僅使用4個維度開始,一直到使用所有3072個維度。用越來越多的維度可視化套娃向量。

OpenAI最新套娃嵌入模型分析:256維的MTEB效果超過1536維-AI.x社區

可以看到,當使用512個維度時,向量空間的結構已經被很好地定義了,在這些最初的512個維度之后,其他維度主要用于在更大的結構內收緊數據表示

當到達2000+維度時,只看到數據點的小幅度抖動,可能是因為增量維度的貢獻微乎其微,無法在前3個主成分中看到。

熟悉 OpenAI 的 Matryoshka

OpenAI 發布了兩個新模型,text-embedding-3-small和,它們使用Matryoshka表示學習text-embedding-3-large技術進行訓練 。這些模型的 API 支持一個參數,可以使用該參數控制生成的嵌入的長度。dimensions

如果使用相同的模型但不同的dimensions參數嵌入相同的文本,會發現較短的嵌入不是較長嵌入的截斷版本。

# !pip install openai
from openai import OpenAI


openai = OpenAI()


def vectorize(text,
              dimensions,
              model = "text-embedding-3-small"):
   text = text.lower()


   return openai.embeddings.create(input = [text], 
                                   model = model, 
                                   dimensions = dimensions).data[0].embedding


example_text = "Learned representations are a central component in modern ML systems, serving a multitude of downstream tasks."


full = vectorize(example_text, dimensions = 1536)
short = vectorize(example_text, dimensions = 8)


print(full[:8])
print(short)

[-0.001463836757466197, -0.0241670124232769,  0.00683123804628849, -0.013936602510511875, 0.0320618636906147, 0.00872271228581667, 0.031053075566887856, 0.021820487454533577]
[-0.025210261344909668, -0.41620534658432007, 0.11764788627624512, -0.24001678824424744,  0.5521708130836487, 0.15022294223308563, 0.5347974300384521,   0.3757933974266052]

但是,如果檢查它們的余弦相似度,會發現它們非常相似(或者由于四舍五入而甚至相等)。

from sklearn.metrics.pairwise import cosine_similarity


cosine_similarity([full[:8]], [short])

array([[1.]])

如果仔細觀察,會發現嵌入實際上僅在縮放因子上有所不同(在本例中為 0.058)。

scale = full[0]/short[0]
print(scale)
print([x * scale for x in short])
print(full[:8])

0.05806511632065122
[-0.001463836757466197, -0.0241670118626955, 0.006831238201508919, -0.01393660272831134, 0.03206186249057062, 0.008722712614794586, 0.031053074983168057, 0.021820487334108546]
[-0.001463836757466197, -0.0241670124232769, 0.00683123804628849, -0.013936602510511875, 0.0320618636906147, 0.00872271228581667, 0.031053075566887856, 0.021820487454533577]

請注意 text-embedding-3-large 和 text-embedding-3-small 在默認嵌入長度的長度上有所不同:

默認尺寸text-embedding-3-small:1536

默認尺寸text-embedding-3-large:3072

此外,  當切片為相同尺寸時,它們不會產生兼容的嵌入:

large = vectorize(example_text, dimensions = 3072, model = "text-embedding-3-large")
small = vectorize(example_text, dimensions = 1536, model = "text-embedding-3-small")
print(large[:1536])
print(small)


cosine_similarity([large[:1536]], [small])

[0.011070899665355682,   0.014488349668681622, -0.021118611097335815, -0.011152755469083786, 0.011555208824574947, -0.0007622754783369601, ... ]
[-0.001463836757466197, -0.0241670124232769,    0.00683123804628849,  -0.013936602510511875, 0.0320618636906147,    0.00872271228581667,   ... ]
array([[-0.00149749]])

如果需要在生成嵌入維度后更改嵌入維度,則需要對嵌入維度進行規范化。OpenAI文檔對此進行了更全面的解釋。

本文轉載自??PaperAgent??

已于2024-6-20 15:51:37修改
收藏
回復
舉報
回復
相關推薦
香蕉久久aⅴ一区二区三区| 一卡二卡在线观看| 国产一区国产二区国产三区| 欧美亚洲综合一区| 中文字幕色呦呦| 免费观看毛片网站| 日本va欧美va欧美va精品| 久久精品国产清自在天天线 | 日韩欧美在线一区二区| 国产精品伦一区二区三区| 亚洲高清av| 中文字幕日韩综合av| 男女一区二区三区| 日韩第二十一页| 精品动漫一区二区| 黄色免费高清视频| 涩爱av在线播放一区二区| 激情小说亚洲一区| 国产成人精品综合久久久| 免费人成视频在线| 日韩成人激情| 亚洲男人天堂网站| 国产国语老龄妇女a片| 国产经典一区| 黄网动漫久久久| 久久观看最新视频| 91精品大全| 久久久91精品国产一区二区三区| 成人激情av| 国产精品无码免费播放| 日韩vs国产vs欧美| 欧美中文字幕视频在线观看| 免费在线黄色片| 国产精品久久久久9999赢消| 亚洲精品有码在线| 国产精品无码在线| av动漫精品一区二区| 欧美日韩成人综合| 亚洲三级视频网站| 天然素人一区二区视频| 欧美色视频日本版| 99精品在线免费视频| 波多野结衣精品| 一区二区三区四区激情| 异国色恋浪漫潭| 欧美日韩在线资源| 国产精品久久久久国产精品日日| 国产在线精品日韩| 天天操天天舔天天干| 福利一区福利二区| 国产亚洲一区在线播放 | 亚洲免费精彩视频| 亚洲狠狠婷婷综合久久久久图片| 老司机aⅴ在线精品导航| 欧美大片一区二区三区| 真实乱偷全部视频| 99久热这里只有精品视频免费观看| 日韩免费电影一区| 国产综合内射日韩久| 国产精品videossex| 亚洲成人精品在线| 国产中文字幕一区二区| 先锋影音国产精品| 亚洲天堂av电影| 免费看的黄色录像| 国产精品99在线观看| 日韩视频免费在线| 午夜免费激情视频| 影音先锋中文字幕一区二区| 国模叶桐国产精品一区| 国产专区第一页| 日韩成人精品在线观看| 成人信息集中地欧美| av中文字幕免费| 99久久久免费精品国产一区二区| 欧美精品一区二区三区在线看午夜 | 国产在线麻豆精品观看| 99蜜桃在线观看免费视频网站| 午夜精品久久久久久久99老熟妇 | 99中文视频在线| 五月激情婷婷综合| 亚洲国产精品成人久久综合一区| 亚洲一区二区三区涩| 久久av色综合| 一本大道久久a久久综合婷婷| www欧美激情| 亚洲一区二区三区中文字幕在线观看| 日韩精品免费在线视频| 国产三级黄色片| 精品不卡视频| 国产精品欧美激情| 草逼视频免费看| 久久久久久电影| 国产成年人在线观看| 九色porny丨首页入口在线| 欧美熟乱第一页| 国产精品91av| 久久中文亚洲字幕| 97精品国产97久久久久久| 中文字幕日本人妻久久久免费 | 国产视频不卡| 午夜视频成人| 欧美日韩国产中字| 天天色天天干天天色| 久久成人av| 久久久久久久久久婷婷| 中文字幕在线观看国产| av电影在线观看完整版一区二区| 亚洲欧洲在线一区| 蜜桃麻豆影像在线观看| 69久久99精品久久久久婷婷 | 国产成人精品综合| 亚洲精品久久久久久久久久久久久久 | 91九色02白丝porn| 免费啪视频在线观看| 色婷婷亚洲mv天堂mv在影片| 91精品国产91久久久久| 国产肥老妇视频| 国产精品久久网站| 国产精品99久久免费黑人人妻| 日韩免费成人| 久久精品一本久久99精品| 精品国产乱子伦| caoporen国产精品视频| 97久久国产亚洲精品超碰热| 免费一级欧美在线观看视频| 亚洲另类激情图| 日本五十熟hd丰满| 国产成人在线看| 中文字幕综合在线观看| 91福利精品在线观看| 亚洲精品网站在线播放gif| 午夜偷拍福利视频| 国产成人综合自拍| 看全色黄大色大片| 亚洲爽爆av| 日韩中文在线观看| 中文字幕一区二区三区免费看| eeuss国产一区二区三区| 又大又硬又爽免费视频| 亚洲国产aⅴ精品一区二区| 久久久精品国产亚洲| 国产又粗又猛又爽又黄的| 中文字幕欧美三区| 欧美一级裸体视频| 成人在线免费观看91| 国产精品久久久久久久久借妻| 理论视频在线| 在线观看国产91| 黄色三级生活片| 轻轻草成人在线| 亚洲午夜精品久久| 国产精品xnxxcom| 欧美成人久久久| 国精品人妻无码一区二区三区喝尿| 亚洲欧美偷拍卡通变态| 国产成人av免费观看| 好吊一区二区三区| 国产视频99| 日韩天堂在线| 最近的2019中文字幕免费一页| 中文字幕人成人乱码亚洲电影| 国产精品国模大尺度视频| 日韩成人精品视频在线观看| 欧美一区91| 国产伦精品一区| 欧美××××黑人××性爽| 亚洲人在线视频| 国产精品玖玖玖| 亚洲成人av一区二区| 国产福利短视频| 免费观看在线色综合| 最近中文字幕免费mv| 深夜福利一区二区三区| 91黄色8090| 尤物网在线观看| 精品福利在线导航| 日韩精品成人免费观看视频| 国产精品每日更新| 国产伦理在线观看| 久久一区视频| 日本道在线视频| 亚洲第一二三区| 国产一区视频在线| 77thz桃花论族在线观看| 亚洲日本中文字幕免费在线不卡| 一起草av在线| 天天综合日日夜夜精品| www.日本高清视频| 丁香婷婷综合色啪| 欧美日韩怡红院| 国产精品vip| 天堂√在线观看一区二区| 中文字幕一区图| 国产精品爱啪在线线免费观看| 最新av在线播放| 亚洲欧美国产精品久久久久久久| 91久久精品国产91性色69| 亚洲va欧美va人人爽午夜| 久久久免费看片| 99久久亚洲一区二区三区青草| jizz18女人| 久久男女视频| 男人添女荫道口图片| 色综合久久网| 美脚丝袜一区二区三区在线观看| 亚洲久草在线| 国产suv精品一区二区| 青春草视频在线| 中文字幕在线日韩| 欧美女优在线| 亚洲的天堂在线中文字幕| 97人妻一区二区精品免费视频| 欧美日韩在线一区| 久久精品女人毛片国产| 国产精品成人一区二区艾草| 男女黄床上色视频| 成av人片一区二区| 欧美xxxxxbbbbb| 捆绑变态av一区二区三区| 日韩精品一区二区三区久久| 欧美在线观看天堂一区二区三区| 色综合666| 狠狠做深爱婷婷综合一区| 久久99影院| 国产乱人伦丫前精品视频| 亚洲综合色av| 超碰国产精品一区二页| 国产精自产拍久久久久久蜜| 惠美惠精品网| 555www成人网| 手机在线观看av网站| 久久久伊人欧美| 牛牛精品在线| 久久久亚洲网站| 1区2区3区在线| 久久久亚洲精选| 不卡视频观看| 91精品国产免费久久久久久| bbw在线视频| 久久香蕉国产线看观看av| 日本不卡在线| 久久韩剧网电视剧| 成人无遮挡免费网站视频在线观看| 中文字幕亚洲第一| 日本成人网址| 欧美乱大交xxxxx| 欧美韩日亚洲| 国内精品久久久久影院 日本资源 国内精品久久久久伊人av | 色婷婷av一区二区三区久久| 18视频免费网址在线观看| 视频在线观看一区二区| 91激情在线| 久久视频在线免费观看| av大片在线| 久久久久久久久久久人体| 天堂√中文最新版在线| 青草成人免费视频| 成人做爰视频www| 91久久国产精品91久久性色| 久久伊人精品| 国产一区二区不卡视频| 色综合综合网| 亚洲欧美电影在线观看| 在线成人超碰| 青青在线免费观看| 久久中文在线| 日韩精品视频一二三| 国产精品资源在线看| 国产精品入口麻豆| 国产亚洲一二三区| 天天色影综合网| 亚洲福利视频一区| 波多野结衣一区二区三区在线 | 亚洲午夜私人影院| 日本道在线观看| 欧美视频三区在线播放| 国产高清免费av| 日韩黄色高清视频| 网友自拍视频在线| 久久久久久国产| 欧美电影h版| 亚洲自拍另类欧美丝袜| 亚洲精品动态| 黄频视频在线观看| 亚洲美女视频在线免费观看| 婷婷六月天在线| 成人一级视频在线观看| www久久久久久久| 一区二区三区高清不卡| 国产女主播喷水视频在线观看 | 国产精品69久久久久孕妇欧美| 一区二区三区 在线观看视频| 欧美精品韩国精品| 日韩精品一区二区在线| 精品美女视频在线观看免费软件| 久久福利视频导航| 香蕉视频亚洲一级| caoporn国产精品免费公开| 精品国产一区二区三区久久久蜜臀 | 91久久久久久久久久| 日韩最新在线| 999久久欧美人妻一区二区| 奇米精品一区二区三区四区 | 牲欧美videos精品| 日本高清视频免费在线观看| 日韩国产精品久久| 久久久久久久无码| 一区二区三区91| 97国产成人无码精品久久久| 国产偷亚洲偷欧美偷精品| 欧美6一10sex性hd| 91精品久久久久久久久不口人| 巨人精品**| 17c丨国产丨精品视频| 久久国产精品一区二区| 熟女少妇内射日韩亚洲| 欧美性猛交xxxx富婆| 色呦呦免费观看| 欧美激情videos| 精品999日本久久久影院| 色播亚洲婷婷| 久久精品123| 一女三黑人理论片在线| 亚洲一区在线观看网站| 99热这里只有精品在线观看| 色狠狠av一区二区三区香蕉蜜桃| 欧美中文字幕精在线不卡| 久久久久网址| 99综合视频| 人妻在线日韩免费视频| 亚洲成人综合网站| 日本高清视频在线| 欧美极品在线播放| 亚洲高清999| 欧美极品少妇无套实战| 国产很黄免费观看久久| 538任你躁在线精品视频网站| 欧美一区二区三区在线观看视频 | 91精品国产91久久久久久久久| 日韩精品成人| 真人做人试看60分钟免费| 国产精品一卡二| 麻豆一区产品精品蜜桃的特点| 日韩三级免费观看| 色图在线观看| 国产视频一区二区不卡| 日韩一级欧洲| 免费观看av网站| 在线观看亚洲专区| 三区四区在线视频| 成人黄色影片在线| 欧美高清一区| xxxx黄色片| 一本大道久久a久久精二百| 蜜桃视频在线观看视频| 国产精品久久久久久久久久久新郎 | 黄色免费网址大全| 欧美国产一区二区| 伊人成人在线观看| 久久中文久久字幕| 北条麻妃一区二区三区在线| 妞干网在线观看视频| 久久久久久99精品| 国产乱色精品成人免费视频| 欧美成人第一页| 欧美a一欧美| 在线观看av日韩| 最新中文字幕一区二区三区| 99热精品在线播放| 欧美一级在线播放| 日韩毛片视频| 香蕉视频污视频| 在线观看av不卡| 伊人春色在线观看| 精品一区二区三区自拍图片区| 日韩经典一区二区| 婷婷久久综合网| 国产视频久久久久| 亚洲青青久久| 国产99久久九九精品无码| 国产精品美女久久久久aⅴ| 亚洲第一色视频| 国产精品久久久久久久久久久久久久| 亚洲一区二区| 国产福利短视频| 欧美一区二区人人喊爽| 深夜福利视频一区二区| 秋霞在线一区二区| 久久久午夜精品理论片中文字幕| 97在线播放免费观看| 高清欧美性猛交| 国产精品精品国产一区二区| 亚洲最大免费视频| 3d动漫精品啪啪一区二区竹菊 | 欧美性猛交xxxx免费看| 二区在线播放| 日韩精品伦理第一区| 成人福利电影精品一区二区在线观看| 中文无码精品一区二区三区|