精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

OpenAI文本嵌入模型入門指南 原創

發布于 2024-9-14 15:14
瀏覽
0收藏

這篇綜合指南介紹了如何使用OpenAI文本嵌入模型在GenAI應用程序中嵌入創建和語義搜索。

向量嵌入在AI中至關重要,它可以將復雜的非結構化數據轉換成機器可以處理的數值向量。這些嵌入捕獲數據中的語義和關系,從而實現更有效的分析和內容生成。

ChatGPT的創建者OpenAI提供了各種嵌入模型,這些模型提供高質量的向量表示,可用于包括語義搜索、聚類和異常檢測在內的各種應用。這篇指南將探討如何利用OpenAI的文本嵌入模型來構建響應迅速的智能AI系統。

什么是向量嵌入和嵌入模型?

在我們深入討論之前,不妨先闡述幾個術語。首先,什么是向量嵌入?向量嵌入是許多AI概念的基礎。它是數據的數值表示,特別是非結構化數據,比如文本、視頻、音頻、圖片及其他數字媒體。它捕獲數據中的語義和關系,并為存儲系統和AI模型提供一種高效的方式來解讀、處理、存儲和檢索復雜的高維非結構化數據。

所以,如果嵌入是數據的數值表示,那么如何將數據轉換成向量嵌入?這時候嵌入模型就有了用武之地。

嵌入模型是一種將非結構化數據轉換成向量嵌入的專用算法。它旨在學習數據中的模式和關系,然后在高維空間中表示它們。關鍵思想是,相似的數據片段具有相似的向量表示,并且在高維空間中彼此更接近,從而允許AI模型更有效地處理和分析數據。

比如在自然語言處理(NLP)背景下,嵌入模型可能在學習后明白單詞“king”和“queen”是相關的,應該在向量空間中彼此靠近,而像“banana”這樣的單詞將被放在更遠的位置。向量空間中的這種鄰近反映了單詞之間的語義關系。

OpenAI文本嵌入模型入門指南-AI.x社區

嵌入模型和向量嵌入的一個常見用途在于檢索增強生成(RAG)系統。RAG系統不是僅僅依賴大語言模型(LLM)中的預訓練知識,而是在生成輸出之前為LLM提供額外的上下文信息。這些額外的數據使用嵌入模型轉換成向量嵌入,然后存儲在像Milvus這樣的向量數據庫中。對于需要詳細的、基于事實的查詢響應的組織和開發人員來說,RAG是理想的選擇,使得它在各個行業部門都很有價值。

OpenAI文本嵌入模型

ChatGPT背后的OpenAI公司提供了各種嵌入模型,它們非常適合處理語義搜索、聚類、推薦系統、異常檢測、多樣性測量和分類等任務。

鑒于OpenAI的受歡迎程度,許多開發人員可能會使用它的模型來嘗試RAG概念。雖然這些概念一般適用于嵌入模型,還是不妨關注OpenAI具體提供了什么。

在談論NLP時,一些OpenAI嵌入模型特別重要。

  • text-embedding-ada- 002
  • text-embedding-3-small
  • text-embedding-3-large

下表提供了這些模型之間的直接比較。

模型?

描述?

輸出維度?

最大輸入?

價格?

text-

embedding-3-

large

功能最強大的嵌入模型,

同時適用于英文任務和

非英文任務。

3072

8.191

0.13美元/100萬

個token

text-

embedding-3-

small

比第二代ada嵌入模型

提高了性能。

1536

8.191

0.10美元/100萬

個token

text-

embedding-

ada - 002

功能最強大的第二代嵌入

模型,取代16個第一代

模型。

1536

8.191

0.02美元/100萬

個token

選擇合適的模型

與所有事情一樣,選擇模型需要權衡利弊。在全身心投入其中一個模型之前,確保你清楚地了解自己想要做什么、有哪些可用的資源以及期望從生成的輸出中獲得哪種程度的準確性。使用RAG系統,你可能會權衡計算資源與查詢響應的速度和準確性。

  • text- embeddings -3-large:當準確性和嵌入豐富度很重要時,這可能是首選的模型。它使用最多的CPU和內存資源(價格更昂貴),需要最長的時間來生成輸出,但輸出將是高質量的。典型的用例包括研究、高風險應用或處理非常復雜的文本。
  • text-embedding-3-small:如果你更關心速度和效率,而不是獲得絕對最好的結果,該模型的資源密集程度較低,從而降低了成本,并縮短了響應時間。典型的用例包括實時應用或資源有限的情形。
  • text-embedding-ada-002:雖然其他兩個模型是最新版本,但這是在OpenAI引入之前的主要模型。這種多功能模型在兩個極端之間提供了很好的中間地帶,提供了可靠的性能和合理的效率。

如何用OpenAI生成向量嵌入?

不妨逐步看看如何使用這每一種嵌入模型生成向量嵌入。無論選擇哪種模型,你都需要具備幾個要素才能入手,包括向量數據庫。

PyMilvus是用于Milvus的Python軟件開發工具包(SDK),在這種環境下很方便,因為它與所有這些OpenAI模型無縫集成。OpenAI Python庫是另一個選擇,它是OpenAI提供的SDK。

為了本教程,我將使用PyMilvus生成向量嵌入,并將它們存儲在Zilliz Cloud中,以便進行簡單的語義搜索。

Zilliz Cloud上手起來很簡單:

  • 注冊一個免費的Zilliz Cloud帳戶。
  • 設置無服務器集群,并獲取公共端點和API密鑰。
  • 創建一個向量集合,并插入你的向量嵌入。
  • 對存儲的嵌入進行語義搜索。

好了,現在我將解釋如何為上面討論的這三個模型生成向量嵌入。

text-embedding-ada-002text-embedding-ada-002

使用text-embedding-ada-002生成向量嵌入,并將其存儲在Zilliz Cloud中進行語義搜索:

from pymilvus.model.dense import OpenAIEmbeddingFunction
from pymilvus import MilvusClient

OPENAI_API_KEY = "your-openai-api-key"
ef = OpenAIEmbeddingFunction("text-embedding-ada-002", api_key=OPENAI_API_KEY)

docs = [
  "Artificial intelligence was founded as an academic discipline in 1956.",
  "Alan Turing was the first person to conduct substantial research in AI.",
  "Born in Maida Vale, London, Turing was raised in southern England."
]
# Generate embeddings for documents
docs_embeddings = ef(docs)

queries = ["When was artificial intelligence founded",
         "Where was Alan Turing born?"]
# Generate embeddings for queries
query_embeddings = ef(queries)

# Connect to Zilliz Cloud with Public Endpoint and API Key
client = MilvusClient(
   uri=ZILLIZ_PUBLIC_ENDPOINT,
   token=ZILLIZ_API_KEY)

COLLECTION = "documents"
if client.has_collection(collection_name=COLLECTION):
   client.drop_collection(collection_name=COLLECTION)
client.create_collection(
   collection_name=COLLECTION,
   dimension=ef.dim,
   auto_id=True)

for doc, embedding in zip(docs, docs_embeddings):
   client.insert(COLLECTION, {"text": doc, "vector": embedding})
  
results = client.search(
   collection_name=COLLECTION,
   data=query_embeddings,
   consistency_level="Strong",
   output_fields=["text"])

text-embedding-3-small

使用text-embedding-3-small生成向量嵌入,并將其存儲在Zilliz Cloud中進行語義搜索:

	from pymilvus import model, MilvusClient
	
	OPENAI_API_KEY = "your-openai-api-key"
	ef = model.dense.OpenAIEmbeddingFunction(
	  model_name="text-embedding-3-small",
	  api_key=OPENAI_API_KEY,
	  )
	
	# Generate embeddings for documents
	docs = [
	  "Artificial intelligence was founded as an academic discipline in 1956.",
	  "Alan Turing was the first person to conduct substantial research in AI.",
	  "Born in Maida Vale, London, Turing was raised in southern England."
	]
	
	docs_embeddings = ef.encode_documents(docs)
	
	# Generate embeddings for queries
	queries = ["When was artificial intelligence founded",
	         "Where was Alan Turing born?"]
	
	query_embeddings = ef.encode_queries(queries)
	
	# Connect to Zilliz Cloud with Public Endpoint and API Key
	client = MilvusClient(
	   uri=ZILLIZ_PUBLIC_ENDPOINT,
	   token=ZILLIZ_API_KEY)
	
	COLLECTION = "documents"
	if client.has_collection(collection_name=COLLECTION):
	   client.drop_collection(collection_name=COLLECTION)
	client.create_collection(
	   collection_name=COLLECTION,
	   dimension=ef.dim,
	   auto_id=True)
	
	for doc, embedding in zip(docs, docs_embeddings):
	   client.insert(COLLECTION, {"text": doc, "vector": embedding})
	  
	results = client.search(
	   collection_name=COLLECTION,
	   data=query_embeddings,
	   consistency_level="Strong",
	   output_fields=["text"])

text-embedding-3-large

使用text-embedding-3-large生成向量嵌入,并將其存儲在Zilliz Cloud中進行語義搜索:

	from pymilvus.model.dense import OpenAIEmbeddingFunction
	from pymilvus import MilvusClient
	
	OPENAI_API_KEY = "your-openai-api-key"
	ef = OpenAIEmbeddingFunction("text-embedding-3-large", api_key=OPENAI_API_KEY)
	
	docs = [
	  "Artificial intelligence was founded as an academic discipline in 1956.",
	  "Alan Turing was the first person to conduct substantial research in AI.",
	  "Born in Maida Vale, London, Turing was raised in southern England."
	]
	
	# Generate embeddings for documents
	docs_embeddings = ef(docs)
	
	queries = ["When was artificial intelligence founded",
	         "Where was Alan Turing born?"]
	
	# Generate embeddings for queries
	query_embeddings = ef(queries)
	
	# Connect to Zilliz Cloud with Public Endpoint and API Key
	client = MilvusClient(
	   uri=ZILLIZ_PUBLIC_ENDPOINT,
	   token=ZILLIZ_API_KEY)
	
	COLLECTION = "documents"
	if client.has_collection(collection_name=COLLECTION):
	   client.drop_collection(collection_name=COLLECTION)
	client.create_collection(
	   collection_name=COLLECTION,
	   dimension=ef.dim,
	   auto_id=True)
	
	for doc, embedding in zip(docs, docs_embeddings):
	   client.insert(COLLECTION, {"text": doc, "vector": embedding})
	  
	results = client.search(
	   collection_name=COLLECTION,
	   data=query_embeddings,
	   consistency_level="Strong",
	   output_fields=["text"])

結論

雖然本教程只是觸及表面,但這些腳本足以讓你開始上手向量嵌入。值得一提的是,這些絕不是唯一可用的模型。這份全面的??AI模型列表??都與Milvus協同工作。不管你的AI用例是什么,你可能都會找到一個可以滿足需求的模型。

如果想進一步了解Milvus、Zilliz Cloud、RAG系統和向量數據庫等方面,敬請訪問Zilliz.com。

原文標題:Beginner’s Guide to OpenAI Text Embedding Models,作者:Jason Myers

鏈接:???https://thenewstack.io/beginners-guide-to-openai-text-embedding-models/??

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
收藏
回復
舉報
回復
相關推薦
av天堂永久资源网| 成人h片在线播放免费网站| 99免费观看视频| 超清av在线| 久久伊人蜜桃av一区二区| 日本乱人伦a精品| 欧美aaa级片| 成人综合日日夜夜| 国产精品乱人伦中文| 国产日本欧美一区二区三区| 国产成人av免费在线观看| 综合激情网...| 欧美午夜久久久| 亚洲国产精品久久久久久女王| 很污很黄的网站| 国产91精品在线| 樱花影视一区二区| 欧美高清视频一区| 一级黄色片在线观看| 欧美精品一卡| 一区三区二区视频| 91丨porny丨九色| 久久精品美女视频| 免费一区二区| 欧美一区二区三区成人| 免费黄色福利视频| 欧美jizz18hd性欧美| 国产99精品在线观看| 国产91露脸中文字幕在线| 欧美在线视频第一页| 久操精品在线| 精品国内二区三区| 亚洲天堂2018av| 天堂а√在线最新版中文在线| 韩国理伦片一区二区三区在线播放| 亚洲精品第一页| 亚洲综合激情视频| 成人免费看视频网站| 亚洲男人的天堂一区二区| 国产伦精品一区| 在线免费看av片| 亚洲综合三区| 久久久久久久久久国产精品| 91成人精品一区二区| 国产美女撒尿一区二区| 欧美中文字幕亚洲一区二区va在线 | 亚洲啊v在线观看| 国产丝袜一区视频在线观看| 三级黄色片免费看| 国产精品亚洲成在人线| 欧美日韩免费在线| 国产情侣第一页| 91在线免费看| 国产三级三级三级精品8ⅰ区| 日韩美女视频在线观看| 国产精品自拍视频一区| 日本一区二区在线看| 日韩激情视频在线播放| 图片区偷拍区小说区| 日本精品在线观看| 777亚洲妇女| 亚洲欧美手机在线| 一级毛片视频在线| 久久免费精品国产久精品久久久久| 欧美有码在线视频| 国产wwwwxxxx| 欧美日韩在线播放视频| 精品亚洲一区二区三区在线观看| 欧美视频第一区| а√天堂中文在线资源8| 亚洲激情在线激情| 在线视频不卡一区二区| 这里只有精品6| 久久精品国产网站| 国产精品一区二区在线| 波多野结衣小视频| 日本成人中文字幕在线视频| 国产精品久久97| 国产精品无码一区| 麻豆成人91精品二区三区| 国产精品夫妻激情| 在线观看国产黄| 狠狠色狠狠色综合系列| 91青青草免费在线看| 亚洲爆乳无码一区二区三区| 国产成人啪午夜精品网站男同| 91高清视频免费| www.欧美色| 麻豆freexxxx性91精品| 亚洲在线www| 欧洲成人一区二区三区| 久久在线免费观看| 午夜一区二区三视频在线观看| 精品人妻aV中文字幕乱码色欲| 性久久久久久| 欧美亚洲成人精品| 欧美三级网站在线观看| 精品一区二区三区av| 97自拍视频| 成人午夜视频一区二区播放| 国产精品 欧美精品| 国产91aaa| 国产高清免费在线播放| 亚洲色图在线播放| 人体内射精一区二区三区 | 91精品国产综合久久久蜜臀粉嫩| 激情小视频网站| 一区二区乱码| 欧美三级电影精品| 国产乱淫av麻豆国产免费| 日韩av黄色在线| 深夜精品寂寞黄网站在线观看| 国产69视频在线观看| 久久久久观看| 欧美亚洲图片小说| 午夜福利123| 欧美18xxxx| 日韩在线观看免费网站| 黄网站免费在线| 麻豆国产精品官网| 国产日本一区二区三区| 成人精品一区二区| 亚洲成人动漫精品| 国产福利在线免费| 日本一区福利在线| 欧美成人激情视频免费观看| 九一国产在线观看| 国产九九视频一区二区三区| 欧美连裤袜在线视频| 少妇视频在线| 精品视频在线看| 国产高清自拍视频| 欧美日韩一区二区国产| 国产精品成人观看视频国产奇米| 日本五十路女优| 狠狠色综合日日| 日韩视频精品| av资源在线看片| 色综合久久中文综合久久牛| 免费观看黄网站| 日韩精品一卡| 国内免费精品永久在线视频| 亚洲精品国产欧美在线观看| 不卡av在线免费观看| 浴室偷拍美女洗澡456在线| 欧美xnxx| 亚洲无线码在线一区观看| 国产精品999久久久| 国产一区二区看久久| 亚洲精品在线免费看| 国产综合色区在线观看| 亚洲精品久久久久中文字幕欢迎你 | 无套内谢丰满少妇中文字幕| 日韩欧美网站| 国产精品福利小视频| 日韩a在线看| 狠狠躁夜夜躁人人爽超碰91| 污污污www精品国产网站| 欧美三级在线| 成人片在线免费看| 污视频网站免费在线观看| 欧美一区二区三区在| 国产三级aaa| 麻豆国产欧美日韩综合精品二区 | 国产精品黄色网| 在线成人亚洲| 国产精品美女黄网| 欧美aaa免费| 精品精品欲导航| 日本少妇做爰全过程毛片| yourporn久久国产精品| 成人黄色av片| 曰本一区二区三区视频| 国产成人精品一区二区在线| 日韩av成人| 色噜噜狠狠成人网p站| 欧美日韩高清免费| 久久av色综合| 欧美一级片在线| 欧美特级一级片| 国产麻豆欧美日韩一区| 成人黄色片免费| 电影一区二区在线观看| 久久频这里精品99香蕉| 亚洲精品无码专区| 欧美日韩亚洲视频| 能直接看的av| 国产精品主播直播| 久激情内射婷内射蜜桃| 久久不见久久见国语| 国产欧美精品xxxx另类| 午夜影院免费在线| 日韩精品欧美国产精品忘忧草| 亚洲毛片亚洲毛片亚洲毛片| 人妖欧美一区二区| a级黄色片网站| avtt综合网| 欧美一区在线直播| av在线三区| 精品国产一区二区三区久久久蜜月 | 亚洲午夜国产成人av电影男同| 卡通动漫亚洲综合| 国产69精品久久777的优势| 免费人成自慰网站| 欧美男同视频网| 亚洲r级在线观看| 台湾佬中文娱乐网欧美电影| 日韩在线一区二区三区免费视频| 亚洲综合久久网| 中文字幕亚洲一区二区av在线| 丰满爆乳一区二区三区| 国产欧美日韩精品一区二区免费| 国内伊人久久久久久网站视频 | 国产精品成人99一区无码| 久久综合激情| 少妇一晚三次一区二区三区| 久久不见久久见中文字幕免费| 不卡av日日日| 美女毛片在线看| 日韩欧美的一区二区| 91丨porny丨对白| 日本系列欧美系列| 成人性生活视频免费看| 日韩视频在线观看| 免费看污久久久| 7m精品国产导航在线| 国产日韩精品在线播放| 天天色天天射天天综合网| 亚洲视频在线观看免费| 囯产精品一品二区三区| 欧美色电影在线| 少妇一级淫片免费放中国| 国产精品人妖ts系列视频| 97香蕉碰碰人妻国产欧美| 日韩二区在线观看| 欧美亚洲精品一区二区| 亚洲成av人电影| 精品一卡二卡三卡四卡日本乱码| 成人av福利| 最近2019中文字幕在线高清| 性猛交xxxx| 精品国产不卡一区二区三区| 一级做a爱片久久毛片| 日本韩国精品在线| 日韩欧美a级片| 亚洲午夜久久久久久久久久久 | 四虎永久在线精品| 亚洲天堂免费看| 欧美日韩国产黄色| 国产三级精品在线| 亚洲激情图片网| 国产精品二区一区二区aⅴ污介绍| 中文字幕1234区| 欧美aa在线视频| 青青青国产在线视频| 欧美综合二区| 久久久久人妻精品一区三寸| 日韩亚洲国产精品| 青青草视频在线免费播放| 亚洲午夜黄色| av免费看网址| 国产欧美精品| 欧美xxxxx在线视频| 狂野欧美一区| 天天色综合天天色| 日韩不卡免费视频| 色七七在线观看| 奇米色777欧美一区二区| 国产成人黄色网址| 紧缚奴在线一区二区三区| 一级黄色录像在线观看| 精品一区精品二区高清| 亚洲第一成肉网| 国产成人久久精品77777最新版本 国产成人鲁色资源国产91色综 | 午夜啪啪福利视频| 五月天激情综合网| 狠狠噜天天噜日日噜| 亚洲承认在线| 99999精品视频| 日本三级亚洲精品| www.国产视频.com| 国产在线不卡一区| 亚洲成年人在线观看| 久久综合九色综合97婷婷女人| 91视频免费入口| 91首页免费视频| 国产激情av在线| 亚洲精品水蜜桃| 久久久久久久久久久网| 精品欧美国产一区二区三区| 国产一级免费视频| 5566中文字幕一区二区电影| 性中国xxx极品hd| 精品亚洲国产视频| 欧洲不卡视频| 久久久中文字幕| 91精品韩国| 亚洲一区二区久久久久久久| 日韩极品少妇| 一区二区三区四区不卡| 今天的高清视频免费播放成人| 91社在线播放| 亚洲美女网站| 国产精品自拍视频在线| 不卡一区二区三区四区| 少妇视频在线播放| 亚洲一区在线电影| 亚洲av无码不卡| 日韩女优毛片在线| 国产午夜在线视频| 久久久久久久电影一区| 国产成人福利夜色影视| 国产亚洲精品自在久久| 日本a级不卡| 国产高清精品在线观看| 另类小说视频一区二区| 亚洲精品乱码久久| 亚洲色图欧美偷拍| 亚洲伊人成人网| 欧美精品自拍偷拍| 欧美 日韩 中文字幕| 亚洲欧美另类在线观看| av网站网址在线观看| 国产精品白丝jk喷水视频一区 | 亚洲成人av在线电影| 波多野结衣一区二区在线| 5566中文字幕一区二区电影| 欧美人体大胆444www| 久久久久久亚洲精品不卡| 亚洲男人在线| 日本黄网免费一区二区精品| 在线成人黄色| 国产xxx在线观看| 中文字幕一区二区在线播放 | 久久九九热re6这里有精品 | 欧美日韩黄色一级片| 国产精品一区2区| youjizz亚洲女人| 色婷婷精品大视频在线蜜桃视频| av一级在线观看| 精品欧美一区二区三区精品久久| 好吊色一区二区三区| 久久色在线播放| 吞精囗交69激情欧美| 精品久久久三级| 亚洲婷婷在线| 乳色吐息在线观看| 亚洲品质自拍视频| 91极品身材尤物theporn| 中日韩美女免费视频网站在线观看| 米奇777四色精品人人爽| 国产精品免费一区| 成人午夜三级| 亚洲高潮无码久久| 国产一区二区在线视频| 久久中文字幕精品| 91成人在线免费观看| 黄色在线播放| 国产精品欧美激情在线播放| 免费一区二区三区视频导航| 日本不卡在线观看视频| 91欧美一区二区| 日本视频在线观看免费| 日韩精品在线电影| 午夜精品久久久久久久久久蜜桃| 91精品免费视频| 一区二区日韩欧美| 久久久久亚洲av片无码v| 亚洲精品欧美激情| 亚洲av综合色区无码一二三区| 亚洲精品国产美女| 国产亚洲成av人片在线观看 | 日韩www在线| 国产盗摄在线观看| 国产精品一区免费观看| 久久影院亚洲| 免费成人深夜夜行网站| 精品国产一区二区三区av性色| 日本高清视频在线播放| 99re视频| 日韩高清在线一区| 69av.com| 国产亚洲欧洲在线| av在线亚洲色图| xxxx一级片| 午夜日韩在线观看| av午夜在线| 国产在线一区二| 狠狠v欧美v日韩v亚洲ⅴ| 亚洲精品77777| 日韩一区二区福利| 日韩高清成人在线| 免费观看一区二区三区| 在线免费视频一区二区| 三级资源在线| 亚洲精品一区二区三| 成人av在线看| 国产精品女同一区二区| 国产91色在线|| 伊人久久成人|