精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

OpenAI文本嵌入模型入門指南

譯文 精選
人工智能
這篇綜合指南介紹了如何使用OpenAI文本嵌入模型在GenAI應用程序中嵌入創建和語義搜索。

譯者 | 布加迪

審校 | 重樓

向量嵌入在AI中至關重要,它可以將復雜的非結構化數據轉換成機器可以處理的數值向量。這些嵌入捕獲數據中的語義和關系,從而實現更有效的分析和內容生成。

ChatGPT的創建者OpenAI提供了各種嵌入模型,這些模型提供高質量的向量表示,可用于包括語義搜索、聚類和異常檢測在內的各種應用。這篇指南將探討如何利用OpenAI的文本嵌入模型來構建響應迅速的智能AI系統。

什么是向量嵌入和嵌入模型?

在我們深入討論之前,不妨先闡述幾個術語。首先,什么是向量嵌入?向量嵌入是許多AI概念的基礎。它是數據的數值表示,特別是非結構化數據,比如文本、視頻、音頻、圖片及其他數字媒體。它捕獲數據中的語義和關系,并為存儲系統和AI模型提供一種高效的方式來解讀、處理、存儲和檢索復雜的高維非結構化數據。

所以,如果嵌入是數據的數值表示,那么如何將數據轉換成向量嵌入?這時候嵌入模型就有了用武之地。

嵌入模型是一種將非結構化數據轉換成向量嵌入的專用算法。它旨在學習數據中的模式和關系,然后在高維空間中表示它們。關鍵思想是,相似的數據片段具有相似的向量表示,并且在高維空間中彼此更接近,從而允許AI模型更有效地處理和分析數據。

比如在自然語言處理(NLP)背景下,嵌入模型可能在學習后明白單詞“king”和“queen”是相關的,應該在向量空間中彼此靠近,而像“banana”這樣的單詞將被放在更遠的位置。向量空間中的這種鄰近反映了單詞之間的語義關系。

嵌入模型和向量嵌入的一個常見用途在于檢索增強生成(RAG)系統。RAG系統不是僅僅依賴大語言模型(LLM)中的預訓練知識,而是在生成輸出之前為LLM提供額外的上下文信息。這些額外的數據使用嵌入模型轉換成向量嵌入,然后存儲在像Milvus這樣的向量數據庫中。對于需要詳細的、基于事實的查詢響應的組織和開發人員來說,RAG是理想的選擇,使得它在各個行業部門都很有價值。

OpenAI文本嵌入模型

ChatGPT背后的OpenAI公司提供了各種嵌入模型,它們非常適合處理語義搜索、聚類、推薦系統、異常檢測、多樣性測量和分類等任務。

鑒于OpenAI的受歡迎程度,許多開發人員可能會使用它的模型來嘗試RAG概念。雖然這些概念一般適用于嵌入模型,還是不妨關注OpenAI具體提供了什么。

在談論NLP時,一些OpenAI嵌入模型特別重要。

  • text-embedding-ada- 002
  • text-embedding-3-small
  • text-embedding-3-large

下表提供了這些模型之間的直接比較。

模型

描述

輸出維度

最大輸入

價格

text-

embedding-3-

large

功能最強大的嵌入模型,

同時適用于英文任務和

非英文任務。

3072

8.191

0.13美元/100萬

個token

text-

embedding-3-

small

比第二代ada嵌入模型

提高了性能。

1536

8.191

0.10美元/100萬

個token

text-

embedding-

ada - 002

功能最強大的第二代嵌入

模型,取代16個第一代

模型。

1536

8.191

0.02美元/100萬

個token

選擇合適的模型

與所有事情一樣,選擇模型需要權衡利弊。在全身心投入其中一個模型之前,確保你清楚地了解自己想要做什么、有哪些可用的資源以及期望從生成的輸出中獲得哪種程度的準確性。使用RAG系統,你可能會權衡計算資源與查詢響應的速度和準確性。

  • text- embeddings -3-large:當準確性和嵌入豐富度很重要時,這可能是首選的模型。它使用最多的CPU和內存資源(價格更昂貴),需要最長的時間來生成輸出,但輸出將是高質量的。典型的用例包括研究、高風險應用或處理非常復雜的文本。
  • text-embedding-3-small:如果你更關心速度和效率,而不是獲得絕對最好的結果,該模型的資源密集程度較低,從而降低了成本,并縮短了響應時間。典型的用例包括實時應用或資源有限的情形。
  • text-embedding-ada-002:雖然其他兩個模型是最新版本,但這是在OpenAI引入之前的主要模型。這種多功能模型在兩個極端之間提供了很好的中間地帶,提供了可靠的性能和合理的效率。

如何用OpenAI生成向量嵌入?

不妨逐步看看如何使用這每一種嵌入模型生成向量嵌入。無論選擇哪種模型,你都需要具備幾個要素才能入手,包括向量數據庫。

PyMilvus是用于Milvus的Python軟件開發工具包(SDK),在這種環境下很方便,因為它與所有這些OpenAI模型無縫集成。OpenAI Python庫是另一個選擇,它是OpenAI提供的SDK。

為了本教程,我將使用PyMilvus生成向量嵌入,并將它們存儲在Zilliz Cloud中,以便進行簡單的語義搜索。

Zilliz Cloud上手起來很簡單:

  • 注冊一個免費的Zilliz Cloud帳戶。
  • 設置無服務器集群,并獲取公共端點和API密鑰。
  • 創建一個向量集合,并插入你的向量嵌入。
  • 對存儲的嵌入進行語義搜索。

好了,現在我將解釋如何為上面討論的這三個模型生成向量嵌入。

text-embedding-ada-002text-embedding-ada-002

使用text-embedding-ada-002生成向量嵌入,并將其存儲在Zilliz Cloud中進行語義搜索:

from pymilvus.model.dense import OpenAIEmbeddingFunction
from pymilvus import MilvusClient

OPENAI_API_KEY = "your-openai-api-key"
ef = OpenAIEmbeddingFunction("text-embedding-ada-002", api_key=OPENAI_API_KEY)

docs = [
  "Artificial intelligence was founded as an academic discipline in 1956.",
  "Alan Turing was the first person to conduct substantial research in AI.",
  "Born in Maida Vale, London, Turing was raised in southern England."
]
# Generate embeddings for documents
docs_embeddings = ef(docs)

queries = ["When was artificial intelligence founded",
         "Where was Alan Turing born?"]
# Generate embeddings for queries
query_embeddings = ef(queries)

# Connect to Zilliz Cloud with Public Endpoint and API Key
client = MilvusClient(
   uri=ZILLIZ_PUBLIC_ENDPOINT,
   token=ZILLIZ_API_KEY)

COLLECTION = "documents"
if client.has_collection(collection_name=COLLECTION):
   client.drop_collection(collection_name=COLLECTION)
client.create_collection(
   collection_name=COLLECTION,
   dimension=ef.dim,
   auto_id=True)

for doc, embedding in zip(docs, docs_embeddings):
   client.insert(COLLECTION, {"text": doc, "vector": embedding})
  
results = client.search(
   collection_name=COLLECTION,
   data=query_embeddings,
   consistency_level="Strong",
   output_fields=["text"])

text-embedding-3-small

使用text-embedding-3-small生成向量嵌入,并將其存儲在Zilliz Cloud中進行語義搜索:

from pymilvus import model, MilvusClient
	
	OPENAI_API_KEY = "your-openai-api-key"
	ef = model.dense.OpenAIEmbeddingFunction(
	  model_name="text-embedding-3-small",
	  api_key=OPENAI_API_KEY,
	  )
	
	# Generate embeddings for documents
	docs = [
	  "Artificial intelligence was founded as an academic discipline in 1956.",
	  "Alan Turing was the first person to conduct substantial research in AI.",
	  "Born in Maida Vale, London, Turing was raised in southern England."
	]
	
	docs_embeddings = ef.encode_documents(docs)
	
	# Generate embeddings for queries
	queries = ["When was artificial intelligence founded",
	         "Where was Alan Turing born?"]
	
	query_embeddings = ef.encode_queries(queries)
	
	# Connect to Zilliz Cloud with Public Endpoint and API Key
	client = MilvusClient(
	   uri=ZILLIZ_PUBLIC_ENDPOINT,
	   token=ZILLIZ_API_KEY)
	
	COLLECTION = "documents"
	if client.has_collection(collection_name=COLLECTION):
	   client.drop_collection(collection_name=COLLECTION)
	client.create_collection(
	   collection_name=COLLECTION,
	   dimension=ef.dim,
	   auto_id=True)
	
	for doc, embedding in zip(docs, docs_embeddings):
	   client.insert(COLLECTION, {"text": doc, "vector": embedding})
	  
	results = client.search(
	   collection_name=COLLECTION,
	   data=query_embeddings,
	   consistency_level="Strong",
	   output_fields=["text"])

text-embedding-3-large

使用text-embedding-3-large生成向量嵌入,并將其存儲在Zilliz Cloud中進行語義搜索:

from pymilvus.model.dense import OpenAIEmbeddingFunction
	from pymilvus import MilvusClient
	
	OPENAI_API_KEY = "your-openai-api-key"
	ef = OpenAIEmbeddingFunction("text-embedding-3-large", api_key=OPENAI_API_KEY)
	
	docs = [
	  "Artificial intelligence was founded as an academic discipline in 1956.",
	  "Alan Turing was the first person to conduct substantial research in AI.",
	  "Born in Maida Vale, London, Turing was raised in southern England."
	]
	
	# Generate embeddings for documents
	docs_embeddings = ef(docs)
	
	queries = ["When was artificial intelligence founded",
	         "Where was Alan Turing born?"]
	
	# Generate embeddings for queries
	query_embeddings = ef(queries)
	
	# Connect to Zilliz Cloud with Public Endpoint and API Key
	client = MilvusClient(
	   uri=ZILLIZ_PUBLIC_ENDPOINT,
	   token=ZILLIZ_API_KEY)
	
	COLLECTION = "documents"
	if client.has_collection(collection_name=COLLECTION):
	   client.drop_collection(collection_name=COLLECTION)
	client.create_collection(
	   collection_name=COLLECTION,
	   dimension=ef.dim,
	   auto_id=True)
	
	for doc, embedding in zip(docs, docs_embeddings):
	   client.insert(COLLECTION, {"text": doc, "vector": embedding})
	  
	results = client.search(
	   collection_name=COLLECTION,
	   data=query_embeddings,
	   consistency_level="Strong",
	   output_fields=["text"])

結論

雖然本教程只是觸及表面,但這些腳本足以讓你開始上手向量嵌入。值得一提的是,這些絕不是唯一可用的模型。這份全面的AI模型列表都與Milvus協同工作。不管你的AI用例是什么,你可能都會找到一個可以滿足需求的模型。

如果想進一步了解Milvus、Zilliz Cloud、RAG系統和向量數據庫等方面,敬請訪問Zilliz.com。

原文標題:Beginner’s Guide to OpenAI Text Embedding Models,作者:Jason Myers

鏈接:https://thenewstack.io/beginners-guide-to-openai-text-embedding-models/。

責任編輯:姜華 來源: 51CTO內容精選
相關推薦

2023-10-27 20:52:13

OpenAIJina AI開源

2024-09-24 11:01:03

2024-05-09 08:11:04

OllamaGo訓練文本

2023-04-09 16:17:05

ChatGPT人工智能

2024-01-29 00:05:00

OpenAI嵌入機器學習

2023-11-09 09:00:00

OpenAI人工智能Whisper

2025-07-15 09:07:00

2023-11-24 14:05:00

AI訓練

2019-03-18 09:00:00

軟件測試軟件開發

2024-02-19 09:19:54

OpenAIAI模型人工智能

2024-03-04 14:15:16

OpenAI語言嵌入模型

2024-02-26 16:36:48

2011-03-08 09:22:37

2011-05-18 15:15:44

MySQL

2010-08-03 15:19:08

FlexBuilder

2021-03-26 10:31:19

人工智能AIOps

2024-02-04 07:20:00

AI模型

2025-03-14 11:09:41

2019-07-18 07:52:01

路由策略IP路由

2010-12-31 13:30:12

點贊
收藏

51CTO技術棧公眾號

一区二区国产视频| 美腿丝袜一区二区三区| 日韩精品日韩在线观看| 三级在线免费看| a黄色片在线观看| 国产成人综合亚洲网站| 2019日本中文字幕| 免费黄色国产视频| 9999久久久久| 欧美四级电影网| 国产一区二区四区| 在线视频二区| 国产成人精品免费看| 国产91在线视频| 九九免费精品视频| 精品freesex老太交| 日韩精品一区二区三区中文精品| 欧美a在线视频| 亚洲精品一线| 国产三级精品在线| 国产精品我不卡| 在线免费看av片| 99亚洲视频| 欧美成人一二三| 黄色片在线观看免费| 国产精品网在线观看| 欧美日韩国产小视频在线观看| 黄页免费在线观看视频| 激情视频在线观看| 国产日韩欧美精品电影三级在线| 国产成人成网站在线播放青青| 国产精品国产精品国产| 亚洲视频成人| 欧美激情精品久久久| 欧美日韩生活片| 免费视频亚洲| 精品视频偷偷看在线观看| 无码人妻少妇色欲av一区二区| 成人软件在线观看| 精品久久中文字幕久久av| 成人毛片100部免费看| 尤物网在线观看| 国产日本一区二区| 精品无人区一区二区三区| 国产sm主人调教女m视频| 美女在线视频一区| 国产精品对白刺激| 日本黄色中文字幕| 久久国产精品久久久久久电车| 久久久之久亚州精品露出| 丝袜 亚洲 另类 欧美 重口 | 欧美午夜电影网| 国产超级av在线| 性国裸体高清亚洲| 欧美体内谢she精2性欧美| 国产在线精品91| av在线最新| 天天综合色天天| 可以在线看的av网站| 精品极品在线| 欧美午夜精品在线| 免费在线观看的毛片| 电影一区二区| 欧美区在线观看| 亚洲一二三av| 99这里只有精品视频| 精品国产乱码久久久久久图片 | 久久亚洲精品网站| 精品无码久久久久成人漫画| 欧美在线高清| 97视频com| 日本免费在线观看视频| 日本伊人色综合网| 91麻豆桃色免费看| 亚洲毛片在线播放| wwwwww.欧美系列| 日本精品免费| а√资源新版在线天堂| 夜色激情一区二区| 97xxxxx| 精品网站在线| 日韩女优av电影| 中文字幕av观看| 日本大胆欧美| 久久久91精品| 日韩欧美大片在线观看| 日韩在线观看一区二区| 91在线免费网站| 熟妇人妻中文av无码| 国产日韩欧美a| 国产内射老熟女aaaa| 美女网站在线看| 欧美视频日韩视频| 99re这里只有| 成人久久久久| 欧美激情在线观看| www.av88| 成人黄页毛片网站| 亚洲欧美在线网| 99色在线观看| 欧美日韩精品一区二区在线播放 | 在线观看亚洲黄色| 国产成人av影院| 日韩精品久久久| 污污片在线免费视频| 色综合天天天天做夜夜夜夜做| 91亚洲精品久久久蜜桃借种| 日本欧美韩国国产| 久久影院资源网| 日本中文字幕久久| 风间由美性色一区二区三区| 色噜噜狠狠色综合网| 国产高清在线a视频大全| 欧美在线视频日韩| 国产一级黄色录像| 一区二区在线影院| 国产精品成久久久久三级| 色一情一乱一乱一区91av| 国产精品婷婷午夜在线观看| 丝袜老师办公室里做好紧好爽| 在线视频成人| 一区二区在线免费视频| 日韩三级视频在线| 国产黄色91视频| 亚洲永久激情精品| 欧美精选视频一区二区| 亚洲成人在线网| 在线免费日韩av| 另类专区欧美蜜桃臀第一页| 欧美久久在线| 国产美女高潮在线| 精品国产乱码久久久久久图片 | 蜜桃传媒一区二区亚洲av| 欧美久久九九| 96国产粉嫩美女| 免费在线观看av网站| 欧美性生交片4| 国精产品一区一区三区免费视频| 亚洲青涩在线| 国产一区二区三区免费不卡| 欧美精品videosex| 欧美一激情一区二区三区| 最新日韩免费视频| 蜜臀av一区二区在线免费观看| 日韩精品久久久毛片一区二区| 欧美a级在线观看| 亚洲电影免费观看高清完整版在线观看| 老女人性淫交视频| 国产精品综合久久| 欧美一区二区视频在线播放| 久久69av| 欧美高清无遮挡| 国产成人自拍一区| 午夜日韩在线观看| 四虎永久免费影院| 亚洲一区日韩| 日本高清久久一区二区三区| 欧美日韩尤物久久| 久久精品一区中文字幕| 亚洲不卡免费视频| 亚洲va国产va欧美va观看| 在线观看国产免费视频| 日韩午夜av在线| 欧美日韩精品免费观看| 免费高清视频在线一区| 久久精品亚洲94久久精品| 国产激情视频在线播放| 亚洲成国产人片在线观看| 欧美性xxxx图片| 久久深夜福利| 中文字幕日韩一区二区三区| 榴莲视频成人app| 国外成人免费在线播放| 日本福利片高清在线观看| 欧美性猛交xxxx黑人交| 黄色片子在线观看| 成人福利在线看| 成人在线观看黄| 首页国产精品| 国产精品白丝jk白祙| 久草在线中文最新视频| 伊人久久久久久久久久| 国产aⅴ爽av久久久久成人| 午夜精品福利一区二区三区av| 美女脱光内衣内裤| 国产一区二区三区精品欧美日韩一区二区三区 | 久久精品免费网站| 午夜片欧美伦| 久久精品magnetxturnbtih| 国内自拍亚洲| 久久久最新网址| 日韩精品毛片| 亚洲娇小xxxx欧美娇小| 在线不卡免费视频| 亚洲成人一二三| 激情五月深爱五月| 波多野结衣中文字幕一区二区三区| 十八禁视频网站在线观看| 你懂的亚洲视频| 欧美一区二区在线| jazzjazz国产精品麻豆| 国产精品福利网| a级大胆欧美人体大胆666| 这里只有精品久久| 少妇一区二区三区四区| 欧美狂野另类xxxxoooo| 国产91精品一区| 夜夜操天天操亚洲| 精品伦精品一区二区三区视频密桃| 成人h版在线观看| 爽爽爽在线观看| 日韩av在线播放中文字幕| 久久99久久99精品| 一区二区影视| 在线观看福利一区| 国产一区二区观看| 精品无人区一区二区三区竹菊| 日韩高清二区| 91亚洲人电影| 亚洲青青一区| 国产精品视频在线播放| 大胆人体一区二区| 午夜精品福利视频| 狂野欧美性猛交xxxxx视频| www.欧美免费| 天堂аⅴ在线地址8| 亚洲男人av在线| 天天干在线观看| 精品国内二区三区| 成 人 黄 色 片 在线播放| 欧美日韩国产片| 国产精品欧美综合| 色哟哟国产精品免费观看| 韩国av中文字幕| 狠狠躁夜夜躁久久躁别揉| 精品视频在线观看免费| 亚洲精品午夜久久久| 少妇aaaaa| 亚洲欧美日韩国产综合| 六月婷婷在线视频| 亚洲精品国偷拍自产在线观看蜜桃| 久久青草久久| 91蝌蚪视频在线观看| 久久国产欧美| 日日摸天天爽天天爽视频| 香蕉成人久久| 日韩一级片播放| 日韩成人免费在线| 国产高清视频网站| 久久国产夜色精品鲁鲁99| 欧美日韩亚洲自拍| 看电视剧不卡顿的网站| 中文字幕第88页| 狠狠狠色丁香婷婷综合激情| 伊人国产精品视频| 国产精品456露脸| 日本久久久久久久久久| 成人一区二区三区视频| 性欧美丰满熟妇xxxx性久久久| 99久久免费国产| 国产av自拍一区| 国产精品丝袜黑色高跟| av黄色免费在线观看| 一区二区三区四区av| 国产成人无码精品| 欧美视频在线看| 一级α片免费看刺激高潮视频| 欧美精品 国产精品| 亚洲爱情岛论坛永久| 日韩av在线免费观看| 韩日在线视频| 久久精品视频在线| 成入视频在线观看| 国产精品第100页| 精品国产乱码久久久久久樱花| 国产精品区二区三区日本| 日韩电影不卡一区| 一个色的综合| 亚洲激情另类| www.99r| 99久久婷婷国产综合精品电影| 这里只有久久精品| 亚洲欧美一区二区不卡| 日韩手机在线观看| 欧美日韩国产a| 香港一级纯黄大片| 日韩在线播放视频| 国产欧洲在线| 成人a免费视频| 秋霞在线一区| 国产成年人在线观看| 在线欧美视频| 中文av一区二区三区| 国产suv精品一区二区6| b站大片免费直播| 亚洲一区二区三区视频在线| 久草视频一区二区| 日韩欧美国产综合| 国产福利电影在线| 97在线精品国自产拍中文| 成人51免费| 日本精品一区二区三区视频| 欧美日韩一区二区三区四区在线观看| 成人在线激情网| aaa欧美日韩| 青青草手机视频在线观看| 色欧美88888久久久久久影院| 亚洲毛片欧洲毛片国产一品色| 最近2019中文字幕mv免费看| a级片在线免费| 99精品国产一区二区| 欧美日韩在线播放视频| 国产精品999视频| 国产经典欧美精品| 国产精品成人69xxx免费视频| 精品国产91乱高清在线观看 | 黑人玩欧美人三根一起进| 国产精品美女www| 亚洲aaa级| 一二三四视频社区在线| 国产高清不卡一区二区| 97精品在线播放| 欧美午夜精品理论片a级按摩| 污污网站免费在线观看| 欧美激情一区二区三区成人| 99国内精品久久久久| 一区二区三区在线视频111| 日精品一区二区| 中文字字幕码一二三区| 五月激情综合色| 色wwwwww| 97人人模人人爽人人喊中文字| 亚洲视频精选| 人妻无码一区二区三区四区| 精品一区二区av| 三级黄色在线观看| 欧美日韩国产综合一区二区| 国产在线一二三区| 国产精品久久久久久久久| 精品99在线| 国产精品自拍视频在线| 中文在线一区二区| 中文字幕永久免费视频| 色偷偷亚洲男人天堂| 在线不卡一区| 水蜜桃在线免费观看| 国产精品一级片| 日本妇女毛茸茸| 精品国产一区二区三区不卡 | 丰满人妻一区二区三区免费视频棣| 亚洲色大成网站www久久九九| 一级aaaa毛片| 欧美成人午夜免费视在线看片 | 日韩av电影免费播放| 日韩电影在线免费观看| 亚洲毛片亚洲毛片亚洲毛片| 欧美性xxxxxx少妇| 欧美性猛交xxx乱大交3蜜桃| 国产免费亚洲高清| 伊人久久大香线蕉综合四虎小说 | 欧美成人四级hd版| 精品国产影院| 久久久久免费精品| 中文字幕一区av| 亚洲国产欧美另类| 欧美一级视频免费在线观看| 红桃视频在线观看一区二区| 中文字幕第88页| 亚洲国产成人va在线观看天堂| 色窝窝无码一区二区三区成人网站| 欧美中文在线视频| 日产精品一区二区| 男人女人拔萝卜视频| 精品人伦一区二区三区蜜桃网站 | 国产精品久久久久久久久久| 日韩精品久久| 国产清纯白嫩初高中在线观看性色| 五月天激情综合| av在线播放网| 成人羞羞视频免费| 久久性色av| 国产97免费视频| 日韩精品中文字幕有码专区| 国产91在线播放精品| 日韩免费在线观看av| 91蝌蚪国产九色| 11024精品一区二区三区日韩| 欧美激情亚洲激情| 国产一区二区三区探花| 善良的小姨在线| 在线亚洲一区观看| xxxx在线视频| 伊人色综合影院| 26uuu亚洲| www精品国产| 国产精品一二区| 国产日韩欧美一区在线| 人人澡人人澡人人看| 日韩精品在线播放| 秋霞一区二区三区|