精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

談談GPT 模型背后以數據為中心的 AI

人工智能
人工智能 (AI) 在改變我們生活、工作和與技術互動的方式方面取得了巨大的進步。最近,取得重大進展的領域是大型語言模型 (LLM) 的開發,例如GPT-3、ChatGPT和GPT-4。這些模型能夠準確的執行語言翻譯、文本摘要和問答等任務。

人工智能 (AI) 在改變我們生活、工作和與技術互動的方式方面取得了巨大的進步。最近,取得重大進展的領域是大型語言模型 (LLM) 的開發,例如GPT-3、ChatGPT和GPT-4。這些模型能夠準確的執行語言翻譯、文本摘要和問答等任務。

圖片

雖然很難忽視 LLM 不斷增加的模型規模,但同樣重要的是要認識到,他們的成功很大程度上歸功于用于訓練他們的大量高質量數據。

在本文中,我們將從以數據為中心的 AI 角度概述 LLM 的最新進展。我們將通過以數據為中心的 AI 視角研究 GPT 模型,這是數據科學界中一個不斷發展的概念。我們通過討論三個以數據為中心的 AI 目標:訓練數據開發、推理數據開發和數據維護,來揭示 GPT 模型背后以數據為中心的 AI 概念。

大型語言模型 (LLM) 和 GPT 模型

LLM 是一種自然語言處理模型,經過訓練可以在上下文中推斷單詞。例如,LLM 最基本的功能是在給定上下文的情況下預測缺失的標記。為此,LLM 接受了訓練,可以從海量數據中預測每個候選單詞的概率。下圖是在上下文中使用 LLM 預測丟失標記的概率的說明性示例。

GPT模型是指OpenAI創建的一系列LLM,如GPT-1、GPT-2、GPT-3、InstructGPT、ChatGPT/GPT-4等。與其他 LLM 一樣,GPT 模型的架構主要基于Transformers,它使用文本和位置嵌入作為輸入,并使用注意力層來模擬令牌的關系。

GPT-1 模型架構

后來的 GPT 模型使用與 GPT-1 類似的架構,除了使用更多模型參數和更多層、更大的上下文長度、隱藏層大小等。

什么是以數據為中心的人工智能

以數據為中心的 AI是一種新興的思考如何構建 AI 系統的新方法。以數據為中心的人工智能是系統地設計用于構建人工智能系統的數據的學科。

過去,我們主要專注于在數據基本不變的情況下創建更好的模型(以模型為中心的 AI)。然而,這種方法在現實世界中可能會導致問題,因為它沒有考慮數據中可能出現的不同問題,例如標簽不準確、重復和偏差。因此,“過度擬合”數據集不一定會導致更好的模型行為。

相比之下,以數據為中心的人工智能專注于提高用于構建人工智能系統的數據的質量和數量。這意味著注意力在數據本身,模型相對更固定。使用以數據為中心的方法開發人工智能系統在現實場景中具有更大的潛力,因為用于訓練的數據最終決定了模型的最大能力。

需要注意的是,“以數據為中心”與“數據驅動”有著根本的區別,后者只強調用數據來指導人工智能的發展,通常仍以開發模型而不是數據為中心。

圖片

以數據為中心的人工智能與以模型為中心的人工智能之間的比較

以數據為中心的 AI 框架包含三個目標:

  • 訓練數據開發就是收集和生產豐富、高質量的數據,以支持機器學習模型的訓練。
  • 推理數據開發是為了創建新的評估集,這些評估集可以提供對模型的更細粒度的洞察力,或者通過數據輸入觸發模型的特定功能。
  • 數據維護是為了在動態環境下保證數據的質量和可靠性。數據維護至關重要,因為現實世界中的數據不是一次性創建的,而是需要持續維護。

圖片

以數據為中心的 AI 框架

為什么以數據為中心的 AI 使 GPT 模型成功

幾個月前,Yann LeCun 在推特上表示 ChatGPT 并不是什么新鮮事。事實上,ChatGPT 和 GPT-4 中使用的所有技術(變壓器、從人類反饋中強化學習等)一點都不新鮮。然而,他們確實取得了以前模型無法實現的結果。那么,他們成功的原因什么?

訓練數據開發。通過更好的數據收集、數據標記和數據準備策略,用于訓練 GPT 模型的數據的數量和質量有了顯著提高。

  • GPT-1:BooksCorpus 數據集用于訓練。該數據集包含4629.00 MB 的原始文本,涵蓋各種類型的書籍,例如冒險、幻想和浪漫。
    -以數據為中心的 AI 策略:無。
    -結果:在該數據集上使用 GPT-1 可以通過微調提高下游任務的性能。
  • GPT-2:訓練中使用WebText 。這是 OpenAI 中的一個內部數據集,通過從 Reddit 抓取出站鏈接創建。
    -以數據為中心的 AI 策略:(1) 僅使用來自 Reddit 的出站鏈接來整理/過濾數據,該鏈接至少獲得 3 個業力。(2) 使用工具Dragnet和Newspaper來提取干凈的內容。(3) 采用去重和其他一些基于啟發式的清洗。
    -結果:過濾后得到 40 GB 的文本。GPT-2 無需微調即可獲得強大的零樣本結果。
  • GPT-3:GPT-3的訓練主要基于Common Crawl。
    -以數據為中心的 AI 策略:(1) 訓練分類器根據每個文檔與WebText(高質量文檔)的相似性過濾掉低質量文檔。(2)利用Spark的MinHashLSH對文檔進行模糊去重。(3) 使用WebText、圖書語料庫和維基百科擴充數據。
    - 結果:45TB的明文過濾后得到570GB的文本(本次質量過濾只選擇了1.27%的數據)。GPT-3 在零樣本設置中明顯優于 GPT-2。
  • InstructGPT:讓人類評估調整GPT-3 的答案,使其更好地符合人類的期望。他們為標注者設計了測試,只有通過測試的人才有資格標注。他們甚至設計了一項調查,以確保注釋者全心投入到注釋過程中。
    -以數據為中心的 AI 策略:(1)使用人類提供的提示答案通過監督訓練調整模型。(2)收集比較數據以訓練獎勵模型,然后使用此獎勵模型通過人類反饋強化學習(RLHF)調整GPT-3。
    - 結果:InstructGPT 表現出更好的真實性和更少的偏差,即更好的對齊。
  • ChatGPT/GPT-4:OpenAI 沒有透露細節。但眾所周知,ChatGPT/GPT-4 很大程度上沿用了之前 GPT 模型的設計,他們仍然使用 RLHF 來調整模型(可能有更多和更高質量的數據/標簽)。人們普遍認為,隨著模型權重的增加,GPT-4 使用了更大的數據集。

推理數據開發。由于最近的 GPT 模型已經足夠強大,我們可以通過在模型固定的情況下調整提示或調整推理數據來實現各種目標。例如,我們可以通過提供要總結的文本以及諸如“總結它”或“TL;DR”之類的指令來引導推理過程,從而進行文本摘要。

圖片

及時調整

設計正確的推理提示是一項具有挑戰性的任務。它嚴重依賴啟發式方法。一個很好的調查總結了不同的促銷方法。有時,即使是語義相似的提示也會有非常不同的輸出。在這種情況下,可能需要基于軟提示的校準來減少方差。

圖片

LLM推理數據開發的研究仍處于早期階段。在不久的將來,可以在 LLM 中應用更多已用于其他任務的推理數據開發技術。

數據維護。ChatGPT/GPT-4作為商業產品,不僅訓練一次,而且不斷更新和維護。顯然,我們無法知道在 OpenAI 之外如何進行數據維護。因此,我們討論了一些通用的以數據為中心的 AI 策略,這些策略已經或將很可能用于 GPT 模型:
- 連續數據收集:當我們使用 ChatGPT/GPT-4 時,我們的提示/反饋可能反過來被 OpenAI 使用進一步推進他們的模型。可能已經設計并實施了質量指標和保證策略,以在此過程中收集高質量數據。
- 數據理解工具:可以開發各種工具來可視化和理解用戶數據,促進更好地了解用戶需求并指導未來改進的方向。
- 高效的數據處理:隨著ChatGPT/GPT-4用戶數量的快速增長,需要一個高效的數據管理系統來實現快速的數據采集。

圖片

上圖是ChatGPT/GPT-4 通過“贊”和“不贊”收集用戶反饋的示例。

數據科學界可以從這波 LLM 浪潮中學到什么

LLM的成功徹底改變了人工智能。展望未來,LLM可以進一步徹底改變數據科學生命周期。我們做出兩個預測:

  • 以數據為中心的人工智能變得更加重要。經過多年研究,模型設計已經非常成熟,尤其是在Transformer之后。數據成為未來改進 AI 系統的關鍵方式。另外,當模型變得足夠強大時,我們就不需要在日常工作中訓練模型了。相反,我們只需要設計適當的推理數據來從模型中探索知識。因此,以數據為中心的人工智能的研發將推動未來的進步。
  • LLM將實現更好的以數據為中心的人工智能解決方案

許多繁瑣的數據科學工作可以在LLM的幫助下更有效地進行。例如,ChaGPT/GPT-4 已經可以編寫可工作的代碼來處理和清洗數據。此外,LLM 甚至可以用于創建訓練數據。例如使用 LLM 生成合成數據可以提高文本挖掘中的模型性能。

圖片

責任編輯:華軒 來源: 數據驅動智能
相關推薦

2023-04-23 08:00:00

人工智能ChatGPTGPT模型

2021-10-18 10:43:59

數據數據中心DCIM

2017-04-11 20:10:56

2021-03-24 14:13:51

數據分析架構大數據

2023-11-07 08:28:08

GPT模型環境

2012-07-30 09:48:32

設計管理

2011-08-05 16:36:02

Informatica數據中心

2023-12-28 15:22:19

AI

2024-01-31 09:00:12

人工智能數據模型

2022-02-21 10:18:13

機器學習數據模型

2025-05-16 01:00:00

2023-01-04 13:03:22

AI模型

2018-12-14 09:39:07

軟件開發用戶迭代

2013-08-16 10:14:32

APIWeb應用以API為中心的Web

2010-11-09 10:22:19

開放數據中心云計算

2024-09-12 09:20:48

2024-03-04 16:27:06

數據中心

2011-07-08 09:55:02

數據中心防震

2021-08-20 10:13:38

人工智能AI深度學習

2013-10-11 18:46:57

點贊
收藏

51CTO技術棧公眾號

久久久精品久久| 欧美视频免费在线| 97se亚洲综合| 日本三级午夜理伦三级三| 乱中年女人伦av一区二区| 色婷婷综合久色| 伊人情人网综合| 欧美 日韩 综合| 母乳一区在线观看| 精品国产欧美一区二区五十路| 日本女人黄色片| 日本不卡1234视频| 亚洲欧美日韩久久| 欧美xxxx黑人又粗又长密月| 亚洲一级黄色大片| 激情综合视频| 最近中文字幕日韩精品| 国产亚洲精品成人a| 成人性教育av免费网址| 亚洲欧美另类小说| 奇米视频888战线精品播放| 国产熟女一区二区三区四区| 久久精品一区二区国产| 欧美国产日韩一区二区在线观看 | 男人天堂中文字幕| 国产精品99视频| 亚洲男人第一网站| 中文字幕第3页| 国产精品毛片无码| 在线视频亚洲一区| 国产中文字幕在线免费观看| 成人免费在线| 中文一区二区完整视频在线观看 | 日韩欧美在线免费观看视频| 搞黄网站在线看| 亚洲天堂av老司机| 亚洲一二区在线| 免费在线黄色网址| 91亚洲资源网| 国产精品伊人日日| 亚洲va欧美va| 国产二区国产一区在线观看| 成人激情黄色网| 中文字幕在线视频第一页| 老司机精品导航| 欧美中文字幕精品| 国产午夜在线播放| 日韩一级在线| 国内久久久精品| 久久综合加勒比| 亚洲第一黄网| 午夜精品久久久99热福利| 久久久精品一区二区涩爱| 亚洲综合激情在线| 美日韩丰满少妇在线观看| 中文字幕无码日韩专区免费| 日韩精品1区| 中文字幕一精品亚洲无线一区| 37p粉嫩大胆色噜噜噜| 亚洲传媒在线| 亚洲天堂网在线观看| 亚洲精品国产一区黑色丝袜| 九九免费精品视频在线观看| 亚洲少妇中文在线| 国产1区2区在线观看| 欧美性感美女一区二区| 最近2019中文字幕一页二页| 97在线观看免费高| 国内久久精品| 97久久久免费福利网址| xxxx.国产| 丝袜美腿一区二区三区| 国产精品视频精品视频| 国产三级精品在线观看| 国产成人av影院| 久久99精品久久久久久青青日本 | 成人国产电影网| 久久爱av电影| 成人精品一区二区三区免费 | 中文字幕一区二区三区在线乱码 | 国产精品黄色在线观看| 免费观看中文字幕| 678在线观看视频| 一本大道av伊人久久综合| wwww.国产| 香港久久久电影| 日韩精品在线影院| 国产午夜精品福利视频| 久久久精品久久久久久96| 久久久之久亚州精品露出| 黄色av一级片| 国内精品免费在线观看| 国模精品娜娜一二三区| 成人h小游戏| 一区二区高清免费观看影视大全| 妞干网在线视频观看| 日韩三区免费| 日韩欧美你懂的| 粉嫩av蜜桃av蜜臀av| 99久久夜色精品国产亚洲狼| 久久久久久久一区二区| 性色av一区二区三区四区| 国产99久久精品| 日韩.欧美.亚洲| 日本小视频在线免费观看| 欧美色图在线视频| 1314成人网| 国产在线日韩精品| 久久久久久久久久久av| 中文字幕在线2019| 99久久免费国产| 欧美一级免费在线观看| 中文字幕在线官网| 日韩精品一区国产麻豆| 国产又黄又粗视频| 亚洲人人精品| 91亚洲永久免费精品| 韩国中文免费在线视频| 亚洲va中文字幕| 网站在线你懂的| 国产videos久久| 欧美精品电影免费在线观看| 亚洲无码久久久久| 国产亚洲精品aa| 成人免费观看视频在线观看| 欧美成人精品一级| 精品国内产的精品视频在线观看| 人人草在线观看| 成人丝袜18视频在线观看| 在线免费一区| jizz久久久久久| 亚洲精品影视在线观看| 日本少妇毛茸茸高潮| 国产综合久久久久影院| 亚洲欧美国产不卡| yw.尤物在线精品视频| 日韩电影中文 亚洲精品乱码| 欧美日韩精品亚洲精品| 国产麻豆精品95视频| 在线视频不卡一区二区三区| 日韩精品麻豆| 国产小视频国产精品| 亚洲GV成人无码久久精品| 成人福利视频网站| 国产av人人夜夜澡人人爽麻豆| 成人噜噜噜噜| 精品久久久999| 亚洲天堂网视频| 国产精品美女视频| 最新天堂中文在线| 99精品视频在线| 91视频免费在线| 成人影院在线看| 日韩精品一区二区三区视频播放| 午夜免费激情视频| 国产精品99久久久久久宅男| 最新视频 - x88av| 9l视频自拍九色9l视频成人| 久久久久久国产| 欧美自拍偷拍一区二区| 香蕉久久一区二区不卡无毒影院| www.88av| 久久久人人人| 亚洲精品免费在线看| 亚洲视频自拍| 欧美激情中文字幕在线| 少妇无码一区二区三区| 欧美视频免费在线观看| 蜜臀久久99精品久久久久久| 麻豆视频一区二区| 永久免费网站视频在线观看| 99精品国产一区二区三区2021| 韩剧1988免费观看全集| 国外av在线| 欧美一区二区三区四区久久| 久久午夜鲁丝片午夜精品| 99精品1区2区| 欧美三级理论片| 一区二区三区四区在线观看国产日韩 | 玖玖爱这里只有精品| 高清久久久久久| 男人天堂999| 2023国产精品久久久精品双| 成人在线免费观看一区| 91精品论坛| 久久久极品av| 污视频在线免费观看| 欧美视频一二三区| 久久久久国产精品夜夜夜夜夜| 91在线播放网址| 亚洲美女爱爱视频| 亚洲国产日本| 一区二区精品在线观看| 高潮久久久久久久久久久久久久| 国产成人在线亚洲欧美| av香蕉成人| 亚洲人午夜精品免费| 99热这里只有精| 色综合色狠狠天天综合色| 国产性生活大片| 久久综合九色综合97_久久久| 日韩精品视频一二三| 99精品免费网| 中文视频一区视频二区视频三区| 欧美激情网址| 成人国产精品日本在线| 依依综合在线| 欧美日本国产在线| 中文字幕在线视频区| 日韩精品视频观看| av高清一区二区| 欧美视频一区在线| 中文字幕一区二区三区手机版| 18欧美亚洲精品| 天天躁日日躁aaaxxⅹ| 国产高清不卡一区| 不卡的在线视频| 久久精品五月| 欧美丰满熟妇bbbbbb百度| 欧美精品综合| 欧美h视频在线观看| 欧美日韩有码| 欧美自拍资源在线| 红杏视频成人| 成人欧美一区二区三区视频xxx| 91在线亚洲| 国产精品激情自拍| 澳门成人av网| 78m国产成人精品视频| 色呦呦在线资源| 久久好看免费视频| 拍真实国产伦偷精品| 亚洲香蕉在线观看| 久久久久久久久亚洲精品| 亚洲国产精品专区久久| 亚洲免费一级片| 日韩一级黄色大片| www.天堂在线| 日韩一区二区三区四区五区六区| 中文字幕日本人妻久久久免费| 丁香五六月婷婷久久激情| 日韩美女一级片| 亚洲综合一区在线| 超碰在线国产97| 亚洲女同女同女同女同女同69| 在线看片中文字幕| 中文字幕不卡在线播放| www.黄色在线| 欧美激情综合五月色丁香小说| 国产精品国产三级国产专业不 | 农村寡妇一区二区三区| 亚洲动漫在线观看| 欧洲久久久久久| 国产日产精品一区二区三区四区的观看方式| 精品无人区一区二区三区 | 色综合视频二区偷拍在线| 精品国产乱码久久久久久果冻传媒 | 久久99精品久久久久久噜噜| 三级网站视频在在线播放| 欧美极品美女电影一区| a级片在线免费观看| 欧美重口另类videos人妖| 中文字幕资源网在线观看免费| 欧美在线免费观看| 色综合天天色| 成人免费自拍视频| 亚洲一区二区三区日本久久九| 超碰97在线人人| 青青草原在线亚洲| 视频一区视频二区视频三区视频四区国产 | 日韩一区二区三| 亚洲国产精品suv| 亚洲大胆人体视频| 九一在线视频| 久久精品99国产精品酒店日本| 在线中文字幕视频观看| 隔壁老王国产在线精品| 小h片在线观看| 国产精品视频一| 亚洲高清999| 欧美日韩亚洲免费| 99成人在线视频| 福利视频一二区| 日韩精品1区2区3区| 色婷婷激情视频| 91在线视频官网| 久久久免费看片| 亚洲成人精品在线观看| 日韩欧美国产另类| 日韩精品一区二区三区中文精品| 欧美色图另类| 欧美成人午夜激情在线| 亚洲欧美韩国| 91香蕉视频在线下载| 外国成人在线视频| 99视频精品全部免费看| 99伊人成综合| 亚洲成人手机在线观看| 91视视频在线观看入口直接观看www | 亚洲一二区视频| 日韩av在线高清| 久操视频在线观看| 浅井舞香一区二区| 亚洲3区在线| 亚洲综合av一区| 亚洲一区观看| 人妻av一区二区三区| 中文字幕免费在线观看视频一区| 久久综合综合久久| 欧美精品三级在线观看| 久久视频www| 国内精品中文字幕| 日韩成人小视频| 五月天婷婷在线视频| 午夜精品一区二区三区视频免费看| 欧美影视资讯| 精品伦精品一区二区三区视频| 天天综合一区| caoporn超碰97| 国产成人午夜精品5599| 美国精品一区二区| 在线精品视频一区二区| 香蕉av在线播放| 久久精品国产欧美激情| 日本免费久久| 久久资源亚洲| 亚洲毛片在线| 国产精九九网站漫画| 泷泽萝拉在线播放| 欧美午夜xxx| 色窝窝无码一区二区三区成人网站 | 国模视频一区二区| 亚洲天堂中文字幕在线观看| 综合操久久久| 久久国产成人午夜av影院| 久久久久久亚洲中文字幕无码| 五月天欧美精品| 欧美一区二区三区黄片| 欧美国产日韩一区二区| 中文久久电影小说| 国产av熟女一区二区三区| 国产精品综合一区二区三区| 在线日韩国产网站| 在线成人av网站| www在线免费观看视频| 国产精品自在线| 四虎8848精品成人免费网站| 国产九九在线视频| 国产精品久久久久一区二区三区共 | jyzzz在线观看视频| 国产成人福利视频| 精品日本12videosex| 国产成人av影视| 国产精品系列在线| 97精品人妻一区二区三区香蕉| 色老头一区二区三区| 在线不卡一区| 黄色录像特级片| 成人不卡免费av| 啦啦啦免费高清视频在线观看| 精品视频久久久| 成人看片网站| 宅男在线精品国产免费观看| 久久www免费人成看片高清| 国产少妇在线观看| 精品精品国产高清一毛片一天堂| 大菠萝精品导航| 日本精品一区二区三区不卡无字幕| 蜜桃精品视频在线| 青娱乐av在线| 精品在线观看国产| 久久69成人| 欧美另类videosbestsex日本| 懂色av中文一区二区三区| 欧美三级午夜理伦| 中文字幕亚洲欧美日韩2019| 榴莲视频成人app| 337p粉嫩大胆噜噜噜鲁| 国产日韩精品久久久| 国产又黄又粗又长| 久久久免费av| 成久久久网站| 在线播放第一页| 色久综合一二码| 亚洲色图美国十次| 欧美日韩高清在线一区| 久久丁香综合五月国产三级网站| 精品爆乳一区二区三区无码av| 日韩精品999| www欧美在线观看| 欧美网站免费观看| 亚洲欧洲av色图| 涩涩视频在线观看免费| 91牛牛免费视频| 男女精品视频| 亚洲成人生活片| 亚洲欧美日韩另类| 波多野结衣欧美| 成人免费在线观看视频网站| 亚洲一二三专区|