精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

o1不是聊天模型?24小時(shí)熱度暴漲,奧特曼、Brockman在線圍觀

人工智能
在剛剛過去的一天,一篇名為《o1 isn’t a chat model(and that’s the point)》的文章引發(fā)了包括 OpenAI CEO Sam Altman、總裁 Greg Brockman 的關(guān)注。

不要再將 o1 當(dāng)做聊天模型了。

如何定位 o1 模型?你是否常常將其當(dāng)做一個(gè)聊天模型來使用。

在剛剛過去的一天,一篇名為《o1 isn’t a chat model(and that’s the point)》的文章引發(fā)了包括 OpenAI CEO Sam Altman、總裁 Greg Brockman 的關(guān)注。

這篇文章表示 o1 不是一個(gè)聊天模型,我們可以將它想象成一個(gè)報(bào)告生成器。

圖片


原文鏈接:https://www.latent.space/p/o1-skill-issue

2014 年,OpenAI 接連放出了 o1、o1 pro、o3 模型,隨著模型推理能力的提升,隨著而來的是高昂的訂閱費(fèi)。但很多人在訂閱使用后發(fā)現(xiàn) o1 的表現(xiàn)并不如宣傳的那樣好,當(dāng)然也包括本文的作者——曾任SpaceX軟件工程師、蘋果VisionOS人機(jī)交互設(shè)計(jì)師的Ben Hylak。

Hylak 表示每次他問 o1 一個(gè)問題時(shí),都要等上 5 分鐘的時(shí)間,結(jié)果看到的只是一大堆自相矛盾的胡言亂語,還有未經(jīng)請求的架構(gòu)圖 + 優(yōu)缺點(diǎn)列表。這讓 Hylak 很是惱火,因此直言 o1 就是垃圾。

圖片

o1 回答問題,多次自相矛盾。

為了表達(dá)心中的憤怒,Hylak 還在社交媒體上分享了這種觀點(diǎn),「我今天一整天都在使用 o1 pro—— 我再怎么強(qiáng)調(diào)也不為過 —— 它真的很糟糕。」

圖片

「輸出內(nèi)容幾乎接近胡言亂語,在同一個(gè)答案中多次自相矛盾。例如:我向它征求關(guān)于重構(gòu)的建議。它建議合并文件,但輸出的代碼塊中文件并未合并,然后又出現(xiàn)了完全不相關(guān)的結(jié)論。」

圖片

圖源:https://x.com/benhylak/status/1864835651725910023

對于 Hylak 的觀點(diǎn),有人表示贊同,但也有人強(qiáng)烈反對,他們認(rèn)為 o1 表現(xiàn)非常好。

隨著 Hylak 與那些持反對意見的人交流越來越多,他逐漸意識(shí)到自己完全錯(cuò)了:他把 o1 當(dāng)作聊天模型來使用,但實(shí)際上 o1 并不是聊天模型。

對于作者態(tài)度的轉(zhuǎn)變,奧特曼很是欣慰,表示道:「隨著人們學(xué)會(huì)如何使用 o1(包括 pro 版),觀察人們對它態(tài)度的轉(zhuǎn)變真是很有趣。」

圖片

奧特曼關(guān)于這條博客的推文瀏覽量達(dá)到 1.5M 。

Greg Brockman 表示:「o1 是一個(gè)不同類型的模型。要獲得出色的性能,需要以一種與標(biāo)準(zhǔn)聊天模型不同的新方式來使用它。」

圖片


如果 o1 不是聊天模型,那它是什么?

我們可以把它想象成一個(gè)報(bào)告生成器(report generator)。如果你給定足夠的上下文,然后告訴它你想要的輸出,o1 通常會(huì)一下子確定解決方案。

接下來的問題是,如何使用 o1。

不要寫提示,要寫 Brief

給它大量的上下文,上下文的數(shù)量作者用 ton 來形容,我們可以把它想象成提示的 10 倍。

圖片

這張圖解釋了如何構(gòu)建一個(gè)針對 o1 模型的提示(prompt),并將其分為幾個(gè)部分。

通常情況下,當(dāng)你使用像 Claude 3.5 Sonnet 或 4o 這樣的聊天模型時(shí),會(huì)先提出一個(gè)簡單的問題并附帶一些上下文。如果模型需要更多的上下文,它通常會(huì)向你詢問。

你會(huì)與模型來回迭代,糾正它并擴(kuò)展需求,直到達(dá)到期望的輸出。聊天模型本質(zhì)上是通過這種來回交互的方式從你這里獲取上下文。在與模型交互過程中,我們可能會(huì)變得越來越懶,只要還能得到好的輸出,輸入的提示越來越敷衍。

但是,o1 會(huì)直接接受那些敷衍的問題,并不會(huì)試圖從我們這里獲取上下文。相反,你需要盡可能多地向 o1 提供上下文。

即使你只是詢問一個(gè)簡單的工程問題,你也需要:

  • 詳細(xì)說明所有你嘗試過但沒有奏效的方法;
  • 添加所有數(shù)據(jù)庫架構(gòu)的完整 dump;
  • 解釋你公司的業(yè)務(wù)、規(guī)模(并定義公司特有的術(shù)語)。

簡而言之,我們要把 o1 當(dāng)作一個(gè)新入職的員工來對待。

圖片

把更多的時(shí)間用在開頭提示上。圖源:https://x.com/swyx/status/1839213190816870425

專注于目標(biāo):準(zhǔn)確地描述你想要什么

一旦你向模型提供了盡可能多的上下文,就需要專注于解釋你希望輸出是什么。

在大多數(shù)模型中,我們會(huì)告訴模型我們希望它如何回答我們。例如:你是一位專家級軟件工程師。你需要模型進(jìn)行慢思考且思考的很仔細(xì)。

這與使用 o1 取得成功的方法完全相反。不要告訴它如何做 —— 只告訴它做什么。然后讓 o1 接管,自行規(guī)劃和解決問題的步驟。這就是自主推理的作用所在,實(shí)際上這比你作為人工環(huán)節(jié)手動(dòng)審查和聊天要快得多。

圖片

知道 o1 擅長什么、不擅長什么

o1 擅長什么:

  • 完美地一次性處理整個(gè) / 多個(gè)文件:到目前為止,這是 o1 最令人印象深刻的能力。例如,復(fù)制 / 粘貼大量代碼,大量關(guān)于正在構(gòu)建內(nèi)容的上下文,o1 會(huì)完全一次性地完成整個(gè)文件(或多個(gè)文件),通常沒有錯(cuò)誤,遵循現(xiàn)有模式代碼庫。
  • 減少幻覺:例如,o1 確實(shí)擅長定制查詢語言(如 ClickHouse 和 New Relic),而 Claude 經(jīng)常混淆 Postgres 的語法。
  • 醫(yī)療診斷:Hylak 的女朋友是一名皮膚科醫(yī)生,當(dāng)朋友或家人有皮膚問題時(shí),他們通常會(huì)給 Hylak 的女朋友發(fā)一張照片。當(dāng) Hylak 拿照片詢問 o1 時(shí),o1 的回答通常與正確答案驚人地接近(約 60%)。對于醫(yī)療專業(yè)人員來說更有用 ——o1 幾乎總能提供極其準(zhǔn)確的鑒別診斷。
  • 解釋概念:Hylak 發(fā)現(xiàn) o1 非常擅長通過示例解釋非常困難的工程概念。
  • 在制定困難的架構(gòu)決策時(shí),Hylak 經(jīng)常會(huì)讓 o1 生成多個(gè)計(jì)劃,甚至比較這些計(jì)劃,每個(gè)計(jì)劃都有優(yōu)缺點(diǎn)。
  • 評估:Hylak 一直對使用 LLM 作為評估的判別器持非常懷疑的態(tài)度,但 o1 表現(xiàn)出巨大的希望 —— 它通常能夠在很少的上下文下確定生成結(jié)果是否正確。

o1 做得還不夠好的地方:

  • 用特定的聲音 / 風(fēng)格寫作:Hylak 發(fā)現(xiàn) o1 不擅長寫任何東西,尤其是在特定的聲音或風(fēng)格中。它遵循一種非常學(xué)術(shù) / 企業(yè)的報(bào)告風(fēng)格。

圖片

Hylak 嘗試讓 o1 寫這篇博客的一個(gè)例子 — — 經(jīng)過多次反復(fù),它只會(huì)寫一份平淡的報(bào)告。

  • 構(gòu)建整個(gè)應(yīng)用程序:o1 非常擅長一次性構(gòu)建整個(gè)文件,但 o1 不會(huì)構(gòu)建整個(gè) SaaS,至少不會(huì)進(jìn)行大量迭代。不過,它幾乎可以一次性完成整個(gè)功能,特別是前端功能或簡單的后端功能。

延遲從根本上改變了我們對產(chǎn)品的體驗(yàn)。考慮一下電子郵件和短信之間的區(qū)別 —— 主要是延遲,語音消息與電話通話 —— 延遲,等等。

Hylak 將 o1 稱為「報(bào)告生成器」,因?yàn)?o1 顯然不是聊天模型 —— 它感覺更像電子郵件。

Hylak 認(rèn)為 o1 將首次使某些產(chǎn)品成為可能 —— 例如,可以從高延遲、長時(shí)間運(yùn)行的后臺(tái)智能中受益的產(chǎn)品。

用戶愿意等待 5 分鐘來完成什么樣的任務(wù)?一個(gè)小時(shí)?一天?3-5 個(gè)工作日?如果設(shè)計(jì)正確的話,有很多。

需要注意的是,o1-preview 和 o1-mini 支持流式傳輸,但不支持結(jié)構(gòu)化生成或系統(tǒng)提示。o1 支持結(jié)構(gòu)化生成和系統(tǒng)提示,但尚不支持流式傳輸。

當(dāng)開發(fā)人員在 2025 年設(shè)計(jì)產(chǎn)品時(shí),實(shí)際使用該模型做什么將會(huì)非常重要。

責(zé)任編輯:姜華 來源: 機(jī)器之心
相關(guān)推薦

2025-01-20 09:28:00

AI工具模型

2025-01-13 11:48:10

人工智能o1聊天模型

2024-12-09 07:00:00

o1-mini模型強(qiáng)化微調(diào)OpenAI

2024-09-24 11:01:03

2024-09-14 12:51:04

2025-01-08 13:08:55

2024-09-18 08:40:00

智能模型AI

2024-10-05 00:00:00

2024-09-19 13:32:24

2024-11-07 15:40:00

2024-11-04 09:00:00

2024-11-25 17:23:10

2024-12-05 10:16:14

2021-12-21 10:26:39

交付項(xiàng)目Jira開發(fā)

2024-11-12 12:53:46

2025-02-03 14:17:27

2024-09-13 10:06:21

2024-12-09 11:06:31

2025-07-22 10:22:02

2012-05-16 09:53:56

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

国产乱码久久久久| 丁香激情五月少妇| 91九色美女在线视频| 99久久综合狠狠综合久久| 91tv亚洲精品香蕉国产一区7ujn| 玖玖爱在线观看| 亚洲精品777| 图片区小说区国产精品视频 | 日韩一区二区三区高清在线观看| 亚洲成人av一区二区三区| 欧美亚洲一级二级| 成 人 黄 色 片 在线播放| 亚洲欧美日韩视频二区| 欧美美女18p| 熟女少妇内射日韩亚洲| 99久热这里只有精品视频免费观看| 日本韩国一区二区三区| 中文字幕日韩精品无码内射| 国产女主播在线写真| 国产麻豆9l精品三级站| 国产激情视频一区| 欧美一级高潮片| 久久在线免费| 国产丝袜一区二区三区免费视频| www.国产福利| 国产精品久久久久77777丨| 亚洲风情在线资源站| 在线播放 亚洲| 成人av电影观看| 不卡视频在线看| 1卡2卡3卡精品视频| 亚洲中文无码av在线| 亚洲欧美日韩精品一区二区| 久久久免费av| 中文字幕另类日韩欧美亚洲嫩草| 欧美日韩伦理在线免费| 日韩精品视频在线播放| 日本在线不卡一区二区| 欧美a在线观看| 这里只有精品免费| 欧美三级理论片| 这里有精品可以观看| 亚洲国产成人va在线观看天堂| 一区二区三视频| 中文字幕在线播放| 国产午夜亚洲精品午夜鲁丝片| 久久精彩视频| 五月天久久久久久| 91亚洲国产成人精品一区二三 | 另类春色校园亚洲| 日韩欧美国产午夜精品| 日本网站在线看| 日韩电影免费观看高清完整版在线观看| 在线看国产一区二区| 黄色国产精品视频| 在线看片福利| 91九色最新地址| 在线观看免费成人av| 国产69精品久久久久9999人| 欧美日韩视频在线观看一区二区三区 | 91福利在线导航| jizz欧美激情18| 成人黄色免费观看| 欧美另类变人与禽xxxxx| xxx国产在线观看| 国产精品国产亚洲精品| 日韩欧美中文字幕一区| 人妻激情偷乱频一区二区三区| 成人av综合网| 亚洲女人天堂色在线7777| 国产成人无码精品久久二区三| 国产一区网站| 日韩一区二区久久久| 久久国产柳州莫菁门| 四虎国产精品免费观看| 欧美理论电影在线播放| 欧美一级高潮片| 亚洲欧美久久久| 国产精品青青在线观看爽香蕉| 一级黄色大片免费| 国产成人啪午夜精品网站男同| 国产精品久久久久久久小唯西川| 色鬼7777久久| 亚洲欧洲av另类| 日本黄大片在线观看| 国产在线美女| 欧美色图12p| 欧美熟妇精品一区二区 | 亚洲国产精品一区二区第四页av | 亚洲欧洲av色图| 成人午夜免费在线| 日韩三区免费| 精品少妇一区二区三区视频免付费| 欧美激情 亚洲| 日韩黄色大片| 午夜精品久久久久久99热| www.久久久久久久| 国产二区国产一区在线观看| 欧美激情一区二区三区在线视频 | 精品久久一区| 欧美激情乱人伦| 最好看的日本字幕mv视频大全| 国产一区二区剧情av在线| 免费在线成人av电影| av网站在线看| 欧美自拍偷拍午夜视频| 国产精品一区二区在线免费观看| 国产欧美一区二区精品久久久| 欧美丰满少妇xxxxx| 亚洲 国产 日韩 欧美| 成人综合婷婷国产精品久久蜜臀 | 草草地址线路①屁屁影院成人| 日韩精品欧美| 欧美中在线观看| 成人av手机在线| 国产精品三级在线观看| 国产精品一区二区免费在线观看| 96视频在线观看欧美| 亚洲女人天堂视频| 日韩伦理在线视频| 国产精品综合久久| 在线观看一区二区三区三州| 精品国产第一福利网站| 精品毛片乱码1区2区3区| 影音先锋男人看片资源| 视频在线在亚洲| 久久亚洲一区二区| av免费不卡| 日韩免费在线观看| 国产大学生自拍| 精品综合免费视频观看| 日韩区国产区| 二吊插入一穴一区二区| 亚洲精品资源在线| 国偷自拍第113页| 成人一道本在线| 国产精品视频一二三四区| 四虎地址8848精品| 中文字幕一精品亚洲无线一区| 欧美精品韩国精品| 久久综合九色综合97婷婷| 精品无码国模私拍视频| 嗯用力啊快一点好舒服小柔久久| 精品少妇v888av| 99在线精品视频免费观看20| 自拍偷拍亚洲激情| 色婷婷一区二区三区在线观看| 日韩电影在线视频| 国产精品综合不卡av| 成人p站proumb入口| 欧美日韩在线观看一区二区| 久久免费手机视频| 免费观看在线色综合| 亚洲欧美一区二区原创| 久久日本片精品aaaaa国产| 色综合伊人色综合网| 亚洲图片欧美在线| 一区二区中文视频| 污污的视频免费观看| 中文字幕免费一区二区| 亚洲在线视频福利| 7777kkk亚洲综合欧美网站| 亚洲国产精品电影在线观看| 成人毛片18女人毛片| 久久色中文字幕| 美女少妇一区二区| 亚洲一区在线| 国产一区二区不卡视频| 成人性教育av免费网址| 中文欧美日本在线资源| 国产绿帽刺激高潮对白| 亚洲成人激情av| 人人人妻人人澡人人爽欧美一区| 免费在线观看精品| 黄色一级片av| 五月激激激综合网色播| 国产裸体写真av一区二区| 99在线播放| 日韩精品视频在线播放| 伊人网免费视频| 亚洲一区在线免费观看| 一级性生活毛片| 久久国产精品第一页| 国产视频在线观看网站| 亚洲va久久久噜噜噜久久| 国产精品夜间视频香蕉| 国精产品一区一区三区mba下载| 日韩av在线免费播放| 中文字幕一区二区三区四区视频 | 日韩免费视频播放| 日韩美女一区二区三区在线观看| 成人激情av| 一二区成人影院电影网| 欧美精品国产精品日韩精品| 国产中文在线视频| 精品人在线二区三区| 亚洲无码精品一区二区三区| 一区二区三区四区五区视频在线观看| 久久久久久久久久久国产精品| 国产精品一区二区久久不卡| 成人在线观看a| 国产精品啊啊啊| 五月天亚洲综合情| 另类春色校园亚洲| 亚洲自拍高清视频网站| 麻豆精品蜜桃| 91精品国产高清自在线看超| 国产调教视频在线观看| 亚洲性猛交xxxxwww| 欧美一区二区黄片| 欧美一区三区四区| 中文天堂在线资源| 精品毛片网大全| 久久婷婷国产麻豆91| 亚洲国产精品二十页| 亚洲一区二区观看| 成人性视频免费网站| 中日韩av在线播放| 日韩电影在线一区二区三区| 国产原创中文在线观看| 欧美黄色免费| 欧美aaa在线观看| 欧美日韩色图| 欧美一区二视频在线免费观看| 一区二区三区欧洲区| 成人a在线观看| 成人国产在线| 国产精品jvid在线观看蜜臀| 色是在线视频| 91chinesevideo永久地址| 欧美精品videossex少妇| 久久夜色精品国产亚洲aⅴ| 成黄免费在线| 亚洲人在线观看| 欧美777四色影视在线| 亚洲精品99999| 老熟妇高潮一区二区高清视频| 日韩一区二区在线看| 97精品人妻一区二区三区在线 | 国产成人精品999在线观看| 狠狠色噜噜狠狠色综合久| 国产精品jk白丝蜜臀av小说| 亚洲qvod图片区电影| 疯狂欧洲av久久成人av电影 | 国产精品女人久久久| 欧美日韩国产色站一区二区三区| 成人免费一区二区三区| 欧美色综合网站| 在线免费观看高清视频| 欧美军同video69gay| 国产又粗又猛又爽又黄的视频一| 欧美日本高清视频在线观看| 国产又粗又猛又黄又爽| 91麻豆精品国产91久久久更新时间| 国产精品高潮呻吟av| 欧美一区二区三区视频| av中文字幕第一页| 精品福利在线导航| 污视频在线免费| 亚洲欧美变态国产另类| 成人高清免费观看mv| 久久久久99精品久久久久| 污视频网站在线免费| 国内精品视频久久| 天堂av中文在线观看| 国产精品777| 亚洲色图综合| 国产成人精品一区二区三区福利| 国产专区精品| 久草精品电影| av中文一区| 国产精品一二三在线观看| 激情亚洲成人| 青青青国产在线视频| 精品一区二区三区免费| 熟妇高潮一区二区| 国产女人18水真多18精品一级做| 日本二区三区视频| 亚洲成人福利片| 亚洲大尺度在线观看| 欧美一区二区免费视频| 五十路在线视频| 久久精品91久久久久久再现| 福利成人导航| 国产精品久久久久久久久久久不卡 | 密臀av在线| 日韩免费在线播放| 国产精品毛片无码| 欧美日韩国产综合视频在线| 国产精品久久久久久久久久10秀 | 欧美自拍电影| 亚洲伊人久久综合| 精品一区亚洲| 国产午夜精品视频一区二区三区| 亚洲综合二区| 午夜大片在线观看| 久久影院视频免费| 精国产品一区二区三区a片| 色香蕉久久蜜桃| 亚洲第一免费视频| 色偷偷av一区二区三区乱| а√在线中文网新版地址在线| 国产精品最新在线观看| 亚洲丝袜啪啪| 国产freexxxx性播放麻豆| 日本不卡视频在线观看| 国产精品嫩草av| 亚洲欧美乱综合| 国产美女www爽爽爽| 日韩成人在线播放| 污污在线观看| 成人免费观看a| 成人91在线| 欧美亚洲另类色图| 成人性色生活片免费看爆迷你毛片| 毛片aaaaaa| 色天使色偷偷av一区二区| 农村少妇久久久久久久| 久久福利网址导航| 开心久久婷婷综合中文字幕| 欧美二区在线| 亚洲作爱视频| 国产女人18毛片水真多18| 亚洲天堂福利av| 亚洲天堂avav| 在线日韩av观看| 久久久一本精品| 鲁鲁狠狠狠7777一区二区| 亚洲欧洲一级| 图片区偷拍区小说区| 亚洲美女视频在线| 91美女精品网站| 日韩在线视频网站| 欧美国产日韩电影| 日韩国产欧美一区| 丝袜诱惑制服诱惑色一区在线观看 | 91亚洲国产成人精品一区二区三| 国产一级av毛片| 精品国产麻豆免费人成网站| 男女在线视频| 国产精品乱码一区二区三区| 悠悠资源网久久精品| 日韩无码精品一区二区| 亚洲国产视频一区二区| 午夜老司机福利| 国产69精品久久久| 欧美黑白配在线| 欧美aⅴ在线观看| 久久久91精品国产一区二区精品| 老熟妇仑乱一区二区av| 亚洲欧美福利视频| 国产精品久久亚洲不卡| 一本久道久久综合| 精品一二三四在线| 午夜少妇久久久久久久久| 欧美一区二区美女| 国内小视频在线看| 久久99国产精品99久久| 久久一二三四| 人妻无码一区二区三区免费| 欧美精品九九99久久| 性欧美猛交videos| 激情视频在线观看一区二区三区| 亚洲主播在线| 奇米网一区二区| 日韩欧美一区二区免费| 理论不卡电影大全神| 日韩三级电影| 国产成人自拍高清视频在线免费播放| 久久免费视频播放| 亚洲人成网站色ww在线| 欧美性生活一级| 国产日韩亚洲欧美在线| 久久久蜜桃精品| 亚洲视频在线观看一区二区| 欧美大学生性色视频| 曰本一区二区三区视频| 在线观看免费视频高清游戏推荐| 亚洲免费观看视频| 外国精品视频在线观看 | 亚洲精品91天天久久人人| 久久久久北条麻妃免费看| 精品亚洲免a| 伊人国产在线视频| 亚洲妇女屁股眼交7| 香蕉视频在线播放| 国产一区二区高清视频| 免费观看在线综合| 中文字幕一区二区三区精品| 中文字幕日韩电影| 国产精品视屏| 色噜噜狠狠永久免费| 大桥未久av一区二区三区| 免费看美女视频在线网站| 精品久久久久亚洲| 九色|91porny| 国产成人无码专区| 欧美精品久久久久| 国产精品久久久久久久久久10秀 | 精品人妻久久久久一区二区三区|