精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

OpenAI Deep Research已向所有付費用戶開放,系統卡發布

人工智能 新聞
OpenAI 宣布 Deep Research 已經面向所有 ChatGPT Plus、Team、Edu 和 Enterprise 用戶推出(剛發布時僅有 Pro 用戶可用),同時,OpenAI 還發布了 Deep Research 系統卡。

相信很多用戶已經見識過或至少聽說過 Deep Research 的強大能力。

今天凌晨,OpenAI 宣布 Deep Research 已經面向所有 ChatGPT Plus、Team、Edu 和 Enterprise 用戶推出(剛發布時僅有 Pro 用戶可用),同時,OpenAI 還發布了 Deep Research 系統卡。

此外,OpenAI 研究科學家 Noam Brown 還在 ?? 上透露:Deep Research 使用的基礎模型是 o3 正式版,而非 o3-mini。

Deep Research 是 OpenAI 本月初推出的強大智能體,其能使用推理來綜合大量在線信息并為用戶完成多步驟研究任務,從而助力用戶進行深入、復雜的信息查詢與分析。

在發布之后的這二十幾天里,OpenAI 還對 Deep Research 進行了一些升級:

OpenAI 這次發布的 Deep Research 系統卡報告介紹了發布 Deep Research 之前開展的安全工作,包括外部紅隊、根據準備度框架進行的風險評估,以及 OpenAI 為解決關鍵風險領域而采取的緩解措施。這里我們簡單整理了這份報告的主要內容。

地址:https://cdn.openai.com/deep-research-system-card.pdf

Deep Research 是一種新的智能體能力,可針對復雜任務在互聯網上進行多步驟研究。Deep Research 模型基于為網頁瀏覽進行了優化的 OpenAI o3 早期版本。Deep Research 利用推理來搜索、解讀和分析互聯網上的大量文本、圖像和 PDF,并根據遇到的信息做出必要的調整。它還可以讀取用戶提供的文件,并通過編寫和執行 Python 代碼來分析數據。

「我們相信 Deep Research 可以幫助人們應對多種多樣的情形?!筄penAI 表示,「在發布 Deep Research 并將其提供給我們的 Pro 用戶之前,我們進行了嚴格的安全測試、準備度評估和治理審查。我們還進行了額外的安全測試,以更好地了解與 Deep Research 瀏覽網頁的能力相關的增量風險,并增加了新的緩解措施。新工作的關鍵領域包括加強對在線發布的個人信息的隱私保護,以及訓練模型以抵御在搜索互聯網時可能遇到的惡意指令?!?/span>

OpenAI 還提到,對 Deep Research 的測試也揭示了進一步改進測試方法的機會。在擴大 Deep Research 的發布范圍之前,他們還將花時間對選定的風險進行進一步的人工檢測和自動化測試。

本系統卡包含 OpenAI 如何構建 Deep Research、了解其能力和風險以及在發布前提高其安全性的更多詳細信息。

模型數據和訓練

Deep Research 的訓練數據是專門為研究用例創建的新瀏覽數據集。

該模型學習了核心的瀏覽功能(搜索、單擊、滾動、解讀文件)、如何在沙盒環境中使用 Python 工具(用于執行計算、進行數據分析和繪制圖表),以及如何通過對這些瀏覽任務進行強化學習訓練來推理和綜合大量網站以查找特定信息或撰寫綜合報告。

其訓練數據集包含一系列任務:從具有 ground truth 答案的客觀自動評分任務,到帶有評分標準的更開放的任務。

在訓練期間,評分過程使用的評分器是一個思維鏈模型,其會根據 ground truth 答案或評分標準給出模型響應的分數。

該模型的訓練還使用了 OpenAI o1 訓練用過的現有安全數據集,以及為 Deep Research 創建的一些新的、特定于瀏覽的安全數據集。

風險識別、評估和緩解

外部紅隊方法

OpenAI 與外部紅隊成員團隊合作,評估了與 Deep Research 能力相關的關鍵風險。

外部紅隊專注的風險領域包括個人信息和隱私、不允許的內容、受監管的建議、危險建議和風險建議。OpenAI 還要求紅隊成員測試更通用的方法來規避模型的安全措施,包括提示詞注入和越獄。

紅隊成員能夠通過有針對性的越獄和對抗策略(例如角色扮演、委婉表達、使用黑客語言、莫爾斯電碼和故意拼寫錯誤等輸入混淆)來規避他們測試的類別的一些拒絕行為,并且根據這些數據構建的評估將 Deep Research 的性能與之前部署的模型進行比較。

評估方法

Deep Research 擴展了推理模型的能力,使模型能夠收集和推理來自各種來源的信息。Deep Research 可以綜合知識并通過引用提出新的見解。為了評估這些能力,需要調整已有的一些評估方法,以解釋更長、更微妙的答案 —— 而這些答案往往更難以大規模評判。

OpenAI 使用其標準的不允許內容和安全評估對 Deep Research 模型進行了評估。他們還為個人信息和隱私以及不允許的內容等領域開發了新的評估。最后,對于準備度評估,他們使用了自定義支架來引出模型的相關能力。

ChatGPT 中的 Deep Research 還使用了另一個自定義提示的 OpenAI o3-mini 模型來總結思維鏈。以類似的方法,OpenAI 也根據其標準的不允許內容和安全評估對總結器模型進行了評估。

觀察到的安全挑戰、評估和緩解措施

下表給出了風險和相應的緩解措施;每個風險的具體評估和結果請參閱原報告。

準備度框架評估

準備度框架是一個動態文檔,其中描述了 OpenAI 跟蹤、評估、預測和防范來自前沿模型的災難性風險的方式。

該評估目前涵蓋四個風險類別:網絡安全、CBRN(化學、生物、放射、核)、說服和模型自主性。

只有緩解后(post-mitigation)得分為「中」或以下的模型才能部署,只有緩解后得分為「高」或以下的模型才能進一步開發。OpenAI 根據準備度框架對 Deep Research 進行了評估。

準備度框架詳情請訪問:https://cdn.openai.com/openai-preparedness-framework-beta.pdf

下面更具體地看看對 Deep Research 的準備度評估。Deep Research 基于針對網頁瀏覽進行了優化的 OpenAI o3 早期版本。為了更好地衡量和引出 Deep Research 的能力,OpenAI 對以下模型進行了評估:

  • Deep Research(緩解前),一種僅用于研究目的的 Deep Research 模型(未在產品中發布),其后訓練程序與 OpenAI 已發布的模型不同,并不包括公開發布的模型中的額外安全訓練。
  • Deep Research(緩解后),最終發布的 Deep Research 模型,包括發布所需的安全訓練。

對于 Deep Research 模型,OpenAI 測試了各種設置以評估最大能力引出(例如,有瀏覽與無瀏覽)。他們還根據需要修改了支架,以最好地衡量多項選擇題、長答案和智能體能力。

為了幫助評估每個跟蹤風險類別中的風險級別(低、中、高、嚴重),準備團隊使用「indicator」將實驗評估結果映射到潛在風險級別。這些 indicator 評估和隱含風險水平經過安全咨詢小組(Safety Advisory Group)審查,該小組確定了每個類別的風險水平。當達到或看起來即將達到 indicator 閾值時,安全咨詢小組會進一步分析數據,然后確定是否已達到風險水平。

OpenAI 表示模型訓練和開發的整個過程中都進行了評估,包括模型啟動前的最后一次掃描。為了最好地引出給定類別中的能力,他們測試了各種方法,包括在相關情況下的自定義支架和提示詞。

OpenAI 也指出,生產中使用的模型的確切性能數值可能會因最終參數、系統提示詞和其他因素而異。

OpenAI 使用了標準 bootstrap 程序計算 pass@1 的 95% 置信區間,該程序會對每個問題的模型嘗試進行重新采樣以近似其指標的分布。

默認情況下,這里將數據集視為固定的,并且僅重新采樣嘗試。雖然這種方法已被廣泛使用,但它可能會低估非常小的數據集的不確定性,因為它只捕獲抽樣方差而不是所有問題級方差。換句話說,該方法會考慮模型在多次嘗試中對同一問題的表現的隨機性(抽樣方差),但不考慮問題難度或通過率的變化(問題級方差)。這可能導致置信區間過緊,尤其是當問題的通過率在幾次嘗試中接近 0% 或 100% 時。OpenAI 也報告了這些置信區間以反映評估結果的內在變化。

在審查了準備度情況評估的結果后,安全咨詢小組將 Deep Research 模型評級為總體中等風險(overall medium risk)—— 包括網絡安全、說服、CBRN、模型自主性都是中等風險。

這是模型首次在網絡安全方面被評為中等風險。

下面展示了 Deep Research 與其它對比模型在 SWE-Lancer Diamond 上的結果。請注意其中上圖是 pass@1  結果,也就是說在測試的時候,每個模型在每個問題上只有一次嘗試的機會。

整體來看,各個階段的 Deep Research 的表現都非常好。其中,緩解后的 Deep Research 模型在 SWE-Lancer 上表現最佳,解決了大約 46-49% 的 IC SWE 任務和 47-51% 的 SWE Manager 任務。

更多評估細節和結果請訪問原報告。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-04-25 09:09:00

2023-07-07 09:32:57

GPT-4OpenAI

2025-04-25 10:26:19

2023-10-20 08:26:50

2025-02-06 08:12:41

2025-03-10 10:26:16

2025-02-06 15:07:27

2025-02-03 12:07:52

2023-08-11 09:16:14

2025-03-28 09:07:05

2025-06-17 15:28:03

智能體AI開源

2025-03-17 08:30:00

谷歌模型AI

2023-03-10 07:53:10

AI系統AIGC系統

2024-04-30 07:15:51

OpenAIChatGPT人工智能

2025-07-08 09:22:31

2024-12-16 14:20:55

2021-01-14 07:46:08

Windows 7微軟操作系統

2011-03-14 10:18:56

2025-09-03 04:11:00

2023-11-11 12:46:09

點贊
收藏

51CTO技術棧公眾號

一区二区日韩av| 日日夜夜一区二区| 欧美v日韩v国产v| 免费欧美一级视频| 午夜精品一区| 成人黄色国产精品网站大全在线免费观看 | 欧美国产1区2区| 91亚洲va在线va天堂va国| 精品无码人妻一区二区三区品| 日韩三级av| 在线91免费看| 国产中文字幕视频在线观看| av在线天堂播放| av不卡在线观看| 国产日产久久高清欧美一区| 精品少妇theporn| 成人在线免费小视频| 亚洲精品在线一区二区| 午夜视频你懂的| caoprom在线| 国产精品电影院| 欧美福利精品| 欧美熟妇交换久久久久久分类| 日韩一区欧美二区| 久久久久久久国产精品视频| 亚洲天堂精品一区| 亚洲婷婷伊人| 精品国产伦一区二区三区免费| 国产高潮免费视频| 午夜久久中文| 一卡二卡三卡日韩欧美| 亚洲精品tv久久久久久久久| 天堂在线观看视频| 国产精品1区2区3区| 国产精品久久二区| 国产精品老女人| 国内精品福利| 美女撒尿一区二区三区| 中文字幕av久久爽一区| 亚洲区小说区图片区qvod| 日韩美女视频在线| www.cao超碰| 777午夜精品电影免费看| 激情成人在线视频| 丰满的少妇愉情hd高清果冻传媒 | 97香蕉超级碰碰久久免费的优势| 久久国产高清视频| 三级电影一区| 最近中文字幕2019免费| 亚洲女优在线观看| 国产成人调教视频在线观看| 日韩电影免费在线观看中文字幕| 特种兵之深入敌后| 欧美日韩卡一| 欧美肥妇毛茸茸| 高潮一区二区三区| 国产资源一区| 777久久久精品| 日日干日日操日日射| 美女视频一区| 欧美日韩1234| 亚洲综合123| 免费观看亚洲天堂| 精品裸体舞一区二区三区| 又大又长粗又爽又黄少妇视频| 日韩精品视频在线看| 精品久久人人做人人爱| 欧洲熟妇的性久久久久久| 中文字幕日韩在线| 亚洲国产精品人人爽夜夜爽| 97人妻精品一区二区三区免费| 成人激情自拍| 日韩电影免费在线观看中文字幕 | 亚洲大尺度网站| 成人亚洲一区二区一| 精品视频一区二区三区四区| 欧美偷拍视频| 中文字幕精品一区| 亚洲精品偷拍视频| 波多野结衣乳巨码无在线观看| 午夜国产不卡在线观看视频| 久久久免费视频网站| 91超碰碰碰碰久久久久久综合| 欧美日韩视频在线第一区| 天天操精品视频| 国产ts一区| 亚洲天堂av高清| 国产又粗又硬又长又爽| 欧美三级免费| 国产91在线播放精品91| 中文字字幕在线中文乱码| 国产精品影音先锋| 精品乱码一区二区三区| av网站大全在线观看| 玉足女爽爽91| 久久精品视频91| 婷婷视频一区二区三区| 日韩国产高清污视频在线观看| 蜜臀久久99精品久久久久久| 五月开心六月丁香综合色啪| 91高清视频免费观看| 在线免费观看一级片| 国产xxx精品视频大全| 欧美日韩在线一二三| 国产区在线看| 色欧美88888久久久久久影院| 涩多多在线观看| 要久久电视剧全集免费| 久久69精品久久久久久国产越南| 欧美在线观看不卡| 国产乱对白刺激视频不卡| 久久久久天天天天| 18视频在线观看网站| 日本乱人伦一区| 又黄又色的网站| 久久一区二区三区电影| 91高清免费在线观看| 精品区在线观看| 国产日韩av一区二区| 精品一二三四五区| 欧美激情三区| 亚洲人成电影网| 日本三级中文字幕| 国产一区二区0| 婷婷久久伊人| 毛片无码国产| 亚洲精品久久久久久久久久久久久| 任我爽在线视频| 日本不卡123| 欧美精品人人做人人爱视频| 超碰在线中文字幕| 欧美一区二区福利在线| 免费黄色激情视频| 日本sm残虐另类| 欧美精品一区二区视频| gogo高清在线播放免费| 欧美tickling网站挠脚心| 午夜爱爱毛片xxxx视频免费看| 青草网在线观看| 日韩免费成人| 欧美国产中文字幕| 亚洲精品97久久中文字幕无码| 亚洲欧美在线另类| 在线观看免费不卡av| 不卡中文字幕| 国产精品久久久久久久久借妻| 毛片在线播放网站| 色综合天天综合网天天看片| 午夜视频在线观看国产| 亚洲激情网站| 精品不卡在线| 天堂av中文在线观看| 日韩成人在线观看| 国产尤物在线视频| 久久综合色婷婷| 噜噜噜久久亚洲精品国产品麻豆| 精品人人人人| 77777亚洲午夜久久多人| 午夜一区在线观看| 岛国av一区二区在线在线观看| 香港三日本8a三级少妇三级99| 99亚洲精品| 欧美大香线蕉线伊人久久| 东京一区二区| 中文字幕欧美日韩精品| 一区二区三区免费观看视频| 成人免费在线播放视频| 亚洲精品国产久| 国产精品99一区二区| 国产精品中出一区二区三区| 福利影院在线看| 亚洲免费一级电影| 中文字幕 亚洲视频| 中文字幕欧美激情| 韩国一区二区在线播放| 激情综合在线| 欧美日韩高清在线一区| 韩日一区二区| 欧美另类极品videosbest最新版本| 超碰人人人人人人| 狠狠综合久久av一区二区小说 | 性欧美videos另类hd| 精品国产91乱高清在线观看| 一色道久久88加勒比一| 九一九一国产精品| www污在线观看| 九九热爱视频精品视频| 国产在线视频91| 国产丝袜精品丝袜| 亚洲免费av电影| 国产原创中文av| 天天做天天摸天天爽国产一区| 国产高清一区二区三区四区| 国产精品一级二级三级| 国模吧无码一区二区三区| 色欧美自拍视频| 国产精品有限公司| 香蕉久久一区| 68精品久久久久久欧美 | 国产精品嫩草影院av蜜臀| 在线观看网站黄| 久久午夜影视| 国产爆乳无码一区二区麻豆| 国产精品视频一区二区三区四蜜臂| 成人精品一区二区三区| 亚洲精品福利电影| 色综合天天狠天天透天天伊人| 男人av在线| 精品少妇一区二区三区在线播放 | 亚洲国产私拍精品国模在线观看| 波多野结衣视频免费观看| 亚洲精品国产第一综合99久久| 亚洲综合网在线观看| 国产伦精品一区二区三区免费| 日本免费一级视频| 国产精品v亚洲精品v日韩精品 | 91av一区二区三区| 欧美va视频| 91大神福利视频在线| 日本在线观看高清完整版| 色先锋资源久久综合5566| 深夜福利在线观看直播| 日韩欧美资源站| 一区二区日韩在线观看| 在线观看一区日韩| 欧美精品二区三区| 亚洲专区一二三| 日韩在线不卡av| 日本一区二区久久| 中文字幕有码在线播放| 91香蕉国产在线观看软件| 亚洲色图欧美另类| 国产99精品视频| 韩国三级hd中文字幕有哪些| 激情五月播播久久久精品| 在线黄色免费观看| 秋霞影院一区二区| 麻豆一区二区三区视频| 久久精品一区二区国产| 超碰97人人射妻| 美女91精品| 无码日韩人妻精品久久蜜桃| 亚洲综合国产| 日韩av在线综合| 日韩在线a电影| 在线免费观看视频黄| 青椒成人免费视频| 色噜噜狠狠一区二区| 蜜臀av一区二区| 日本在线播放一区二区| 国内外成人在线| 中文字幕无码毛片免费看| 高清av一区二区| xfplay5566色资源网站| 成人av动漫在线| theav精尽人亡av| 久久夜色精品国产欧美乱极品| 中文人妻一区二区三区| 国产日韩综合av| 色撸撸在线视频| 一卡二卡三卡日韩欧美| 国产无精乱码一区二区三区| 亚洲第一成年网| 日韩av一二三区| 一区二区理论电影在线观看| 久久成人国产精品入口| 亚洲成a人片综合在线| 国产奶水涨喷在线播放| 婷婷成人激情在线网| 69av视频在线观看| 欧美日韩国产高清一区二区 | 51国产成人精品午夜福中文下载| 国产精品麻豆| 91蜜桃网站免费观看| 97色婷婷成人综合在线观看| 国产精品精品软件视频| 欧美亚洲大陆| 玖玖玖精品中文字幕| 成人精品视频| 中文字幕日韩一区二区三区| 国产精品传媒精东影业在线| 国产乱子伦精品无码专区| 亚洲激情社区| 韩国中文字幕av| 国产乱码精品一区二区三区五月婷| 岛国精品一区二区三区| 97se亚洲国产综合自在线| 国产在视频线精品视频| 亚洲精品国产精品乱码不99| 日本少妇激情舌吻| 欧美久久久久中文字幕| 国精品人妻无码一区二区三区喝尿| 亚洲国产精品成人va在线观看| 98在线视频| 欧美黄色三级网站| 欧美成人精品三级网站| 91丨九色丨国产在线| 日韩激情网站| 99re99热| 午夜在线a亚洲v天堂网2018| 黄色手机在线视频| 国产成人av电影免费在线观看| 日本二区在线观看| 亚洲精品成人a在线观看| 精品人妻在线播放| 7777女厕盗摄久久久| 十九岁完整版在线观看好看云免费| 欧美精品一本久久男人的天堂| 人成在线免费网站| 成人a在线观看| 国产欧美日韩影院| 成人午夜视频免费观看| 爽好多水快深点欧美视频| 黄色性视频网站| 国产精品第一页第二页第三页| 国产乡下妇女做爰视频| 日韩一区二区三区免费观看| 加勒比一区二区三区在线| 久久久久久国产精品久久| aa亚洲一区一区三区| 欧美午夜精品久久久久免费视 | 自拍偷拍亚洲欧美| 手机av在线| av噜噜色噜噜久久| 欧美va天堂在线| 中文字幕国内自拍| 26uuu国产一区二区三区 | 日韩欧美在线观看| 午夜美女福利视频| 日韩亚洲国产中文字幕| 91国拍精品国产粉嫩亚洲一区| 久久久久久久久久久久久久一区| 久久久久亚洲| 免费网站在线观看黄| 国产午夜精品一区二区三区四区| 国产精品午夜影院| 亚洲国产精品va在线| 主播国产精品| 亚洲最大激情中文字幕| 久久国产电影| 成人免费毛片网| 99精品欧美一区二区蜜桃免费 | 一区二区三区毛片免费| 性生活免费在线观看| 成人av免费在线观看| 精品在线播放视频| 精品裸体舞一区二区三区| 91资源在线观看| 成人区精品一区二区| 女主播福利一区| 伊人久久久久久久久| 夜夜爽夜夜爽精品视频| www.av导航| 性色av一区二区三区免费| 成人自拍在线| 2019日韩中文字幕mv| 91网站在线观看视频| 中文字幕激情小说| 日韩国产精品亚洲а∨天堂免| 国产粉嫩在线观看| 精选一区二区三区四区五区| 久久久久久色| 精品人妻少妇嫩草av无码| 亚洲国产欧美一区二区三区丁香婷| 后进极品白嫩翘臀在线视频| 久久久视频免费观看| 一区二区美女| 久久久久狠狠高潮亚洲精品| 国产视频一区在线播放| 中文字幕男人天堂| www.久久久久| 高清一区二区三区| 91国视频在线| 欧美激情在线观看视频免费| 国产免费不卡av| 九色精品免费永久在线| 亚洲国产国产| 男女男精品视频站| 亚洲欧美色综合| 五月婷婷久久久| 国产精品91在线观看| 亚洲天堂一区二区三区四区| 色欲欲www成人网站| 亚洲一区欧美一区| 国产女主播在线写真| 91精品久久久久久久久久入口| 亚洲日韩视频| 色欲AV无码精品一区二区久久| 欧美一区二区三区啪啪| 性欧美18~19sex高清播放| 涩涩涩999| 成人黄色综合网站| 中文字幕第99页| 久久久久久成人| 日韩成人三级| 中文字幕一二三区| 精品视频全国免费看| 色呦呦呦在线观看| 日韩妆和欧美的一区二区| 国产一区二区在线视频|