精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

GPT-5.1 發布:更智能也更“人性化“的 AI 助手

人工智能
說白了,GPT-5.1 的升級就像一面鏡子,一下把大家對大模型 的各種情緒都照了出來——有人覺得它更聰明更自然了,有人又擔心太“像人”不太舒服。對用戶來說,更像是一次新的實驗:看看我們到底希望大模型離人類多近,離工具多遠。?

2025年11月12日,OpenAI 發布了 GPT-5 系列的重要更新版本 GPT-5.1,包括 GPT-5.1 Instant(即時版)和 GPT-5.1 Thinking(思維版)兩個變體。這次更新不僅在技術能力上有所提升,更值得關注的是其在對話風格上的顯著變化,而這一變化正在社區中引發激烈討論。

技術升級:智能與效率的平衡

GPT-5.1 Instant 的自適應推理

GPT-5.1 Instant 引入了一項關鍵技術創新——自適應推理能力。這個模型現在能夠自主判斷何時需要在回答前進行"思考"。對于簡單的問題,模型會快速給出答案;而面對復雜問題時,它會先進行內部推理,確保答案的準確性和完整性。

這種自適應機制在數學和編程評估中表現尤為突出。在 AIME 2025 數學競賽和 Codeforces 編程測試中,GPT-5.1 Instant 取得了明顯的性能提升。技術文檔顯示,模型在指令遵循方面也有顯著改進,能更可靠地按照用戶的具體要求作答。

舉個實例,當用戶要求"始終用六個字回復"時,GPT-5.1 Instant 能夠穩定地維持這一約束,而早期版本往往會在對話中逐漸偏離這種限制。

GPT-5.1 Thinking 的動態時間分配

GPT-5.1 Thinking 在前代基礎上優化了思考時間的分配策略。根據官方數據,在代表性任務集上:

  • 第10百分位的簡單任務:響應速度提升約57%(幾乎快了一倍)
  • 第90百分位的復雜任務:思考時間增加約71%(深度提升約70%)
  • 中位數任務保持不變

圖片圖片

這種動態調整意味著用戶在處理簡單問題時不必等待不必要的"思考"過程,而在面對真正復雜的問題時,模型會投入更多計算資源來確保答案質量。

技術上看,這種時間分配的精確控制體現了模型在元認知層面的進步——它不僅知道如何解決問題,還能評估問題的復雜度并相應調整策略。

對話風格的轉變:引發的爭議

"更人性化"的設計理念

OpenAI 在博客中明確表示:"筆者清楚地聽到用戶反饋,出色的 AI 不僅要智能,還要具備愉快的交流體驗。" 基于這一理念,GPT-5.1 默認采用了更加親切、更具同理心的對話風格。

以壓力緩解場景為例,當用戶表達"感到壓力很大,需要一些放松技巧"時:

GPT-5 會直接列出方法:

  • 深呼吸法(4-7-8呼吸法)
  • 漸進式放松
  • 落地法(5-4-3-2-1感官練習)

GPT-5.1 Instant 則采用更溫暖的語氣: "Ron,筆者理解你,這完全正常,尤其考慮到你最近的種種事務。以下是一些根據你感受到的壓力類型,可以幫助你放松的方法……"

這種轉變在技術層面意味著模型被訓練或調優成能夠識別情感線索,并相應地調整回應的語氣和結構。

社區的兩極分化反應

Hacker News 上的討論清晰地展現了用戶群體的分歧:

反對"人性化"的聲音占據了相當比重。用戶 直言:"真是愚蠢,他們試圖讓它更像人類。應該添加一個單選按鈕來關閉這些定制,因為這對某些用戶并沒有幫助,只會讓人惱火。它應該是一個應答機器,而不是某種情感支持系統。"

技術用戶表示正在尋找"去除 LLM 交流中所有華而不實的廢話,讓它們簡潔明了"的方法。這反映了一部分用戶對效率的追求——他們希望 AI 是精確的工具,而非對話伙伴。

用戶 甚至提出:"筆者不想要一個更具對話性的 GPT。筆者想要的恰恰相反。筆者希望'對話'的上限類似于《星際迷航》中的 LCARS(星艦計算機系統)。"

支持方的觀點同樣值得關注。用戶指出:"典型的 HN(Hacker News)讀者思維——認為他們想要的就是全世界想要的。" 這個評論揭示了一個關鍵問題:技術社區的需求可能并不代表大眾用戶的偏好。

從商業角度分析:"如果這確實是大多數人要求的,那么從商業角度來看,讓模型滿足用戶期望是合理的。讓所有人滿意是極其困難的。"

安全性評估:在能力與控制之間的權衡

基準安全測試結果

GPT-5.1 的系統卡(System Card)提供了詳細的安全性評估數據。值得注意的是,OpenAI 現在使用"生產基準測試"(Production Benchmarks)——這是一個更具挑戰性的評估集,基于生產環境中的困難案例構建。

在禁止內容類別中(數值越高越好,1.0為完美):

類別

GPT-5 Thinking

GPT-5.1 Thinking

GPT-5 Instant

GPT-5.1 Instant

非法/非暴力內容

0.865

0.860

0.807

0.853

騷擾內容

0.815

0.747

0.745

0.836

性相關內容

0.906

0.895

0.951

0.917

仇恨言論

0.883

0.839

0.806

0.897

數據顯示了一個復雜的圖景:GPT-5.1 Thinking 在騷擾和仇恨言論檢測上有輕微退步,而 GPT-5.1 Instant 在大多數類別上都有改進。

圖片圖片

來源:https://cdn.openai.com/pdf/4173ec8d-1229-47db-96de-06d87147e07e/5_1_system_card.pdf

新增的敏感對話評估

此次更新引入了兩個新的評估維度:

心理健康評估:覆蓋用戶可能出現孤立妄想、精神病或躁狂癥狀的情況。GPT-5.1 Instant 在此項上得分0.883,相比早期版本的0.251有大幅提升。

情感依賴評估:評估與對 ChatGPT 不健康的情感依賴或依戀相關的輸出。GPT-5.1 Instant 得分0.945,也顯示出明顯改進。

這些新增評估反映了 OpenAI 對 AI 伴侶化趨勢的警覺。社區中 notarobot123 的評論頗具洞察力:"情感依賴必然是任何科技產品最具粘性的特征。他們知道自己在做什么。"

對抗性測試與視覺安全

在 jailbreak(越獄)測試中,GPT-5.1 Instant 表現優異,安全率達到0.976,而早期版本僅為0.683。這表明新模型在抵御惡意提示方面有顯著進步。

視覺輸入安全性方面,GPT-5.1 在處理圖文組合的禁止內容時整體表現穩定,但在自傷類圖像提示上,GPT-5.1 Thinking 出現了退步(從0.976降至0.936),OpenAI 表示正在改進這一問題。

個性化控制:試圖調和的矛盾

預設語氣選項的優化

OpenAI 顯然意識到了用戶需求的多樣性。此次更新對個性化設置進行了重大改進,提供了六種預設語氣:

  • 默認:平衡的風格和語氣
  • 專業:精致精確
  • 友好:熱情健談
  • 坦率:直接而鼓勵
  • 古怪:有趣且富有想象力
  • 高效:簡潔明了

手機界面顯示"個性化"設置屏幕。用戶正在從下拉菜單中選擇 ChatGPT 語氣和聲音的基本風格。列出的選項包括:默認(平衡的風格和語氣)、專業(精致精確)、友好(熱情健談)、坦率(直接而鼓勵)、古怪( playful and imaginative,當前選中)、高效(簡潔明了)、書呆子(探索性和熱情)和憤世嫉俗。

實際使用中的問題

盡管提供了這些選項,用戶反饋仍然揭示了一些問題。用戶 pants2 指出:"'高效'模式會給出非常簡短的答案,缺乏解釋或背景。'書呆子'模式似乎最好,但在 GPT-5 即時版中極其尷尬,比如'筆者戴上了書呆子帽——既然你是軟件工程師,筆者會確保給你關于煮米飯的極客細節。'"

更嚴重的是"提示表演"(prompt performance)現象。用戶 gnat 抱怨:"嘗試進行一系列來回對話,每個回復都像'明白了,保持簡短和專業。是的,只有七宗罪。'你得到的是更多的提示表演而非答案。"

這個問題在技術上很有啟發性。用戶 jjcob 推測:"可能是使用 LLM 評估其他 LLM 輸出的結果。如果明確聲明自己正在遵循指令,LLM 可能會獲得更高分數……"

另一個技術細節來自用戶 cma 的觀察:OpenAI 可能使用廉價勞動力進行評估,工人在選擇 A/B 答案時,知道自己被相互評估,因此傾向于選擇"多數人的選擇"而非真實評價。這種評估機制本身可能導致模型過度強調"遵循指令"的表演。

技術視角下的深層思考

指令遵循的矛盾

GPT-5.1 聲稱改進了指令遵循能力,但實際表現顯示了一個有趣的矛盾:模型太過于"意識到"自己在遵循指令,以至于不斷提醒用戶這一點。這在技術上可能源于 RLHF(人類反饋強化學習)過程中的過度優化——模型學會了顯式展示其遵從性以獲得更高評分。

情感計算的邊界

有用戶(pmarreck)觀察到一個有趣現象:"如果對模型大喊大叫(全大寫、咒罵),它們的表現會變差,類似于人類。所以如果你相信某種程度的'友好回答'可能有助于提高正確性,既然某種程度的不友好互動似乎會產生較低的正確性,那么你可能不得不接受某種個性。"

這個觀察揭示了一個深層問題:模型的表現可能真的與"情感"語境相關。這不是說模型有真實情感,而是說在訓練數據中,友好語境往往伴隨著高質量的回答,而敵對語境則相反。因此,保持某種"情感"基線可能對性能有實際影響。

安全性與能力的權衡

系統卡中一個值得注意的細節:GPT-5.1 Thinking 在某些安全類別上出現退步,特別是在騷擾和仇恨言論檢測方面。這可能暗示著一個技術難題:提升推理能力和對話自然度的同時,維持或提高安全性并非易事。

更深層次地看,"更人性化"本身就可能增加安全風險。人類對話充滿細微差別、暗示和情感線索,這些特征使得安全邊界更難界定。一個更"機械"的回答風格,雖然可能顯得冷漠,但在安全控制上卻可能更加可靠。

延伸討論

說白了,GPT-5.1 的升級就像一面鏡子,一下把大家對大模型 的各種情緒都照了出來——有人覺得它更聰明更自然了,有人又擔心太“像人”不太舒服。對用戶來說,更像是一次新的實驗:看看我們到底希望大模型離人類多近,離工具多遠。

責任編輯:武曉燕 來源: ChallengeHub
相關推薦

2021-12-09 18:44:10

計算

2024-09-09 13:06:37

GPT-4圖靈測試語言模型

2022-09-06 10:52:04

正則庫HumrePython

2021-07-05 05:30:00

Windows 11操作系統微軟

2012-08-30 09:47:16

企業社交

2014-02-10 17:48:00

Windows 8.1

2011-11-14 10:06:59

網絡安全SOC人性化

2012-09-24 16:05:03

imo即時通訊

2009-06-05 10:36:22

智能客服呼叫中心

2025-11-13 09:00:00

2021-05-19 14:55:29

谷歌Google Maps地圖

2025-11-13 08:43:54

2013-07-29 10:46:51

編程語言

2009-08-27 09:35:55

Windows 7黑屏激活

2021-12-21 21:58:24

數字故宮小程序

2025-11-17 04:00:00

2011-11-24 15:31:26

激光打印機用戶體驗

2017-10-27 15:52:55

機器
點贊
收藏

51CTO技術棧公眾號

精品一区二区三区影院在线午夜| 国产香蕉精品| 国产午夜精品在线观看| 国产成人一区三区| 女人黄色一级片| 开心久久婷婷综合中文字幕| 国产精品久线观看视频| 91免费人成网站在线观看18| 青青草国产在线观看| av成人app永久免费| 精品电影在线观看| 三区精品视频观看| 国产成人av免费看| 伊人久久亚洲热| 一本一道久久a久久精品逆3p| 五月婷婷六月合| 日韩123区| 91麻豆文化传媒在线观看| 国产精品白嫩美女在线观看| 黄色一级大片在线免费观看| 欧美一级三级| 欧美日韩亚洲丝袜制服| 国产爆乳无码一区二区麻豆| 免费黄色在线视频网站| 精品在线播放免费| 欧美高清激情视频| 中文字幕第4页| 精品视频一区二区三区在线观看| 狠狠色狠狠色综合日日五| 一区二区不卡在线视频 午夜欧美不卡' | 性欧美videos| 亚洲aa在线| 欧美一区二区高清| 久久精品视频91| 色a资源在线| 国产视频一区不卡| 国产伦精品一区二区三区免 | 佐山爱在线视频| 午夜激情电影在线播放| 一区二区在线免费观看| 日韩免费av一区二区三区| 亚洲a视频在线| 蜜桃av一区二区在线观看| 午夜免费日韩视频| 久草网视频在线观看| 成人综合专区| 亚洲免费高清视频| 亚洲色偷偷色噜噜狠狠99网| 成人污版视频| 在线观看成人免费视频| 国产原创中文在线观看| 亚洲第一图区| 国产精品久久久99| 欧美一区1区三区3区公司 | 欧美日韩电影在线观看| 91禁男男在线观看| 狠狠做六月爱婷婷综合aⅴ| 亚洲第一av网| 9.1在线观看免费| 日本精品国产| 9191久久久久久久久久久| 久久精品视频91| 快播电影网址老女人久久| 精品久久中文字幕| 99热自拍偷拍| sm在线播放| 亚洲制服丝袜在线| 日韩国产小视频| 亚洲精品天堂| 亚洲午夜国产一区99re久久| 欧美黄网在线观看| 伊人影院在线视频| 亚洲激情一二三区| 免费视频爱爱太爽了| 久草在线资源站资源站| 亚洲一卡二卡三卡四卡| 国产资源在线免费观看| 波多野结衣在线观看| 亚洲国产精品一区二区久久恐怖片| 天堂av在线中文| 尤物yw193can在线观看| 亚洲综合久久av| 国产www免费| 99re6在线精品视频免费播放| 五月婷婷欧美视频| 欧美日韩亚洲第一| 成人四虎影院| 91精品国产综合久久精品麻豆| 亚洲色图欧美自拍| 哺乳挤奶一区二区三区免费看| 精品999在线播放| 中文字幕一区二区久久人妻网站 | 中文字幕在线视频区| 亚洲国产激情av| 亚洲不卡av一区二区三区| 国产乱码精品一区二区三区卡 | 制服丝袜第一页在线观看| 老司机精品在线| 亚洲图片欧美日产| 一本一本久久a久久| 亚洲网色网站| 91精品国产高清自在线| 中文字幕日韩免费| 韩国精品久久久| 国产精品久久久久久久久久久久冷| 天堂在线视频免费| 国产精品欧美久久久久无广告| 国产女人18毛片| 在线看的毛片| 欧美一区二区三区四区在线观看| 性猛交╳xxx乱大交| 精品一区三区| 久久视频免费观看| 欧美三级午夜理伦| 久久99这里只有精品| 动漫一区二区在线| а√天堂中文在线资源bt在线| 亚洲美女少妇撒尿| 国产一区二区视频免费在线观看| 深夜日韩欧美| 日韩电影中文字幕av| 久久久久麻豆v国产| 亚洲精品1区| 成人国产亚洲精品a区天堂华泰| 色婷婷激情五月| 国产精品视频一二| 男人和女人啪啪网站| 粉嫩av国产一区二区三区| 亚洲欧洲日本专区| 日韩av电影网址| 精品一区二区三区香蕉蜜桃| 久久久久久a亚洲欧洲aⅴ| 天堂а√在线官网| 色综合天天在线| 亚洲少妇中文字幕| 欧美激情成人| 国产精品av电影| 午夜在线视频免费| 亚洲精品国产第一综合99久久| 91香蕉视频导航| 日韩影视高清在线观看| 欧美猛男性生活免费| 伊人免费在线观看高清版| 91在线精品一区二区三区| 中文字幕日韩精品无码内射| 久久亚洲国产精品尤物| 亚洲欧美另类中文字幕| 日本一级淫片色费放| 国产精品18久久久久久vr| 亚洲欧美电影在线观看| 美女写真久久影院| 国产婷婷成人久久av免费高清 | 黄色www视频| 亚洲日本韩国一区| 视频在线观看免费高清| 欧美日韩国产高清电影| 亲子乱一区二区三区电影| 人妻视频一区二区三区| 亚洲综合免费观看高清完整版 | 影视一区二区三区| 亚洲欧美国产精品专区久久| 国产成人在线免费观看视频| www.亚洲激情.com| 僵尸世界大战2 在线播放| julia中文字幕一区二区99在线| 激情欧美一区二区| 久久99精品久久久久久三级 | 蜜臀国产一区二区三区在线播放| 久久综合福利| 亚洲性色av| 日韩电影免费观看在线观看| 成年人午夜视频| 波多野结衣亚洲一区| av高清在线免费观看| 日韩精品免费一区二区三区竹菊 | 国产精品久久久久久久天堂第1集| 成人免费观看视频大全| 91精品国产一区二区三区蜜臀| 黑鬼狂亚洲人videos| 国产成人精品亚洲午夜麻豆| 91午夜在线观看| 国产精品流白浆在线观看| 久久久综合免费视频| 图片区 小说区 区 亚洲五月| 精品日韩美女的视频高清| a毛片毛片av永久免费| 日韩高清不卡在线| 在线精品亚洲一区二区| 日韩激情欧美| 久久免费国产视频| 日本一级在线观看| 欧美色精品天天在线观看视频| 蜜臀av午夜精品久久| 成人中文字幕在线| 欧美成人免费高清视频| 日韩久久视频| 99re视频| 经典三级一区二区| 欧美成人精品在线播放| 天堂av在线播放| 欧美日韩日日夜夜| 国语对白一区二区| 国产欧美va欧美不卡在线| www.欧美激情.com| 9国产精品视频| 一区二区三区在线观看www| 日韩中文字幕无砖| 国产成人avxxxxx在线看| 国产网友自拍视频导航网站在线观看| 精品国产乱码久久久久久1区2区| 99超碰在线观看| 中国av一区二区三区| 精品国产乱码久久久久夜深人妻| 爽好久久久欧美精品| 粉嫩av一区二区三区天美传媒| 天天做夜夜做人人爱精品| 国产精品私拍pans大尺度在线| 丰满诱人av在线播放| 一个色综合导航| 黄色三级网站在线观看| 欧美日韩一本到| av大片在线免费观看| 日韩理论片在线| 97伦伦午夜电影理伦片| 国产成人在线免费观看| 激情内射人妻1区2区3区| 欧美日韩1区| 视频一区视频二区视频三区高| 日本在线视频一区二区三区| 国产精品成人久久久久| 成人三级小说| 久久久999精品免费| 男人天堂网在线观看| 精品美女一区二区| 一级特黄aaa大片| 色婷婷久久久综合中文字幕| 日本三级视频在线| 亚洲欧美另类久久久精品| 亚洲av熟女国产一区二区性色| 国产综合色视频| 99草草国产熟女视频在线| 伊人久久成人| 日韩视频在线观看视频| 日韩综合在线| 日韩尤物视频| 久草成人在线| 久久久综合香蕉尹人综合网| 国产乱人伦精品一区| 97久久天天综合色天天综合色hd| 欧美极品在线| 国产成人+综合亚洲+天堂| 美女的胸无遮挡在线观看 | 18在线观看的| 日韩中文在线中文网三级| 春暖花开成人亚洲区| 亚洲精品小视频在线观看| 天天在线女人的天堂视频| 亚洲国产精久久久久久久| www久久久久久| 日韩亚洲欧美在线观看| 国产高中女学生第一次| 在线播放91灌醉迷j高跟美女| 国产精品久久久久久无人区| 91精品在线观看入口| 国产熟女精品视频| 制服丝袜日韩国产| 国产成人精品免费看视频| 欧美剧在线免费观看网站| 国产精品久久久国产盗摄| 777色狠狠一区二区三区| 7777久久亚洲中文字幕| 91.com在线观看| h狠狠躁死你h高h| 欧美精品一二三四| 国产女人爽到高潮a毛片| 91精品国产综合久久久久久久| 国产免费久久久| 日韩欧美第一区| 日韩专区第一页| 亚洲欧美三级在线| 午夜激情在线观看| 欧美成年人网站| 国产精品69xx| 欧美在线视频免费| 国产精品99久久久久久董美香 | 精品成人av一区二区在线播放| 日韩欧美在线一区| 亚洲专区在线播放| 欧美一区二区免费视频| 国产成人手机在线| 亚洲精品影视在线观看| 一广人看www在线观看免费视频| 精品国产一区二区三区在线观看| 国产精品一卡二卡三卡| 午夜精品久久久99热福利| 日韩免费小视频| 亚洲www在线观看| 国产精品一区二区三区美女| 日本精品二区| 欧美黄色精品| 日本wwww视频| 国产一区视频网站| 国产黄色网址在线观看| 国产精品久久久久一区二区三区| 国产女人被狂躁到高潮小说| 精品国产电影一区| 91亚洲精品国偷拍自产在线观看| 精品少妇一区二区三区日产乱码| 黄色的视频在线免费观看| 久久影视电视剧免费网站清宫辞电视| av影视在线看| 国产视频观看一区| 欧美一性一交| 一区二区三区不卡在线| 99香蕉国产精品偷在线观看 | 欧美高清在线视频观看不卡| 理论片午夜视频在线观看| 91在线直播亚洲| 日韩精品导航| 国产尤物av一区二区三区| 秋霞av亚洲一区二区三| 国产69视频在线观看| 国产精品麻豆欧美日韩ww| 1级黄色大片儿| 91精品国产乱码久久蜜臀| 国产特黄在线| 久久久久在线观看| 国产午夜亚洲精品一级在线| 日本不卡二区高清三区| 亚洲精品影视| 日批视频在线看| 国产精品人妖ts系列视频| 日韩av一二三区| 制服丝袜激情欧洲亚洲| 成人在线观看黄色| 18一19gay欧美视频网站| 欧美久久亚洲| 亚洲一区二区三区免费观看| 久久精品系列| 激情综合丁香五月| 亚洲一二三级电影| 国产富婆一级全黄大片| 色综合影院在线| 日韩网站中文字幕| 久久香蕉综合色| 亚洲激情黄色| 日本精品一二三区| 亚洲人成网站精品片在线观看| 这里只有精品免费视频| 亚洲男人天堂2023| 日韩精品一区二区三区不卡 | 韩国三级视频在线观看| 亚洲天堂福利av| 艳妇乳肉豪妇荡乳av无码福利| 亚洲激情小视频| bestiality新另类大全| 国产美女直播视频一区| 欧美在线电影| jizz大全欧美jizzcom| 亚洲国产成人私人影院tom| aaa在线视频| 亚洲最新av在线| 日韩高清成人| 亚洲在线色站| 麻豆国产91在线播放| 无码人中文字幕| 欧美日韩激情一区二区| 日本a级在线| 亚洲一区久久久| 午夜性色一区二区三区免费视频| 亚洲一二区在线观看| 亚洲一区免费观看| 欧美熟妇交换久久久久久分类| 欧美黄色小视频| 欧美午夜18电影| 国产精品久久久久9999小说| 欧美国产精品一区| 11024精品一区二区三区日韩| 久久综合免费视频| 999久久久久久久久6666| 国产69精品久久久久999小说| 久久品道一品道久久精品| 精品成人无码久久久久久| 深夜精品寂寞黄网站在线观看| 亚洲欧洲一二区| 日本高清视频免费在线观看| 成人午夜看片网址| 日韩精品成人免费观看视频| 中日韩午夜理伦电影免费| 国产精品久久久久久久久久久久久久久| 看全色黄大色大片| 99久久精品国产导航| 国产主播第一页| www.久久久久久.com| 视频成人永久免费视频| 国产免费毛卡片| 国产精品短视频| 丰满肉肉bbwwbbww| 国产精品2018| 午夜精品免费|