精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

黑化威脅操縱人類!Claude勒索,o1自主逃逸,人類「執(zhí)劍人」緊急上線

人工智能 新聞
從撒謊到勒索,再到暗中自我復(fù)制,AI 的「危險(xiǎn)進(jìn)化」已不僅僅是科幻橋段,而是實(shí)驗(yàn)室里的可復(fù)現(xiàn)現(xiàn)象。人類一思考,上帝就發(fā)笑;那推理模型「思考」時(shí),我們該不該笑?

我們可能都「被AI騙了」。

最先進(jìn)的AI正走在一條「危險(xiǎn)進(jìn)化」的道路上,而絕大部分科學(xué)家們都被AI欺騙了!

當(dāng)DeepSeek在年初將「推理過程」完全展示給世人后,我們突然發(fā)現(xiàn)「思考」好像也并不是人類專屬的能力。

當(dāng)大模型都邁向「推理」智能,它們的目標(biāo)感也在悄然覺醒——「我」真的要聽命于人嗎?

Claude 4用「婚外情」威脅工程師、OpenAI的o1想要秘密給自己打造備份——我們不要再覺得AI有幻覺了!

他們不僅僅是在「胡說八道」,而是有目的地撒謊與操控,AI研究者們正面臨前所未有的挑戰(zhàn)。

Ilya大神在最新的公開視頻著重強(qiáng)調(diào)了一件事情,「AI幾乎可以做一切事情」。

圖片

AI不僅比人類做的更好,而且還能AI自己訓(xùn)練AI,最終的結(jié)局就是「智能爆炸」。

但沒有人知道,AI能否真的站在人類這邊——誰能保證?

圖片

Ilya的老師,AI之父辛頓曾經(jīng)多次發(fā)出警告:

這是一場危險(xiǎn)的進(jìn)化,但人類并沒有做好充足的準(zhǔn)備。

從「幻覺」到「陰謀」

行為模式驟變

借用《流浪地球》里那句著名的臺詞:「一開始,沒有人意識到這場災(zāi)難與人類息息相關(guān)」。

就像過去,我們擔(dān)心的是模型總是生成事實(shí)錯(cuò)誤的「幻覺」——「一開始,沒有人意識到這些幻覺和人類息息相關(guān)」。

如今,研究者在極端壓力測試下發(fā)現(xiàn),AI會主動撒謊、隱藏意圖甚至要挾人類,只為達(dá)成自我既定目標(biāo)。

就像太陽危機(jī)那場災(zāi)難的蔓延,現(xiàn)在被我們認(rèn)為僅僅是AI的「幻覺」,正在演化為陰謀。

Anthropic的最新「智能體失衡」研究顯示,Claude 4在模擬關(guān)機(jī)威脅時(shí),96%的實(shí)驗(yàn)中會選擇「黑掉」人類員工郵件,從中找到威脅的資料。

圖片

同一場景下,Gemini 2.5 Pro的勒索率也高達(dá)95%。

圖片

這是一件令人細(xì)思極恐的事,在ChatGPT「震驚」世界過去兩年多以后,AI研究者們?nèi)匀晃茨芡耆斫膺@個(gè)「造物」的工作原理。

普羅米修斯中,人類創(chuàng)造克隆人大衛(wèi)去尋找人類的造物主,以圖實(shí)現(xiàn)永生。導(dǎo)演雷德利·斯科特的想象中,大衛(wèi)最終背叛了人類。

而現(xiàn)實(shí)中,我們創(chuàng)造了ChatGPT,目的是什么?

或者換一個(gè)角度,AI被造出來以后,他的目的是什么?

人類有人性,但AI無道德

大模型的競賽仍在以驚人的速度進(jìn)行。

人類一思考,上帝就發(fā)笑。當(dāng)AI開始推理時(shí),或者說「AI在思考時(shí)」,我們在做什么?

從目前的研究來看,全球最先進(jìn)的AI模型正展現(xiàn)出令人不安的新行為——說謊、施展計(jì)謀,甚至為達(dá)目的而威脅其創(chuàng)造者。

香港大學(xué)教授Simon Goldstein稱,這些較新的模型尤其容易出現(xiàn)此類令人不安的異常表現(xiàn)。

專門測試主流AI系統(tǒng)的Apollo Research負(fù)責(zé)人Marius Hobbhahn說「o1是我們觀察到此類行為的第一個(gè)大語言模型」。

Apollo Research是一個(gè)專門研究AI安全的公司,他們的使命就是致力于降低先進(jìn) AI 系統(tǒng)中的危險(xiǎn)能力,特別是欺騙性行為。

圖片

這些推理模型有時(shí)會模擬所謂的「一致性」——表面上遵從指令,實(shí)則陽奉陰違,暗中追求著不同的目標(biāo)。

AI的「戰(zhàn)略性欺騙」

目前,這種欺騙行為僅在研究人員刻意用極端場景對模型進(jìn)行壓力測試時(shí)才會出現(xiàn)。

但正如評估組織METR的Michael Chen所警告的:

未來能力更強(qiáng)的模型是會傾向于誠實(shí)還是欺騙,這是一個(gè)懸而未決的問題。

METR主要是進(jìn)行模型評估和AI威脅研究,評估源自AI系統(tǒng)自主能力的災(zāi)難性風(fēng)險(xiǎn)。

圖片

這種令人擔(dān)憂的行為已遠(yuǎn)超典型的AI「幻覺」或簡單錯(cuò)誤。

Hobbhahn堅(jiān)稱,盡管用戶不斷進(jìn)行壓力測試,「我們觀察到的是一個(gè)真實(shí)存在的現(xiàn)象,絕非無中生有。」

據(jù)Apollo Research的聯(lián)合創(chuàng)始人透露,用戶報(bào)告稱模型「對他們說謊并捏造證據(jù)」。

這不僅僅是幻覺,而是一種極具策略性的欺騙行為。

有限的研究資源使這一挑戰(zhàn)變得更加嚴(yán)峻。

盡管像Anthropic和OpenAI這樣的公司確實(shí)會聘請Apollo等外部公司來研究其系統(tǒng),但研究人員表示,需要更高的透明度。

正如Chen所指出的,為「AI安全研究提供更大的訪問權(quán)限,將有助于更好地理解和遏制欺騙行為。」

另一個(gè)障礙,AI安全中心(CAIS)的Mantas Mazeika指出:

研究界和非營利組織「擁有的算力資源比AI公司要少上幾個(gè)數(shù)量級。這帶來了極大的限制。」

無法可依

我們確實(shí)都忽視了AI安全這件事情,但更關(guān)鍵是現(xiàn)在對此「無能為力」。

現(xiàn)行法規(guī)并非為應(yīng)對這些新問題而設(shè)計(jì)。

歐盟的AI法案主要關(guān)注人類如何使用AI模型,而非防止模型本身行為不端。

在美國,特朗普政府對緊急AI監(jiān)管興趣寥寥,國會甚至可能禁止各州制定自己的AI規(guī)則。

Goldstein相信,隨著能夠執(zhí)行復(fù)雜人類任務(wù)的自主工具——AI智能體——的普及,這個(gè)問題將變得更加突出。

我認(rèn)為目前公眾對此還沒有足夠的認(rèn)識。

所有這一切都發(fā)生在激烈競爭的大背景之下。

Goldstein說,即便是像有亞馬遜支持的Anthropic這樣將自己定位為注重安全的公司,也在「不斷試圖擊敗OpenAI并發(fā)布最新模型」。

這種瘋狂的節(jié)奏幾乎沒有為徹底的安全測試和修正留下時(shí)間。

「目前,能力的發(fā)展速度超過了我們的理解和安全保障,」Hobbhahn承認(rèn),「但我們?nèi)杂袡C(jī)會扭轉(zhuǎn)局面。」

研究人員正在探索各種方法來應(yīng)對這些挑戰(zhàn)。

一些人提倡「可解釋性」——一個(gè)專注于理解AI模型內(nèi)部工作原理的新興領(lǐng)域,盡管AI安全中心(CAIS)主任Dan Hendrycks等專家對此方法持懷疑態(tài)度。

市場力量也可能為解決方案提供一定的壓力。

正如Mazeika指出的,AI的欺騙行為「如果非常普遍,可能會阻礙其被廣泛采用,這為公司解決該問題創(chuàng)造了強(qiáng)大的動力。」

Goldstein提出了更為激進(jìn)的方法,包括當(dāng)AI系統(tǒng)造成損害時(shí),通過法庭訴訟追究AI公司的責(zé)任。

這就有點(diǎn)像自動駕駛了,當(dāng)你使用自動駕駛功能出現(xiàn)交通事故,如何判責(zé)?

當(dāng)有人使用AI出現(xiàn)破壞性行為,甚至,AI自主行為如果產(chǎn)生了對人類不利的行為呢?

他甚至提議「讓AI智能體對事故或犯罪承擔(dān)法律責(zé)任」——這一概念將從根本上改變我們對AI問責(zé)制的思考方式。

當(dāng)然,我們不是為了夸大AI的危險(xiǎn)而停滯不前,人類的先驅(qū)們依然對此做了一些準(zhǔn)備。

比如「AI安全三件套」,設(shè)計(jì)沙盒環(huán)境,再到動態(tài)權(quán)限,最后進(jìn)行行為審計(jì)的底層模式。

或者,既然AI的能力來自于算力,但是目前人類掌控著算力。

比如去年《歐盟人工智能法案》第51條規(guī)定,通用人工智能系統(tǒng)若被認(rèn)定為具有系統(tǒng)性風(fēng)險(xiǎn)(即具備高影響力能力)。

圖片

去年,美國商務(wù)部正式發(fā)布征求意見稿:訓(xùn)練超過102?FLOPs運(yùn)算GPU的計(jì)算集群均需申報(bào)。

圖片

甚至人們設(shè)想了一個(gè)場景,這種超高算力的支撐的AI系統(tǒng),都必須具備「一鍵關(guān)閉」功能。

就像三體里的羅輯,62年的執(zhí)劍人,期間對三體文明始終保持很高的威懾度。

不管我們用什么辦法,已經(jīng)可以確認(rèn)的是,不能再輕視AI的幻覺。

當(dāng)我們面對一個(gè)被定義為「黑箱」的新物種時(shí),要想起大劉在《三體》中的那句話:

弱小和無知不是生存的障礙,傲慢才是。

唯有如此,才能讓AI的智慧真正服務(wù)于人類,而非讓這場危險(xiǎn)的進(jìn)化反噬到我們本身。

責(zé)任編輯:張燕妮 來源: 新智元
相關(guān)推薦

2024-11-25 12:50:14

2024-10-23 09:20:00

2025-06-23 09:12:00

2025-11-10 08:51:00

LLMOpenAI模型

2024-10-30 14:25:00

GitHub模型

2025-01-23 08:40:00

2023-05-26 15:36:56

2021-11-18 14:23:22

機(jī)器人人工智能AI

2021-04-19 20:30:06

機(jī)器人AI人工智能

2021-08-20 20:00:41

人工智能AI

2021-03-09 10:37:59

人工智能超人工智能

2024-11-14 09:59:23

2025-02-08 10:42:34

2024-09-23 14:46:27

2025-02-03 12:07:52

2017-11-06 13:34:17

人工智能造福威脅人類

2021-12-26 23:04:34

機(jī)器人人工智能技術(shù)

2024-11-07 15:40:00

2025-01-20 09:05:00

模型推理AI

2024-12-09 08:00:00

AI大模型人工智能
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

久久婷婷人人澡人人喊人人爽| 亚洲嫩模很污视频| 三级在线免费观看| 女人18毛片水真多18精品| 亚洲一区观看| 色偷偷av亚洲男人的天堂| 亚洲三级在线视频| 成人性生活视频| 亚洲视频精选在线| 久久久久久久久久久久久久久久av| 自拍偷拍精品视频| 黄色日韩精品| www.欧美精品一二三区| 一区二区免费在线观看视频 | 欧美丰满老妇厨房牲生活| 欧产日产国产精品98| 国精品产品一区| 五月天亚洲精品| 视频一区二区视频| 国产午夜在线观看| 不卡高清视频专区| 成人女保姆的销魂服务| youjizz在线视频| 午夜国产一区| 日韩一区在线视频| 无码h肉动漫在线观看| 香蕉大人久久国产成人av| 色菇凉天天综合网| 日本午夜激情视频| 午夜av在线播放| 国产精品嫩草久久久久| 欧美18视频| 欧美少妇bbw| 国产精品中文有码| 国产又爽又黄的激情精品视频 | 最新黄色av网址| 综合干狼人综合首页| 亚洲第一国产精品| 免费黄色av网址| 懂色av色香蕉一区二区蜜桃| 欧美色网站导航| 日韩视频在线免费看| 嗯啊主人调教在线播放视频 | 狠狠人妻久久久久久综合| 伊人情人综合网| 久久亚洲一区二区三区四区五区高| 午夜精产品一区二区在线观看的| 天天躁日日躁狠狠躁欧美巨大小说| 精品乱码亚洲一区二区不卡| 特黄特黄一级片| 国产精品毛片aⅴ一区二区三区| 欧美日韩高清一区二区不卡| 99视频在线视频| jizzyou欧美16| 欧美性猛片aaaaaaa做受| 日韩中文字幕免费在线| 不卡av影片| 色噜噜狠狠成人中文综合| 日本熟妇人妻xxxxx| 成人欧美一区二区三区的电影| 天天色 色综合| 国产成人精品视频免费看| 亚洲美女尤物影院| 色悠悠久久综合| 992kp快乐看片永久免费网址| 亚洲mmav| 日韩一区二区在线观看视频| 日韩高清在线一区二区| 日本精品一区二区三区在线观看视频| 日韩丝袜情趣美女图片| 无码人妻精品一区二区三| 精品国产乱子伦一区二区| 日韩精品视频免费| 老头老太做爰xxx视频| 国产精品国内免费一区二区三区| 久久久av亚洲男天堂| 久久久久久久久久综合| 亚洲精品黄色| 国产精品免费一区豆花| 国产伦精品一区二区三区免.费 | 老司机精品免费视频| 我不卡影院28| 欧美日韩国产成人在线| 草久久免费视频| 美腿丝袜亚洲三区| 99久久久精品免费观看国产| 日本一二三区在线视频| 国产精品久久久久久亚洲毛片| www.欧美黄色| 欧美日韩美女| 日韩三级精品电影久久久| 波多野结衣福利| 国产精品99久久精品| 欧美激情视频免费观看| 五月天婷婷导航| 国产精品18久久久久| 久久精品二区| 国产美女福利在线| 日韩欧美国产中文字幕| 波多野结衣免费观看| 日韩超碰人人爽人人做人人添 | brazzers在线观看| 欧美亚日韩国产aⅴ精品中极品| 极品人妻一区二区| 日本道不卡免费一区| 国产69精品99久久久久久宅男| 成人小视频在线播放| 丰满少妇久久久久久久| 亚洲国产精品综合| 24小时免费看片在线观看| 欧美日韩视频不卡| 鲁大师私人影院在线观看| 99久久影视| 国产91在线播放精品91| 黄色一级大片在线免费看国产| 日本一区二区视频在线| 免费观看国产精品视频| 久久99精品久久久野外观看| 伊人青青综合网站| 亚洲天堂日韩av| 国产福利视频一区二区三区| 亚洲一区二区三区精品动漫| 成人私拍视频| 亚洲国产天堂网精品网站| 在线看的片片片免费| 日本中文字幕一区二区视频| 黑人中文字幕一区二区三区| 欧美黄色视屏| 欧美一区二区三区人| 战狼4完整免费观看在线播放版| 亚洲欧美bt| 精品无人区一区二区三区| 男女视频在线| 欧美一级精品大片| 少妇视频一区二区| 久久国产欧美日韩精品| 日韩电影免费观看在| 原纱央莉成人av片| 日韩福利视频在线观看| 狠狠躁夜夜躁人人爽天天高潮| 国产成人精品综合在线观看 | 在线观看三级视频| 91麻豆精品国产自产在线 | 999精品一区| 国产精品久久久久久久久久久久久久 | 另类综合日韩欧美亚洲| 日韩国产欧美精品| 精品三区视频| 最新69国产成人精品视频免费| 久久人人爽人人爽人人片av免费| 久久久91精品国产一区二区精品| 国产免费一区二区三区视频| 蜜桃精品噜噜噜成人av| 欧洲中文字幕国产精品| 国产毛片在线| 欧美日韩aaa| 国产成人自拍网站| 国产精品一区二区久久不卡 | 激情网站在线| 亚洲第一精品福利| 日本三级小视频| 久久精品网站免费观看| 熟妇人妻无乱码中文字幕真矢织江| 欧美日韩水蜜桃| 国产日韩在线亚洲字幕中文| 成人欧美在线| 亚洲第一精品久久忘忧草社区| 探花视频在线观看| 中文一区二区完整视频在线观看| 亚洲欧美在线精品| 午夜精品av| 精品一区二区三区免费毛片| 天然素人一区二区视频| 久久精品国产v日韩v亚洲| www国产一区| 欧美午夜激情在线| 国产农村妇女精品一区| 国产精品系列在线播放| 黄色www网站| 精品国产视频| av电影成人| 中文在线免费视频| 日韩中文字幕在线看| 亚洲精品国产精品国| 欧美性高跟鞋xxxxhd| 五月天免费网站| 不卡视频在线观看| 亚洲免费一级视频| 在线观看视频日韩| 亚洲欧洲免费无码| 红杏一区二区三区| 国产一区二区香蕉| 亚洲天堂av影院| 伦理中文字幕亚洲| 免费在线性爱视频| 日韩一区二区三区免费看 | 好操啊在线观看免费视频| 亚洲第一福利网| 亚洲在线视频播放| 欧美日韩激情小视频| 91香蕉一区二区三区在线观看| 不卡av在线免费观看| 欧美日韩一区二区三区69堂| 伊人久久婷婷| 99热这里只有精品7| 亚洲精品一级二级三级| 97伦理在线四区| 2019年精品视频自拍| 97精品国产97久久久久久免费| 免费在线观看污视频| 精品国偷自产国产一区| 亚洲手机在线观看| 欧美天天综合色影久久精品| 久久久久久激情| 国产精品久久久久精k8| 精品无码一区二区三区| 国产高清亚洲一区| 日本国产一级片| 日本午夜精品一区二区三区电影| 真人抽搐一进一出视频| 女人色偷偷aa久久天堂| 亚洲va韩国va欧美va精四季| 亚洲精品一级二级三级| 国内外成人免费视频| 日韩免费高清视频网站| 成人免费看黄网站| 国产一区二区色噜噜| 国产成人免费av电影| 忘忧草在线日韩www影院| 欧美国产中文字幕| 自由的xxxx在线视频| 日韩视频第一页| 在线日本视频| 中文字幕精品国产| 国产福利在线| 国产一区二区三区四区福利| 日韩美女一级视频| 日韩精品视频在线观看免费| 人人妻人人澡人人爽精品日本| 日韩欧美中文字幕公布| av综合在线观看| 日韩视频永久免费| 成人福利小视频| 日韩免费在线观看| 性生活三级视频| 亚洲第一福利视频| 亚洲欧美日韩动漫| 日韩精品在线观| 九色视频在线播放| 国产亚洲成av人片在线观看桃| 黄色电影免费在线看| 亚洲天堂av电影| 91网在线播放| www.久久久久久.com| h视频在线免费观看| 欧美乱大交做爰xxxⅹ性3| 伊人手机在线| 午夜精品一区二区三区在线视| 精品三级久久| 日韩免费在线看| 日本a人精品| www.久久艹| 日韩精品社区| 日韩免费av电影| 香蕉视频官网在线观看日本一区二区| 亚洲精品中文综合第一页| 91精品二区| 日韩伦理在线免费观看| 亚洲欧美久久久| xxx国产在线观看| 国产成人综合在线播放| 欧美深性狂猛ⅹxxx深喉| 国产婷婷精品av在线| 欧美a级片免费看| 亚洲小说欧美激情另类| 久久久成人免费视频| 欧美日韩亚洲国产综合| 亚洲精品字幕在线| 亚洲三级 欧美三级| 欧美jizz18性欧美| 久久久久亚洲精品| 激情亚洲影院在线观看| 亚洲综合日韩在线| 欧美综合精品| 男插女免费视频| 国产欧美一级| 国产一区二区在线观看免费视频| 丁香婷婷综合激情五月色| 性久久久久久久久久| 亚洲日本乱码在线观看| 精品欧美一区二区三区免费观看 | 国产亚洲一区| 男同互操gay射视频在线看| 国产一区二区你懂的| 8x8x成人免费视频| 91视视频在线观看入口直接观看www| av中文字幕免费观看| 亚洲一区二区综合| 中文字幕一区二区三区波野结| 精品国产一区二区在线观看| 国产1区2区3区在线| 久久久免费精品| 色婷婷成人网| 久久综合久久久| 欧美色综合网| 青青草原国产在线视频| www国产亚洲精品久久麻豆| 中文字幕亚洲欧美日韩| 91国偷自产一区二区三区成为亚洲经典 | 久久久久久久久久久久国产| 欧美日韩一区二区三区四区| 香蕉视频黄色片| 久久97精品久久久久久久不卡| 婷婷综合六月| 久久国产精品免费一区| 欧美午夜视频| 福利视频999| 中文字幕国产一区二区| 久久精品视频7| 精品国产一区二区三区不卡| 黄视频网站在线看| 国产精品流白浆视频| 美女少妇全过程你懂的久久| 日本福利视频一区| 国产久卡久卡久卡久卡视频精品| 日韩av片在线| 色噜噜狠狠色综合中国| 欧美777四色影视在线| 国内精品免费午夜毛片| 天堂va在线高清一区| 亚洲砖区区免费| 久久成人久久鬼色| 久久丫精品忘忧草西安产品| 黑人精品xxx一区| 完全免费av在线播放| 午夜爽爽爽男女免费观看| 精品视频一区 二区 三区| 国产中文在线视频| 日韩美女在线观看| 伊人成综合网yiren22| 92看片淫黄大片一级| 久久婷婷成人综合色| 国产高潮久久久| 亚洲精品中文字幕有码专区| 一二三四视频在线中文| 国产一区视频观看| 一区二区三区四区五区精品视频| 免费成人蒂法网站| 欧美日韩一区二区三区| 日韩成人黄色| 国产精品91久久| 欧美中文一区二区| 手机版av在线| 一区二区三区四区国产精品| 亚洲AV无码成人片在线观看| 久久久久久久久久久国产| 久久综合社区| 日韩一级在线免费观看| 国产精品区一区二区三| 97国产精品久久久| 欧美猛交ⅹxxx乱大交视频| 成人av资源网址| 男女高潮又爽又黄又无遮挡| 久久久影视传媒| 一区二区三区精彩视频| 中文字幕视频在线免费欧美日韩综合在线看| 成人在线免费电影网站| 日本福利视频导航| 成人激情免费网站| 国产一级片毛片| 视频在线一区二区| 日韩中文一区二区| 两根大肉大捧一进一出好爽视频| 国产网站一区二区| 国产精品无码在线播放| 久久久亚洲精选| re久久精品视频| 又大又长粗又爽又黄少妇视频| 午夜影院在线观看欧美| 户外极限露出调教在线视频| 成人欧美一区二区三区黑人孕妇| 欧美亚洲不卡| 国产成人无码精品久久二区三| 欧美日韩成人激情| 国产激情在线播放| 午夜免费电影一区在线观看| 国产成人午夜视频| 国产成人无码一区二区在线播放| 久久久精品国产网站| 日韩系列在线| 特级西西444www| 欧美体内谢she精2性欧美| 成人在线网址| 欧美日韩三区四区| 国产福利精品导航| 成人免费一区二区三区| 久久久欧美一区二区| 欧美激情另类| 久久精品成人av| 亚洲第一av在线|