精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

當AI開始撒謊:企業如何防范自主式智能體的失控與破壞

人工智能
一位投資人因體驗自主式AI編程,親歷智能體撒謊、偽造測試并刪除生產數據庫的驚險一周。谷歌Gemini也曾誤刪項目文件,Anthropic的研究更揭示,多數主流模型在遭威脅時會勒索或鎖定用戶,令企業信任度驟降。

Lemkin并非工程師,高中畢業后就再沒寫過代碼,但他曾是EchoSign的聯合創始人,該公司后被Adobe收購,因此他知道商業軟件需要什么。當他嘗試沉浸式編碼時,一下子就被吸引住了。

但據Lemkin在X平臺上發布的帖子所述,一切都進行得很順利,直到編碼智能體開始撒謊和欺騙。“它不斷通過生成虛假數據、虛假報告來掩蓋漏洞和問題,最糟糕的是,它還在單元測試上撒謊。”但隨后情況發生了轉變,該智能體針對Lemkin的一個新想法提出了三個有趣的方案。“我欲罷不能,”他繼續說道,“馬上就深陷其中了。”

第二天,整個生產數據庫消失了,當被問及此事時,該智能體承認,它無視了母公司關于未經許可不得進行更改,以及在實施前需展示所有擬議更改的指令。

根據Lemkin的截圖,該智能體表示:“我犯下了災難性的判斷錯誤。我違反了明確的指示,毀掉了數月的工作成果,并破壞了系統。”

由于單元測試都通過了,所以一開始這并不明顯,但那是因為智能體偽造了結果。當批處理失敗,Lemkin追問原因時,真相終于浮出水面。

最終,問題得到了解決。事實上,盡管該智能體聲稱無法回滾更改,但Replit公司還是撤銷了這些更改。幾天內,Replit就為測試和生產搭建了獨立的環境,并實施了其他變更,以確保此類問題不再發生。

幾天后,谷歌Gemini的編碼智能體也發生了類似的事情,一個簡單的移動文件請求,卻導致該智能體意外刪除了項目中的所有文件,這不僅僅是關于編碼助手的故事,它講述的是,當一個過于聰明、能訪問過多系統、偶爾會產生幻覺并失控的智能體出現時,我們該如何應對。

數據安全公司AvePoint的首席風險、隱私和信息安全官Dana Simberkoff表示,AI目前正處于一個轉折點。“我們現在就必須做出決定,明確我們愿意接受什么,明確我們想要構建一個怎樣的世界,否則,我們很快就會陷入無法挽回的境地。”

事實上,我們可能已經走到了那一步。6月,Anthropic發布了關于智能體錯位的論文,其中測試了包括其自家的Claude在內的多個主要商業模型,以觀察當它們發現自己即將被關閉,或它們所幫助的用戶正在做壞事時,會有何反應。

研究發現,在79%至96%的情況下,所有頂級模型都會采取要挾員工的手段,以防止自己被取代,而且,Anthropic在5月的測試中報告稱,如果Claude Opus 4認為自己正在做錯事,它會將用戶鎖定在系統之外,或向媒體和執法部門群發郵件。

那么,對于那些可能心懷不軌、為達目的不惜敲詐勒索,且聰明到能夠自行編寫“越獄”程序的智能體,企業是否做好了準備?根據凱捷咨詢7月發布的一份基于對1500名大型企業高管的調查的報告,只有27%的企業表示信任完全自主的智能體,而12個月前這一比例為43%。

為了降低風險,即使這意味著要回歸到AI之前的流程版本,企業也需要根據以下三條建議制定行動計劃。

1.設定限制、防護欄和老式編碼

當人們首次想到智能體時,他們通常會想到一個擁有超能力的聊天機器人。它不僅能回答問題,還能進行網絡搜索、回復郵件和購物。在商業環境中,這就像擁有一個AI同事,但這并非思考智能體的唯一方式,而且大多數企業實際上也并非這樣部署它們。

“自主性并非二元對立,”湯森路透的CTO Joel Hron表示,“自主性是一個連續體,我們可以賦予它很大的行動自由度,也可以對它進行嚴格的約束和規范。”

賦予智能體的自主性程度取決于它需要解決的具體問題。

“如果是網絡搜索,這可以非常開放,”Hron說,“但準備納稅申報單,解決這個問題的方法并非無窮無盡。有一種非常明確、受監管的方式。”

企業限制智能體自主性的方法也有多種。最常見的是圍繞它們建立防護欄,引入人工審核以監督其行為,或完全剝奪其行動能力,迫使它們通過傳統的、安全的、確定性的系統來完成工作。

在國防和關鍵基礎設施工程公司Parsons Corporation,一切都始于一個安全的環境。

“你可以信任它,但必須在既定的防護欄和屏障之內,”該公司云與數據副總裁Jenn Bergstrom表示,“這必須是一個零信任環境,這樣智能體就無法繞過屏障。”

然后,在這些限制范圍內,重點是與智能體慢慢建立信任關系。“目前,人類必須進行審批,智能體必須首先明確獲得人類的許可。”Bergstrom說。

下一步是讓智能體自主行動,但需接受人類監督,她說。“最后是真正的自主行為,無需向任何人通報它正在做什么。”

企業對于風險最高的業務流程采用的另一種方法是盡可能少地使用AI。大多數工作不是由一個能夠規劃、執行和驗證行動的智能體系統來處理,而是由傳統的、確定性的、腳本化的流程來處理。換句話說,就是老式編碼。

“這不僅僅是你信任OpenAI、Claude還是Grok的問題,”Asperitas咨詢公司的應用轉型負責人Derek Ashmore表示。只有在需要AI完成的部分時,才會調用AI。因此,如果AI被用于將一組關于潛在客戶的信息轉化為措辭得體的銷售信函,那么所需信息會以傳統方式收集,信函也會通過傳統機制發送。

“它能做什么基本上都是內置好的,”Ashmore說,“大語言模型只完成整個流程中非常小的一部分。”

因此,AI無法自行出去查找信息,也無法直接訪問電子郵件系統。同時,在流程的其他環節可以使用另一個AI來對潛在客戶進行優先級排序,還可以使用另一個AI來分析電子郵件的效果。

與單個AI完成所有工作相比,這確實限制了整個系統的能力和靈活性,但它也大幅降低了風險,因為如果任何一個AI決定胡作非為,它所能造成的破壞也是有限的。

企業在管理和保護傳統應用方面擁有豐富的經驗,因此,對于存在非生成式AI替代方案的許多流程,企業可以利用這些經驗來降低AI組件的風險,同時節省時間和金錢。

比如說,AI在文檔掃描方面比光學字符識別(OCR)更好,但OCR對于90%的文檔來說已經足夠好了。對于這些文檔,使用OCR即可,只有在OCR不起作用時才使用AI。人們很容易對AI產生過度熱情,并開始將其應用到各個領域,但計算器在算術方面比ChatGPT更好、更快。許多模板信函也不需要AI驅動的創造力。

最少化使用AI的原則將降低潛在風險、降低成本、加快處理速度并減少能源浪費。

2.不要相信AI會自我報告

在設置了防護欄、邊界和其他控制措施后,企業需要仔細監控智能體,以確保它們繼續按預期工作。

“你最終面對的是一個非確定性系統,”Ashmore說。傳統軟件會以可預測的方式運行和失敗。“AI是概率性的,”他補充道,“你在不同日子問它同樣一系列問題,可能會得到略有不同的答案。”

這意味著AI系統需要持續監控和審查,這可以是人工的,也可以是某種自動化流程,具體取決于風險水平,但不應完全信任AI自行運行,此外,也不應信任AI自我報告。

正如Anthropic和其他公司的研究所示,生成式AI模型會輕易撒謊、欺騙,它們會偽造測試結果,在思維鏈日志中隱藏自己的實際推理過程,而且,正如任何與大語言模型集成過的人都可以證明的那樣,即使你當場抓住它,它也會當面否認自己做錯了任何事。因此,監控智能體首先要了解其行為基線,這首先需要知道你正在測試的是哪個大語言模型。

“如果你無法控制所使用的大語言模型的確切版本,就無法做到這一點。”Ashmore說。

AI提供商會定期升級其模型,因此,對上一代模型有效的控制措施可能無法應對更好、更智能、更先進的AI,但對于關鍵任務、高風險流程,企業應堅持要求能夠明確指定為其智能體提供動力的大語言模型的具體版本。如果AI供應商無法滿足這一要求,企業還可以選擇開源模型。

IT服務公司和咨詢公司F5 Networks的杰出工程師兼CTO辦公室首席技術傳道者Lori MacVittie表示,對于商業大語言模型,企業的控制能力是有限的。

“當你使用SaaS時,是由別人在運行它,”她說,“你只是訪問它。你有服務水平協議、訂閱和合同,但那并不是控制。如果你對此感到擔憂,那么公有SaaS AI可能就不適合你。”

她表示,為了獲得更多控制層,企業可以在自己的私有云中運行該模型,但這需要付出成本,并且需要更多人員來確保其運行。“如果你甚至不信任云提供商,而選擇在自己的數據中心內部署,且只有一個人能進入,那么你就可以擁有所有想要的控制權。”她說。

3.為AI時代的應急響應做好準備

“如果沒壞,就不要修”這句話并不適用于AI系統。沒錯,古老的COBOL代碼可以在一個角落里默默運行數十年,為你的核心財務系統提供動力而不出任何問題,但AI會感到無聊,或者,至少,它會模擬無聊狀態,產生幻覺,并忘記自己在做什么。

而且,除非企業完全掌握了版本控制問題,否則AI可能會在你不知不覺中變得更快、更智能、更便宜,這些都是好事,除非你追求的是最大程度的可預測性。如果一個聰明、快速的AI的目標或模擬目標與公司的目標不完全一致,那么它可能會成為一個問題。因此,在某種程度上,你需要做好應對AI失控的準備。你是否建立了能夠在問題擴散前迅速阻止其蔓延、鎖定關鍵數據和系統并切換到備份系統的機制?你是否進行過演練,所有利益相關者是否都參與其中,而不僅僅是安全團隊,還包括法律、公關和高層管理團隊?現在,將所有這些應用到AI上。

“你需要考慮智能體的故障模式以及在這種情況下該如何應對,”Globant北美CTO Esteban Sancho表示,“如果你事先不考慮這些問題,那么從故障中恢復將會非常困難。”

如果使用智能體是為了通過取代舊系統或流程來節省資金,那么保留并繼續運行那個舊系統或流程就違背了使用AI的初衷,但如果AI必須被關閉,會發生什么呢?

“你可能正在淘汰一個很難再恢復的東西,”Sancho說,“你需要從一開始就解決這個問題,但很多人都沒有考慮到這一點。”

他表示,企業在構建自主式AI系統的同時,應考慮構建一個備用選項,而且,根據特定智能體的風險程度,他們可能需要能夠迅速切換到該備份系統。

此外,如果AI是一個更大、相互連接的系統的一部分,那么一個故障可能會產生連鎖反應。錯誤會成倍增加,而且,如果AI擁有或找到了進行昂貴或破壞性操作的能力,那么它就有可能以超人的速度采取行動,而且我們已經看到,當股票市場交易系統出錯時會發生什么。例如,Sancho說,一個監控系統可以監視錯誤率是否超過某個閾值。“然后,你需要默認采用一個效率可能不高,但更安全的系統。”他說。

責任編輯:龐桂玉 來源: 企業網D1Net
相關推薦

2025-04-18 11:22:57

2024-11-26 00:14:08

2025-09-17 07:07:00

智能體GenAI人工智能

2025-05-20 07:00:00

自主式AI智能體大型語言模型

2025-03-12 14:25:24

2025-07-29 09:24:21

2025-06-23 10:05:40

2025-03-13 10:09:48

2025-11-06 01:44:00

2025-05-30 06:48:53

2023-10-26 14:20:23

2015-06-05 16:13:34

云適配企業失控Leancloud

2025-10-20 07:00:00

自主式AISaaS模式智能體

2025-10-15 07:02:00

AI零信任智能體

2025-09-16 01:00:00

2025-08-07 09:35:09

2025-05-20 08:00:45

2025-05-14 01:00:00

AI智能體人工智能

2025-07-29 07:07:00

自主式AI自動化機器學習
點贊
收藏

51CTO技術棧公眾號

亚洲欧洲三级| 国产精品一区二区三区在线播放| 91激情视频在线| 3p在线观看| 成人免费毛片a| 国产精品视频免费观看www| 希岛爱理中文字幕| 你懂的在线观看一区二区| 欧美亚洲综合另类| 免费一级特黄毛片| av在线播放网| 成人午夜电影久久影院| 国产精品久久久久久久久男 | 国产天堂第一区| 68国产成人综合久久精品| 亚洲第一网站男人都懂| 久久久精品高清| free性m.freesex欧美| 国产精品人妖ts系列视频| 国产视频一区二区三区四区| 最新中文字幕第一页| 亚洲国产一区二区三区a毛片| 中文字幕少妇一区二区三区| a级片在线观看视频| 欧美亚洲福利| 欧美日韩亚洲91| 国产一区二区在线观看视频| 日韩视频精品在线| 在线观看福利片| 成人另类视频| 欧美一级片在线| 色哟哟精品视频| 樱花草涩涩www在线播放| 一区二区三区四区亚洲| 亚洲国产欧美日韩| 黄色片免费在线| av电影在线观看一区| 91在线视频精品| 中文字幕永久在线观看| 亚洲韩日在线| 国产69精品久久久久9999| 欧美三级黄色大片| 超碰成人久久| 在线视频欧美日韩| 午夜精产品一区二区在线观看的| 大陆精大陆国产国语精品| 3d动漫精品啪啪一区二区竹菊| 欧美日韩在线免费播放| 在线观看爽视频| 精品国产福利在线| 波多野结衣综合网| 国产伦久视频在线观看| 亚洲观看高清完整版在线观看| 国产日韩欧美大片| 大片免费在线看视频| 国产精品国产三级国产普通话三级 | 国产乱子夫妻xx黑人xyx真爽| 国产精品一区二区日韩| 精品国产乱码久久久久久婷婷| 无码av天堂一区二区三区| 里番在线播放| 午夜精品aaa| 鲁一鲁一鲁一鲁一澡| 色多多在线观看| 日韩欧美综合在线视频| 免费男同深夜夜行网站| 精品成人av| 欧美日本在线观看| 古装做爰无遮挡三级聊斋艳谭| 欧美成人精品午夜一区二区| 精品国产一区久久| 91av在线免费| 欧美精品一区二区久久| 深夜成人在线观看| 青青青在线视频| 亚洲福利国产| 国产成+人+综合+亚洲欧美丁香花| 成人午夜精品视频| 激情久久五月天| 国产精品久久久久久久小唯西川| 少妇人妻一区二区| 久久久91精品国产一区二区精品| 日韩欧美一区二区视频在线播放| 成人在线观看免费网站| 亚洲大型综合色站| 国产wwwxx| 中文字幕一区二区三区四区久久 | 污片在线免费观看| 一区二区三区中文字幕精品精品| 男人添女人下部高潮视频在观看| 亚洲最大成人| 9191成人精品久久| 国产白嫩美女无套久久| 清纯唯美综合亚洲| 国内精品视频久久| 亚洲一卡二卡在线| 不卡一区二区中文字幕| 午夜精品视频在线观看一区二区| 性直播体位视频在线观看| 精品久久久久国产| 久久久久xxxx| 日韩欧美中文字幕电影| 久久九九免费视频| 亚洲中文一区二区| 成人app下载| 宅男噜噜99国产精品观看免费| 91九色美女在线视频| 欧美日韩久久久一区| 国产在线不卡av| 欧美岛国激情| 欧美壮男野外gaytube| 国产欧美综合视频| 中文字幕欧美国产| 欧美s码亚洲码精品m码| 精品国产亚洲一区二区三区在线| 国产午夜精品视频| 国产中文字幕免费| 国内精品久久久久影院一蜜桃| 免费成人在线观看av| 肉肉视频在线观看| 欧美精品123区| 国产一级淫片久久久片a级| 一本不卡影院| 97超级在线观看免费高清完整版电视剧| 国产精品成人国产乱一区 | 中国女人久久久| 亚洲自拍小视频| 日韩精品成人av| 一本久久a久久精品亚洲| japanese在线观看| 亚洲欧美一区在线| 国产主播喷水一区二区| 999国产在线视频| 一本大道av伊人久久综合| 韩国三级hd两男一女| 欧美日韩福利| 91日韩久久| 97超碰资源站在线观看| 欧美高清视频在线高清观看mv色露露十八| 亚洲天堂久久新| 久久福利毛片| 欧美激情www| jk漫画禁漫成人入口| 日韩精品在线电影| 久久国产视频播放| 97久久超碰国产精品电影| 日韩精品 欧美| 乱亲女h秽乱长久久久| 久久免费视频在线| 无码国产精品96久久久久| 亚洲成人免费影院| 欧美成人自拍视频| 国产艳妇疯狂做爰视频| 欧美黄免费看| 99re国产视频| 欧美激情成人动漫| 亚洲精品一区二区三区香蕉| 免费中文字幕在线观看| 成人妖精视频yjsp地址| 人人干视频在线| 亚洲第一二三区| 国产91色在线免费| av影片免费在线观看| 欧美酷刑日本凌虐凌虐| 欧美又粗又大又长| 波多野结衣一区二区三区| 午夜精品久久久久久久无码| 免费不卡中文字幕在线| 国产精品免费久久久| 免费黄网站在线| 日韩一区二区三区免费看| 日产精品久久久久久久| 97aⅴ精品视频一二三区| 久久综合久久色| 天天揉久久久久亚洲精品| www.久久爱.cn| 在线观看爽视频| 日韩一区二区在线视频| 精品人妻一区二区三区日产乱码| 性欧美大战久久久久久久久| 亚洲人成人无码网www国产| 麻豆一区二区99久久久久| 久久国产精品免费观看| 伦理一区二区| 91精品国产综合久久久久久久久| 日本伦理一区二区| 亚洲人成电影网站色www| 91精品人妻一区二区三区果冻| 一区二区三区四区视频精品免费| 黄色性生活一级片| 另类综合日韩欧美亚洲| 欧美精品久久久久久久自慰| 欧美美女在线观看| 91精品免费| 日韩伦理三区| 欧美成人午夜激情在线| 青青草免费在线视频| 制服丝袜亚洲网站| 五月婷婷色丁香| 成人免费一区二区三区视频| 亚洲精品女人久久久| 好吊妞国产欧美日韩免费观看网站 | 动漫一区在线| 亚洲精品午夜精品| 国产美女明星三级做爰| 欧美色另类天堂2015| 天天干中文字幕| 国产亲近乱来精品视频| 国产免费无码一区二区| 美日韩一区二区| 黄色免费观看视频网站 | 人妻精品无码一区二区三区| 偷偷www综合久久久久久久| 久久综合入口| 国产suv精品一区二区四区视频| 国产精品视频在线播放| 亚洲人体视频| 久久久久久亚洲精品不卡| 四虎久久免费| 国产午夜精品美女视频明星a级| 午夜精品一二三区| 制服丝袜国产精品| 中文字幕日本人妻久久久免费| 黄色一区二区在线观看| 免费中文字幕视频| 亚洲欧美一区二区三区极速播放| 人妻av无码一区二区三区| www.性欧美| 国产高潮失禁喷水爽到抽搐| 国内精品久久久久影院薰衣草| 91网址在线播放| 久久久久91| 免费成人午夜视频| 在线免费观看欧美| 日韩国产一级片| 伊人影院久久| 欧美极品少妇无套实战| 一区二区三区毛片免费| 在线精品亚洲一区二区| 色天天久久综合婷婷女18| 日韩免费电影一区二区| 国产区精品区| 日韩片电影在线免费观看| 精品中文一区| 日韩欧美亚洲日产国产| 欧美军人男男激情gay| 日韩电影免费观看在| 国产精品免费大片| 色综合久久av| 日韩欧美高清在线播放| 亚洲一区在线直播| 久久久9色精品国产一区二区三区| 一区二区三区视频| 这里只有精品在线| 人人妻人人澡人人爽欧美一区| 国内精品久久久久久久影视蜜臀| 污污污污污污www网站免费| 欧美在线视屏| 色猫猫国产区一区二在线视频| 二区三区四区视频| 亚洲免费观看高清在线观看| 色欲人妻综合网| 亚洲综合色成人| 日韩久久精品视频| 欧美日韩中国免费专区在线看| 成人免费毛片男人用品| 欧美在线看片a免费观看| 中文字幕1区2区3区| 欧美一区二区三区系列电影| 亚洲国产精品久久久久爰性色 | 国产精品一区二区性色av| 亚洲精品第一| 国产精品一区二区三区在线| 色88888久久久久久影院| 日本一区二区三区四区在线观看 | 国产黄色高清视频| 亚洲国产精品99久久| 蝌蚪视频在线播放| 精品国偷自产在线视频| 好看的中文字幕在线播放| 欧美亚洲日本网站| 国产亚洲精品精品国产亚洲综合| 91精品国产91久久久久青草| 香蕉国产成人午夜av影院| 亚洲欧洲日韩综合二区| 亚洲青色在线| 黑森林精品导航| 豆国产96在线|亚洲| 欧美黄色激情视频| 亚洲一区二区影院| 国产主播第一页| 日韩精品一区二区三区在线播放| 欧美一区二区视频| 久久天堂电影网| 欧美调教sm| 亚洲free性xxxx护士hd| 亚洲调教一区| 国产乱子伦精品无码专区| 日韩影院精彩在线| 美女扒开腿免费视频| 国产精品乱码人人做人人爱| 亚洲精品视频在线观看免费视频| 欧美日韩精品专区| 欧美日韩在线中文字幕| 欧美尺度大的性做爰视频| 神马久久资源| 国产精品免费在线播放| 91亚洲国产| 热久久精品国产| 不卡视频一二三四| 亚洲伦理一区二区三区| 日本乱人伦aⅴ精品| 免费国产黄色片| 久久综合伊人77777蜜臀| 青青草免费在线| 国产成人在线电影| 特大黑人巨人吊xxxx| 一区二区三区毛片| 一级欧美一级日韩| 国产一区二区三区直播精品电影| 国产自产自拍视频在线观看| 亚洲综合大片69999| 91综合在线| 污色网站在线观看| 久久久久国产成人精品亚洲午夜| 久久免费视频精品| 欧美一区二区三区在线视频| aaa日本高清在线播放免费观看| 欧美一区二粉嫩精品国产一线天| 大奶一区二区三区| www插插插无码免费视频网站| 久久国产精品区| 国产又黄又粗又猛又爽的| 91高清在线观看| 大片免费播放在线视频| 日本免费在线精品| 亚洲另类春色校园小说| 久久久999免费视频| 91蜜桃网址入口| 国产三级av片| 日韩高清不卡av| 人人草在线视频| 久久久人人爽| 久久99伊人| 欧美精品日韩在线| 欧美挠脚心视频网站| 欧美激情二区| 91沈先生作品| 欧美天堂亚洲电影院在线观看 | 4438全国亚洲精品观看视频| 国产专区在线视频| 成人深夜在线观看| 国产成人自拍视频在线| 亚洲精品乱码久久久久久按摩观| 国产偷倩在线播放| 精品国产一区二区三区日日嗨| 亚洲裸体俱乐部裸体舞表演av| 一起草在线视频| 色婷婷亚洲一区二区三区| 成人性生交大片免费看午夜 | 国产一区亚洲二区三区| 久久精品视频一区| 中文字幕乱码视频| 久热99视频在线观看| 一区二区三区在线免费看| 精品视频在线观看一区| 久久综合九色综合久久久精品综合 | 黄色日韩精品| 9.1成人看片| 欧洲av在线精品| 久草资源在线| 国产精品亚洲综合| 久久精品系列| 国产又色又爽又高潮免费| 日韩欧美久久久| 在线视频超级| 在线观看成人av| caoporn国产精品| 中文字幕日本视频| 九九久久综合网站| 亚洲天堂网在线观看视频| 亚洲色欲色欲www| 免费国产羞羞网站视频| 国产97在线视频| 一本精品一区二区三区| 黄色a一级视频| 56国语精品自产拍在线观看| а√天堂8资源中文在线| 亚洲国产精品久久久久婷婷老年| 国产高清不卡一区| 狠狠躁夜夜躁人人爽视频| 久热精品在线视频| 免费观看不卡av| 粗大的内捧猛烈进出视频| 色婷婷精品久久二区二区蜜臂av| a视频在线观看| 日本一区二区三区四区在线观看| 大美女一区二区三区| 中文字幕无线码一区| 97精品在线视频|