主流AI平臺擅自共享用戶個(gè)人信息 ,用戶掌控權(quán)嚴(yán)重缺失
AI平臺將用戶數(shù)據(jù)鎖定于模型訓(xùn)練環(huán)節(jié)
根據(jù)Incogni的研究報(bào)告,包括Meta、谷歌和微軟在內(nèi)的多家主流生成式AI和大語言模型(LLM)平臺正在收集敏感數(shù)據(jù)并與不明第三方共享,導(dǎo)致用戶對自身信息的存儲、使用和共享方式既缺乏透明度,也幾乎沒有任何控制權(quán)。

谷歌Gemini、Meta AI、DeepSeek和Pi.ai等平臺均未提供退出機(jī)制來阻止用戶輸入內(nèi)容被用于AI模型訓(xùn)練。一旦輸入個(gè)人或敏感數(shù)據(jù),實(shí)際上無法從AI訓(xùn)練數(shù)據(jù)集中刪除這些信息。盡管《通用數(shù)據(jù)保護(hù)條例》(GDPR)等法律賦予個(gè)人要求刪除數(shù)據(jù)的權(quán)利,但如何從機(jī)器學(xué)習(xí)模型中實(shí)際移除信息仍不明確。因此,許多公司目前既無義務(wù)也缺乏技術(shù)能力來事后刪除此類數(shù)據(jù)。用戶的聯(lián)系信息或商業(yè)機(jī)密可能在未經(jīng)明確告知或同意的情況下,被永久嵌入模型訓(xùn)練數(shù)據(jù)中。
數(shù)據(jù)收集行為全景掃描
隨著生成式AI日益融入日常生活,用戶往往不清楚這些工具收集了哪些個(gè)人數(shù)據(jù)、如何使用以及最終流向何處。研究人員從三個(gè)維度分析了主流AI平臺的數(shù)據(jù)實(shí)踐:用戶數(shù)據(jù)在模型訓(xùn)練中的使用情況、平臺隱私政策的透明度、數(shù)據(jù)收集與第三方共享的范圍。
- Meta.ai和Gemini會收集用戶的精確定位數(shù)據(jù)和實(shí)體地址
- Claude根據(jù)其Google Play商店頁面顯示,會向第三方共享電子郵件、電話號碼和應(yīng)用交互數(shù)據(jù)
- Grok(xAI)可能將用戶提供的照片和應(yīng)用交互數(shù)據(jù)共享給第三方
- Meta.ai會與外部實(shí)體(包括研究合作伙伴和企業(yè)集團(tuán)成員)共享姓名、電子郵件和電話號碼
- 微軟的隱私政策暗示用戶輸入內(nèi)容可能被共享給涉及在線廣告或使用微軟廣告技術(shù)的第三方
- Gemini、DeepSeek、Pi.ai和Meta.ai很可能未提供退出模型訓(xùn)練的選擇權(quán)
- ChatGPT在說明哪些輸入內(nèi)容會用于模型訓(xùn)練方面最為透明,并制定了清晰的隱私政策
即便用戶主動尋求解釋,相關(guān)細(xì)節(jié)也往往隱藏在零散的幫助頁面或用晦澀的法律術(shù)語書寫。Incogni發(fā)現(xiàn)所有被分析的隱私政策都需要大學(xué)水平的閱讀能力才能理解。
員工使用AI或致商業(yè)機(jī)密外泄
除個(gè)人隱私外,企業(yè)面臨的風(fēng)險(xiǎn)更為嚴(yán)峻。員工常使用生成式AI工具協(xié)助起草內(nèi)部報(bào)告或通訊,卻未意識到這可能導(dǎo)致專有數(shù)據(jù)成為模型訓(xùn)練集的一部分。這種保護(hù)機(jī)制的缺失不僅使個(gè)人面臨非自愿數(shù)據(jù)共享,還可能導(dǎo)致敏感商業(yè)數(shù)據(jù)在未來與其他用戶的交互中被重復(fù)利用,從而引發(fā)隱私、合規(guī)和競爭風(fēng)險(xiǎn)。
"多數(shù)人以為只是在與可信助手對話,并未泄露聯(lián)系信息或商業(yè)機(jī)密。"Incogni負(fù)責(zé)人Darius Belejevas指出,"實(shí)際情況更具侵入性,而企業(yè)并未讓用戶輕松理解數(shù)據(jù)的真實(shí)流向。用戶有權(quán)知曉哪些數(shù)據(jù)被收集、誰能查看以及如何阻止。目前這些答案往往難以尋覓,甚至根本不存在。"

























