GenAI正導致敏感數據大規模泄露

敏感數據無處不在,且增長迅速。Concentric AI發布的一份新報告強調了非結構化數據、重復文件以及高風險的共享行為如何給安全團隊帶來嚴重問題。研究結果顯示,微軟Copilot等GenAI工具增加了復雜性,而過度共享和數據管理不善等老問題仍持續造成數據泄露風險。
GenAI引發新擔憂
2025年上半年,平均每個企業中Copilot訪問的敏感數據記錄接近300萬條。研究人員還發現,每個企業中用戶與Copilot的交互超過3000次,這意味著敏感數據在缺乏適當管控的情況下被修改或共享的可能性更大。
報告警告稱,員工依賴未經授權工具的“影子GenAI”使用行為會帶來進一步風險,因為企業甚至可能不知道其數據流向何處。
權限過多,泄露風險加劇
報告顯示,過度共享仍是核心問題。數據經常被共享給無需訪問權限的人員和系統。
在參與研究的所有企業中,平均每個企業外部共享的敏感數據記錄達300萬條,占所有共享文件的半數以上。金融服務公司外部共享敏感數據的比例最高,達73%。
其中,“任意人鏈接”帶來的風險尤為突出,這種鏈接允許無需登錄即可無限制訪問。在醫療行業,通過此類鏈接共享的文件中有很大一部分包含敏感數據。在各行業中,以這種方式共享的許多文件也包含敏感信息。
內部共享同樣存在風險。在許多企業中,公司內部廣泛共享的文件中有相當一部分包含敏感數據。在零售和金融服務行業,與個人賬戶共享的大多數文件都包含敏感信息。
數據泛濫導致效率低下和風險增加
隨著數據量的增長,數據雜亂問題也日益嚴重。研究人員發現,各企業平均擁有1000萬條重復數據記錄,政府和教育機構的重復率超過30%。
陳舊數據也是一個問題。在各行業中,企業平均擁有700萬條陳舊數據記錄,制造業的陳舊數據占比最高,約占總數據的四分之一。保留舊數據不僅會增加成本,還會加大風險管理難度。
報告還強調了無主數據(即沒有所有者的數據)和非活躍用戶數據(即屬于前員工或休眠賬戶的數據)的問題。各企業平均擁有400萬條無主數據記錄和200萬條非活躍用戶數據記錄。在政府和教育行業,僅非活躍數據就占所有數據的近10%。
































