你的照片被多少面部識(shí)別系統(tǒng)「偷偷」用過(guò)?是時(shí)候用工具查一查了
當(dāng)科技公司開(kāi)發(fā)出「蠶食個(gè)人隱私」的面部識(shí)別系統(tǒng)的時(shí)候,他們大概率已經(jīng)得到了您意想不到的幫助:你的臉——
公司、大學(xué)和政府實(shí)驗(yàn)室使用了數(shù)百萬(wàn)張從五花八門(mén)的網(wǎng)上資源中收集來(lái)的圖像,來(lái)開(kāi)發(fā)這項(xiàng)技術(shù)。
而現(xiàn)在,國(guó)外的研究人員開(kāi)發(fā)了一項(xiàng)技術(shù):「Exposing.AI 」, 這項(xiàng)技術(shù)可以幫助人們?cè)谶@些圖像中搜索他們的舊照片。
這款工具可以匹配Flickr在線照片共享服務(wù)中的圖像,為查找各種AI技術(shù)(從面部識(shí)別到聊天機(jī)器人)所使用的大量數(shù)據(jù)提供了窗口。
「人們需要知道,他們最私密的照片很可能被利用了」,隱私和民權(quán)組織監(jiān)視技術(shù)監(jiān)督項(xiàng)目的技術(shù)總監(jiān)利茲·奧沙利文(Liz O’sullivan)如是說(shuō)
她與在柏林的研究員、藝術(shù)家亞當(dāng)·哈維(Adam Harvey)一起合作,也參與了Exposing.AI項(xiàng)目,
蜜月照被國(guó)家級(jí)監(jiān)控系統(tǒng)所用,這位導(dǎo)演感到了「害怕」
人工智能系統(tǒng)不會(huì)魔法般的變得聰明——它們是通過(guò)精確定位人類(lèi)生成的數(shù)據(jù)模式來(lái)自我學(xué)習(xí)的。技術(shù)是一直在進(jìn)步和發(fā)展的,然而,它們卻學(xué)到了人類(lèi)對(duì)女性和少數(shù)族裔的偏見(jiàn)。
大家可能并不知道,自己其實(shí)一直在默默為AI的發(fā)展做著貢獻(xiàn)。
對(duì)于一些人來(lái)說(shuō),這是一件很令人感到新奇的事,而對(duì)于另外一些人,就非常令人毛骨悚然了。
關(guān)鍵是,在國(guó)外,這可能是違法的——
2008年,伊利諾斯州通過(guò)了一項(xiàng)名為《生物特征信息隱私法》(Biometric Information Privacy Act)的法律,條文中要求,如果在未經(jīng)居民同意的情況下使用他們的面部掃描,將會(huì)受到經(jīng)濟(jì)處罰。
2006年,來(lái)自不列顛哥倫比亞省維多利亞州的紀(jì)錄片導(dǎo)演布雷特•蓋勒(Brett Gaylor)將他的蜜月照片上傳到當(dāng)時(shí)很受歡迎的Flickr網(wǎng)站上:
經(jīng)過(guò)15年后,使用哈維提供的早期版本的Exposing.AI,他發(fā)現(xiàn), 多年來(lái),F(xiàn)lickr被許多公司買(mǎi)賣(mài),現(xiàn)在屬于照片共享服務(wù)公司SmugMug,該公司允許用戶(hù)在知識(shí)共享許可(Creative Commons license)下分享他們的照片。數(shù)百?gòu)埶拿墼侣眯械恼掌呀?jīng)進(jìn)入到了多個(gè)數(shù)據(jù)集——這些數(shù)據(jù)集很可能被用于訓(xùn)練世界各地的面部識(shí)別系統(tǒng)。
多年來(lái),F(xiàn)lickr被許多公司買(mǎi)賣(mài),現(xiàn)在屬于照片共享服務(wù)公司SmugMug,該公司允許用戶(hù)在知識(shí)共享許可(Creative Commons license)下分享他們的照片。
這種許可在互聯(lián)網(wǎng)網(wǎng)站上很常見(jiàn),意味著其他人可以在一定的限制下使用這些照片(盡管這些限制可能被忽略了)。
2014年,當(dāng)時(shí)擁有Flickr的雅虎(Yahoo)在一個(gè)數(shù)據(jù)集中,為了幫助計(jì)算機(jī)視覺(jué)方面的工作,使用了許多這樣的照片。
蓋勒好奇,自己的照片究竟是如何被到處傳來(lái)傳去的。接著,他就被告知,這些照片可能被美國(guó)和其他國(guó)家的監(jiān)控系統(tǒng)所使用。
「我的好奇變成了恐懼」,他說(shuō)。
是的,一個(gè)美國(guó)人的蜜月照片,竟然被用來(lái)建立國(guó)家級(jí)別的監(jiān)視系統(tǒng),實(shí)在是令人意外。
非商業(yè)用途MegaFace被各種公司普遍使用,下線也無(wú)法解決問(wèn)題
幾年前,頂尖大學(xué)和科技公司的人工智能研究人員,開(kāi)始從各種渠道收集照片,這些渠道包括照片分享服務(wù)、社交網(wǎng)絡(luò)、OkCupid等約會(huì)網(wǎng)站,甚至還包含安裝在大學(xué)里的相機(jī)。收集之后,他們向其他組織分享了這些照片。
這對(duì)于研究人員來(lái)說(shuō),是正常現(xiàn)象。他們都需要把數(shù)據(jù)輸入新的人工智能系統(tǒng),所以他們就分享了所有的數(shù)據(jù),但這是合法的。
MegaFace數(shù)據(jù)集就是一個(gè)例子——這是華盛頓大學(xué)的教授們?cè)?015年創(chuàng)建的一個(gè)數(shù)據(jù)集。
他們?cè)跀?shù)據(jù)源沒(méi)有知情且同意的情況下,就把他們的照片放進(jìn)了龐大的照片庫(kù)中。
這些教授將圖片發(fā)布到互聯(lián)網(wǎng)上,以便其他人可以下載。
根據(jù)《紐約時(shí)報(bào)》的公開(kāi)記錄請(qǐng)求,世界各地的公司和政府機(jī)構(gòu)已經(jīng)下載了超過(guò)6000次MegaFace。其中包括美國(guó)國(guó)防承包商諾斯羅普·格魯曼公司、中央情報(bào)局的投資部門(mén)In-Q-Tel,當(dāng)然還有中國(guó)的社交媒體及公司等。
研究人員創(chuàng)建MegaFace的起初目的,是為了將其用于一項(xiàng)旨在促進(jìn)面部識(shí)別系統(tǒng)發(fā)展的學(xué)術(shù)競(jìng)賽,并不是為商業(yè)用途準(zhǔn)備的。
然而事實(shí)是,但只有一小部分公開(kāi)下載了MegaFace的用戶(hù)參加了這場(chǎng)比賽。
「我們不適合討論第三方項(xiàng)目」,華盛頓大學(xué)發(fā)言人維克托·巴爾塔(Victor Balta)說(shuō),「MegaFace已經(jīng)“退役”,我們也不再分發(fā)MegaFace的數(shù)據(jù)了」
今年5月,華盛頓大學(xué)(University of Washington)將MegaFace下線。然而。這些數(shù)據(jù)的副本可能出現(xiàn)在任何地方,并繼續(xù)為新的研究提供素材。
限制之下,隱私數(shù)據(jù)濫用問(wèn)題何時(shí)可解?
奧沙利文和哈維花了數(shù)年時(shí)間,試圖開(kāi)發(fā)一個(gè)可以揭露所有這些數(shù)據(jù)使用情況的工具,實(shí)際的過(guò)程比他們預(yù)料的要困難。
他們想要使用某人的照片,來(lái)立即告訴那個(gè)人ta的臉被包含在各種數(shù)據(jù)集的次數(shù)。
但他們擔(dān)心,這種工具可能會(huì)被其他組織用在不好的地方。
「潛在的危害似乎很大」,奧沙利文說(shuō)。
值得一提的是,奧沙利文還是幫助企業(yè)管理AI技術(shù)使用的紐約公司Responsible.AI的副總裁。
最后,他們被迫限制了人們搜索該工具的方式以及搜索提供的結(jié)果。結(jié)果是,這個(gè)工具并不像他們希望的那樣有效。
Exposing.AI本身并不使用面部識(shí)別技術(shù)。只有當(dāng)你提供了可以在線指向該照片的方式——比如一個(gè)互聯(lián)網(wǎng)地址,它才能實(shí)現(xiàn)照片的精確定位。
此外,人們只能搜索發(fā)布在Flickr上的照片:他們需要Flickr的用戶(hù)名、標(biāo)簽或網(wǎng)絡(luò)地址來(lái)識(shí)別這些照片。
研究人員表示,這一舉措是為了加強(qiáng)安全和隱私保護(hù)能力。
雖然限制了該工具的用途,但它的效果仍然讓人大開(kāi)眼界:
Flickr上的圖片構(gòu)成了大量的面部識(shí)別數(shù)據(jù)集,這些數(shù)據(jù)集已經(jīng)在互聯(lián)網(wǎng)上廣泛流傳,其中就包括MegaFace。
使用Exposing.AI 找到與自己有聯(lián)系的照片并不難:只需要在舊郵件中搜索Flickr鏈接,就能找到被用于MegaFace和其他面部識(shí)別數(shù)據(jù)集的照片。
通過(guò)這個(gè)工具,蓋勒對(duì)他所發(fā)現(xiàn)的情況感到特別不安,因?yàn)樗?jīng)認(rèn)為。互聯(lián)網(wǎng)上的信息自由流動(dòng)是一件積極的事情,而他使用Flickr,是因?yàn)槠渌耸褂盟掌臋?quán)利是受到知識(shí)共享許可限制的。
「我現(xiàn)在正經(jīng)歷著這些后果」,他說(shuō)。
他的希望——也是奧沙利文女士和哈維先生的希望——是公司和政府會(huì)制定新的規(guī)范、政策和法律,來(lái)防止個(gè)人數(shù)據(jù)被大量收集。
此外,蓋勒正在制作一部記載他的蜜月照片漫長(zhǎng)、曲折、令人不安的「流傳歷程」的紀(jì)錄片,來(lái)揭示這個(gè)私人數(shù)據(jù)被濫用的問(wèn)題。
參考鏈接:
https://www.nytimes.com/2021/01/31/technology/facial-recognition-photo-tool.html?referringSource=articleShare



























