你的照片被多少面部識(shí)別系統(tǒng)「偷偷」用過(guò)？是時(shí)候用工具查一查了

作者：佚名 2021-02-03 15:29:44

在這個(gè)數(shù)據(jù)「泛濫」的時(shí)代，你的隱私數(shù)據(jù)到底被多少機(jī)構(gòu)「花式」使用了？國(guó)外的研究人員開(kāi)發(fā)一款名叫Exposing.AI的工具，可以幫人們獲知自己的人臉數(shù)據(jù)被各種面部識(shí)別系統(tǒng)使用的情況，并經(jīng)常能獲得令人出乎意料的結(jié)果。

當(dāng)科技公司開(kāi)發(fā)出「蠶食個(gè)人隱私」的面部識(shí)別系統(tǒng)的時(shí)候，他們大概率已經(jīng)得到了您意想不到的幫助：你的臉——

公司、大學(xué)和政府實(shí)驗(yàn)室使用了數(shù)百萬(wàn)張從五花八門(mén)的網(wǎng)上資源中收集來(lái)的圖像，來(lái)開(kāi)發(fā)這項(xiàng)技術(shù)。

而現(xiàn)在，國(guó)外的研究人員開(kāi)發(fā)了一項(xiàng)技術(shù)：「Exposing.AI 」, 這項(xiàng)技術(shù)可以幫助人們?cè)谶@些圖像中搜索他們的舊照片。

這款工具可以匹配Flickr在線照片共享服務(wù)中的圖像，為查找各種AI技術(shù)（從面部識(shí)別到聊天機(jī)器人）所使用的大量數(shù)據(jù)提供了窗口。

「人們需要知道，他們最私密的照片很可能被利用了」，隱私和民權(quán)組織監(jiān)視技術(shù)監(jiān)督項(xiàng)目的技術(shù)總監(jiān)利茲·奧沙利文(Liz O’sullivan)如是說(shuō)

她與在柏林的研究員、藝術(shù)家亞當(dāng)·哈維（Adam Harvey）一起合作，也參與了Exposing.AI項(xiàng)目，
蜜月照被國(guó)家級(jí)監(jiān)控系統(tǒng)所用，這位導(dǎo)演感到了「害怕」
人工智能系統(tǒng)不會(huì)魔法般的變得聰明——它們是通過(guò)精確定位人類(lèi)生成的數(shù)據(jù)模式來(lái)自我學(xué)習(xí)的。技術(shù)是一直在進(jìn)步和發(fā)展的，然而，它們卻學(xué)到了人類(lèi)對(duì)女性和少數(shù)族裔的偏見(jiàn)。

大家可能并不知道，自己其實(shí)一直在默默為AI的發(fā)展做著貢獻(xiàn)。

對(duì)于一些人來(lái)說(shuō)，這是一件很令人感到新奇的事，而對(duì)于另外一些人，就非常令人毛骨悚然了。

關(guān)鍵是，在國(guó)外，這可能是違法的——

2008年，伊利諾斯州通過(guò)了一項(xiàng)名為《生物特征信息隱私法》(Biometric Information Privacy Act)的法律，條文中要求，如果在未經(jīng)居民同意的情況下使用他們的面部掃描，將會(huì)受到經(jīng)濟(jì)處罰。

2006年，來(lái)自不列顛哥倫比亞省維多利亞州的紀(jì)錄片導(dǎo)演布雷特•蓋勒(Brett Gaylor)將他的蜜月照片上傳到當(dāng)時(shí)很受歡迎的Flickr網(wǎng)站上：

[[380305]]

經(jīng)過(guò)15年后，使用哈維提供的早期版本的Exposing.AI，他發(fā)現(xiàn)，多年來(lái)，F(xiàn)lickr被許多公司買(mǎi)賣(mài)，現(xiàn)在屬于照片共享服務(wù)公司SmugMug，該公司允許用戶(hù)在知識(shí)共享許可(Creative Commons license)下分享他們的照片。數(shù)百?gòu)埶拿墼侣眯械恼掌呀?jīng)進(jìn)入到了多個(gè)數(shù)據(jù)集——這些數(shù)據(jù)集很可能被用于訓(xùn)練世界各地的面部識(shí)別系統(tǒng)。

多年來(lái)，F(xiàn)lickr被許多公司買(mǎi)賣(mài)，現(xiàn)在屬于照片共享服務(wù)公司SmugMug，該公司允許用戶(hù)在知識(shí)共享許可(Creative Commons license)下分享他們的照片。

這種許可在互聯(lián)網(wǎng)網(wǎng)站上很常見(jiàn)，意味著其他人可以在一定的限制下使用這些照片（盡管這些限制可能被忽略了）。

2014年，當(dāng)時(shí)擁有Flickr的雅虎(Yahoo)在一個(gè)數(shù)據(jù)集中，為了幫助計(jì)算機(jī)視覺(jué)方面的工作，使用了許多這樣的照片。

蓋勒好奇，自己的照片究竟是如何被到處傳來(lái)傳去的。接著，他就被告知，這些照片可能被美國(guó)和其他國(guó)家的監(jiān)控系統(tǒng)所使用。

「我的好奇變成了恐懼」，他說(shuō)。

是的，一個(gè)美國(guó)人的蜜月照片，竟然被用來(lái)建立國(guó)家級(jí)別的監(jiān)視系統(tǒng)，實(shí)在是令人意外。

非商業(yè)用途MegaFace被各種公司普遍使用，下線也無(wú)法解決問(wèn)題
幾年前，頂尖大學(xué)和科技公司的人工智能研究人員，開(kāi)始從各種渠道收集照片，這些渠道包括照片分享服務(wù)、社交網(wǎng)絡(luò)、OkCupid等約會(huì)網(wǎng)站，甚至還包含安裝在大學(xué)里的相機(jī)。收集之后，他們向其他組織分享了這些照片。

這對(duì)于研究人員來(lái)說(shuō)，是正常現(xiàn)象。他們都需要把數(shù)據(jù)輸入新的人工智能系統(tǒng)，所以他們就分享了所有的數(shù)據(jù)，但這是合法的。

MegaFace數(shù)據(jù)集就是一個(gè)例子——這是華盛頓大學(xué)的教授們?cè)?015年創(chuàng)建的一個(gè)數(shù)據(jù)集。

[[380307]]

他們?cè)跀?shù)據(jù)源沒(méi)有知情且同意的情況下，就把他們的照片放進(jìn)了龐大的照片庫(kù)中。

這些教授將圖片發(fā)布到互聯(lián)網(wǎng)上，以便其他人可以下載。

根據(jù)《紐約時(shí)報(bào)》的公開(kāi)記錄請(qǐng)求，世界各地的公司和政府機(jī)構(gòu)已經(jīng)下載了超過(guò)6000次MegaFace。其中包括美國(guó)國(guó)防承包商諾斯羅普·格魯曼公司、中央情報(bào)局的投資部門(mén)In-Q-Tel，當(dāng)然還有中國(guó)的社交媒體及公司等。

研究人員創(chuàng)建MegaFace的起初目的，是為了將其用于一項(xiàng)旨在促進(jìn)面部識(shí)別系統(tǒng)發(fā)展的學(xué)術(shù)競(jìng)賽，并不是為商業(yè)用途準(zhǔn)備的。

然而事實(shí)是，但只有一小部分公開(kāi)下載了MegaFace的用戶(hù)參加了這場(chǎng)比賽。

「我們不適合討論第三方項(xiàng)目」，華盛頓大學(xué)發(fā)言人維克托·巴爾塔(Victor Balta)說(shuō)，「MegaFace已經(jīng)“退役”，我們也不再分發(fā)MegaFace的數(shù)據(jù)了」

[[380308]]

今年5月，華盛頓大學(xué)(University of Washington)將MegaFace下線。然而。這些數(shù)據(jù)的副本可能出現(xiàn)在任何地方，并繼續(xù)為新的研究提供素材。

限制之下，隱私數(shù)據(jù)濫用問(wèn)題何時(shí)可解？
奧沙利文和哈維花了數(shù)年時(shí)間，試圖開(kāi)發(fā)一個(gè)可以揭露所有這些數(shù)據(jù)使用情況的工具，實(shí)際的過(guò)程比他們預(yù)料的要困難。

他們想要使用某人的照片，來(lái)立即告訴那個(gè)人ta的臉被包含在各種數(shù)據(jù)集的次數(shù)。

但他們擔(dān)心，這種工具可能會(huì)被其他組織用在不好的地方。

「潛在的危害似乎很大」，奧沙利文說(shuō)。

值得一提的是，奧沙利文還是幫助企業(yè)管理AI技術(shù)使用的紐約公司Responsible.AI的副總裁。

最后，他們被迫限制了人們搜索該工具的方式以及搜索提供的結(jié)果。結(jié)果是，這個(gè)工具并不像他們希望的那樣有效。

Exposing.AI本身并不使用面部識(shí)別技術(shù)。只有當(dāng)你提供了可以在線指向該照片的方式——比如一個(gè)互聯(lián)網(wǎng)地址，它才能實(shí)現(xiàn)照片的精確定位。

此外，人們只能搜索發(fā)布在Flickr上的照片：他們需要Flickr的用戶(hù)名、標(biāo)簽或網(wǎng)絡(luò)地址來(lái)識(shí)別這些照片。

研究人員表示，這一舉措是為了加強(qiáng)安全和隱私保護(hù)能力。

雖然限制了該工具的用途，但它的效果仍然讓人大開(kāi)眼界：

Flickr上的圖片構(gòu)成了大量的面部識(shí)別數(shù)據(jù)集，這些數(shù)據(jù)集已經(jīng)在互聯(lián)網(wǎng)上廣泛流傳，其中就包括MegaFace。

使用Exposing.AI 找到與自己有聯(lián)系的照片并不難：只需要在舊郵件中搜索Flickr鏈接，就能找到被用于MegaFace和其他面部識(shí)別數(shù)據(jù)集的照片。

通過(guò)這個(gè)工具，蓋勒對(duì)他所發(fā)現(xiàn)的情況感到特別不安，因?yàn)樗?jīng)認(rèn)為。互聯(lián)網(wǎng)上的信息自由流動(dòng)是一件積極的事情，而他使用Flickr，是因?yàn)槠渌耸褂盟掌臋?quán)利是受到知識(shí)共享許可限制的。

「我現(xiàn)在正經(jīng)歷著這些后果」，他說(shuō)。

他的希望——也是奧沙利文女士和哈維先生的希望——是公司和政府會(huì)制定新的規(guī)范、政策和法律，來(lái)防止個(gè)人數(shù)據(jù)被大量收集。

此外，蓋勒正在制作一部記載他的蜜月照片漫長(zhǎng)、曲折、令人不安的「流傳歷程」的紀(jì)錄片，來(lái)揭示這個(gè)私人數(shù)據(jù)被濫用的問(wèn)題。

參考鏈接：

https://www.nytimes.com/2021/01/31/technology/facial-recognition-photo-tool.html?referringSource=articleShare

責(zé)任編輯：梁菲來(lái)源：新智元