网页抓取

社交媒体用户每天都将数百万张图片上传到其帐户;每天仅3.5亿张照片就上传到Facebook。许多社交媒体网站都通过网络浏览器向任何人提供用户的信息和图像。社交媒体上可用的大量公共信息非常有价值,并且网络抓取(第三方使用漫游器从网站上抓取公共信息以将信息货币化)的做法越来越普遍。

社交媒体网站上的照片引起了棘手的问题,因为它们包含了个人的生物识别数据,这是一种基本不变且高度个人化的数据。由于高度关注隐私问题,技术公司长期以来一直认为收集,分析和销售生物识别数据是禁忌,至少在Clearview AI推出其面部识别软件之前。

Clearview AI的面部识别数据库

2016年,名为Hoan Ton-That的开发人员开始创建面部识别算法。 2017年,在完善算法之后,Ton-That与他的商业伙伴Richard Schwartz(Rudy Giuliani的前顾问)一起创立了Clearview AI,并开始向执法机构推销其面部识别软件。据报道,Clearview AI使用从社交媒体网站(包括Facebook,YouTube,Twitter和Venmo以及许多其他网站)抓取的公开可用图片填充其照片数据库。 纽约时报 报告称,该数据库已积累了超过30亿张图像。
继续阅读 Clearview AI和面部识别数据库面临的法律挑战