“网络抓取”或“网络收集”(使用自动“机器人”或“蜘蛛”从可公开获得的网站中提取大量数据的做法)占 18%的网站访问者和23%的所有互联网访问量 在2013年。以刮板为目标的网站可能会因以下原因而受到损害:带宽使用量增加,网络崩溃,使用反垃圾邮件和过滤技术的需求,用户投诉,声誉受损以及刮板时可能产生的缓解成本垃圾邮件用户,或更糟糕的是,窃取其个人数据。

尽管有时很难战斗,但抓地相当容易执行。一个简单的在线搜索将返回大量的抓取程序,两者 所有权开源的, 以及 D.I.Y.教程。当然,在某些情况下刮擦可能是有益的。资源有限的公司可能会使用抓取来访问大量数据,从而刺激创新并允许此类公司识别并满足消费者需求领域。例如, Mint.com 据说 二手筛刮 汇总银行网站上的信息,使用户可以跟踪他们的支出和财务状况。不幸的是,并非所有刮板都能永久发挥其作用。在一种情况下,我们 先前报告,网站的运营商 Jerk.com 据称,他们从Facebook抓取了个人信息,以创建个人资料,将人标记为“混蛋”或“不是混蛋”。根据 联邦贸易委员会 (FTC),包括儿童在内的超过7300万受害者被错误地告知,他们可以通过在网站上支付30美元来修改个人资料。

网站运营商已对刮板提出了各种索赔,包括 版权主张, 侵犯动产索赔合同要求 根据有关刮板违反网站使用条款的指控。但是,本文重点介绍网站运营商用于打击抓取的另一工具:联邦 计算机欺诈和滥用法 (CFAA)。

CFAA对“任何……未经授权有意访问计算机或超出授权访问权限,因此可以从任何受保护的计算机中获取……信息。” CFAA主要是一项刑事法规,但它还规定了民事补救措施,使原告在任何一年内因违反《美国联邦法规》而遭受的总损失超过5,000美元。 CFAA。对于声称CFAA要求刮板的大型网站运营商而言,5000美元的损害赔偿要求并未被证明是克服困难的障碍。例如,在 CollegeSource,Inc.诉AcademyOne,Inc.。,宾夕法尼亚州东区地方法院发现,原告对被告网站进行内部调查,聘请计算机专家分析被告行动范围以及实施增加的安全措施的成本远远超过5,000美元。同样,在 Facebook公司诉Power Ventures公司,加利福尼亚北区地方法院发现,原告针对被告的特定行为而支出的费用,包括三到四天的工程时间,75,000美元的外部顾问费用以及至少应对60,000例诉讼的费用。被告发送的垃圾邮件远远超过了法定阈值。更为棘手的问题是,刮削是否完全违反了CFAA。

CFAA最初旨在作为一项反黑客法规,并且将其应用于抓取(毕竟,通常涉及在可公开访问的网站上访问可公开获得的数据)并不总是已成定局。当抓取工具在可公开访问的网站上收集可公开访问的数据时,是否会“未经授权”访问网站或“超出授权访问权限”?原告经常争辩说,由于网站的在线使用条款禁止抓取和/或禁止抓取者使用其收集的数据,因此抓取者未经授权就采取行动。如下所述,在某些情况下,此类主张已获得成功,但法院在其他报废案件中不愿发现违反CFAA的意愿。

Cvent,Inc.诉Eventbrite,Cvent起诉Eventbrite,要求其抓取Cvent网站以获得场地信息,并使用Eventbrite的“场地目录”中的信息。 Cvent声称这违反了CFAA,因为Cvent的使用条款明确指出此类活动是未经授权的。弗吉尼亚州东区地方法院认为,Eventbrite的行为并不构成违反CFAA的“黑客行为”,因为该信息是公开可用的; Cvent的网站不需要任何登录名,密码或其他个性化访问权限;而且Cvent的使用条款很难找到。因此,法院批准了Eventbrite的驳回动议,认为Eventbrite被授权访问Cvent网站上的信息,并且仅因Eventbrite不当地使用该信息而被指控并不能根据CFAA获得救济。

电力企业,被告 Facebook公司诉Power Ventures公司,运营了一个社交媒体帐户集成网站。作为获得新会员的促销活动的一部分,Power Ventures为用户提供了他们的Facebook朋友列表,Power Ventures通过抓取Facebook网站获得了该列表,并要求用户选择朋友邀请使用Power Ventures网站。 Facebook通知Power Ventures,其访问未经授权,并阻止了Power Ventures的IP地址。但是,Power Ventures的抓取技术旨在规避此类技术措施,因此继续进行抓取。加利福尼亚北区地方法院裁定,Power Ventures未经授权访问Facebook,并违反了CFAA,因此,就CFAA的索赔对Facebook做出了简易判决。

CollegeSource,原告 CollegeSource,Inc.诉AcademyOne,Inc.。,以PDF格式保存了大学课程目录的存档,并提供了名为CataLink的超链接服务,这两种服务都可供付费订户使用。 CollegeSource的订户AcademyOne聘请第三方直接从大学网站下载大学目录,以编译课程描述数据库。但是,第三方通过CataLink从CollegeSource复制了一些PDF文档。 AcademyOne收到CollegeSource发出的终止通知后,从系统中删除了CollegeSource文档,但CollegeSource仍然对AcademyOne提出了许多索赔要求,其中包括CFAA提出的索赔,其依据是AcademyOne未经授权访问了文档并超出了授权的访问权限。但是,法院裁定,AcademicOne未经授权不会访问这些文件,因为这些文件可供公众使用。 CollegeSource关于AcademyOne超出授权访问权的说法是基于AcademyOne违反CollegeSource使用条款的指控。法院承认,在某些情况下,访问网站违反适用的使用条款是为了支持CFAA索赔,但是,CollegeSource在此提出的论点对此没有说服力,因为CollegeSource的订购协议并不涵盖CataLink。因此,法院批准了关于CFAA索赔的AcademyOne简易判决。

Craigslist 在c.诉3Taps 在c.,据称3Taps抓取了Craigslist的网站,并在其自己的网站craiggers.com上重新发布了Craigslist广告。作为回应,Craigslist向3Taps发送了终止通知,并终止了3Taps出于任何目的访问Craigslist网站的授权,并重新配置了该网站以阻止3Taps。据称3Taps通过使用不同的IP地址和代理服务器隐藏其身份继续其抓取活动时,Craigslist提出了CFAA的诉讼。尽管Craigslist的网站是公开可用的,但加利福尼亚北区地方法院拒绝批准3Taps提出的驳回CFAA要求的动议。根据法院的说法,尽管Craigslist可能已向世界授予了访问其网站的权限,但它保留了逐案撤销该权限的权力,即在发送终止和终止函并阻止3Taps的访问权时行使的权力。 知识产权 地址。因此,3Taps的继续访问未经授权。法院还驳回了3Taps援引第九巡回法院的裁决的尝试。 美国诉Nosal。在 Nosal,第九巡回法庭裁定,如果员工最初有权访问雇主的计算机系统,则其违反雇主政策的信息使用并不构成CFAA违反。但是,3Tap法院的结论是,“完全禁止用户访问网站的演算是不同的”,就像3Taps一样。

菲德拉(Fidlar),原告 菲德拉 Technologies诉LPS Real Estate Data Solutions,Inc.,向政府机构(例如县职员办公室)提供其Laredo计划,后者使用Laredo来提供公共记录,以便通过Internet查看。 Laredo阻止用户下载或以电子方式捕获他们查看的文档。需要公共记录副本的用户必须向县支付打印费。 LPS是一家房地产分析公司,与许多县签有合同,可使用Laredo访问其公共记录,但使用了一种抓取程序以电子方式捕获文档而无需支付任何费用。 菲德拉起诉LPS违反CFAA的第1030(a)(5)(A)条,该条对“……明知导致程序,代码或命令的传输,结果……”的任何人施加责任。擅自对受保护的计算机造成损坏。”伊利诺伊州中部地区法院驳回了LPS驳回CFAA索赔的动议,认为菲德拉(Fidlar)的申诉正确地声称LPS采取了故意的行动,除其他破坏因素外,这损害了Laredo的完整性。

鉴于上述情况,原告似乎很可能会成功主张CFAA对刮板的索赔,因为他们明确明确地撤销了访问其网站的授权并采取了肯定的措施来阻止刮板,例如 3Taps 电力企业。相反,当刮板在撤消访问权限后停止刮板并采取补救措施时,例如 CollegeSource,法院可能不太愿意施加CFAA责任。如所见 Cvent,仅违反使用条款,尤其是在刮板可能没有实际使用条款通知的情况下,可能不支持CFAA索赔。抓取工具仅仅是使用软件来更有效地收集公共信息,还是做其他事情(例如避免为信息付费),如 菲德拉-也可能是相关的。无论如何,在一个数据收集成本高昂,拥有价值高昂且获取成本低廉的时代,CFAA得当使用,仍然是打击刮板的可行工具。