网页抓取

最新一期 社交意识 新闻通讯现已发布 这里 .

在本期 社交意识 , 我们的 伯顿奖-关于社交媒体法律和商业的权威指南,我们研究了《计算机欺诈和滥用法》如何打击网页抓取;我们探索Google Glass的发布

“网络抓取”或“网络收集”(使用自动“机器人”或“蜘蛛”从可公开获得的网站中提取大量数据的做法)占 18%的网站访问者和23%的所有互联网访问量 在2013年。以刮板为目标的网站可能会因以下原因而受到损害:带宽使用量增加,网络崩溃,使用反垃圾邮件和过滤技术的需求,用户投诉,声誉受损以及刮板时可能产生的缓解成本垃圾邮件用户,或更糟糕的是,窃取其个人数据。

尽管有时很难战斗,但抓地相当容易执行。一个简单的在线搜索将返回大量的抓取程序,两者 所有权开源的, 以及 D.I.Y.教程。当然,在某些情况下刮擦可能是有益的。资源有限的公司可能会使用抓取来访问大量数据,从而刺激创新并允许此类公司识别并满足消费者需求领域。例如, Mint.com 据说 二手筛刮 汇总银行网站上的信息,使用户可以跟踪他们的支出和财务状况。不幸的是,并非所有刮板都能永久发挥其作用。在一种情况下,我们 先前报告,网站的运营商 Jerk.com 据称,他们从Facebook抓取了个人信息,以创建个人资料,将人标记为“混蛋”或“不是混蛋”。根据 联邦贸易委员会 (FTC),包括儿童在内的超过7300万受害者被错误地告知,他们可以通过在网站上支付30美元来修改个人资料。

网站运营商已对刮板提出了各种索赔,包括 版权主张, 侵犯动产索赔合同要求 根据有关刮板违反网站使用条款的指控。但是,本文重点介绍网站运营商用于打击抓取的另一工具:联邦 计算机欺诈和滥用法 (CFAA)。


继续阅读 数据获取:使用计算机欺诈和滥用法打击网络爬虫