我们有一个网站的想法是与一些特定的文件相关的。 我们要做的就是抓取所有的网页并获取一些特定的文件,正如你猜测的那样,把它们放在CDN中。 有些文件可能是受版权保护的资料,因为有很多开放网站托pipe受版权保护的资料。 我们可能在100万个文件中拥有4万到5万个版权材料。 如果我们收到任何投诉,我们会在一个工作日内删除相关资料。
但是,您认为在此期间CDN可能会删除我们的所有文件? 您可能知道,如果您拥有受版权保护的资料,许多公司直接向托pipe这些文件的数据中心投诉,以给业主造成额外的压力。 有时数据中心closures服务器而不给予任何通知。 我们将是一个完全合法的业务,但实际上不可能检测版权材料。
这个项目仍然是一个想法,但我们希望预见潜在的问题。 你怎么看? 创build我们自己的存储解决scheme最好吗?
编辑:我想我不能说清楚。 它是谷歌或雅虎或冰%100相同。 我们只是一个专注的search引擎。 谷歌已经索引这些types的文件。 所以这没有问题。 然而,我的问题是,谷歌正在删除这些types的文件,如果他们得到的投诉,但他们没有任何努力,以防止索引文件,因为实际上谷歌也不可能。 重点是,谷歌是一个巨人,所以他们没有问题。 但是,小公司可能会有麻烦。 如果我们与欧洲的本地数据中心合作,我们就没有任何问题,因为我们已经与他们build立了良好的关系(我们不时为不同的项目租用数百台服务器)。然而,我们与任何CDN没有任何关系不要试图build立一个全球性的项目。 无论如何,我想现在更清楚了。
谢谢,
尤里,这似乎是我可以提供的最相关的信息: http : //www.chillingeffects.org/dmca512/faq.cgi
基本上,如果您托pipe在美国外,您可以构build您的系统,以便您受到DMCA安全港条款的保护。
根据您使用的托pipe服务提供商的不同,如果他们收到有关版权材料的投诉,则会有一些小型帐户被移出并取消。 您可以通过与更大的提供商联系,并事先与他们讨论处理数字千年版权法案请求来缓解这种情况。
您还需要提供清晰的“报告版权内容”path,供访问者向您报告DMCA违规行为。 这将减less用户跳跃链接并与您的提供商交谈的人数。
我们将是一个完全合法的业务
不,你不会。 你在互联网上窃取他人的工作,并想知道会出现什么问题。 让我们看看,有可能的诉讼,在极端的情况下,甚至有时候在你的政府的一个假期营地。 不同的地方有不同的法律,但我准备打赌,你在做什么,或者打算做什么,在任何地方都是不合法的。
从字面上来说,你所要做的一切都是来自其作者的版权。 他们如何select许可内容取决于他们,但每件作品都获得版权。
你需要小心。
你用类似的方式来操作,就像Google一样。 我的印象是,Google只是简单地链接到在线资源。 你的问题就像你想要下载和存储你自己的CDN中的第三方资源的副本。
哪个是对的?
因为即使在编辑之后,您仍然拒绝指定“重点”的实际含义,您必须联系CDN提供商才能获得批准。 我最好的猜测是你实际上没有做Google的工作,而且你打算不仅仅caching简单的或高级的文本文件。