Reddit CEO吐槽封闭必应等搜索引擎太费事微软等公司总想着白嫖数据

08-27 901阅读 1评论

文章最后更新时间：2024年08月29日

早前闻名网络社区 Reddit 现已封禁除谷歌以外的一切查找引擎，也便是只允许谷歌持续抓取 Reddit 上的内容并将其编入索引，原因很简单：谷歌每年向 Reddit 付出 6,000 万美元取得内容授权，能够抓取这些内容用来练习人工智能。

而其他查找引擎开发商不愿意付出费用因而天然会被封禁，其时微软必应查找主管还表明早在 2023 年 9 月必应就为一切网站供给了抓取控件，该控件能够用来操控必应查找的抓取状况。

不过随后微软必应主管仍是泄漏 Reddit 的确现已屏蔽必应查找的爬虫和其他数据，这不只影响必应查找获取 Reddit 上的内容，也影响其他根据必应查找的查找引擎例如 DuckDuckGo 等。

因而现在用户经过必应和 DuckDuckGo 等无法查找到 Reddit 上的内容，只能切换成谷歌查找后才能从查找引擎上找到 Reddit 论坛上更多有用的或许最新帖子、谈论。

Reddit 首席执行官史蒂夫霍夫曼日前在承受采访时泄漏了封禁这些查找引擎的原因：

微软现已从 Reddit 获取数据并将这些数据用于人工智能模型的练习，一起「在不知情的状况下」将 Reddit 的内容编入必应查找中。

别的两家人工智能开发商 Anthropic (主要产品是 Claude) 和 Perplexity (主要产品是同名 AI 查找引擎) 也经过 Reddit 上的数据练习他们的体系。

微软、Anthropic 和 Perplexity 都体现得如同互联网上的一切内容都能够免费供他们运用，这才是他们真实的态度。

霍夫曼还表明封闭这些公司实在太费事了，他认为查找引擎从网站获取内容并不供给任何补偿的传统状况正在产生改动，即抓取内容以繁荣流量的价值正在变得含糊。

传统形式中查找引擎索引网站内容并在用户查找时出现，查找引擎能够为网站带来流量并转化为收益，而现在查找引擎则是抓取数据用来练习模型，所以霍夫曼觉得这现已不是等价交换了。

别的还有音讯称微软等公司都现已牧场回绝与 Reddit 进行内容授权商洽，即使查找引擎现已被 Reddit 封禁他们也不会向该论坛付出任何费用繁荣解禁或购买内容数据。

文章版权声明：除非注明，否则均为ZBLOG原创文章，转载或复制请以超链接形式并注明出处。

相关阅读

发表评论取消回复

评论列表（有 1 条评论，901人围观）

我来抓人了 V 游客沙发

体系。微软、Anthropic 和 Perplexity 都体现得如同互联网上的一切内容都能够免费供他们运用，这才是他们真实的态度。霍夫曼还表明封闭这些公司实在太费事了，他认为查找引擎从网站获取内

08-30 回复