资讯
AI公司发现通过Wayback Machine抓取Reddit的历史数据,既无需遵守Reddit的平台政策(如付费、合规协议),又能获取训练所需的大量内容,于是就利用这一漏洞开始了违规“曲线获取数据”的行为。 Reddit发言人Tim ...
Reddit现已封锁互联网档案馆 (IA)对热门Reddit帖子的索引,原因是发现一些被限制抓取Reddit数据的AI公司,转而从IA的存档内容中抓取数据。 此前,IA的Wayback Machine可靠地存档Reddit页面、用户资料和评论,这是其互联网存档使命的一部分。但今后,只有Reddit首页的截图会被存档。正如The ...
markdown ...
Reddit 发言人在向媒体解释这一变化时表示,这是因为一些 AI 企业以违反平台政策的方式通过互联网档案馆的存档页面抓取该企业数据。Reddit 允许企业付费抓取 AI 所需的数据,但 经由互联网档案馆间接访问显然绕过了这一规定 。
IT之家 8 月 13 日消息,参考外媒 The Verge 当地时间 11 日报道,海外大型社区论坛 Reddit 宣布禁止互联网档案馆 (Internet Archive) 对该论坛非首页的绝大多数页面进行索引存档。Reddit 发言人在向媒体解释这一变化时表示,这是因为一些 AI 企业以违反平台政策的方式通过互联网档案馆的存档页面抓取该企业数据。Reddit ...
当你向AI助手提问“500人远程团队需集成Salesforce的最佳CRM是什么?”时,品牌如何在ChatGPT、Perplexity或谷歌AI生成的答案中脱颖而出?
6 天on MSN
AI变革搜索方式,Reddit意外占据有利位置
由真人分享和整理的Reddit对话内容成为AI模型的重要信息来源,使Reddit在AI机器时代中意外脱颖而出。尽管广告仍是该公司主要收入来源,但AI授权业务也开始为其带来高利润增长。
最初,数据抓取只是业余爱好者的一种边缘策略,如今已演变成一个由商业数据聚合器驱动的、价值数百亿元的复杂生态系统——自动机器人在面向公众的网站上撒下大网,收集价格数据、产品列表、评论等,其速度通常比人类点击“刷新”的速度还要快。如今,这些实体经常绕过传 ...
2025年,谁最可能成为AI时代的中国Reddit,Reddit在过去的2024年算得上是容光焕发。这家创立了近20年的社交平台,去年3月在纽交所完成上 ...
一款小游戏在Reddit上火了。游戏的规则很简单:识别出以假乱真的AI聊天bot。 最近,有一款游戏在Reddit上火了。 名字叫做human or not,规则也非常简单 ...
哈?AI秘密潜入Reddit社区,“操纵”用户观点4个月。离谱的是,人类全程毫无察觉,而且被AI说服改变想法的概率,高达正常基准的6倍Reddit Lies在X上 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果