TollBit 是一家总部位于纽约的初创公司,成立仅六个月,其 28 岁的创始人认为我们正生活在人工智能的“Napster 时代”。就像某一代人下载数字音乐一样,公司在不向版权所有者付费的情况下盗取互联网的大片内容。他们希望 TollBit 成为人工智能世界的 iTunes。
“现在有点像狂野西部,”该公司联合创始人兼首席运营官奥利维亚·乔斯林在接受采访时表示。 “我们希望让人工智能公司更容易为他们所需的数据付费。”他们的想法很简单:创建一个市场,将需要获取新鲜、高质量数据的人工智能公司与实际花钱创建数据的出版商联系起来。
事实上,人工智能公司最近才开始向新闻出版商支付他们所需的(部分)数据费用。 OpenAI 在 2022 年底拉开了军备竞赛的序幕,但仅仅一年前,该公司才与美联社签署了众多许可协议中的第一份。同年晚些时候,OpenAI 宣布与德国出版商 Axel Springer 建立合作伙伴关系,该出版商在美国运营Business Insider和Politico 。此后,包括Vox 、金融时报、新闻集团和时代周刊在内的多家出版商已与 OpenAI 和谷歌签署了协议。
但这仍然让无数其他出版商和创作者感到冷落——即使他们愿意,也无法选择达成这个浮士德式的交易。这就是 TollBit 想要瞄准的“长尾”出版商。
TollBit 联合创始人兼首席执行官 Toshit Panigrahi 表示:“强大的人工智能模型已经存在,并且已经接受过训练。” “现在,有数以千计的应用程序正在将这些现有模型下架。他们需要的是新鲜的内容。但现在,没有基础设施——他们既不能购买它,也不能让内容制作者以无缝的方式出售它。”
乔斯林和帕尼格拉希对媒体行业都不是特别了解。但他们都知道在线市场和平台的运作方式——他们是 Toast 的同事,Toast 是一个让餐厅管理账单和预订的平台。帕尼格拉希(Panigrahi)目睹了人工智能领域的交易和诉讼堆积如山,然后致电乔斯林(Joslin)。
他们早期的谈话是关于 RAG,它代表人工智能世界中的检索增强一代。借助 RAG,人工智能模型首先从特定数据库(例如互联网的可抓取部分)查找信息,并使用该信息来综合响应,而不是简单地依赖训练数据。 ChatGPT 等服务不知道当前房价或最新新闻。相反,他们通常通过查看网站来获取数据。由于缺乏新鲜数据,人工智能聊天机器人经常被有关突发新闻事件的查询所困扰——如果它们不抓取最新数据,它们就无法跟上。
“我们认为,将内容用于 RAG 与将其用于培训有本质上的不同,”Panigrahi 说。
据估计,RAG 是搜索引擎的未来。越来越多的人在互联网上提出问题,并期望得到完整的答案,而不是蓝色链接列表。在短短一年多的时间里,像 Perplexity 这样的初创公司在杰西·贝索斯 (Jess Bezos) 和 NVIDIA 等公司的支持下,就已经崭露头角,雄心勃勃地想要挑战谷歌。甚至 OpenAI 也计划有一天让 ChatGPT 成为您的搜索引擎。作为回应,谷歌已迅速采取行动——它现在从搜索结果中剔除相关信息,并将其作为连贯的答案呈现在结果页面的顶部,该功能被称为人工智能概述。 (它并不总是有效,但似乎会一直存在)。
基于 RAG 的搜索引擎的兴起让出版商惊慌失措。毕竟,如果人工智能为我们阅读互联网,谁会赚钱呢?谷歌今年早些时候推出 AI Overviews 后,至少有一份报告估计,出版商将损失超过 20 亿美元的广告收入,因为有理由访问其网站的人越来越少。 “人工智能公司也需要持续获取高质量的内容和数据,”乔斯林说,“但如果你不在这里找到一些经济模型,那么任何人都没有动力去创造内容,那就结束了人工智能应用程序也是如此。”
TollBit 的模式不是削减一次性支票,而是旨在持续向出版商提供补偿。假设,如果某人的内容被用于一千个人工智能生成的答案中,他们将按照他们设定的价格获得一千倍的报酬,并且可以随时更改该价格。
每次人工智能公司通过 TollBit 访问出版商的新数据时,它都可以支付出版商设定的一小笔费用,Panigrahi 和 Joslin 认为该费用应该大致相当于传统页面浏览量给出版商带来的费用。该平台还可以阻止未注册的人工智能公司访问出版商的数据。
到目前为止,自 2 月份 TollBit 推出以来,创始人声称已与 100 家出版商合作,并与 3 家人工智能公司进行试点。他们以保密条款为由,拒绝透露迄今为止哪些出版商或人工智能公司已经签署,但没有否认与 OpenAI、Anthropic、谷歌和 Meta 进行了交谈。他们表示,到目前为止,人工智能公司和其平台上的出版商之间还没有资金易手。
在此之前,他们的模型仍然是一个巨大的假设——尽管投资者迄今已向该模型投入了 700 万美元。 Joslin 声称,TollBit 的投资者包括 Sunflower Capital、Lerer Hippeau、Operator Collective、AIX 和 Liquid 2 Ventures,更多投资者目前正在“敲门”。今年 4 月,TollBit 还聘请了坎贝尔·布朗 (Campbell Brown) 担任高级顾问,坎贝尔·布朗曾是一名电视主播,曾在过去十年的大部分时间里担任 Meta 的新闻合作主管。
尽管发生了一些引人注目的诉讼,人工智能公司仍在免费抓取互联网,并且基本上侥幸逃脱惩罚。为什么他们有动力向出版商实际支付这些数据费用?创始人表示,有三大原因:自从生成式人工智能成为主流以来,越来越多的网站正在采取措施防止其内容被抓取,这意味着抓取网络变得越来越困难和昂贵;没有人愿意处理正在进行的版权诉讼;而且,至关重要的是,能够根据需要轻松支付内容费用,让人工智能公司能够进入更小、更小众的出版物,因为不可能与每个网站达成单独的许可协议。 Joslin 还指出,多个 TollBit 投资者也投资了人工智能公司,他们担心这些公司可能因未经许可使用内容而面临诉讼。
让人工智能公司为内容付费不仅可以为大型出版商提供经常性收入来源,还可以为任何在线发布任何内容的人提供经常性收入来源。上个月,Perplexity 被指控非法窃取《福布斯》 、 《连线》和《康泰纳仕》的内容,推出了一项出版商计划,根据该计划,如果它使用出版商的内容通过人工智能生成答案,它计划与出版商分享其收入的一部分。 。然而,该计划的成功取决于 Perplexity 今年晚些时候在应用程序中引入广告时能赚多少钱。与 Tollbit 一样,这完全是另一个假设。
“我们与 TollBit 的论点是,如果你今天失去了页面浏览量,你应该立即得到补偿,而不是在科技公司制定出其广告计划几年后,”Panigrahi 在谈到 Perplexity 的计划时说道。
尽管存在所有现有的许可协议和技术进步,人工智能驱动的聊天机器人仍然会产生可怕的新闻来源。他们仍然编造事实,并自信地想象出与实际不存在的故事的完整链接。但科技公司现在正在尽可能地将人工智能聊天机器人塞进每一个缝隙中,这意味着在不久的将来,许多人仍会从这些产品中获取新闻。
对 TollBit 前提的更愤世嫉俗的看法是,这家初创公司实际上是在向出版商提供封口费,而这些出版商的作品很可能会被误导为错误信息。它的创始人自然不同意这种描述。 “我们对我们加入的人工智能合作伙伴非常谨慎,”帕尼格拉希说。 “这些公司非常注重输入材料的质量和响应的正确性。我们发现,为内容付费——即使是象征性的金额——会激励人们尊重系统的原始输入,而不是将其视为免费的、可替代的商品。”
版权声明
本文为本站原创内容,转载需注明文章来源(https://www.eiefun.com),另:文中部分素材可能会引用自其他平台,如有侵权或其它,请联系 admin@eiefun.com,我们会第一时间配合删除