
我们发现自己处于从大型语言模型中引入具有数字互动的人类代理商的楼梯。但…
…在商业实施方面发生了变化,焦点移动表格AI代理支持代理工作流/数据综合。
但是,Salesforce和Service这样的公司对AI代理人制造了硬枢轴,但是,AI代理商的鲜明现实是,从准确性方面,该技术并不是应有的位置。
如果人们看到了营销大肆宣传,并且有AI代理的伟大原型和演示,它们的准确性尚不适合生产。
𝗖𝗹𝗮𝘂𝗱𝗲𝗔𝗜𝗖𝗼𝗺𝗽𝘂𝘁𝗲𝗿(𝗔𝗖𝗜)的表现为人类绩效的14%。
下面的图表表明,AI代理在成本,步骤和成功率方面位于位置。请注意,成功率的时间约为20%。
这些数字是当前情况的鲜明现实。

随着OpenAI操作员的最新发布,计算机使用和Web浏览器的使用精度达到了30%至50%,但这仍然落后于70%以上的人类能力。

并补充说,还有一些有趣的研究,该研究是关于使用网络浏览的AI代理如何容易受到邪恶弹出式攻击的猎物。
AI特工有两种途径可以执行像人类这样的任务。一个是通过Web浏览器( WebVoyager,OpenAI操作员等) 。第二个是通过OS的完整GUI(拟人)。
这些方法利用GUI作为AI代理的API。
初始方法着眼于使用单个API,但是由于开发每个API集成的开销,这是不切实际的。另外,对于许多商业应用,没有API。
每个人都同意现代知识工作被打破了,并说明了各种数字。其中一份报告说,工人花费了30%的时间来寻找信息。
知识工作者在回答复杂问题并需要综合各种文档中的信息方面也面临着挑战。
代理工作流程(如下图所示)允许将复杂的任务推理和分解为更简单的子任务,并以序列将这些任务链接在一起。

通过执行此序列,引入了可观察性,可检查性和可发现性等元素。
数据的综合将变得越来越重要。知识工作者的代理工作流程就是这样的示例,可以将工作数据和资源综合为一个一个答案。
语言模型提供商仅仅远离提供模型。但也扩展到用户体验。 ChatGpt中的深入研究不是一个新模型,而是Chatgpt中的新代理能力,该能力在Internet上进行了多步研究,以进行复杂的任务。它在数十分钟内完成了数十分钟的时间。
这也是一个很好的例子,说明如何合成不同的数据来源来回答用户问题。
我觉得这是Llamaindex创造的东西,即代理抹布的概念,其中的概念是,在特定时间点为“一个人”的“观众”综合数据将变得重要。
在接下来的几个月中,将非常关注个人代理工作流,信息综合,您可以称为桌面编排。
现代AI模型越来越多地将推理纳入核心功能,使它们能够通过将它们分解为可管理的组件来解决复杂问题。

这种转变的基础是一种创新的方法,该方法涉及将问题分解为较小的子集,从而使模型可以系统地解决每个部分。
通过将推理视为一种内部机制,这些模型可以模拟类似人类的思维过程,从而增强其提供准确和细微的响应的能力。
分解策略不仅提高了解决问题的效率,还提高了在得出的结论方面提高透明度。
结果,用户受益于更容易解释的产出,从而弥合了高级计算和可理解的决策之间的差距。
最初,用户必须在其提示中包括推理特征,指导模型如何推理并分解复合或复合任务。并通过几个节目的方法给出示例,以供模型效仿。
组织必须将重点从固定在特定工具或趋势上的重点转变,例如那些曾经将自己贴上抹布公司的人,促使工程游乐场等等,而优先解决现实世界中的业务挑战。
世界正在以前所未有的速度前进,几乎每天都会出现新技术,每个技术都有承诺彻底改变行业。
但是,创新的真正衡量标准在于掌握最新技术,而是应用这些进步来创造有形价值。
无论是改善客户体验,简化运营还是满足社会需求,问题仍然存在,我们如何利用技术来提供有意义的解决方案?
通过采用这种思维方式,企业可以自我防止,并确保在不断变化的进步潮流中保持相关性。

首席传教士@ kore.ai |我热衷于探索AI和语言的交集。从语言模型,AI代理到代理应用,开发框架和以数据为中心的生产力工具,我分享了这些技术如何塑造未来的见解和想法。

Cobus Greyling
AI遇到语言的地方|语言模型,AI代理,代理应用,开发框架和以数据为中心…
www.cobusgreyling.com
版权声明
本文为本站原创内容,转载需注明文章来源(https://www.eiefun.com),另:文中部分素材可能会引用自其他平台,如有侵权或其它,请联系 admin@eiefun.com,我们会第一时间配合删除