亚马逊表示,新模型Amazon Nova Act在多个衡量AI代理智能和能力的基准测试中表现超越OpenAI和Anthropic。在GroundUI Web和ScreenSpot基准测试中,Amazon Nova Act的表现优于Claude 3.7 Sonnet和OpenAI Computer Use Agent。亚马逊计划在AI市场竞争的主要部分是专注于构建代理,而新模型的能力体现了其打造一代能与最佳工具相匹敌的工具的努力。亚马逊AGI SF实验室负责人David Luan表示:“我相信未来计算的基本原子单位将是对巨型[AI]代理的调用。”他此前曾是OpenAI的工程副总裁,并在2024年加入亚马逊,之前共同创立了开发AI代理的初创公司Adept。现在,许多领先的AI实验室都专注于构建越来越强大的AI代理。让AI掌握独立行动和对话的能力将使这一技术变得更有用和更有价值。然而,从对话到行动的转变仍然处于进展之中。在过去的六个月里,OpenAI、Anthropic、谷歌等公司展示了一些能够响应提示采取行动的网页浏览代理。但在大多数情况下,这些代理仍然不可靠,容易受到开放式请求的干扰。Luan表示,亚马逊的目标是构建可靠而非炫目的AI代理。他提到,制约代理发展的不是需要“更多60%有效的酷炫演示”,而是“Waymo问题”,指的是无人驾驶汽车在进军无人驾驶之前需要训练以应对不寻常的边缘案例。许多所谓的代理通过将大型语言模型与多个旨在防止其偏离方向的人为规则结合构建,但这也使其行为变得脆弱。Amazon Nova Act是亚马逊自家最强大模型Amazon Nova的改进版本,经过额外培训以帮助其做出行动决策。Luan表示,AI模型普遍难以决定何时应介入任务。为了提升Nova的代理能力,亚马逊正在使用强化学习,这一方法帮助其他AI模型更好地模拟推理过程。亚马逊的新模型还从物理机器人那里获得灵感。Luan的团队与另一组位于旧金山的亚马逊团队合作,后者由UC伯克利的教授Pieter Abbeel领导,他致力于寻找AI在机器人领域的应用。Abbeel也是早期OpenAI的员工,于2024年8月加入亚马逊,届时亚马逊对他的初创公司Covariant进行了投资。考虑到在其履行中心已经部署的大量机器人,亚马逊在机器人领域的进展前景广阔。Amazon Nova Act的发布暗示亚马逊可能在创造有用软件代理的竞争中脱颖而出。尽管该公司在回应ChatGPT方面较为缓慢,但最近显示了改善的迹象。今年2月,该公司宣布了新版本的语音助手Alexa,提升了对话能力并能够自动化某些网页任务。亚马逊提到的一个用途是,Alexa帮助预订修理服务,比如修理坏掉的烤箱。Luan表示,Alexa的新代理能力是由他的团队开发的。正如WIRED在10月披露的,亚马逊还研究了代理如何可能通过自动化寻找和购买产品的流程来改善电子商务。这样的代理可能根据用户的兴趣和习惯主动将商品添加到用户的购物车中,亚马逊的工程师表示。除了推出新模型外,亚马逊今天还宣布了一款软件开发工具包(SDK),旨在使计算机工程师更易于利用Amazon Nova Act构建软件代理。SDK让开发人员可以为其代理提供具体指令,以帮助其在为人类用户构建的互联网中导航。例如,代理可以被指示“在租车时不要接受保险增值服务”。Luan表示,最终,亚马逊的代理应该聪明到不会轻易上当。他说:“Nova Act实际上是这一愿景的第一步。”
发表回复