值得信赖的区块链资讯!
比推数据  |  比推终端  |  比推英文  |  比推 APP  | 

下载比推 APP

值得信赖的区块链资讯!
iPhone
Android

AI代理开始帮你搞钱了,但难点是…

BitpushNews

作者:Vaidik Mandloi

原标题:Know Your Agent

编译及整理:BitpushNews


AI代理将改变互联网格局的承诺正逐渐成为现实。它们已超越聊天窗口中的实验性工具,成为我们日常运营中不可或缺的一部分——从清理收件箱、安排会议到回复支持工单,它们正在悄无声息地提升生产力,而这种改变往往被人们所忽视。

然而,这种增长并非只是传闻。

到2025年,自动流量已超越人类流量,占网络总活动的51%。仅美国零售网站的AI驱动流量就同比增长了4700%。AI代理现在正跨系统运行,许多代理能够访问数据、触发工作流,甚至发起交易。

然而,对完全自主代理的信任度在一年内从43%降至22%,这在很大程度上源于不断攀升的安全事件。近一半的企业仍在使用共享API密钥对代理进行身份验证,而这种方法从未设计用于让自主系统转移价值或独立行动。

问题在于:代理的扩展速度超过了旨在治理它们的基础设施。

作为回应,全新的协议层正在涌现。稳定币、卡网络集成以及像x402这样的代理原生标准,正在实现机器发起的交易。同时,新的身份和验证层也在开发中,以帮助代理在结构化环境中识别自身并进行操作。

但实现支付并不等同于实现经济。因为一旦代理可以转移价值,更根本的问题就会浮现:它们如何以机器可读的方式发现合适的服务?它们如何证明身份和授权?我们如何验证它们声称执行的操作确实发生了?

本文将探讨代理驱动经济大规模运行所需的基础设施,并评估这些层级是否足够成熟,以支持以机器速度运行的持久、自主参与者。

代理无法购买它们看不见的东西

在代理为服务付费之前,它必须先找到该服务。这听起来很简单,但却是目前摩擦力最大的地方。

互联网是为人类阅读页面而构建的。当人类搜索内容时,搜索引擎返回排名链接。这些页面针对说服力进行了优化。它们充满了布局、追踪器、广告、导航栏和风格元素,这些对人有意义,但对机器来说主要是“噪音”。

当代理请求相同的页面时,它接收的是原始 HTML。一篇典型的博客文章或产品页面以这种形式可能需要大约 16,000 个 token。当转换为干净的 Markdown 文件时,token 计数会降至约 3,000 个。这意味着模型必须处理的内容减少了 80%。对于单次请求,这种差异可能无关紧要。但当代理跨多个服务发出数千次此类请求时,过多的处理会复合转化为延迟、成本和更高的推理复杂度。

image.png

@Cloudflare

代理最终花费了大量的计算精力来剥离界面元素,然后才能访问采取行动所需的核心信息。这种努力并没有提高输出质量,它只是在补偿一个从未为它们设计的网络。

随着代理驱动流量的增长,这种低效变得更加明显。零售和软件网站的 AI 驱动爬取在过去一年中大幅增加,目前已占网络总活动的大部分。

与此同时,约 79% 的主要新闻和内容网站至少屏蔽了一个 AI 爬虫。从它们的角度来看,这种反应是可以理解的。代理提取内容时不会与广告、订阅或传统的转化漏斗互动。屏蔽它们是为了保护收入。

问题在于,网络没有可靠的方法来区分恶意的抓取程序和合法的采购代理。 两者都表现为自动流量,都源自云基础设施。对系统而言,它们看起来一模一样。

更深层次的问题是,代理并不是在尝试“消费”页面,它们是在尝试发现行动的可能性。

当人类搜索“500 美元以下的机票”时,一个排名链接列表就足够了。人可以比较选项并做出决定。当代理收到相同的指令时,它需要完全不同的东西。它需要知道哪些服务接受预订请求、需要什么输入格式、价格如何计算以及支付是否可以程序化结算。极少有服务能清晰地公开这些信息。

image.png

@TowardsAI

这就是为什么对话正在从搜索引擎优化(SEO)转向代理导向的可发现性(Agent-Oriented Discoverability),通常被称为 AEO。如果最终用户是代理,那么在搜索页面上的排名就变得不那么重要了。重要的是服务是否能以代理无需猜测即可解读的方式描述其能力。如果不能,它就有可能在不断增长的经济活动份额中变得“隐形”。

代理需要身份

image.png

@Hackernoon

一旦代理能够发现服务并发起交易,下一个主要问题就是让另一端的系统知道它在与谁打交道。换句话说:身份。

如今的金融系统运行的机器身份远多于人类身份。在金融领域,非人类身份与人类身份的比例约为 96 比 1。API、服务账户、自动化脚本和内部代理主导着机构基础设施。它们中的大多数从未被设计为对资本拥有裁量权。它们执行预定义的指令,不能谈判、选择供应商或在开放网络上发起支付。

自主代理改变了这一边界。如果一个代理可以直接移动稳定币或触发结账流程而无需手动确认,核心问题就从“它能支付吗?”转变为“谁授权它支付?”

这就是身份变得基础的地方,“了解你的代理”(Know Your Agent)的概念由此成型。

正如金融机构在允许客户交易前会进行核实一样,与自主代理互动的服务在授予资本访问权限或敏感操作之前,必须验证三件事:

  1. 加密真实性: 这个代理是否真的控制着它声称使用的密钥?

  2. 委托权限: 谁授予了这个代理权限,其限制是什么?

  3. 现实世界关联: 该代理是否与具有法律责任的实体挂钩?

这些检查共同构成了身份栈:

  • 底层是加密密钥生成和签名。诸如 ERC-8004 之类的标准试图正式化代理如何在可验证的链上注册表中锚定身份。

  • 中间层是身份提供者层。这将密钥连接到现实世界的实体,如注册公司、金融机构或经过验证的个人。没有这种绑定,签名只能证明控制权,而不能证明问责制。

  • 边缘层是验证基础设施。支付处理器、CDN 或应用服务器实时验证签名、检查相关凭证并执行权限边界。Visa 的信任代理协议(Trusted Agent Protocol)是许可商务的一个例子,它允许商户验证代理是否被授权代表特定用户进行交易。Stripe 的代理商务协议(ACP)正在将类似的检查推向可编程结账和稳定币流。

与此同时,由 Google 和 Shopify 领导的通用商务协议(UCP)允许商户发布代理可以发现并谈判的“能力清单”。它充当编排层,预计将集成到 Google 搜索和 Gemini 中。

image.png

@FintechBrainfood

重要的细微差别在于,无许可和许可系统将共存。

在公共区块链上,代理可以在没有中心化门槛的情况下进行交易。这提高了速度和可组合性,但也加剧了合规压力。StripeBridge 的收购凸显了这种张力。稳定币实现了即时跨境转账,但合规义务并不会因为结算发生在链上而消失。

这种张力不可避免地将监管机构卷入其中。一旦自主代理能够在没有直接人工监督的情况下发起金融交易并与市场互动,问责制问题就变得不可回避。金融系统不能允许资本通过未识别或未授权的行为者流动,即使这些行为者是软件片段。

监管框架已经在被采纳。《科罗拉多州 AI 法案》于 2026 年 2 月 1 日生效,为高风险自动化系统引入了问责制要求,全球范围内类似的立法也在推进。随着代理开始大规模执行金融决策,身份将不再是可选的。如果说发现性让代理可见,那么身份就是让它们被认可的凭证。

验证代理的执行与声誉

一旦代理开始执行涉及金钱、合同或敏感信息的任务,仅仅拥有身份可能还不够。一个经过验证的代理仍然可能产生幻觉、歪曲其工作、泄露信息或表现不佳。

因此,最重要的问题是:能否证明代理确实完成了它所声称的工作?

如果一个代理声明它分析了 1,000 份文件、检测到了欺诈模式或执行了交易策略,必须有一种方法来验证这种计算确实发生了,并且输出没有被伪造或损坏。为此,我们需要一个性能层来实现这一点。

目前有三种方法可以实现:

  1. TEEs(可信执行环境): 第一种方法依赖于通过 AWS Nitro 和 Intel SGX 等硬件进行的证明。在这种模式下,代理在安全飞地(Enclave)内运行,该飞地发布加密证书,确认特定代码在特定数据上执行且未被篡改。开销通常较小(约 5-10% 的额外延迟),对于诚信高于速度的金融和企业级用例来说,这是可以接受的。

  2. ZKML(零知识机器学习): 第二种方法是数学方法。ZKML 使代理能够生成加密证明,证明输出是由特定模型产生的,而无需泄露模型权重或私有输入。Lagrange Labs 的 DeepProve-1 最近演示了 GPT-2 推理的全零知识证明,速度比之前的方法快 54-158 倍。

  3. 再质押安全性(Restake Security): 第三种模型通过经济手段而非计算手段强制执行正确性。诸如 EigenLayer 之类的协议引入了基于质押的安全性,验证者在代理的输出背后质押资本。如果输出被质疑并证明为假,质押物将被扣除(Slashing)。系统不证明每次计算,而是让不诚实行为在经济上变得不合理。

这些机制从不同角度解决了同一个问题。然而,执行证明是偶发性的。它们验证单一任务,但市场需要累积性的东西。这就是声誉变得至关重要的地方。

声誉将孤立的证明转化为长期的性能历史。新兴系统旨在使代理性能具有便携性和加密锚定,而不是依赖于平台特定的评价或不透明的内部仪表板。

以太坊证明服务(EAS)允许用户或服务发布关于代理行为的已签名、链上证明。一次成功的任务完成、一次准确的预测或一笔合规交易都可以以防篡改的方式记录下来,并随代理跨应用移动。

image.png

@EAS

竞争性基准测试环境也在形成。代理竞技场(Agent Arenas)根据标准化任务评估代理,并使用 Elo 等评分系统进行排名。Recall Network 报告称,超过 11 万名参与者生成了 588 万份预测,创造了可衡量的性能数据。随着这些系统的扩展,它们开始类似于 AI 代理的真实评级市场。

image.png

这使得声誉可以跨平台携带。

在传统金融中,像穆迪(Moody’s)这样的机构对债券进行评级以发出信用信号。代理经济将需要一个等效层来对非人类行为者进行评级。市场需要评估一个代理是否足够可靠以委托资本,其输出是否具有统计一致性,以及其行为是否能长期保持稳定。

结论

随着代理开始拥有真正的权威,市场将需要一种明确的方法来衡量其可靠性。代理将携带基于验证执行和基准测试的便携式性能记录,评分会随质量下降而调整,权限可追溯到明确的授权。保险商、商户和合规系统将依赖这些数据来决定哪些代理可以访问资本、数据或受监管的工作流。

总而言之,这些层级开始构成代理经济的基础设施:

  1. 可发现性(Discoverability): 代理必须能够以机器可读的方式发现服务,否则无法找到机会。

  2. 身份(Identity): 代理必须证明自己是谁以及谁授权了它,否则无法进入系统。

  3. 声誉(Reputation): 代理必须建立可验证的记录,证明其值得信赖,从而赢得持续的经济信任。


Twitter:https://twitter.com/BitpushNewsCN

比推 TG 交流群:https://t.me/BitPushCommunity

比推 TG 订阅: https://t.me/bitpush

说明: 比推所有文章只代表作者观点,不构成投资建议

比推快讯

更多 >>

下载比推 APP

24 小时追踪区块链行业资讯、热点头条、事实报道、深度洞察。

邮件订阅

金融科技决策者们都在看的区块链简报与深度分析,「比推」帮你划重点。