a16z「2026 年 AI Agent 三大猜测」:输入框的消失,代理使用优先,语音代理的崛起
a16z 预测,AI 正从被动工具进化为主动代理。
撰文:龙玥
来源:华尔街见闻
在知名风险投资机构 Andreessen Horowitz(A16z)于近期举办的「2026 创想」(Big Ideas for 2026)线上研讨会中,其合伙人团队描绘了一幅 AI 技术演进的清晰蓝图:人工智能正从一个等待指令的聊天工具,进化为一个能够主动执行任务的「代理」(Agent)。
同时,他们提出了重塑行业的「三大猜测」:用户界面的交互将从「提示」转向「执行」,产品设计将从「以人为本」转向「代理优先」,而语音代理将从技术演示走向规模化部署。
猜测一:输入框的消失。
a16z AI 应用投资团队合伙人 Marc Andrusko 大胆预测,「到 2026 年,作为 AI 应用主要用户界面的输入框将会消亡。」他认为,下一代 AI 应用将不再需要用户繁琐地输入指令,而是通过观察用户行为,主动介入并提供待审核的行动方案。
这一转变的背后,是 AI 商业价值的巨大跃迁。Andrusko 指出,「我们过去关注的是每年三四千亿美元的全球软件支出,而现在我们兴奋的是仅美国就存在的 13 万亿美元劳动力支出。这使得软件的市场机会扩大了约 30 倍。」
他将未来的 AI 代理比作最顶尖的「S 级员工」:「最高主动性的员工会识别问题、诊断问题根源、实施解决方案,最后才来告诉你:『请批准我找到的这个方案。』这就是 AI 应用的未来。」


猜测二:「代理使用优先」与机器可读性。
a16z 成长型投资合伙人 Stephanie Zhang 提出了一个颠覆性的设计逻辑:软件将不再为人类的眼睛设计。她指出:「对人类消费重要的事情,对智能体消费来说可能不再重要。新的优化方向不是视觉层级,而是机器可读性(Machine Legibility)。」
在 Stephanie 看来,过去我们为了人类注意力而优化的「5W1H」原则或精美的 UI 界面,在智能体时代将面临重构。她预测:「我们可能会看到大量针对智能体兴趣而生成的超个性化、高频内容,这就像是智能体时代的关键词堆砌。」
这一转变将深刻影响从内容创作到软件设计的方方面面。

猜测三:语音代理的崛起。
与此同时,a16z AI 应用投资团队合伙人 Olivia Moore 观察到,「AI 语音代理正开始占据一席之地。」她表示,语音代理已从科幻小说般的概念,演变为真实企业正在大规模采购和部署的系统。尤其在医疗保健、银行金融和招聘等领域,语音代理因其高可靠性、强合规性以及解决人力短缺问题的能力而备受青睐。
她分享了一个有趣的发现:「在银行和金融服务领域,语音 AI 实际上表现得更好,因为人类非常擅长违反合规规定,而语音 AI 每次都能精准执行。」
Moore 强调,「AI 不会抢走你的工作,但一个使用 AI 的人会。」这预示着传统呼叫中心和 BPO 行业将面临深刻变革,而能够利用 AI 技术提供更低价格或更大处理量的服务商将获得竞争优势。

此次线上研讨会核心要点:
- UI 的终结: 提示词框(Prompt Box)作为主要交互界面的时代即将终结,AI 将从「被动响应」转向「主动观察与干预」。
- 30 倍的市场增量: AI 的目标市场正从 4000 亿美元的软件支出转向 13 万亿美元的劳动力支出,商业逻辑发生根本性跃迁。
- S 级员工模型: 理想的 AI 应当像高主动性员工:发现问题、诊断原因、提供方案并执行,仅在最后一步留给人类确认。
- 机器可读性(Machine Legibility): 软件设计目标正从「人类优先」转向「智能体优先」,视觉层级的 UI 将不再是核心。
- 内容创作的异化: 品牌竞争将从吸引人类注意力转向「生成引擎优化」(GEO),甚至可能出现大量针对 AI 抓取而生成的「高频内容」。
- 语音 AI 的合规优势: 在金融等高门槛行业,语音 AI 表现优于人类,因为其能 100% 遵守合规要求且轨迹可追踪。
- 医疗与政务的切入: 语音代理正在解决医疗行业高流动率难题,并有望在未来解决 911 报警及 DMV(车管所)等公共服务痛点。
- 语音 AI 产业化: 语音 AI 正发展为一个完整的产业而非单一市场,价值链的每一层都将出现赢家,从底层模型到平台级应用均存在巨大机遇。
- 从工具到「AI 员工」: AI 不再是简单的辅助工具,而是能够独立处理完整业务闭环的数字员工。
a16z AI 团队研讨会全文实录(由 AI 工具翻译):
导播 00:00 欢迎来到「2026 年大构想」。我们将听到 Marc Andrusko 探讨 AI 用户界面的演变,以及我们与智能系统互动方式的根本性改变。Stephanie Zhang 将讨论为代理而非人类进行设计的意义,这一转变正在重塑产品开发。Olivia Moore 将分享她对 AI 语音代理的兴起及其在我们日常生活中日益增长的作用的看法。这些不仅仅是预测,它们是来自那些直接与构建未来世界的创始人和公司合作的人们的洞见。
Marc Andrusko 00:31 我是 Marc Andrusko,我们 AI 应用投资团队的合伙人。我对 2026 年的大构想是,输入框作为 AI 应用主要用户界面的消亡。下一波应用将需要少得多的提示。它们会观察你在做什么,并主动介入,提供行动方案供你审查。
Marc Andrusko 00:49 我们正在进攻的机会,过去是全球每年三到四千亿美元的软件支出。现在我们感到兴奋的是,仅在美国就存在 13 万亿美元的劳动力支出。这使得软件的市场机会或潜在市场总额(TAM)扩大了约 30 倍。如果你从这里出发,然后思考,好吧,如果我们所有人都希望这个软件为我们工作,理想情况下,它的工作能力至少要和人类相当,甚至更强,对吧?所以我喜欢思考,嗯,最优秀的员工是怎么做的?最优秀的人类员工是怎么做的?我最近一直在讨论一个在 Twitter 上流传的图表。它是一个关于五种员工类型的金字塔,以及那些最具能动性的员工为何是最好的。如果你从金字塔的底层开始,那里的人是发现一个问题,然后来找你寻求帮助,问该怎么做。这是能动性最低的员工。
但如果你去到 S 级,也就是你能拥有的能动性最高的员工,他们会发现一个问题,进行必要的研究来诊断问题来源,研究多种可能的解决方案,实施其中一个,然后让你随时了解情况,或者在最后一刻来找你说,「请批准我找到的这个解决方案」。我认为这就是未来 AI 应用的样子。而且我认为这是每个人都想要的。这是我们所有人都在努力的方向。所以我非常有信心我们差不多就要实现了。我认为大语言模型(LLM)持续变得更好、更快、更便宜,而且我认为在某种程度上,用户行为仍然需要在最后环节有人类参与来批准事情,尤其是在高风险的场景下。但我认为模型完全有能力达到一个可以代表你提出非常聪明的建议的程度,而你基本上只需要点击确认。
Marc Andrusko 02:27 如你们所知,我非常着迷于 AI 原生 CRM 的概念。我认为这是一个完美的例子,展示了这些主动型应用可能的样子。在今天的世界里,一个销售人员可能会打开他们的 CRM,浏览所有开放的机会,查看当天的日历,然后思考,好吧,我现在可以采取什么行动来对我的销售漏斗和成交能力产生最大影响。而对于未来的 CRM,你的 AI 代理或 AI CRM 应该能为你持续不断地做所有这些事情,不仅识别你渠道中最明显的机会,还会翻阅你过去两年的邮件,挖掘出,你知道,这曾是一个有潜力的线索,但你让它沉寂了。或许我们应该给他们发这封邮件,把他们重新拉回你的流程中,对吧?所以我认为,在起草邮件、整理日历、回顾旧的通话记录等方面,机会是无穷无尽的。
Marc Andrusko 03:22 普通用户仍然会想要那最后一英里的批准。几乎 100% 的情况下,他们会希望「人在回路」中的人类部分成为最终的决策者。这很好。
Marc Andrusko 03:33 我认为这是它自然演变的方式。我可以想象一个世界,在这个世界里,高级用户(power user)会投入大量额外精力来训练他们使用的任何 AI 应用,使其尽可能多地了解他们的行为和工作方式。这些应用将利用更大的上下文窗口,利用已融入许多大语言模型的记忆功能,从而使高级用户能够真正信任该应用完成 99.9% 甚至 100% 的工作。他们会为那些无需人类批准就能完成的任务数量而自豪。
Stephanie Zhang 04:09 嗨,我叫 Stephanie Zhang,是 a16z 成长型投资团队的投资合伙人。我对 2026 年的大构想是:为代理而创造,而非为人类。我对 2026 年感到非常兴奋的一件事是,人们必须开始改变他们创造的方式。这涵盖了从内容创作到应用设计的方方面面。人们开始通过代理作为中介来与网络或应用程序等系统交互。对人类消费重要的东西,对代理消费而言重要性将不一样。
Stephanie Zhang 04:41 我上高中的时候,上过新闻课。在新闻课上,我们学到了在新闻文章的首段以 5W 和 1H(何人、何时、何地、何事、何因、如何)开头的重要性,以及在特写报道中以一个引子开头。为什么?为了吸引人类的注意力,人类可能会错过深埋在 H5 页的有深度、有见地的陈述,但代理不会。
Stephanie Zhang 05:02 多年来,我们为可预测的人类行为进行优化。你想成为谷歌返回的首批搜索结果之一吗?你想成为亚马逊上列出的首批商品之一。这种优化不仅适用于网络,也适用于我们设计软件。应用是为人类的眼睛和点击而设计的。设计师为良好的用户界面(UI)和直观的流程进行优化。但随着代理使用量的增长,视觉设计对于整体理解的重要性将降低。以前,在发生事故时,工程师会进入他们的 Grafana 仪表盘,试图拼凑出发生了什么。现在,AI SRE(网站可靠性工程师)会接收遥测数据。它们会分析这些数据,并直接在 Slack 中报告假设和洞察,供人类阅读。
以前,销售团队必须点击并浏览 Salesforce 等 CRM 来收集信息。现在,代理会获取这些数据并为他们总结洞察。我们不再是为人类设计,而是为代理设计。新的优化标准不是视觉层次,而是机器可读性。这将改变我们创造的方式以及我们使用的工具。代理在寻找什么,这是一个我们不知道答案的问题。但我们所知道的是,代理在阅读一篇文章的所有文本方面做得比人类好得多,而人类可能只会读前几段。市面上有很多工具,不同的组织用它们来确保当消费者提示 ChatGPT,询问最好的公司信用卡或最好的鞋子时,它们能够出现。所以市面上有很多我们称之为 SEO(注:应为 SEO 或类似概念,此处为音译)的工具,人们正在使用,但每个人都在问一个问题:AI 代理想看什么?
Stephanie Zhang 06:43 我喜欢这个问题,关于人类何时可能完全退出循环。我们已经看到在某些情况下这正在发生。我们的投资组合公司 Dekagon 已经在为他们的许多客户自主回答问题。但在其他情况下,如安全运营或事故解决,我们通常会看到更多的人在回路中,AI 代理首先尝试找出问题所在,进行分析,并向人类提供不同的潜在情况。这些往往是责任更大、分析更复杂的案例,我们看到人类会留在循环中。而且在模型和技术达到极高准确性之前,他们可能会在循环中停留更长时间。
Stephanie Zhang 07:33 我不知道代理是否会看 Instagram Reels。这真的很有趣,至少在技术方面,优化机器可读性、优化洞察力、优化相关性真的非常重要,尤其与过去相比,过去更注重用华而不实的方式吸引人们、抓住注意力。我们已经看到的是大量、超个性化内容的案例,也许你不是创作一篇极其相关、极具洞察力的文章,而是创作大量低质量内容,但针对你认为代理可能想看的不同东西。这几乎相当于代理时代的关键词,内容创作的成本趋近于零,创作大量内容变得非常容易。这就是为了试图吸引代理注意力而产生大量内容的潜在风险。
Olivia Moore 08:48 我是 Olivia Moore,我们 AI 应用投资团队的合伙人。我对 2026 年的大构想是,AI 语音代理将开始占据一席之地。在 2025 年,我们看到语音代理从看似科幻的东西,突破成为真实企业正在大规模采购和部署的系统。我很高兴看到语音代理平台扩展,跨平台和模式工作,以处理完整的任务,让我们更接近真正的 AI 员工愿景。我们已经看到几乎每个垂直领域都有企业客户在测试语音代理,如果不是已经以相当大的规模部署它们的话。
Olivia Moore 09:25 医疗保健可能是这里最大的一个。我们看到语音代理出现在医疗保健堆栈的几乎每个部分,包括给保险公司、药店、供应商的电话,也包括可能更令人惊讶的面向患者的电话。这可能是像日程安排和提醒这类基本功能,但也包括更敏感的电话,如术后随访电话,甚至精神科的初诊接待电话,都由语音 AI 处理。老实说,我认为这里的一个主要驱动因素是目前医疗保健行业的高人员流动率和招聘困难,这使得能够以一定可靠性执行任务的语音代理成为一个相当不错的解决方案。另一个类似的类别是银行和金融服务。你可能会认为那里有太多的合规和监管,语音 AI 还无法在那里运作。但事实证明,这是一个语音 AI 实际表现更优的领域,因为人类非常擅长违反合规和规定,而语音 AI 每次都能做到。而且重要的是,你可以追踪语音 AI 随时间的表现。最后,我想说另一个语音技术取得突破的领域是招聘。这涵盖了从零售一线工作到入门级工程职位,甚至中级顾问职位。通过语音 AI,你可以为候选人创造一种体验,他们可以在任何适合他们的时间立即进行面试,然后他们会被送到其余的人工招聘流程中。
Olivia Moore 10:46 随着底层模型变得越来越好,我们今年在准确性和延迟方面看到了巨大的改进。实际上,在某些情况下,我听说有语音代理公司会故意减慢他们的代理速度或引入背景噪音,使其听起来更像人类。当谈到 BPO(业务流程外包)和呼叫中心时,我认为其中一些将会经历一个较平缓的过渡,而另一些在面对来自 AI,特别是语音 AI 的威胁时,可能会面临一个更陡峭的悬崖。有点像人们说的,AI 不会抢走你的工作,一个使用 AI 的人会。
Olivia Moore 11:16 我们看到的是,许多最终客户可能仍然只想购买解决方案,而不是购买他们必须自己实施的技术。因此,在近期到中期,他们可能仍会使用呼叫中心或 BPO。但他们可能会选择一个能提供更低价格或能处理更多业务量的,因为它利用了 AI。有趣的是,在一些地区,按永久雇员计算,人类实际上仍然比顶级的语音 AI 便宜。所以,随着模型变得更好,那里的成本是否会下降,以及那些市场的呼叫中心是否会面临比现在更大的威胁,这将是很有趣的看点。
Olivia Moore 11:50 AI 在多语言对话和重口音方面实际上非常出色。很多时候,我在开会时可能会有一个词或短语没听清,然后我会查看我的(Granola)会议记录,它记录得非常完美。所以我认为这是大多数 ASR 或语音转文本提供商能做到的一个很好的例子。
Olivia Moore 12:08 现在有几个用例我希望明年能看到更多,任何与政府相关的。我们是 Prepared 911 的投资者,如果你能处理 911 电话——他们处理的是非紧急电话——但如果你能用语音 AI 处理那个,你应该也能处理 DMV(车管所)的电话和任何其他与政府相关的电话,这些电话现在对消费者来说非常令人沮丧,对电话另一端的员工来说也同样令人沮丧。
Olivia Moore 12:32 我也很想看到更多消费级语音 AI。到目前为止,它主要是 B2B(企业对企业)的,因为用成本低得多的 AI 来替代或补充电话上的人类是如此显而易见。在消费级语音领域,我感到兴奋的一个类别是围绕更广泛的健康和保健。我们已经看到语音伴侣在辅助生活设施、养老院中兴起,既作为居民的伴侣,也能随着时间推移追踪不同的健康指标。我们将语音 AI 视为一个产业而非一个市场,在我们看来,这意味着在整个技术堆栈的每一层都会有赢家。如果你对语音 AI 感兴趣,或者想在语音 AI 领域创业,我建议你去看看那些模型。有很多很棒的平台,比如 11 Labs,你可以在那里测试创建自己的声音和创建自己的语音代理。你会对什么是可能的以及未来会发生什么有一个很好的了解。
免责声明:文章中的所有内容仅代表作者的观点,与本平台无关。用户不应以本文作为投资决策的参考。
你也可能喜欢
MSTR 抄底还是观望?你必须了解的 Strategy 三大关键问题

宏观失真、流动性重构与真实收益的再定价
今日加密市场:基于Cardano的NIGHT暴跌,ZEC和XMR也下跌

5,700 万枚巨额销毁落地,WBS 进入全新估值区间
