Perplexity CEO 最新洞察!

2025-07-11

Perplexity CEO 最新洞察:从搜索到执行,推理模型正在接管生成式 AI 的下一站


image.png

推理模型接棒,开启新范式

曾几何时,大模型 “能写会说” 成为其主要卖点。然而,随着技术的演进,这已逐渐成为标配。如今,行业焦点转向 “能做会执行”。过去两年,生成式预训练模型在语言理解与生成方面成果显著,却也触碰到阶段性瓶颈。当下,全球头部模型实验室已将目光投向提升系统执行能力与任务推理深度,新一代模型愈发依赖后训练阶段的结构化调优,以处理复杂逻辑、执行任务流程并在网页环境中实现行为操作。

Srinivas 认为,通用预训练模型搭建了语言理解的基础,但要转化为实用系统,必须借助推理机制与行为反馈,落地为具备自主任务执行能力的产品。以 Perplexity、DeepSeek 等为代表的推理模型体系,正重塑产品架构,以结构化任务路径取代文本拟合,用真实反馈闭环代替离线评估,从系统工程层面解构模型边界。

训练范式转变,数据与目标革新

在这一变革浪潮下,模型训练范式从 token 预测迈向行为规划,训练数据从 “文本” 转变为 “任务轨迹”,训练目标也从单纯模仿语言转向解决实际任务。企业不再执着于自建预训练模型,而是将通用语义建构交由开源社区与闭源实验室,自身专注于构建封闭式微调体系,针对结构化生成能力与系统性操作流程进行调优,打造可部署、可评估的智能组件。

同时,真实用户的查询行为与交互反馈成为关键训练信号。点赞、修改、点击等行为被系统采集,用于指导模型排序与强化学习。系统还会依据历史回答表现,动态调整信息源抓取策略,优先提升高价值内容的爬虫频次与索引深度,形成反馈驱动的数据供给机制。

商业路径重构,竞争格局生变

从商业角度看,产业链资源配置策略随之重构。以往先进行 UI 包装、开展开源模型试验的模式,逐渐被行为路径验证后再训练与部署的闭环机制取代。企业基于对模型机制的理解,将系统反馈信号转化为计算资源决策。例如,当小规模推理 agent 实验取得正向验证,便迅速扩大部署规模。部分公司还采用 “延迟训练” 策略,初期借助 UI 包装构建原型,获取用户数据与行为反馈后,再利用开源模型进展启动大模型训练,平衡资源投入。

面对搜索引擎巨头的存量优势,新兴系统另辟蹊径,选择机制异构路径。因为大型平台部署生成式系统后,查询量带来的负荷会使基础设施成本失衡,且高品牌溢价平台在内容安全机制不完善时,策略迭代受限。而轻结构团队能够跳过既有依赖,快速构建 “技术 — 产品 — 商业” 闭环,为问答搜索融合系统创造了发展机遇。


阅读2
分享