智谱想给DeepSeek来一场偷袭

出品｜虎嗅科技组

作者｜宋思杭

编辑｜苗正卿

头图｜智谱Openday现场

那个在一个月内斩获三轮国资的“国家队”智谱，终于开启与DeepSeek正面交锋。

3月31日，智谱在中关村论坛闭幕式现场发出奇袭，这同时也是一场酝酿已久的反击。

当天，智谱在智能体产品和基座模型两大维度，分别推出“AutoGLM沉思模型”和推理模型GLM-Z1-Air（以下简称“Air”）。值得一提的是，智谱不仅再次上演“以小搏大”，其宣布在性能表现上，Air仅用32B参数即可比肩671B的DeepSeek R1模型；更重要的是，价格还仅是DeepSeek R1模型的1/30。

这是2025年以来，大模型六小虎中首个发布推理模型，并宣布能够媲美DeepSeek的AI独角兽。然而，性能比肩还不够，DeepSeek的先发制人也不由得让智谱需要给出更高的筹码，才能达到反击效果。所以在本次发布会上，智谱则是以每百万tokens 0.5元的价格反击DeepSeek，而且该模型也即将于2025年4月14日正式开源。

围绕2025年的大模型圈，“预训练”已经很难再次成为关键词。最明显的表现是，大模型六小虎中已经有两家出现严重的战略摇摆。其中，百川智能大批核心成员离职，并砍掉了包括在B端大模型商业化进程最快的金融业务和互联网业务；而零一万物则是主动放弃万亿参数赛道，全面转向B端业务。此前，李开复曾在与彭博社采访中谈道，“未来的大模型将会收敛至DeepSeek、阿里巴巴、字节跳动三家。”

但也并非所有大模型厂商都在摒弃预训练、拥抱DeepSeek。对此，智谱创始人兼CEO张鹏告诉虎嗅，“我们仍然会坚持预训练，但更深一层的问题是，目前关于预训练有很多没有被关注到的点，比如预训练的架构、数据使用效率等等。”

实际上，自2025开年以来，DeepSeek对所有基座模型形成的降维打击，正在持续给整个行业带来余震。“DeepSeek做得那么好，为什么还要投你？”类似这样的灵魂拷问，却从未在过去两年从投资人的口中传出。相反，“大模型六小虎”曾是他们摘不到的星星。

而从整个第一季度来看，资本正逐渐对大模型初创公司失去耐心。可以说，除了智谱连续拿到地方产投融资，目前并无市场化资本进入到其余大模型企业当中。

与此同时，这种降维打击所暴露出的另一面是，即使是用百亿元砸出来的预训练，也没能让基座模型厂商形成护城河。

商业化难题，是大模型企业这三年来都没能绕过去的槛。继拿到多笔国资后，智谱也即将开启新旅程。在今日的发布会现场，CEO张鹏首次正面回应：“智谱的确在为IPO铺路，但目前并无具体计划。”

随之而来被摆到台桌上的疑问是，在如今大模型商业化前景并不明朗之际，作为大模型六小虎之首（根据估值排名），这条路智谱能否顺利走下去？

值得一提的是，在商业化布局方面，智谱正在以端侧为切口，渗透到金融、教育、医疗、政务等七大行业。在海外方面，智谱还在本次发布会上正式宣布与东盟十国及“一带一路”沿线国家共建“自主大模型共建联盟”。

然而，在谈及到智谱是否侧重B端时，张鹏坦言道，“我讨厌标签，智谱也并不是一家做ToB的公司。我们只做自己认为有意义的事。”

实际上，关于究竟应该做ToB还是ToC，对于国内大模型公司而言并非是一道选择题。甚至，有一个共识是，长远而言，大模型的未来一定在C端应用上。只不过，短期来看，摆在所有大模型企业面前的，也只有一条路。

对于杭州、珠海、成都等地方产业而言，智谱的确能许他们一个动听的故事。比如在浙江打造多个产业的垂直大模型示范项目，再比如与珠海龙头企业打造城市级GLM大模型空间。但对于智谱这家估值百亿元的大模型创业公司而言，其真正的星辰大海是一个MAU过亿的C端应用，是一个能塑造出完整生态的大模型产品。

更毋庸置疑的是，这场商业博弈的底层逻辑，需建立在B端场景的短期盈利闭环之上。然而行业见证的是，价值体系重构战役的全面爆发。

自2025年初DeepSeek以“成本优势+开源”一套组合拳撕开市场缺口，头部云厂商能够依托生态优势迅速卡位，而大模型创业公司也只能利用价格来力挽狂澜。

也许，智谱希望通过制造这场奇袭，给DeepSeek造成“亿点”冲击。

以下是与智谱CEO张鹏对话实录：

Q：如今DeepSeek给大模型公司造成了或多或少的冲击，您刚刚也提到Air模型将于4月14日开源。智谱的开源策略和商业化如何形成互补？

张鹏：开源是我们智谱从第一天开始就坚持的事情。宣布2025年是我们的开源年，是考虑到当下，尤其是DeepSeek发布之后对于整个技术生态的影响，大家认知上的影响。我们觉得从开源角度可以加大一些力度。

当然从商业角度来说，肯定会对我们商业策略和服务模式会有一定影响，我们也做了及时的调整，内部也做了相应的调整。我们认为模型即服务（MaaS）会真正落地，变成用服务的模式把模型基础设施的特征体现得更明确。因为过往的模式在于大家所有的关注点在模型本身上，但是企业或用户不管是调API或者买模型也好，怎么使用好这个模型才是大家面临最大的问题。

从这点来说，作为基座或模型的提供方，这些业务如何以创新的方式实现，需要双方磨合出能够落地的方案。在这样的前提下，开源不开源、免费不免费，本身已经不是特别关键的问题。

Q：现在大家很少提预训练大模型的能力，你怎么看预训练大模型基础的能力？另外RL、CoT这种后训练的模型推理能力，让推理模型能力逐渐提升，而且提升的性价比从用户端感知可能是比较好的。你觉得推理模型的天花板在哪里？主要使用场景在哪里？

张鹏：对于预训练这件事情，今天早晨我们在一个圈子里讨论问题，也是不断的学习。大家反共识的点在于什么呢？预训练仍然很重要。为什么仍然很重要？预训练虽然现在关注度不那么高，但是后面的RL或者各种方法也好，其实本质上还是依赖预训练所带来的基座模型天花板，无论是RL等等也好，都是在深度更大的程度挖掘、逼近这个天花板，这个天花板是隐形的。但是预训练仍然很重要，当然预训练里面的问题非常多，或者待研究的点非常多，预训练的架构、数据使用效率甚至是训练计划怎么优化？就像我们说的智能体的学习一样，是不是需要有易到难的过程，还是无序的进行预训练？这里面还有很多问题需要去研究。

这一点上大家关注度没有那么高，反过来讲智能体包括推理模型的应用，是因为技术发展就是这样。当某一项技术进入到所谓的稳定发展期后，大家的注意力会转移到所谓的下一个爆发期的点上，这是很正常的事情。但是处于爆发期的技术，后面会不会也回到爆发期然后再稳定的发展，我相信大概率还是这样。

当然目前来看，推理模型或者推理能力在更多的泛用性任务上表现上并不及预期，也是随着我们研究的进展改变的。最早的推理模型只能解数学、物理这种明确标准答案反馈的任务。后来RL也证明，当你的RL的奖励方式或优化策略有一定调整后，它也可以在其他的开放问题上，比如文字生成、文科类等问题上表现不错。所以，每一个技术的改进，在原来的路径上会产生新的可能性。

Q：智谱今年融资计划主要有哪些方向？哪些地方需要大笔投？

张鹏：这和AGI目标有关系，我们判断实现AGI的路程还很长，这个过程中需要很多技术探索和研究投入，成本非常可观。要知道，从0到1的开拓和从1到10的复制，这两个之间的成本不可同日而语。前者的试错成本相对更高，这是不可避免的，我们不希望永远走在别人后面，我们现在已经走在前面，而我们走在前面的这部分需要加大投入做这些事情。

Q：智谱在Agent领域已经有一定布局，本次新产品的推出是否意味着公司在这方面的调整？未来公司在Agent的规划是怎样的？

张鹏：我们对Agent领域的投资确实很早，2023年我们开始在这一块投入，大家还在拼基座模型、训练大模型和预训练的时候，我们就在这里投入了。站在AGI实现路径上，我们是从L1的预训练到L2的对齐和推理，再到L3的工具使用包括Agent的使用，一级级延续上去的。所以，不能说今天的发布会表示着我们的Agent战略有非常巨大的变化，只是到了当下这个阶段，我们会认为进入到一个可以有更大规模应用和落地的阶段。

Q：你认为下一代Agent的核心能力是什么？AutoGLM系列未来的迭代方向是否包括多模态或者是具身智能？

张鹏：Agent的的核心能力无非是两种，第一个是模型本身能力，包括底层的语言能力、多模态能力和推理能力。第二点是感知环境和环境智能交互，也就是Agent强调的沟通交流能力。这两点我认为是智能体能在应用层面爆发，能够落地产生实际效果的两个核心价值。

Q：现在大多数Agent都是在桌面端，智谱发布的也是在桌面端。您认为未来会不会有更多的入口？当前的话我们要在手机上，未来有没有在AI眼镜上调用Agent的能力，去实现我想达到的目标？现在要调用更多的入口还有哪些挑战？

张鹏：其实这个事情我们已经在做了，只不过今天这个场合突出重点，我们拿了通用场景来说。包括更多的端，AutoGLM更早是手机端，今天只不过是把它移到PC上。其他智能上的硬件，眼镜、汽车、平板等等的端侧，都可以接。但是里面确实有一些问题，不同类型的设备，最终的交互方式不一样，比如说眼镜不可能有键盘，就得用语音交互，语音就引入了全新的模态。如果说产品里面有明显的短板，这个事情就成不了，链条上缺了一环你就做不了，好在整体的能力是齐的，仍然是有高有低。

包括硬件本身也要适配新的技术，比如说我们中关村论坛这次是夸父机器人和我们合作，接了那个模型。但是它接的不是我们最新的模型，没有办法接。因为整体所有的控制和交互的模型只有一套，我们有一套体系，这两者之间还是有一定区分的，想要打磨出完全契合的模式是要花很长时间的。所以，大家也不能忽视这个问题。未来我们期待是这样的，很简单有SDK或者有一个芯片放上去就接上了，这是未来的事情，现在做不到。

Q：智谱自己有想做具身智能吗？

张鹏：我们会有相应的布局，这个事情可能还需要一点时间。

Q：您刚才提到现在坚持预训练的模型，很多家企业已经放弃了。那现阶段公司从战略层面来讲，技术和商业化战略层次和人员、资源的分配大概是什么样的情况？

张鹏：这是战略层面问题。我们把自己定位成技术驱动的公司，另外一条腿是我们的商业化路径。这两条腿并不是互相矛盾的，也不是互相争抢资源，我们是动态调整的过程。我们觉得技术的推进和演进，到了一个必须要深入到产业和应用当中去，吸取营养回馈我们技术研发的阶段。所以才会在这个阶段从去年开始大力推进产业化、商业化落地这件事情，会有资源投入。但是从整体的核心任务和资源投入角度来讲，我们还是投入在技术研发、创新更高一些。

Q：很多投资人认为是今年传统行业大规模应用爆发的一年，智谱也是最早做Agent。那么在落地层面，公司在2025年预期是怎样的，Agent目前急需解决的问题有哪些？

张鹏：今天是Q1的最后一天，今年的很多事情还在计划当中。拿去年来讲，我们拉齐看了一下，还是很不错的，整体实现了超过100%的增长速度，很多头部行业已经打进去，有一定规模化的效果。今年我们会认为因为市场变化，会让市场呈十倍以上的增长，机会是更大的，但是整个模式和商业路径会有一些调整。但我们还是保持一贯稳定的商业化落地速度和效益，持续提升商业化落地的效果。因为作为一个企业来讲，最终的目的还是要挣钱，不挣钱不行。

本文来自虎嗅，原文链接：https://www.huxiu.com/article/4184318.html?f=wyxwapp

主题测试文章，只做测试使用。发布者：北方经济网，转转请注明出处：https://www.hujinzicha.net/12129.html

智谱想给DeepSeek来一场偷袭

发表回复

联系我们

400-800-8888

智谱想给DeepSeek来一场偷袭

相关推荐

失宠的新中式烘焙，带着黄油年糕回来了

品牌部的5大尴尬与出路

少赚40亿，钟睒睒还是栽了？

被讨伐的啄木鸟平台，与寄生的县城二舅们

执着于高净值人群的王石，“割”不动中年总裁们了

发表回复

联系我们

400-800-8888