出品|虎嗅科技组
作者|宋思杭
编辑|苗正卿
头图|智谱Openday现场
那个在一个月内斩获三轮国资的“国家队”智谱,终于开启与DeepSeek正面交锋。
3月31日,智谱在中关村论坛闭幕式现场发出奇袭,这同时也是一场酝酿已久的反击。
当天,智谱在智能体产品和基座模型两大维度,分别推出“AutoGLM沉思模型”和推理模型GLM-Z1-Air(以下简称“Air”)。值得一提的是,智谱不仅再次上演“以小搏大”,其宣布在性能表现上,Air仅用32B参数即可比肩671B的DeepSeek R1模型;更重要的是,价格还仅是DeepSeek R1模型的1/30。
这是2025年以来,大模型六小虎中首个发布推理模型,并宣布能够媲美DeepSeek的AI独角兽。然而,性能比肩还不够,DeepSeek的先发制人也不由得让智谱需要给出更高的筹码,才能达到反击效果。所以在本次发布会上,智谱则是以每百万tokens 0.5元的价格反击DeepSeek,而且该模型也即将于2025年4月14日正式开源。
围绕2025年的大模型圈,“预训练”已经很难再次成为关键词。最明显的表现是,大模型六小虎中已经有两家出现严重的战略摇摆。其中,百川智能大批核心成员离职,并砍掉了包括在B端大模型商业化进程最快的金融业务和互联网业务;而零一万物则是主动放弃万亿参数赛道,全面转向B端业务。此前,李开复曾在与彭博社采访中谈道,“未来的大模型将会收敛至DeepSeek、阿里巴巴、字节跳动三家。”
但也并非所有大模型厂商都在摒弃预训练、拥抱DeepSeek。对此,智谱创始人兼CEO张鹏告诉虎嗅,“我们仍然会坚持预训练,但更深一层的问题是,目前关于预训练有很多没有被关注到的点,比如预训练的架构、数据使用效率等等。”
实际上,自2025开年以来,DeepSeek对所有基座模型形成的降维打击,正在持续给整个行业带来余震。“DeepSeek做得那么好,为什么还要投你?”类似这样的灵魂拷问,却从未在过去两年从投资人的口中传出。相反,“大模型六小虎”曾是他们摘不到的星星。
而从整个第一季度来看,资本正逐渐对大模型初创公司失去耐心。可以说,除了智谱连续拿到地方产投融资,目前并无市场化资本进入到其余大模型企业当中。
与此同时,这种降维打击所暴露出的另一面是,即使是用百亿元砸出来的预训练,也没能让基座模型厂商形成护城河。
商业化难题,是大模型企业这三年来都没能绕过去的槛。继拿到多笔国资后,智谱也即将开启新旅程。在今日的发布会现场,CEO张鹏首次正面回应:“智谱的确在为IPO铺路,但目前并无具体计划。”
随之而来被摆到台桌上的疑问是,在如今大模型商业化前景并不明朗之际,作为大模型六小虎之首(根据估值排名),这条路智谱能否顺利走下去?
值得一提的是,在商业化布局方面,智谱正在以端侧为切口,渗透到金融、教育、医疗、政务等七大行业。在海外方面,智谱还在本次发布会上正式宣布与东盟十国及“一带一路”沿线国家共建“自主大模型共建联盟”。
然而,在谈及到智谱是否侧重B端时,张鹏坦言道,“我讨厌标签,智谱也并不是一家做ToB的公司。我们只做自己认为有意义的事。”
实际上,关于究竟应该做ToB还是ToC,对于国内大模型公司而言并非是一道选择题。甚至,有一个共识是,长远而言,大模型的未来一定在C端应用上。只不过,短期来看,摆在所有大模型企业面前的,也只有一条路。
对于杭州、珠海、成都等地方产业而言,智谱的确能许他们一个动听的故事。比如在浙江打造多个产业的垂直大模型示范项目,再比如与珠海龙头企业打造城市级GLM大模型空间。但对于智谱这家估值百亿元的大模型创业公司而言,其真正的星辰大海是一个MAU过亿的C端应用,是一个能塑造出完整生态的大模型产品。
更毋庸置疑的是,这场商业博弈的底层逻辑,需建立在B端场景的短期盈利闭环之上。然而行业见证的是,价值体系重构战役的全面爆发。
自2025年初DeepSeek以“成本优势+开源”一套组合拳撕开市场缺口,头部云厂商能够依托生态优势迅速卡位,而大模型创业公司也只能利用价格来力挽狂澜。
也许,智谱希望通过制造这场奇袭,给DeepSeek造成“亿点”冲击。
以下是与智谱CEO张鹏对话实录:
Q:如今DeepSeek给大模型公司造成了或多或少的冲击,您刚刚也提到Air模型将于4月14日开源。智谱的开源策略和商业化如何形成互补?
张鹏:开源是我们智谱从第一天开始就坚持的事情。宣布2025年是我们的开源年,是考虑到当下,尤其是DeepSeek发布之后对于整个技术生态的影响,大家认知上的影响。我们觉得从开源角度可以加大一些力度。
当然从商业角度来说,肯定会对我们商业策略和服务模式会有一定影响,我们也做了及时的调整,内部也做了相应的调整。我们认为模型即服务(MaaS)会真正落地,变成用服务的模式把模型基础设施的特征体现得更明确。因为过往的模式在于大家所有的关注点在模型本身上,但是企业或用户不管是调API或者买模型也好,怎么使用好这个模型才是大家面临最大的问题。
从这点来说,作为基座或模型的提供方,这些业务如何以创新的方式实现,需要双方磨合出能够落地的方案。在这样的前提下,开源不开源、免费不免费,本身已经不是特别关键的问题。
Q:现在大家很少提预训练大模型的能力,你怎么看预训练大模型基础的能力?另外RL、CoT这种后训练的模型推理能力,让推理模型能力逐渐提升,而且提升的性价比从用户端感知可能是比较好的。你觉得推理模型的天花板在哪里?主要使用场景在哪里?
张鹏:对于预训练这件事情,今天早晨我们在一个圈子里讨论问题,也是不断的学习。大家反共识的点在于什么呢?预训练仍然很重要。为什么仍然很重要?预训练虽然现在关注度不那么高,但是后面的RL或者各种方法也好,其实本质上还是依赖预训练所带来的基座模型天花板,无论是RL等等也好,都是在深度更大的程度挖掘、逼近这个天花板,这个天花板是隐形的。但是预训练仍然很重要,当然预训练里面的问题非常多,或者待研究的点非常多,预训练的架构、数据使用效率甚至是训练计划怎么优化?就像我们说的智能体的学习一样,是不是需要有易到难的过程,还是无序的进行预训练?这里面还有很多问题需要去研究。
这一点上大家关注度没有那么高,反过来讲智能体包括推理模型的应用,是因为技术发展就是这样。当某一项技术进入到所谓的稳定发展期后,大家的注意力会转移到所谓的下一个爆发期的点上,这是很正常的事情。但是处于爆发期的技术,后面会不会也回到爆发期然后再稳定的发展,我相信大概率还是这样。
当然目前来看,推理模型或者推理能力在更多的泛用性任务上表现上并不及预期,也是随着我们研究的进展改变的。最早的推理模型只能解数学、物理这种明确标准答案反馈的任务。后来RL也证明,当你的RL的奖励方式或优化策略有一定调整后,它也可以在其他的开放问题上,比如文字生成、文科类等问题上表现不错。所以,每一个技术的改进,在原来的路径上会产生新的可能性。
Q:智谱今年融资计划主要有哪些方向?哪些地方需要大笔投?
张鹏:这和AGI目标有关系,我们判断实现AGI的路程还很长,这个过程中需要很多技术探索和研究投入,成本非常可观。要知道,从0到1的开拓和从1到10的复制,这两个之间的成本不可同日而语。前者的试错成本相对更高,这是不可避免的,我们不希望永远走在别人后面,我们现在已经走在前面,而我们走在前面的这部分需要加大投入做这些事情。
Q:智谱在Agent领域已经有一定布局,本次新产品的推出是否意味着公司在这方面的调整?未来公司在Agent的规划是怎样的?
张鹏:我们对Agent领域的投资确实很早,2023年我们开始在这一块投入,大家还在拼基座模型、训练大模型和预训练的时候,我们就在这里投入了。站在AGI实现路径上,我们是从L1的预训练到L2的对齐和推理,再到L3的工具使用包括Agent的使用,一级级延续上去的。所以,不能说今天的发布会表示着我们的Agent战略有非常巨大的变化,只是到了当下这个阶段,我们会认为进入到一个可以有更大规模应用和落地的阶段。
Q:你认为下一代Agent的核心能力是什么?AutoGLM系列未来的迭代方向是否包括多模态或者是具身智能?
张鹏:Agent的的核心能力无非是两种,第一个是模型本身能力,包括底层的语言能力、多模态能力和推理能力。第二点是感知环境和环境智能交互,也就是Agent强调的沟通交流能力。这两点我认为是智能体能在应用层面爆发,能够落地产生实际效果的两个核心价值。
Q:现在大多数Agent都是在桌面端,智谱发布的也是在桌面端。您认为未来会不会有更多的入口?当前的话我们要在手机上,未来有没有在AI眼镜上调用Agent的能力,去实现我想达到的目标?现在要调用更多的入口还有哪些挑战?
张鹏:其实这个事情我们已经在做了,只不过今天这个场合突出重点,我们拿了通用场景来说。包括更多的端,AutoGLM更早是手机端,今天只不过是把它移到PC上。其他智能上的硬件,眼镜、汽车、平板等等的端侧,都可以接。但是里面确实有一些问题,不同类型的设备,最终的交互方式不一样,比如说眼镜不可能有键盘,就得用语音交互,语音就引入了全新的模态。如果说产品里面有明显的短板,这个事情就成不了,链条上缺了一环你就做不了,好在整体的能力是齐的,仍然是有高有低。
包括硬件本身也要适配新的技术,比如说我们中关村论坛这次是夸父机器人和我们合作,接了那个模型。但是它接的不是我们最新的模型,没有办法接。因为整体所有的控制和交互的模型只有一套,我们有一套体系,这两者之间还是有一定区分的,想要打磨出完全契合的模式是要花很长时间的。所以,大家也不能忽视这个问题。未来我们期待是这样的,很简单有SDK或者有一个芯片放上去就接上了,这是未来的事情,现在做不到。
Q:智谱自己有想做具身智能吗?
张鹏:我们会有相应的布局,这个事情可能还需要一点时间。
Q:您刚才提到现在坚持预训练的模型,很多家企业已经放弃了。那现阶段公司从战略层面来讲,技术和商业化战略层次和人员、资源的分配大概是什么样的情况?
张鹏:这是战略层面问题。我们把自己定位成技术驱动的公司,另外一条腿是我们的商业化路径。这两条腿并不是互相矛盾的,也不是互相争抢资源,我们是动态调整的过程。我们觉得技术的推进和演进,到了一个必须要深入到产业和应用当中去,吸取营养回馈我们技术研发的阶段。所以才会在这个阶段从去年开始大力推进产业化、商业化落地这件事情,会有资源投入。但是从整体的核心任务和资源投入角度来讲,我们还是投入在技术研发、创新更高一些。
Q:很多投资人认为是今年传统行业大规模应用爆发的一年,智谱也是最早做Agent。那么在落地层面,公司在2025年预期是怎样的,Agent目前急需解决的问题有哪些?
张鹏:今天是Q1的最后一天,今年的很多事情还在计划当中。拿去年来讲,我们拉齐看了一下,还是很不错的,整体实现了超过100%的增长速度,很多头部行业已经打进去,有一定规模化的效果。今年我们会认为因为市场变化,会让市场呈十倍以上的增长,机会是更大的,但是整个模式和商业路径会有一些调整。但我们还是保持一贯稳定的商业化落地速度和效益,持续提升商业化落地的效果。因为作为一个企业来讲,最终的目的还是要挣钱,不挣钱不行。
本文来自虎嗅,原文链接:https://www.huxiu.com/article/4184318.html?f=wyxwapp
主题测试文章,只做测试使用。发布者:北方经济网,转转请注明出处:https://www.hujinzicha.net/12129.html