阿里秘密研发新模型将发布,影响力指标成最重要考核

阿里秘密研发新模型将发布,影响力指标成最重要考核

出品|虎嗅商业消费组

作者|苗正卿

题图|视觉中国

虎嗅独家获悉,阿里即将在2025年4月第二周发布新模型Qwen3,这将是阿里在2025年上半年最重要的模型产品,距离2024年9月阿里在云栖大会上发布Qwen2.5过去了大约七个月的时间。

据虎嗅独家了解,在2024年发布Qwen2.5后,阿里云内部的基础模型团队已经开始推动Qwen3相关项目。但2025年初DeepSeek的火爆,改变了团队的部分思路与重心。“2024年四季度,圈内已经意识到模型的推理能力很重要,但还不能说是最重要的方向,DeepSeek火爆后,推理能力已经成为绕不开的关键能力。”知情人士告诉虎嗅,DeepSeek-R1发布后,阿里云基础模型团队把策略中心进一步向模型的推理能力倾斜。

值得注意的是,在2024年下半年,阿里云基础模型团队对标的竞品模型主要是OpenAI的o1,而在DeepSeek-R1发布后,DeepSeek-R1已经成为了另一个主要对标模型。

虎嗅独家获悉,在阿里内部,基础模型团队最重要的考核维度是“模型影响力”。在内部,高层希望团队可以在业内成功塑造“最强模型”的心智。阿里集团CEO吴泳铭同时兼任阿里云CEO,据悉吴泳铭频繁参与到基础模型团队的业务沟通之中,并密切留意模型团队的各种进展。

两个具体的维度,被视为阿里基础模型团队的考核点:其一是衍生模型量,其二是在开发者社区的受欢迎度。

由于阿里采取模型开源策略,基于Qwen开源模型的衍生模型总量,被视为一个关键指标。截至目前,这一数据已经超过10万。而在开发者社区的欢迎度,阿里会考虑多个具体指标,比如开源模型下载量等。虎嗅获悉,2024年Qwen系列模型在开发者社区的下载量超过了2亿。

“在开发者社区之中,一个模型的影响力,主要有两个维度:一个是下载量,一个是衍生模型数。基于下载的开源模型,微调而成新的衍生模型后,需要重新上传至开发者社区。所以这两个维度可以比较好地反映一个开源模型的人气。”一位知情人士告诉虎嗅,在阿里内部针对全球开发者的模型影响力相关心智指标,从2024年开始就被高度重视,这和吴泳铭等技术出身的高管熟稔技术圈文化有关。

虎嗅另外独家获悉,2025年阿里模型团队也意识到了诸如智驾、AI Agent、AI硬件等机会风口的存在。为了更好地契合这些场景,基础模型团队依然会采取“多尺寸”策略。2024年发布的Qwen2系列,总共发布了7种不同的模型尺寸,而即将发布的Qwen3尺寸类型可能会更多。

值得注意的是,伴随Qwen3发布,阿里正在开启史上最大规模的校招,而虎嗅获悉,校招的HC之中涉及到基础模型团队的岗位量也达到史上最高。和以往不同的是,目前基础模型团队在招人过程中,更看重人才的“AI原生”,也就是说更希望引入一开始接触的就是大语言模型的人才,而非传统的NLP人才(自然语言模型)。

本文来自虎嗅,原文链接:https://www.huxiu.com/article/4187485.html?f=wyxwapp

主题测试文章,只做测试使用。发布者:北方经济网,转转请注明出处:https://www.hujinzicha.net/12361.html

(0)
北方经济网的头像北方经济网
上一篇 2025年4月2日 上午11:45
下一篇 2025年4月2日

相关推荐

  • 4年5度IPO,绿茶餐厅未上市已过时?

    ‍‍ 作者|初夏 声明|题图来源于网络。惊蛰研究所原创文章,如需转载请留言申请开白。 3月28日,初代网红餐饮品牌绿茶集团港股IPO获证监会备案,距离2021年其首次申请IPO已有4年。在此期间,绿茶集团5次冲击IPO,终于在这个春天迎来了好消息。 惊蛰研究所在《绿茶再次冲击IPO,老牌网红如何翻盘?》一文中,曾讨论绿茶餐厅彼时所遭遇的困境与挑战。如今4年过…

    财经 2025年4月1日
    1500
  • 小米汽车进入创立以来最严峻的信任危机

    出品丨虎嗅汽车组 作者丨李赓 头图丨视觉中国 经历了一整晚的微信聊天记录发酵之后,小米SU7在安徽高速上智驾发生车祸,导致三名花季少女丧生的命案,登上了热榜的头条。 巨大的舆论风波背后,是大众海量的疑问:这次事故究竟是怎样发生的?为什么没有逃生?为什么救援不及时?究竟有没有开不了门? 各种各样的讨论,将小米汽车持续带入创立以来最严峻的信任危机。 但在虎嗅汽车…

    2025年4月2日
    1200
  • 揭开老铺黄金的神秘面纱

    作者|Eastland 头图|视觉中国 2025年3月31日,老铺黄金(HK:06181)发布了《2024年度业绩公告》。报告显示,2024年销售业绩(含税)达98亿、同比增长166.4%;净利润14.7亿、同比增长254%。 2025年一季度,老铺黄金涨幅高达202%;财报公布后的4月1日,单日上涨139元(涨幅达19.07%)、成交额近25亿港元。 定位…

    2025年4月4日
    000
  • AI复活逝者,风口上的情感牢笼

    本文来自微信公众号:三联电子厂Pro,作者:哈尼,题图来自:AI生成 一、AI复活逝者,早已是一门生意 在人工智能技术蓬勃发展的现在,清明时节,是部分商家业务量激增的时节。 AI复活逝者,早已是一项火爆的云业务。 如今,支付一定金额的钱,算法就能让逝者“复活”。只让逝者动起来20元;动起来外加说话50元;动起来外加用逝者的原声说话90元。 有的一眼假,只是照…

    2025年4月3日
    1600
  • 宁德时代前员工打造300亿估值独角兽,海辰储能IPO背后藏隐忧

    出品 | 子弹财经 作者 | 星空 编辑 | 蛋总 美编 | 倩倩 审核 | 颂文 3月25日,厦门海辰储能科技股份有限公司(以下简称“海辰储能”)向港交所递交上市招股书,正式开启IPO征程。 海辰储能被称为新能源赛道的“黑马”,创始人吴祖钰从宁德时代的技术骨干到自立门户,仅用短短5年便将公司推上全球储能第三的位置。 然而,在这场盛宴背后,产能过剩风险、应收…

    财经 2025年4月3日
    800

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信