出品|虎嗅科技组
作者|宋思杭
编辑|苗正卿
头图|电影《模仿游戏》
回国两个月后,罗剑岚加入智元。这是他探索国内具身智能的一个起点。
从机器人不再称之为“机器人”,而是被叫做“具身智能”开始,这个赛道也逐渐年轻化。王兴兴、彭志辉、王鹤、杨丰瑜,如今国内的具身智能圈已经是90后、甚至00后的主场。似乎更名换姓后,人也变年轻了。和上述创业者一样,从伯克利回来的罗剑岚也是一位90后。但不同的是,他的野心不在于拿融资、创业、找钱。也许是性格使然,罗剑岚回国后依然坚持了他过往的科研路线。
2015年,是罗剑岚在机器人领域研究更早的起点。在后续的十年时间里,他有8年都在做学术研究,先后就读于伯克利的博士和博士后学位。而在重返伯克利就读博士后之前,他还有两年的时间是在谷歌度过,分别担任Google X和Google DeepMind研究科学家。在此期间,他还领导开发了全球首个超人类的机器人真机强化学习系统。
尽管在具身智能领域,对于走 IL(模仿学习)路线还是 RL(强化学习)路线,分歧始终存在,但罗剑岚却是一名坚定的 RL 拥护者。他的主张是,除非模仿学习准确率能达到100%,否则在现实世界的不确定性是极大的。而实际情况是准确率达到99.9%都是几乎不可能的。
回到国内,罗剑岚在做科研与回归产业界之间,选择了一条折中的路线。他决定加入智元担任首席科学家,并牵头组建了“智元具身研究中心”,还做了稚辉君的同事。
与罗剑岚回国的初衷相吻合,这个“智元具身研究中心”并非传统意义上的研究机构,而是一个连接基础研究和产业落地之间的桥梁。在罗剑岚的口中,”它并不是为了发 paper 而存在的,这个事情不需要我在智元做,具身研究中心存在的意义是用问题推动科研,它的导向是去解决实际问题,最重要的是,在这个研究中心里,基础研究和产业落地没有严格的界限”。
而罗剑岚口中的界限也正是中美在具身智能领域最大的区别所在。同时,它也是朱啸虎口中具身智能存在泡沫的根源。
我们不能总是在一个个榜单和视频的 demo 里看到具身智能的进步,具身智能只有应用到具体的产业中,转为实际生产力,才能让人感受到它的进步。沉浸在学术界多年的罗剑岚,也并不排斥朱啸虎的观念。从某种程度上,朱啸虎代表着现实主义,但这种现实主义也恰是笼罩在具身智能这种基础研究与产业落地脱节的现实之下。
在与罗剑岚对话的过程中,他流露出了一种非常 open 的态度。他说,“完全可以理解朱啸虎作为投资人的立场”,但同时这并不代表应该放弃基础研究。当下,大众对朱啸虎的观点存在一种误读,甚至解读成对具身智能的唱衰。实际上恰恰相反,他反而在提醒企业,具身智能领域真正需要解决的是基础研究与产业落地之间的 gap 问题。
但这种 gap 在美国的具身智能圈要更加严重。“和国内不同,美国的氛围太过于偏重基础研究,可能他们不卷吧”,罗剑岚对虎嗅说道。但这同时也是国内具身智能的魅力所在,“国内有很多做硬件的公司,而且商业化也会更快一步,这很有利于填补基础研究与产业落地之间的 gap。” 罗剑岚告诉虎嗅。
实际上,国内的具身智能圈,一直都萦绕着两种氛围,一种是聚集了UC伯克利和斯坦福等人才的学术派,一种是聚集了华为、小米等人才的大厂派。但在罗剑岚身上,却既看得到属于学术派的浪漫主义风格,也有来自大厂派的务实风格。这次回国,罗剑岚更多是带着问题回来的。
在具身智能领域,目前最大的难题还是在 manipulation(操控)身上,通俗来讲就是准确应对外部世界的无限性、不确定性。这也是目前各界都在攻克的重点。
而在智元,罗剑岚想用一种“以问题驱动科研”的方式继续完成他的科研工作,同时这里也是他从科研回归到产业界的开始。
以下为虎嗅与智元首席科学家罗剑岚对话实录,有删改:
虎嗅:你在伯克利期间,对国内具身智能公司有过接触吗?当时你怎么看国内这些公司的?
罗剑岚: 2016、17年的时候,那时产业化处于比较早期阶段,更多是硬件导向或者是偏服务类的机器人,真正关注具身智能和通用机器人的还并不多。当时还没有这个概念,普遍都叫机器人。
国外也只是有几家机构在做,包括Google在内。当时大家对于把 learning 移到机器人上这件事一直是持怀疑态度的。那个时候国内偏传统一些,AI做得少。但这一两年,国内至少从声势上看比美国要大得多。
虎嗅:是因为商业化的原因吗?
罗剑岚: 国内可能会比较关注这个词。相比之下,国内更易获得场景和数据,使用效率也会相对较高。但美国会更坚持技术的长期探索。
虎嗅:回国之后,为什么没有选择自己创业,而是加入到一家具身智能公司做首席科学家?
罗剑岚: 在产业界做科研需要一套落地的系统,这涉及到跨学科跨层级的系统性协作。目前这个阶段,我希望专注在我擅长的事情上,而不是一开始就陷入团队建设、融资、工程化这些事情上。
虎嗅:你说跨学科协作。但国外跨学科会不会走得更往前一些?
罗剑岚: 我倒觉得中国天生的土壤或基因会比较好一点,比如美国,第一他没硬件,第二美国AI 人才密度非常高,所以大家会更多基础在AI研究上。但相比之下,在国内恰好相反,国内更容易找到机器人所需要硬件本体、算法等等。
虎嗅: 那智元最吸引你的点在哪?
罗剑岚: 它是全栈的公司,也就是说硬件、软件、算法都是闭环的。这和我的理念非常相符。
虎嗅:你的理念是什么?
罗剑岚: 我觉得现在很多机器人的问题是,现在在硬件、软件、算法上面工程和科研没有一起迭代。你不能把它当做其他的 AI 方向,就是你有一个 benchmark,有一个 dataset,你在上面刷刷点,找一个场景。我比你好10%就好了。这样没有反映实际的进展,也不客观公平。
虎嗅:你在智元牵头组建的“智元具身研究中心”,这个研究中心是怎样的存在?比如它的组织架构和独立性。
罗剑岚:目前还在持续招聘。它是一个连接基础研究,到真正可以被部署到真实系统的中台。他不会只发论文,这可能只是目标之一;但更重要是推动具身系统能力的演进,以及部署到真实世界中。它是内嵌式的科研中台,具有相对的独立性,可以探索新的科研范式,同时也会和我们产品工程这类部门是保持强联动,避免脱节。
虎嗅:那在这个研究中心里,它的基础研究和落地方面会有一个比例吗?
罗剑岚:这是个好问题。我觉得机器人领域有一个挺大的问题,就是在别的领域比说大语言模型,最新的研究成果是几乎可以马上转化到商用上,大家可以看得见摸得着,可以用起来。但机器人研究却很多停留在了纸上,拍个视频发到网上说自己比别人好10%,然后就没有后续了,也没有人负责落地。
所以你说的这个比例问题,在我们的研究中心里我不会设一个就非常boundary的界限,我不会把基础研究和落地分开来。我觉得机器人作为系统性的学科,它是可以被最后 push 到真正应用上的,而不是留在 demo 和论文,然后谁也不管的状态,所以整体会是比较流动的状态。
虎嗅:在国外的话,基础研究和产业落地的这个界限会有多重?
罗剑岚:我觉在机器人领域,国外比较尴尬的一点是,他们如果想落地比较难找场景。受制于一些客观因素,他们的制造业和服务业相对较少。这并不是他们不想做。还有一点是美国环境会包容一点,整个机制会更鼓励大家去做比较长期的探索,而且资本非常充裕,他们对失败的容忍率也比较高,这也导致了在具身智能领域很多问题没有落地。
虎嗅: 所以,“用问题驱动科研”这也是你回到国内要做的主要事情吗?
罗剑岚: 对,我觉得好的技术研究能转化为生产力也是一件非常激动人心的事情。
虎嗅:DeepSeek这波热潮之后,国内外对RL接受度会更高吗?
罗剑岚:对, DeepSeek 或 GPT-O1会让大家看到 RL 的潜力。之前 RL 火起来还是在2016年AlphaGo 那波,但因为后来没找到应用,又沉寂了一会。然后2023年大家看到大语言模型的时候又好了,再到现在大家仿佛又看到了 RL 的潜力。今年图灵奖也颁给了 RL 领域的两位宗师。
我对 RL 的看法是这样,它是一个归纳法和演绎法的区别。归纳法是你现在看到的现象,他现在是什么,以后也就会是什么。但演绎是,你根据它底层的逻辑去推理。因为如果只是 supervise learning (监督学习)的话,没有办法做优化,也没有办法做多步的推理。但RL 在原则上是一个比supervise learning更合理的framework(框架)。如果它出问题了,也不一定是它本身的问题,即使真有的话,我们应该让它变得更好,而不是看到问题就认为它不行了。
虎嗅:现在在具身智能领域,坚持 RL 的会很多吗?
罗剑岚: 我觉得现在做locomotion,也就是做移动的肯定用的比较多了。但manipulation (操控)的话,这个涉及到真实世界,大家还在探索阶段吧,
虎嗅:为什么会这么说?这个locomotion和manipulation具体体现在什么地方?
罗剑岚: 因为 locomotion 更多关注的是你自己的行为。比如狗往前走,机器人 往前走,你只要控制好自己模型的准确性就可以了。但manipulation 更多关于外部世界,除非你的仿真器能够模仿整个世界,但这是个很难的事情。
在过去二三十年的机器学习的经验和教训中告诉我们,在一个AI系统里,如果有一个部分不随着数据的scale(增多)从而性能scale(提升),那么这部分最后就会变成这个系统的瓶颈。仿真器是我们用手设计的,不随着整个系统的提升而提升,最后我们学出来的策略就不会超过仿真器的本身。
虎嗅:所以在manipulation还存在很大问题的情况下,你觉得具身智能接下来的发展方向应该是什么?
罗剑岚: 我觉得接下来几年,我们不要说做全能机器人,而是做有用的机器人,解决一个任务可能太specialize (专用)了,但至少可以解决4、5个场景里面的任务。我也不关注他到底是不是人形。
本文来自虎嗅,原文链接:https://www.huxiu.com/article/4197063.html?f=wyxwapp
主题测试文章,只做测试使用。发布者:北方经济网,转转请注明出处:https://www.hujinzicha.net/13001.html