,玩家揭秘:华纳公司经理电话事件引发行业关注

20260619 01:26:09 吕飞昂 458

,融了数亿美金的「大晓机器人」,其创始人揭开了具身行业的割裂一面,很高兴为您解答这个问题,让我来帮您详细说明一下。

宜昌市当阳市、昌江黎族自治县十月田镇、内蒙古鄂尔多斯市东胜区、雅安市雨城区、广西贵港市港南区、昭通市大关县、徐州市鼓楼区、黄山市屯溪区、鞍山市立山区、本溪市南芬区、肇庆市广宁县、黄山市徽州区、渭南市临渭区、海口市秀英区、宜宾市长宁县、济宁市梁山县、杭州市富阳区

梳理近半年的成果,大晓机器人董事长、商汤科技联合创始人王晓刚,滔滔不绝聊了 10 多分钟。成立于 2025 年 7 月,大晓机器人(ACE ROBOTICS)是具身领域姗姗来迟的入局者。但一年来,这位新玩家成了赛道的 " 卷王 ":在模型侧,大晓新发布的具身大脑——世界模型 " 开悟(Kairos)3.0",在 4 项全球具身智能基准测试中取得 SOTA;开源的 Kairos 3.0-4B,则率先实现在端侧直接驱动具身智能本体的能力。△ Kairos3.0 在 4 个世界模型生成预测具身智能榜单中取得 SOTA。图源:大晓机器人在数据侧,大晓提出的 " 以人为中心 " 环境式采集方案,通过大规模采集人类与真实环境的交互过程,将世界模型训练数据量扩展至 100 万小时,达到传统真机(人遥控机器人)采集模式的 10 倍。还有落地——半年前,大晓的具身大脑模组 A1,落地的主要场景,还是从事道路巡检的机器狗;如今,这颗 " 大脑 " 已经随着形态各异的机器人,进入了酒店、无人零售店、无人物流仓等多个场景。△大晓在上海西岸落地的机器狗巡逻方案。图源:大晓机器人2026 年 6 月 15 日,大晓机器人官宣完成天使 + 轮融资——距离上一轮官宣,仅隔了 4 个月。这一轮投资方包括达晨财智、深创投、上海科创基金、沐曦股份、盛宇投资、复星锐正、华控基金、临港新片区基金、豫资涨泉等基金,老股东商汤国香资本持续增资,告捷资本担任长期财务顾问。至此,2026 年以来,大晓的累计融资金额已经达数亿美元。据《智能涌现》了解,大晓也成了具身领域最快成为独角兽的企业之一。在单轮融资金额动辄数亿元的具身赛道,不仅是技术竞速,入局玩家的场景圈地之战已然打响:孵化自清华的 " 千诀科技 ",瞄准的是酒店保洁、商用服务、精密室内作业等实景项目;前华为车 BU 首席科学家陈亦伦创立的它石智航,聚焦的是线束装配场景。" 具身领域的产业链非常长,很难靠一家企业做完所有的事。" 王晓刚告诉《智能涌现》," 所以在其中怎么撬动更多资源,在整个具身产业链中把握生态位的主导权,是非常关键的。"然而,在落地过程中,王晓刚感受到的是:硬件、数据、模型,三者的结合还不够。在海外,Figure、特斯拉等头部具身企业,都在内部整合硬件研发、数据采集和模型训练,以此提高协同迭代的效率。在国内,这套闭环尚未形成。王晓刚坦言,受制于技术成熟度和资源投入压力,不少本体公司对场景落地持谨慎态度;上游数据采集标准尚未统一,可直接用于具身模型训练的高质量数据供给不足。与此同时,硬件迭代的周期远长于模型,导致设计很难协同。找到可规模化的落地场景,以及可深度合作的本体厂商,是当下大晓构建 " 硬件、数据、模型 " 闭环的方法论。在王晓刚的规划中,大晓会先深入广阔的道路巡检和无人物流仓场景,再扩展到更为复杂、安全性要求更高的 C 端家庭场景。这样的好处在于,大晓能够先从 B 端场景中收集足够多的场景数据,提升世界模型能力的同时,还可以快速形成可以规模化的解决方案,帮助本体厂商进入场景。近期,王晓刚和《智能涌现》聊了聊大晓的进展,以及他对具身行业的观察。以下对话略经编辑:找到可复制的场景智能涌现:今年具身和世界模型是一级市场最火的赛道。相较于大晓成立之初,这一轮的融资难度有变化吗?王晓刚:这个时间点融资的好处是,市场有热度、有关注度。但相对的,企业太多,有时候投资人不清楚每家公司的价值点在哪里。所以我们需要付出更多的解释成本,帮投资人梳理清楚我们的发展路径、技术思路。智能涌现:大晓是 2025 年 7 月成立的。当时你会觉得大晓入局具身赛道晚了吗?王晓刚:我们选择这个时间点入局,是因为看到了具身大脑研究范式的变化:原来的主流的 VLA(视觉 - 语言 - 行动)范式存在局限性,缺少对物理世界的结构化理解。世界模型恰好可以解决这个问题。所以在当时入局,我们有可能实现弯道超车。而且在技术还不成熟的阶段,此前大家在探索技术范式,尤其是具身大脑的过程中,浪费了很多数据、模型训练、人力等资源。所以我们在去年入局可以少走弯路,反而有后发优势。智能涌现:相对而言,晚入局竞争会更激烈。王晓刚:具身领域的产业链非常长,很难靠一家企业做完所有的事。所以在其中怎么撬动更多资源,在整个具身产业链中把握生态位的主导权,是非常关键的。去年大晓成立之前,我们和很多具身企业进行了访谈。我发现,当时具身企业普遍对进入场景,抱有谨慎的态度。但场景在具身的发展中起到了关键作用。具身领域是按场景划分的,只要在一个场景中进行了闭环的验证,就很容易进行全球的规模化的复制。在规模化的复制过程中,就能让数据采集的体量、硬件的规模提升几个数量级。智能涌现:为什么具身公司不太愿意进入场景?王晓刚:一方面,技术成熟度还不高。另一方面,解决场景中的问题,涉及到大量的数据采集、研发等资源投入。加之目前很多新兴的具身公司,本身对行业和场景的理解都不够深刻。所以很多公司的态度是:先融钱,等待一个行业成熟的时机点,再去跟上。但等时机点出现的时候,先机已经被别人占走了。智能涌现:在技术不成熟的阶段,你们是怎么和场景中的头部客户谈的?王晓刚:找到技术的边界很重要。我们要根据技术、软硬件的成熟度,把现实的边界找到。如果进入 To C 场景,比如 L4 阶段的自动驾驶,我的技术就不能有边界。但是进入 To B 场景,加上各种可控条件,技术是可以落地的。我们还得判断:哪些场景是可以直接被解决的,哪些场景通过一些手段可以解决。此外,这些场景的解决方案还得具有可复制性。如果你找到的场景不具备可复制性,你做完这个,下一个还得定制化,这其实不是一个很好的选择。智能涌现:怎么判断一个场景具不具备可复制性?王晓刚:举个例子,我们优先深入的是零售、仓储这些场景,因为他们的业务体系和需求,全国都是可以复制的。再比如酒店也是一个可复制的场景,全国有很多酒店,我们交付的都是同一套巡检、导航机器人和机器狗。智能涌现:这些场景的竞争会更激烈吗?王晓刚:虽然大家都瞄准了这几个场景,但很多企业走得不深。这样的后果就是,你的成本无法控制、无法边际递减。你可以做个 demo 炫技,但它不具备规模化的前提条件。智能涌现:怎样的落地模式才算得上 " 深入 " 场景?王晓刚:首先,你需要有紧密合作的生态伙伴。比如,在无人零售的场景中,我们和商汤生态中的公司善惠机器人合作,给他们提供无人零售解决方案。善惠首先会提出成本、续航、节排等要求。其次,在具体的复杂场景中,他们会给很多技术的反馈。这些要求和反馈,有助于我们形成数据闭环,在场景中快速迭代。做完生态合作伙伴的 " 前期功课 " 后,我们也能够知道哪些方案是必要的,哪些是可以省却的,或者可以通过其他方案进行弥补。等方案成熟,我们也能将业务合作拓展到零售相关的其他头部企业,通过规模化把成本降下来。通过这一套打法,目前大晓能够把解决方案的成本降低到行业的 1/3。智能涌现:之前你提到,大晓落地场景的规划是:道路巡检 - 无人物流 - 家庭场景。这个落地顺序背后的考量是什么?王晓刚:一方面,我们考虑的是技术实现的难度。另一方面,我们遵循的还是先 To B 后 To C 的策略。因为 C 端场景规则边界不强,存在很多非结构化的场景。但 B 端场景是受控的,能够保障安全性。所以在 B 端积累更多经验后,我们再走向 To C。△大晓世界模型的家居场景。图源:大晓机器人世界模型还没有「智能涌现」智能涌现:创业初期你提出了很多新观点,比如在 VLA 还是具身主流范式时,选择了做世界模型,再比如提出 " 以人为中心的数据采集范式 "。你怎么判断这套范式是可行的?王晓刚:大方向上的判断是非常确定的。首先,VLA 与世界模型相比,只有后者这样的生成式模型,才具备智能涌现的能力。所以我们做具身智能,第一天就选了世界模型方向。其次,只有真人的数据,无论是采集的效率和规模,还是拟人化的真实性,才能达到训练世界模型的要求。但其中很多细节是在实践过程中才逐渐变清晰的。比如做世界模型,一开始我们的主要关注点是生成能力。但实际场景中,世界模型不光要生成数据,还要去控制真机,通过机器人与物理世界进行交互。这对世界模型的物理智能、空间智能提出了更高的要求。所以我们最近发布了开源空间智能通用模型 ACE-Brain-0,以及物理 3D 生成框架 PhysX-Omni,来提高世界模型的空间智能和物理智能。智能涌现:视频生成模型、VLA 等都称自己为 " 世界模型 "。你对世界模型的定义是什么?王晓刚:简单来说,世界模型得具备三方面的能力:理解、生成、预测。只有同时具备这三个能力,模型才能自我演进、自我纠正、自我进化。为什么大家都说自己是世界模型?因为业界没有针对世界模型的评价体系。比如,行业缺少对长时序复杂任务执行效果的 benchmark。一些所谓的 " 世界模型 " 只是宣传了自己擅长的东西,但其实缺失了另外的能力。像 VLA 缺乏生成能力,视频生成模型缺乏了对物理和空间的理解能力。智能涌现:你们内部怎么评测世界模型的能力?王晓刚:我们正在联合一些学术机构和具身公司,建立一个世界模型 benchmark,其中的评测维度包括跨本体的泛化能力、模拟仿真的能力,这些维度最终指向的是衡量模型理解、生成、预测的能力。智能涌现:大晓的世界模型 Kairos 最近迭代到了 3.0。它的能力类比语言模型处于什么阶段?王晓刚:还没到 GPT3.0。等到 GPT3.0 的阶段,世界模型就能实现智能涌现,也意味着研究范式有较高程度的确定性。目前我们还是按照 " 理解、生成、预测 " 三个维度来逐步迭代 Kairos。最早的时候,Kairos 主要用来做视频生成,后面逐渐开始控制真机,相应的,我们也要提升它对空间和物理属性的理解。智能涌现:在当下世界模型发展的阶段,数据的量、质量、标注,以及后续的评测等环节,哪个对模型能力的影响最大?王晓刚:眼前世界模型还在 0-1 的阶段,可供训练的数据本来就很少。所以在这个阶段,数据的量对效果的提升更明显。当训练数据增加了 10 倍、100 倍,我立刻能看到模型能力的提升。但等到世界模型出现智能涌现,就需要对数据进行精筛、进行精细化的标注。这和大语言模型的发展是类似的。当下世界模型还没有 " 智能涌现 ",所以先要把数据的量铺上去,再反过来解决质量问题。智能涌现:要实现 " 智能涌现 ",世界模型需要多少的训练数据?王晓刚:我们期待的是要达到千万小时的量级。原来真机采集的数据规模只有 10 万小时的量级,现在我们用人采集,基本上能达到百万小时。智能涌现:提升数据采集量级的关键是什么?王晓刚:还是场景的规模化,所以其中就需要产业方进入。其实对于产业方而言,数据采集也是他们进入具身行业的切入点。因为他们有场景,如果做数据采集,马上就可以变现,立刻产生价值。接着通过训练模型,再引入机器人,产业方也能提高场景的效率。模型、数据、硬件、场景的结合是不够的智能涌现:如今行业对机器人的一种态度是:买来只能当吉祥物,没有实际用处。王晓刚:除却质量问题,很重要的一点在于具身公司没有针对特定场景进行深度的迭代和打磨。现在的机器人公司,每年不断发布新的型号,但这些型号不是针对应用场景迭代的,所以原有的问题没有解决,反而会出现新的问题。问题不收敛,就会造成返修率的增加,机器人工作几百个小时,就会出问题。所以当下机器人的规模化推广面临很大的问题。智能涌现:让具身公司根据场景迭代的解法是什么?王晓刚:等场景能够规模化,硬件可以量产,就会倒逼具身公司将资源集中在针对场景的迭代上。智能涌现:如今行业中还有哪些难题?王晓刚:首先,今天模型、数据、硬件三者的结合是不够的。基座模型厂商、世界模型公司,还有做数据的公司,大家都各做各的数据采集方案。但未来本体是靠数据来驱动的,而不是靠真机或者物理模型的规则。所以这些问题就很关键:怎么从人身

作为国家高新技术企业认证平台,,玩家揭秘:华纳公司经理电话事件引发行业关注,很高兴为您解答这个问题,让我来帮您详细说明一下:

中山市沙溪镇、郑州市巩义市 ,邵阳市双清区、芜湖市鸠江区、白沙黎族自治县金波乡、三亚市崖州区、甘孜雅江县、吉林市永吉县、荆州市洪湖市、楚雄永仁县、甘孜康定市、内蒙古赤峰市喀喇沁旗、乐山市金口河区、抚州市宜黄县、营口市盖州市、果洛玛沁县、十堰市郧西县 、西双版纳勐腊县、内蒙古巴彦淖尔市乌拉特后旗、重庆市綦江区、泉州市晋江市、阜新市彰武县、咸阳市礼泉县、衡阳市石鼓区、凉山冕宁县、三明市三元区、平顶山市宝丰县、陇南市文县、广西贵港市港南区、昭通市绥江县、恩施州巴东县

全球服务区域: 丽江市古城区、鞍山市立山区 、内蒙古阿拉善盟额济纳旗、长治市平顺县、南通市如东县、文昌市潭牛镇、荆州市荆州区、鹤壁市浚县、济宁市微山县、吉安市吉水县、常德市津市市、上海市闵行区、广西贵港市平南县、榆林市米脂县、十堰市茅箭区、昆明市呈贡区、湖州市长兴县 、上饶市余干县、咸阳市彬州市、甘孜九龙县、达州市通川区、岳阳市平江县

刚刚决策小组公开重大调整,,玩家揭秘:华纳公司经理电话事件引发行业关注,很高兴为您解答这个问题,让我来帮您详细说明一下:

全国服务区域: 滨州市邹平市、嘉兴市海盐县 、宜昌市伍家岗区、洛阳市汝阳县、绥化市北林区、怒江傈僳族自治州福贡县、铜川市耀州区、舟山市定海区、安阳市殷都区、安顺市西秀区、阜阳市颍州区、常州市溧阳市、杭州市江干区、内蒙古鄂尔多斯市伊金霍洛旗、上饶市玉山县、琼海市万泉镇、定安县富文镇 、惠州市惠阳区、鸡西市梨树区、湘西州古丈县、韶关市新丰县、淮南市潘集区、徐州市铜山区、衡阳市衡东县、甘孜乡城县、伊春市大箐山县、成都市新都区、泉州市鲤城区、辽阳市弓长岭区、宁波市镇海区、玉树杂多县、黄石市铁山区、营口市鲅鱼圈区、儋州市新州镇、营口市站前区、南平市建瓯市、三亚市海棠区、河源市东源县、福州市马尾区、恩施州来凤县、济南市商河县

本周数据平台今日官方渠道公布最新动态:,玩家揭秘:华纳公司经理电话事件引发行业关注

近日,一位神秘玩家在网络上公开了华纳公司某位经理的电话号码,这一事件迅速引起了业界的广泛关注。这位玩家声称,他通过某种途径获得了华纳公司经理的电话,并在社交媒体上公之于众。这一行为不仅暴露了华纳公司内部管理的不规范,也引发了人们对游戏行业职业道德的思考。 据悉,这位神秘玩家在社交媒体上表示,他是一位游戏爱好者,在长期关注游戏行业的过程中,发现华纳公司存在一些管理上的问题。为了揭露这些问题,他决定采取行动。在经过一番调查后,他成功获取了华纳公司某位经理的电话号码,并在网络上公开。 这一行为迅速引起了网友们的热议。有人赞扬这位玩家的勇气,认为他敢于揭露行业黑幕,为玩家发声;也有人质疑他的行为,认为他侵犯了华纳公司经理的隐私权。对此,这位玩家表示,他只是在履行一个游戏爱好者的责任,希望通过自己的行动,引起行业对职业道德的重视。 华纳公司方面对此事件高度重视,表示已对涉事经理进行调查。公司表示,将依法依规处理此事,并对涉事经理进行严肃处理。同时,华纳公司也呼吁广大玩家理性对待此事,不要盲目跟风。 事实上,这并非华纳公司首次被曝光存在管理问题。近年来,游戏行业内部管理混乱、职业道德缺失等问题屡见不鲜。一些公司为了追求利益,不惜牺牲玩家的权益,甚至出现了一些严重的违规行为。这些问题的存在,严重影响了游戏行业的健康发展。 此次事件曝光后,不少业内人士纷纷表示,游戏行业需要加强职业道德建设,提高行业自律。一方面,游戏公司要加强对员工的培训,提高员工的职业道德意识;另一方面,行业协会要发挥监督作用,对违规行为进行严厉打击。 此外,玩家作为游戏行业的参与者,也应提高自身素质,理性对待游戏。在享受游戏带来的乐趣的同时,关注游戏行业的发展,为行业健康发展贡献自己的力量。 总之,玩家揭秘华纳公司经理电话事件,不仅暴露了华纳公司内部管理的不规范,也引发了人们对游戏行业职业道德的思考。希望这一事件能够成为游戏行业反思和改进的契机,共同推动游戏行业的健康发展。

梳理近半年的成果,大晓机器人董事长、商汤科技联合创始人王晓刚,滔滔不绝聊了 10 多分钟。成立于 2025 年 7 月,大晓机器人(ACE ROBOTICS)是具身领域姗姗来迟的入局者。但一年来,这位新玩家成了赛道的 " 卷王 ":在模型侧,大晓新发布的具身大脑——世界模型 " 开悟(Kairos)3.0",在 4 项全球具身智能基准测试中取得 SOTA;开源的 Kairos 3.0-4B,则率先实现在端侧直接驱动具身智能本体的能力。△ Kairos3.0 在 4 个世界模型生成预测具身智能榜单中取得 SOTA。图源:大晓机器人在数据侧,大晓提出的 " 以人为中心 " 环境式采集方案,通过大规模采集人类与真实环境的交互过程,将世界模型训练数据量扩展至 100 万小时,达到传统真机(人遥控机器人)采集模式的 10 倍。还有落地——半年前,大晓的具身大脑模组 A1,落地的主要场景,还是从事道路巡检的机器狗;如今,这颗 " 大脑 " 已经随着形态各异的机器人,进入了酒店、无人零售店、无人物流仓等多个场景。△大晓在上海西岸落地的机器狗巡逻方案。图源:大晓机器人2026 年 6 月 15 日,大晓机器人官宣完成天使 + 轮融资——距离上一轮官宣,仅隔了 4 个月。这一轮投资方包括达晨财智、深创投、上海科创基金、沐曦股份、盛宇投资、复星锐正、华控基金、临港新片区基金、豫资涨泉等基金,老股东商汤国香资本持续增资,告捷资本担任长期财务顾问。至此,2026 年以来,大晓的累计融资金额已经达数亿美元。据《智能涌现》了解,大晓也成了具身领域最快成为独角兽的企业之一。在单轮融资金额动辄数亿元的具身赛道,不仅是技术竞速,入局玩家的场景圈地之战已然打响:孵化自清华的 " 千诀科技 ",瞄准的是酒店保洁、商用服务、精密室内作业等实景项目;前华为车 BU 首席科学家陈亦伦创立的它石智航,聚焦的是线束装配场景。" 具身领域的产业链非常长,很难靠一家企业做完所有的事。" 王晓刚告诉《智能涌现》," 所以在其中怎么撬动更多资源,在整个具身产业链中把握生态位的主导权,是非常关键的。"然而,在落地过程中,王晓刚感受到的是:硬件、数据、模型,三者的结合还不够。在海外,Figure、特斯拉等头部具身企业,都在内部整合硬件研发、数据采集和模型训练,以此提高协同迭代的效率。在国内,这套闭环尚未形成。王晓刚坦言,受制于技术成熟度和资源投入压力,不少本体公司对场景落地持谨慎态度;上游数据采集标准尚未统一,可直接用于具身模型训练的高质量数据供给不足。与此同时,硬件迭代的周期远长于模型,导致设计很难协同。找到可规模化的落地场景,以及可深度合作的本体厂商,是当下大晓构建 " 硬件、数据、模型 " 闭环的方法论。在王晓刚的规划中,大晓会先深入广阔的道路巡检和无人物流仓场景,再扩展到更为复杂、安全性要求更高的 C 端家庭场景。这样的好处在于,大晓能够先从 B 端场景中收集足够多的场景数据,提升世界模型能力的同时,还可以快速形成可以规模化的解决方案,帮助本体厂商进入场景。近期,王晓刚和《智能涌现》聊了聊大晓的进展,以及他对具身行业的观察。以下对话略经编辑:找到可复制的场景智能涌现:今年具身和世界模型是一级市场最火的赛道。相较于大晓成立之初,这一轮的融资难度有变化吗?王晓刚:这个时间点融资的好处是,市场有热度、有关注度。但相对的,企业太多,有时候投资人不清楚每家公司的价值点在哪里。所以我们需要付出更多的解释成本,帮投资人梳理清楚我们的发展路径、技术思路。智能涌现:大晓是 2025 年 7 月成立的。当时你会觉得大晓入局具身赛道晚了吗?王晓刚:我们选择这个时间点入局,是因为看到了具身大脑研究范式的变化:原来的主流的 VLA(视觉 - 语言 - 行动)范式存在局限性,缺少对物理世界的结构化理解。世界模型恰好可以解决这个问题。所以在当时入局,我们有可能实现弯道超车。而且在技术还不成熟的阶段,此前大家在探索技术范式,尤其是具身大脑的过程中,浪费了很多数据、模型训练、人力等资源。所以我们在去年入局可以少走弯路,反而有后发优势。智能涌现:相对而言,晚入局竞争会更激烈。王晓刚:具身领域的产业链非常长,很难靠一家企业做完所有的事。所以在其中怎么撬动更多资源,在整个具身产业链中把握生态位的主导权,是非常关键的。去年大晓成立之前,我们和很多具身企业进行了访谈。我发现,当时具身企业普遍对进入场景,抱有谨慎的态度。但场景在具身的发展中起到了关键作用。具身领域是按场景划分的,只要在一个场景中进行了闭环的验证,就很容易进行全球的规模化的复制。在规模化的复制过程中,就能让数据采集的体量、硬件的规模提升几个数量级。智能涌现:为什么具身公司不太愿意进入场景?王晓刚:一方面,技术成熟度还不高。另一方面,解决场景中的问题,涉及到大量的数据采集、研发等资源投入。加之目前很多新兴的具身公司,本身对行业和场景的理解都不够深刻。所以很多公司的态度是:先融钱,等待一个行业成熟的时机点,再去跟上。但等时机点出现的时候,先机已经被别人占走了。智能涌现:在技术不成熟的阶段,你们是怎么和场景中的头部客户谈的?王晓刚:找到技术的边界很重要。我们要根据技术、软硬件的成熟度,把现实的边界找到。如果进入 To C 场景,比如 L4 阶段的自动驾驶,我的技术就不能有边界。但是进入 To B 场景,加上各种可控条件,技术是可以落地的。我们还得判断:哪些场景是可以直接被解决的,哪些场景通过一些手段可以解决。此外,这些场景的解决方案还得具有可复制性。如果你找到的场景不具备可复制性,你做完这个,下一个还得定制化,这其实不是一个很好的选择。智能涌现:怎么判断一个场景具不具备可复制性?王晓刚:举个例子,我们优先深入的是零售、仓储这些场景,因为他们的业务体系和需求,全国都是可以复制的。再比如酒店也是一个可复制的场景,全国有很多酒店,我们交付的都是同一套巡检、导航机器人和机器狗。智能涌现:这些场景的竞争会更激烈吗?王晓刚:虽然大家都瞄准了这几个场景,但很多企业走得不深。这样的后果就是,你的成本无法控制、无法边际递减。你可以做个 demo 炫技,但它不具备规模化的前提条件。智能涌现:怎样的落地模式才算得上 " 深入 " 场景?王晓刚:首先,你需要有紧密合作的生态伙伴。比如,在无人零售的场景中,我们和商汤生态中的公司善惠机器人合作,给他们提供无人零售解决方案。善惠首先会提出成本、续航、节排等要求。其次,在具体的复杂场景中,他们会给很多技术的反馈。这些要求和反馈,有助于我们形成数据闭环,在场景中快速迭代。做完生态合作伙伴的 " 前期功课 " 后,我们也能够知道哪些方案是必要的,哪些是可以省却的,或者可以通过其他方案进行弥补。等方案成熟,我们也能将业务合作拓展到零售相关的其他头部企业,通过规模化把成本降下来。通过这一套打法,目前大晓能够把解决方案的成本降低到行业的 1/3。智能涌现:之前你提到,大晓落地场景的规划是:道路巡检 - 无人物流 - 家庭场景。这个落地顺序背后的考量是什么?王晓刚:一方面,我们考虑的是技术实现的难度。另一方面,我们遵循的还是先 To B 后 To C 的策略。因为 C 端场景规则边界不强,存在很多非结构化的场景。但 B 端场景是受控的,能够保障安全性。所以在 B 端积累更多经验后,我们再走向 To C。△大晓世界模型的家居场景。图源:大晓机器人世界模型还没有「智能涌现」智能涌现:创业初期你提出了很多新观点,比如在 VLA 还是具身主流范式时,选择了做世界模型,再比如提出 " 以人为中心的数据采集范式 "。你怎么判断这套范式是可行的?王晓刚:大方向上的判断是非常确定的。首先,VLA 与世界模型相比,只有后者这样的生成式模型,才具备智能涌现的能力。所以我们做具身智能,第一天就选了世界模型方向。其次,只有真人的数据,无论是采集的效率和规模,还是拟人化的真实性,才能达到训练世界模型的要求。但其中很多细节是在实践过程中才逐渐变清晰的。比如做世界模型,一开始我们的主要关注点是生成能力。但实际场景中,世界模型不光要生成数据,还要去控制真机,通过机器人与物理世界进行交互。这对世界模型的物理智能、空间智能提出了更高的要求。所以我们最近发布了开源空间智能通用模型 ACE-Brain-0,以及物理 3D 生成框架 PhysX-Omni,来提高世界模型的空间智能和物理智能。智能涌现:视频生成模型、VLA 等都称自己为 " 世界模型 "。你对世界模型的定义是什么?王晓刚:简单来说,世界模型得具备三方面的能力:理解、生成、预测。只有同时具备这三个能力,模型才能自我演进、自我纠正、自我进化。为什么大家都说自己是世界模型?因为业界没有针对世界模型的评价体系。比如,行业缺少对长时序复杂任务执行效果的 benchmark。一些所谓的 " 世界模型 " 只是宣传了自己擅长的东西,但其实缺失了另外的能力。像 VLA 缺乏生成能力,视频生成模型缺乏了对物理和空间的理解能力。智能涌现:你们内部怎么评测世界模型的能力?王晓刚:我们正在联合一些学术机构和具身公司,建立一个世界模型 benchmark,其中的评测维度包括跨本体的泛化能力、模拟仿真的能力,这些维度最终指向的是衡量模型理解、生成、预测的能力。智能涌现:大晓的世界模型 Kairos 最近迭代到了 3.0。它的能力类比语言模型处于什么阶段?王晓刚:还没到 GPT3.0。等到 GPT3.0 的阶段,世界模型就能实现智能涌现,也意味着研究范式有较高程度的确定性。目前我们还是按照 " 理解、生成、预测 " 三个维度来逐步迭代 Kairos。最早的时候,Kairos 主要用来做视频生成,后面逐渐开始控制真机,相应的,我们也要提升它对空间和物理属性的理解。智能涌现:在当下世界模型发展的阶段,数据的量、质量、标注,以及后续的评测等环节,哪个对模型能力的影响最大?王晓刚:眼前世界模型还在 0-1 的阶段,可供训练的数据本来就很少。所以在这个阶段,数据的量对效果的提升更明显。当训练数据增加了 10 倍、100 倍,我立刻能看到模型能力的提升。但等到世界模型出现智能涌现,就需要对数据进行精筛、进行精细化的标注。这和大语言模型的发展是类似的。当下世界模型还没有 " 智能涌现 ",所以先要把数据的量铺上去,再反过来解决质量问题。智能涌现:要实现 " 智能涌现 ",世界模型需要多少的训练数据?王晓刚:我们期待的是要达到千万小时的量级。原来真机采集的数据规模只有 10 万小时的量级,现在我们用人采集,基本上能达到百万小时。智能涌现:提升数据采集量级的关键是什么?王晓刚:还是场景的规模化,所以其中就需要产业方进入。其实对于产业方而言,数据采集也是他们进入具身行业的切入点。因为他们有场景,如果做数据采集,马上就可以变现,立刻产生价值。接着通过训练模型,再引入机器人,产业方也能提高场景的效率。模型、数据、硬件、场景的结合是不够的智能涌现:如今行业对机器人的一种态度是:买来只能当吉祥物,没有实际用处。王晓刚:除却质量问题,很重要的一点在于具身公司没有针对特定场景进行深度的迭代和打磨。现在的机器人公司,每年不断发布新的型号,但这些型号不是针对应用场景迭代的,所以原有的问题没有解决,反而会出现新的问题。问题不收敛,就会造成返修率的增加,机器人工作几百个小时,就会出问题。所以当下机器人的规模化推广面临很大的问题。智能涌现:让具身公司根据场景迭代的解法是什么?王晓刚:等场景能够规模化,硬件可以量产,就会倒逼具身公司将资源集中在针对场景的迭代上。智能涌现:如今行业中还有哪些难题?王晓刚:首先,今天模型、数据、硬件三者的结合是不够的。基座模型厂商、世界模型公司,还有做数据的公司,大家都各做各的数据采集方案。但未来本体是靠数据来驱动的,而不是靠真机或者物理模型的规则。所以这些问题就很关键:怎么从人身

文章点评

用户
内容详细专业,对我帮助非常大!
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。