介绍
人形机器人目前是最热门的方向之一。谈到人形机器人的最后一场游戏时, 的助理教授Chen 兼时代的创始人说,将来,人类机器人可能会成为人类的体现,并取代人类完成各种复杂的任务。在本科课程期间,他开始研究两足机器人的步态计划。在伯克利分校的博士学位时,他的研究领域包括自动驾驶和机器人技术。当时尚处于商业自主驾驶行业的早期阶段时,大多数针对无人车辆的决策和计划系统都基于人类规则,而陈·贾亚尤(Chen )研究的方法可以自动为无线性车辆等非线性系统(例如无人驾驶汽车)实时计划安全轨迹。 “这是我第一次意识到用自己的算法坐在汽车上的感觉。汽车在摇晃,我不得不调试并找出原因。这非常令人兴奋。”
无人车和机器人在算法级别连接。随着研究期间无人车辆和两足机器人的技术积累,陈·扬(Chen )于2023年创立了《星际运动时代》,重点是人类机器人的研究和开发。现在,可以按照自己的稳定而敏捷的步伐。将来,如果您要解决特定的任务,倒咖啡或炒菜,那么如果您想追求真正的“相似性”而不是表面上的“相似性”,则必须克服许多技术问题。可以想象,拥有真正的类人机器人的一天将就像每个人拥有的智能手机一样。 “在进入成千上万家庭的理想之前,将逐渐推出TOB场景。”
以下是社区访谈的笔录(本文已删除而没有改变其原始含义)
的交叉信息研究所助理教授Chen ,时代的创始人
他获得了大学的学士学位,并获得了加利福尼亚大学伯克利分校的博士学位。他在国家工程学院的院士下学习,并在机械和电气控制学科的先驱教授中学习。近年来,他在机器人和人工智能的交集方面一直从事尖端研究。他的研究目标是建立具有高性能和高智能的高端机器人软件和硬件系统。他在国际顶级会议和日记中发表了50多篇论文,在机器人技术,人工智能,控制,运输和其他领域中,其中一些论文已入围,以参加国际杰出纸张奖,例如L4DC 2022,例如IEEE IV 2021,IV 2021和IFAC MECC 2021。
的独家访谈专栏旨在通过展示技术研究人员和企业家的研究经验和故事来记录技术世界的演变,激发对当代AI从业人员的创新思维,启发认知,关注认知,对突破的进步以及对行业的注入。这次采访是总数的第11期。
从婴儿的步行姿势开始,
双皮亚机器人的研究
您什么时候开始研究的?我听说我已经去过8岁的妈妈大学的物理实验室了吗?
我的母亲在上大学,经常带我去实验室,所以当我小时候时,会有一些零星的记忆片段。小时候,他对科幻小说的事物也非常感兴趣,包括科幻小说,例如“三体问题”和著名的科幻电影。因此,在黑暗的专业选择中,也朝着科学,工程和技术迈进。我一直觉得做这种高端智能机器人是一种科幻的感觉和酷。这是我想做的。
从到UC的研究经验方面,什么对您产生了深远的影响,并带领您走上了科学研究的道路?
这也模糊地奠定了我现在成为两足动物的人形机器人的预兆。自从我从本科课程毕业以来,我开始参与两足机器人。当时,我在 的 fu 教师Fu 的研究小组中。 是中国最早从事两足动物机器人研究的部门之一,并以前制作了非常好的机器人。 Fu老师在他的学术研究中很严格,并且擅长基于生活现象的科学研究。他记得自己研究机器人步行,并会看到他的刚出生的孩子的行走。这也模糊地奠定了我现在成为两足动物的人形机器人的预兆。
当时的机器人已经采取了人类形式?
当时我们正在做的不是一个完整的人类形式。它有一个下半身,两条腿,尚未添加上半身。与现在整个身体一起工作以共同完成工作的情况不同。当时最重要的困难也是研究两脚的相对稳定的步行。当时,AI领域尚未上升,算法是纯计算算法。当时,即使是波士顿的动态尚未实施跑步,跳跃和其他操作,因此能够走路已经很棒了。当时的算法相对较古老,具有更多的人造规则或一些(启发式算法)。现在,无论是基于数据驱动的还是基于理论的方法,它都是自动化和更一般的。
做有用的研究,
不是纯数学游戏
教授的技术思想是什么?对您的主要影响是什么?
我是教授的博士项目小组。他是机电控制领域的发起人。可以认为当前的机器人系统是机电控制系统的扩展。从技术上讲,在博士阶段,我对硬件本体论以及如何控制真正机器人的硬件系统有了更深入的了解和学习。这很重要。必须将智能系统与本体论结合起来,才能真正控制机器人,并执行像人类一样的各种事情。
此外,从深思熟虑的角度来看,我的主管给我带来的灵感是进行有用的科学研究。毕竟,机器人属于工程学科。在博士阶段之前,我去了纯理论。有时,在工程学科中,如果没有一个好的人可以判断我们的工作最终会有用,那么它可能会变成纯粹的数学游戏。当时,我认为我可以推动各种数学公式,这些公式似乎很酷且高端,但是最终可能需要很长时间,这可能没有真正有用,因为您正在研究的问题是每个人都不关注的问题,并不重要,或者并不重要,或者将来没有用。
如何定义有用的研究,您的研究小组认为有用什么?
我们的实验室非常重视与行业(包括无人车项目)的沟通和合作。研究问题来自工业应用中看到的困难和需求,然后将其完善为一般科学研究问题,然后通过一般方法解决。我们可以出于许多问题而来自该行业,而我们不仅锁定实验室可以想象。时间和能量是有限的,因此我们应该专注于这些真正有用并可以创造价值的问题。
对无人车和后来的类人形机器人的研究是否相似?
实际上,无人车是一种机器人。在数学级别进行建模后,公式相同。但是,机器人确实更加复杂,因此它们将花费更多的时间,并且解决准确性和计算能力的要求和复杂性将更高。从技术角度来看,有许多常见的事物可以建模为相同的形式,并且优化方法是一般的。但是,人形机器人的自由度非常高,相对复杂,并且还涉及与地面的接触。
人们为什么这样走路?
数千年的进化只是为了节能
创造星星时代的过程是什么?
一开始,我们将研究小组的科学研究项目作为核心,在早期进行了几个月的探索之后,包括路径,软件和硬件技术路线,我们逐渐招募了团队。大概,去年我开始有这样的想法,并进行了一些准备和技术路线,然后逐渐形成了建立公司的想法。一个很大的部分是,希望可以通过技术驱动器进一步促进类人形机器人行业的发展。
的最大优势是什么? 最近的优化目标是什么?
我们正在做的工作,包括灵活性,高动力和步行的稳定性,已在真实机器上显示。它还可以实现非常精确的单腿瑜伽平衡运动,并且还可以平稳,更快地行走,同时保持崎roug的道路上的平衡和稳定性。在研究方面,我们还提出了一些有关手腿协调的新工作,以及将大型语言模型和视觉语言模型与强化学习控制结合起来以改善概括。将来,我们希望发展到更高的动态,让它“运行”,具有更高的智能,并增强工业设计和算法中的“拟人化”。实际上,“授权”也与节能。
人们的步态为什么看起来不错?人们为什么这样走路?如果您仔细观察,腿在行走时伸直,触摸地面时的腿是笔直的,抬起时腿弯曲。数百万年来,人们已经发展出一种非常节能的步态。
在本科学习期间,我正在研究步态。那个时期是一个相对流行的方向。有几篇关于“”和“,”和“”的论文,这表明人们的步态得到了优化是由于能量而进行的。当时,我还复制了本文中的观点,并在该程序中写下了优化器,使用能量节省作为步行的指示,并在模拟中模拟了非常相似的步态。我们还将在未来的机器上找到它在真实机器上实现的方法。
您还自己做机器人硬件的身体吗?它涉及非常复杂的硬件吗?
我们设计了基础组件,包括电动机,还原器,驱动程序等,以及整个机器的硬件结构,然后我们找到可以制造它们的供应商。团队中的各种才能都可以使用,并且有与学习机械设计,电子产品,软件算法等有关的才能,包括处理技术,所有这些都需要经验丰富且聪明的人。
当您成立一家公司时,您的脑海中有原型吗?机器人产品是什么样的?它满足人类需求,当时有一条完整的道路?
我们的最终愿景仍然是希望它可以进入数千个家庭,而且还没有这样的机器人。但是,当将来实现技术时,它肯定会进入我们的数千个家庭,并帮助我们做各种各样的事情,例如作为保姆,餐厅服务员和工厂工人,这有很大的想象空间。
解决特定的任务,倒咖啡或炒菜,
追求“喜欢形状和类似的精神”
要解决倒咖啡或陪伴您的需求,需要克服哪些关键的技术问题?
目前,可以做“倒咖啡”的作用,但它只能针对倒咖啡的任务或一些特定类型的杯子或咖啡机,而这些杯子或咖啡机的概括不够。以人们为例。如果您进入任何环境,即使您不知道是否有咖啡机,也会自己找到它。您将有一个咖啡机的概念。即使其形状不同,您也会知道在哪里输出水以及如何做。但是,当机器人进入家庭时,概括非常困难。
为了实现真正的概括,仍然有许多科学问题需要进一步解决。大型模型的出现带来了很大的转变。在去年之前,我还没有看到AI在任何领域的概括。现在,大型模型在语言和视野领域表现出非常强烈的概括,从而带来了强大的技术变量。
如果我们以一种简单的方式解释它,可以理解为将大型模型的模块植入机器人中,他可以做更多的事情?
最后,这不仅是植入,而且您必须更改它,我们必须建立一个大型机器人模型。仅植入当前的大型模型可以做出一些改进。您可以在现有机器人上调用程序和技能,并将它们组合起来以完成更复杂的任务。这就是您目前可以做的。在上一个机器人的字段中,称为任务,它也是机器人中相对重要的字段。它以前是基于计算方法,其普遍性和概括相对不足。但是,现在,通过进行大型模型,可以很好地解决这些任务。例如,如果您告诉他假设他是一个机器人,并要求他将一杯水倒入客厅,他会很好地拆除任务。
自定义任务是理想的选择吗?例如,如果我需要一个机器人来取笑猫并白天照顾宠物,我该如何处理这种情况?
如果我们遵循当前的一般路线,我希望它可以解决一些非常普遍的问题。当然,它涉及猫和狗等活物体,并且还涉及模型本身与自主之间的相互作用。毕竟,浇注咖啡与静态物体接触,但被动地遵循物理规则。猫,狗甚至人都有一定程度的自主权。首先,我们必须解决受物理环境的对象(无自主),您可以通过足够的数据来学习这一点,例如苹果落入地面。但是,如果您需要预测另一个人的动作(生物),这将更加困难,需要更多的数据,并且算法需要进一步改进。
以烹饪为例,这有多可行?如何教机器人做饭,它离这个目标还远吗?
当今的机器人只能达到类似的形状,这意味着进行动作,从技术上讲,它们可以完全复制烹饪的作用。但是,人们搅拌不会重复此动作,而是铲子和锅之间的相互作用,包括这些菜肴的移动方式。人们将对物理过程有深刻的了解。例如,对于“油炸菜肴”的任务,我们要搅拌它,我们需要与锅底上的所有菜肴联系。这需要高度要求,并且需要基本的物理常识。它涉及不同菜肴的形状以及不同的花盆和产品,真正的概括很困难,而且没有这样的事情。
但是从工业化的角度来看,类似于形状并不完全没有用。例如,某些任务通过达到形状来解决许多问题。包括当今工厂的工业机器人臂,这些处理方法彼此完全相似。例如,一个简单的爬行任务,在程序中,确定其在哪里,移动到该位置,判断有多大的差异,然后抓取并确定,执行其他计算和计划。尽管您并不真正了解其背后的内核,但如果此任务不是特别复杂,那么您仍然可以实现反向工程和拆卸步骤,包括路上无人车辆。它背后的许多逻辑不是基于人类常识来推断的,许多逻辑也是反向工程,它是制造的,但最终,我仍然希望能够实现真正的理解。
数百所思维学校认为
从“触手可及”到“触手可及”
最近,一些公司发布了类人类机器人,包括 PX5,等。如何评估最近的繁荣?每个人的优点和缺点是什么?
特斯拉的产品非常擅长手眼协调,并且是端到端的,具有非常精致的指尖动作,纯粹基于视觉。不用说,波士顿动力学是唯一能够进行如此高的缺乏和高动力的动作,例如反弹,而运动控制级别是最好的。包括商业化的探索,我们已经开始在不久前在亚马逊的物流仓库中进行探索。每个国内公司也都有自己的亮点。有些人可能会更稳定地走,而另一些人则具有自己的优势。
今年是机器人实施的第一年。近年来,人工智能,电子工程,运动控制等方面的突破性进展使形状机器人从“无法触及”到“可达到”。大众汽车是否高估了该领域的短期发展?面对这种热潮,如何预测批量生产的实施?
不太可能看到如何将其定义在触及范围之内,并且有可能在一年中进入数千个家庭。逐渐抛光和积累将需要几年的时间。任何新产品,尤其是这种硬件产品,都很难说突然出现了热门产品,世界上有数百万用户推出了该产品。
我觉得进入数千户家庭的机器人遥不可及,因为在大型模型出现之前,我没有看到任何技术路线。但是现在,大型模型的出现使它不再遥不可及。您的指尖可能有点夸张。确切地说,应该在艰苦的工作后实现这一点,并且必须克服一些技术困难和关键点。大型模型在语言和视野领域取得了巨大的成功。我们有充分的理由相信它可以继续扩展到机器人技术领域,并带来定性的变化。
从一开始就花了五到六年的时间到第一代的介绍,而且非常快。近年来,机器人硬件本体论和小脑控制等算法的改进以及大型模型出现带来的技术变化肯定会带来新产品。在进入数千个家庭的机器人结束之前,中级过程还可以发展各种B端方案。
想象一下最终图片会是什么样?在再过10到20年的情况下,某种科幻电影,电影和电视作品中的场景是否会得到实现?
我认为这不是太多。当然,我可以想象我像人一样具有完全独立的意识,甚至比人更聪明。但是,语言模型尚未实现这种独立的思维能力,而更多的是帮助人们做事。
我们可以想象的是机器人达到的智能水平()。它可能无法完全自主地完成非常复杂的任务,但是在您的培训和教学下,给它提供了一些和示例,并且可以迅速适应并巧妙地完成相应的任务。例如,最终在家庭做饭时,您一开始可能没有做得很好。您应该尝试教他并提醒他,然后逐渐熟练并完成任务。新任务需要教育和指导。
人形机器人最终游戏:备用信使
有没有更具想象力的场景,他最终还能做什么?
最后,您可以想到那个时候,您可以雇用一组机器人,这些机器人成为您的化身并帮助您处理各种事情。因为当技术达到这一点时,它可能不仅谈论他的家人为您工作,而且可能会带来整个世界的经济结构和运营发生重大变化。包括马斯克的殖民地梦想将人类送往火星,这些梦想将拥有更广阔而宏伟的空间。
如果您想从事类人形机器人研究,需要培养能力或质量的哪些方面? (社区问题)
我认为首先,我们必须对人形机器人和一般AI充满热情。其次,我们可以在机器人控制和AI领域培养一些知识和技能,以及在机器人控制方面的一些实用经验。
什么时候可以实施群众生产?
我们将在明年发布第一代产品,并与合作伙伴合作在各种应用程序方案中抛光产品。
例如,从长远来看,最终有可能最终向TOC侧移动,成为每个人都像手机一样购买的机器人吗?
最终目标是实现这一目标。
最后,对人形机器人的终结进行预测。
最后,我希望在5到10年中逐渐做到这一点。最终结果是进入数千个家庭,即C-End产品。如果目标是TOB,它将更快。实际上,这不是一个非常遥远的未来。它是可以想象的,并且肯定会实施许多新方案。这个结局并非遥不可及。
我们的最终目标是与所有人合作,共同促进人形机器人,通用机器人和具体智能领域的技术和行业。我希望我们能真正看到机器人进入数千个家庭,并在不久的将来融入成千上万的灯光。