编者按:在由bob手机网页登录入口主办的2023世界人工智能大会“生成式AI与大模型:变革与创新”论坛上,人工智能等技术前沿领域的著名专家与学者,顶级投资人和领军创业者汇聚一堂,共同探索中国科技创新的驱动力量。
本次论坛是大会唯一一场由体育机构主办的相关论坛,立足创业与投资视角,分享了最新生成式AI前沿信息和实践探索,并发布了行业首份基于对海内外逾百家企业深入调研撰写的生成式AI洞察报告,全方位解读了生成式AI的产业变革和未来十大展望。
bob手机网页登录入口投资企业优必选科技联合创始人、首席技术官、执行董事熊友军博士在现场发表了“人形机器人的发展与未来”主题演讲。他介绍了人形机器人正在迎来“iPhone”时刻。人形机器人更适合于人类的环境,并提供更自然的人机交互来满足人的情感和陪伴需求。
AI技术的演进和发展,是推进人形机器人智能化的关键,人形机器人和ChatGPT结合将AI推上了一个具身智能的新高度。ChatGPT赋能人形机器人,使之告别四肢发达头脑简单;而人形机器人将延展ChatGPT的能力,帮助其超越文本处理和信息空间,具备与物理世界交互的能力。人形机器人市场目前百花齐放,未来将更加繁荣。
以下为精编整理的演讲实录。
非常感谢bob手机网页登录入口的邀请,我们向大家分享一下优必选科技在人形机器人方面的研究。优必选科技在这方面已经进行了十多年的研发,最近这段时间我们迎来了人形机器人的“iPhone”时刻,可能大家对这方面都很关注,我们给大家分享一下这方面的发展与未来的情况。
优必选科技联合创始人、首席技术官、执行董事熊友军博士
01/
人工智能技术的演进和发展
是推进人形机器人智能化的关键
我们为什么要做人形机器人?或者说机器人为什么一定要有人形?是出于几个方面的考虑。首先因为我们现在的环境都是为人类所打造的,人形机器人更适合于人类的环境,并提供更自然的人机交互来满足人的情感和陪伴需求。
人形机器人的发展历程实际上是一个比较早的故事,1969年早稻田大学开发了第一代的人形机器人。后面的人形机器人大致经历过三个阶段的发展,但是基本上都是围绕着怎样让机器人更好地在我们的人类环境里运动而展开的。
第一个阶段是1969-1995年,它是一个缓慢静态行走的过程,以日本本田ASIMO机器人的前身为代表,当时机器人只能在结构化的固定环境中运动;
第二个阶段是1996-2015年,可以实现连续动态行走,这时候更多考虑到了机器人的质心惯量以及质心的加速度等因素;
第三个阶段是2016年-2020年,追求的是高动态的运动性能,以波士顿动力的ATLAS机器人做出的令人惊叹的运动动作为标志;
人形机器人更强调与人的交互,其环境感知和决策能力都是随着人工智能的发展而快速发展的,所以人工智能技术的演进和发展是推进人形机器人智能化发展的关键因素。
02/
人形机器人和ChatGPT的结合
将AI推上了“具身智能”的新阶段
“具身智能”更强调智能体与物理世界的交互与反馈,也能让人形机器人发挥更多价值,但现在的ChatGPT更多的是在信息空间的结合。过去机器人被认为四肢发达、头脑简单,但在人形机器人和大模型结合之后,会大大延伸人形机器人的工作价值,不仅仅会具有更多的劳动力价值,也会有更多情感交互的价值。
另外,人形机器人也能够延伸ChatGPT的能力。目前ChatGPT实现的只是信息输出,但在未来可以借助人形机器人实现与物理世界的交互,从信息空间向物理空间延展,两者结合具有非常大的想象空间,对人形机器人和ChatGPT都具有非常巨大的价值。
在技术层面,生成式人工智能可以提升人形机器人的研发效率,过去研发过程需要撰写大量基础且重复的代码,未来我们可以用大模型自动生成特定目标的基础代码,节约工程师人力资源。
生成式人工智能还会让人形机器人的运动规划变得更加便捷,过去研发过程需要提供非常细节的指令,未来我们只需要给出宏观指令,设定好目标,由大模型自动生成代码来实现,从而加快机器人的开发过程,降低机器人的开发成本。这些都是人形机器人和ChatGPT结合之后带来的好处。
03/
人形机器人发展涉及的核心技术
需要全行业共同推进
从人形机器人行业现在的竞争格局来看,很多公司已经开始在做人形机器人的研发了,尤其像特斯拉、Open AI还有谷歌,都在这方面做了很多布局。国内也有很多的公司开始加入,包括这几天也有一些公司发布了他们人形机器人的进展。这是非常好的现象,百花齐放,这个生态更加繁荣起来了。
人形机器人发展起来涉及到一些核心的技术,需要全行业共同来推进。
第一,伺服驱动器,也就是机器人的“关节”。这是让机器人能够运动的重要零部件。从小扭矩的手部关节,到大扭矩的踝关节、膝关节,需要伺服驱动器具有高爆发力、高控制力和高能量密度比等不同的特性,也对应不同的核心技术。
第二,运动控制研发。这涉及到机器人的步态算法,需要适应各种环境,比如楼梯、斜坡、草地、石子路等等。
第三,位控和力控。我们对机器人的行走速度、运动速度要求都非常高,希望它能更快一点,甚至能跑、能跳,这里面有两个控制的主要技术,位控和力控,面向不同的场景有各种不同的侧重。
第四,全身柔性控制。人机交互的安全性。人形机器人更多参与与人的交互,需要它是柔性的,而不是工业机器人那样需要用独立环境把它隔离出来,所以它的全身柔性控制是非常重要的。
第五,我们更加关注的是机器人的工作能力,像手眼协调、抓取、力位混合控制、精度的控制,除了要考虑到运动控制,还要跟视觉、力觉等传感器做很多的配合。
第六,导航算法。机器人在生活的场景里面大范围地移动,需要对环境进行重构,基于不同的障碍物进行路径的规划,所以我们要基于它的3D视觉传感器做很多导航算法的研究,和轮式机器人的导航也不一样。
第七,生物特征识别。跟人交互的过程中要用到生物特征识别,机器人在面对老人、小孩等不同的交互对象时,交互的模式和内容都会不一样。
第八,多模态的交互。我们的交互不仅仅是要关注它的语音、视觉,其实我们还有触觉,还有一些表情、行为等等的交互,人形机器人和人的交互是多模态的交互。
第九,机器人操作系统。除了这个以外,还有机器人底层的操作系统也是非常重要的,现在我们很多的操作系统基本上都是基于Linux或者安卓做应用开发,在产业真正发展起来之后,一定会有自己的操作系统。
04/
人形机器人作为第三代人机交互中心
会有巨大的发展
从工业革命以来,每一个时代都有它的标志性产品,第四次工业革命的标志性产品可能就是人形机器人。
另外人形机器人的市场,不同机构给出了很多的市场的预估,这其实只是其中的一种。
最近围绕推动人形机器人的发展,国家出台了很多的政策,从工信部到各个城市,上海、北京、深圳都在大力推动人形机器人的发展,像工信部正在大力推进制造业创新中心、人形机器人制造业创新中心的建设,因此各个地方都推出了人形机器人的行动的计划。
我们做人形机器人最重要的目标就是要把它作为一个多任务、通用型的机器人平台,它有非常多的应用场景。比如说在工业生产的领域,我们已经进入老年社会,发展人形机器人可以大大弥补劳动力的不足,这是一个非常具有吸引力的用户场景。
人形机器人也是很好的社会服务的承担者,因为它具有的拟人特征更能适应以人为中心建造的办公、生活环境,更具有亲近感,它的应用将会在办公辅助、商务服务、家务作业以及居家照料老人等领域。一旦人形机器人大范围应用,劳动力短缺问题将可能一劳永逸地解决。
同时在特种领域,比如说救灾、救援,这类型的任务一般都具有急迫性,而且环境差异都不一样,有些时候特种装备都难以胜任,一般都派消防队员或者是特种救援队员上去,其实这时候可以用人形机器人,人形机器人可以直接使用各种特种装备展开救援任务,大大减少对人的威胁。
另外在国家的重大工程建设方面,人形机器人可以代替人在一些缺氧、强辐射,在对人有危险的环境里长期驻守和部署。所以在核电站、空间站、探月工程,这种国家级的重大工程应用里面,人形机器人也有非常好的应用前景。
其实我也经常被问到一个问题:在工业领域里为什么会用到人形机器人?我们跟制造企业谈过,像深圳的一些汽车制造厂,焊接、喷漆、搬运、生产的自动化程度已经很高了,但是依然还有非常多的岗位由人来承担。这些场景不适合用自动化设备,相比自动化的机械手臂、工业机器人,人形机器人的运动能力适合所有的工厂环境,决策能力更强,灵巧手的抓取能力也更强,每个工种也可以替换不同的夹具来完成。
人形机器人几乎可以完成人类能进行的所有非标任务,在自动化流水线上也可以配合传统设备进行作业。优必选科技在智慧工厂做了很多人形机器人的应用探索,在物流、测试,在分拣方面都做了很多工作。
我们有一个大致的预判,人形机器人会赋能各行各业,最终会走入家庭。这是美国的人工智能协会的预测,我们生活的各个方向,各个层面,机器人都会发挥作用。人形机器人可能是最终的形态,它的数量可能会非常多,像孙正义、马斯克预测的100亿台、200亿台人形机器人,会需要一个发展过程。
继个人电脑、智能手机之后,人形机器人作为第三代人机交互中心,会有巨大的发展。它也会遵循个人电脑和智能手机的发展逻辑,不同的是人形机器人会采用多模态的交互,相对于个人电脑和个人手机来说,交互模式会出现全面的提升。
05/
人形机器人是能推动整个机器人
技术发展的重要产品
优必选科技最早从2012年就开始做小型人形机器人,到现在已经发展了很多代了。我们掌握了全栈的人工智能技术,包括机器人的本体、人工智能的视觉语音技术,包括导航、视觉伺服以及人机方面的技术。我们基于人形机器人的技术,展开了很多应用的场景,现在专注的几个场景是在人工智能教育、智慧物流,以及养老行业,还有一些商业应用的服务机器人。
优必选科技是全球极少数具备人形机器人全栈式技术能力的公司,包括行业领先的机器人技术(机器人运动规划和控制技术、伺服驱动器)、人工智能技术(计算机视觉和语音交互)、机器人与人工智能融合技术(SLAM 及自主技术、视觉伺服操作和人机交互),以及机器人操作系统应用框架(ROSA)。凭借自研的人形机器人全栈技术,优必选科技以智能机器人为载体,人工智能技术为核心,面向人工智能教育、智慧物流、智慧康养、商业服务等多个行业,推出了“硬件+软件+服务+运营”的智能服务机器人解决方案。
这些解决方案都是基于人形机器人技术衍生而来的。人形机器人的核心技术就像是优必选科技树的“树干”一样,可以分出很多的枝桠,为其他产品提供了养分。这也是优必选科技做人形机器人的原因,我们觉得人形机器人是能够推动整个机器人技术发展的非常重要的一个产品。
请关注bob手机网页登录入口公众号
在后台输入“生成式AI报告”
获取完整报告下载方式