2024年,全球科技界共同见证了具身智能领域的蓬勃兴起,这一年被视为该领域发展的“元年”。自艾伦·图灵在1950年提出相关理念以来,具身智能在历经多年的技术积累和探索后,终于在大型模型与生成式AI技术的推动下,从理论走向了实际应用,成为全球人工智能领域的新焦点。
国际上,科技巨头如马斯克、黄仁勋等积极投身其中,推动了行业的快速发展。谷歌发布的RT系列机器人模型,在RT-H任务上的成功率显著提升,彰显了技术进步的力量。英伟达成立了GEAR实验室,推出了Project GR00T及Jetson Thor平台,进一步丰富了具身智能的应用场景。微软与OpenAI也紧跟潮流,不断推出创新产品。特斯拉的擎天柱机器人更是在多个领域展现出了巨大潜力,从日常琐事到工业应用,无所不能。
在国内,具身智能领域同样呈现出蓬勃发展的态势。2024年上半年,超过50家具身智能概念创业公司如雨后春笋般涌现,融资活动频繁。其中,智元机器人、星尘智能、逐际动力等公司,在人形机器人的研发上取得了显著成果,推动了国内具身智能技术的快速发展。
具身智能之所以受到广泛关注,是因为它具备更强的认知与决策能力,能够在复杂环境中自如地交互和执行任务,打破了传统机械的局限性,有望颠覆计算机、智能手机、新能源汽车等产品的传统格局。它将数字世界与物理世界紧密相连,为各行各业的深刻变革提供了可能,开启了一个充满无限可能的全新智能时代。
然而,具身智能的发展之路并非一帆风顺。数据训练与仿真成为制约其发展的关键因素。在具身智能领域,高质量的数据集对于训练深度学习模型至关重要。然而,从机器人及其环境中捕获此类数据极具挑战性,且成本高昂。鉴于数据获取的难度和成本,基于数字孪生的仿真技术成为了一个有效的解决方案。通过建立仿真平台,可以低成本、高效率地进行实验,确保安全,并提供可扩展性、快速原型设计能力以及广泛的研究社区访问。
为了解决数据瓶颈问题,AI领域的杰出人物李飞飞在2024年发布了空间智能及大世界模型,为具身智能的发展提供了全新的思路。与生成式AI工具生成的2D内容不同,李飞飞的世界模型实现了从数字世界向物理世界的跨越,使AI能够在三维空间与时间维度中立体地感知、推理和行动,与现实世界产生真正的互动。
世界模型在具身智能的潜在应用范围极为广泛。在自动驾驶领域,它可以实时精准地把握道路状况,预测变化趋势,为自动驾驶技术的发展提供了强有力的支持。在人形机器人领域,世界模型对于导航、物体识别检测以及任务规划等关键任务起着至关重要的作用。而在虚拟社会系统模拟方面,世界模型能够敏锐地捕捉并预测社会交往互动以及人类决策制定等过程,为虚拟社会的发展提供了有力支持。
在国内,极佳科技成为了具身智能领域的重要引擎和加速器。该公司聚焦于视频生成与4D世界模型在空间智能领域的探索与拓展,在机器人与元宇宙两大领域取得了显著成果。今年10月,极佳科技联合中科院自动化所、理想汽车、北京大学、慕尼黑工业大学等重磅力量,推出了DriveDreamer4D。这是全球首个借助世界模型优化4D驾驶场景重建成效的创新成果,能够显著提升多种自动驾驶4D重建算法效能。
DriveDreamer4D作为驾驶场景的数据强援,可以生成丰富多元的视角数据,涵盖变道、加减速等动态场景,极大地增强了闭环仿真能力。它以世界模型为核心数据引擎,基于真实驾驶数据合成全新轨迹视频,精准模拟各种驾驶场景。无论是车辆轨迹的预判、行人意图的洞察,还是道路与天气状况的综合考量,基于极佳科技4D数据引擎训练的自动驾驶算法都能迅速反应,为驾乘安全提供有力保障。
凭借技术领先优势,极佳科技与地平线、亿咖通等头部主机厂建立了深度合作关系,这不仅是业界对其技术实力的认可,也为具身智能的发展注入了新的动力。在近期现代汽车集团创新计划颁奖典礼上,极佳视界凭借4D世界模型与视频生成领域的创新成果,荣获了“灯塔”创新开放计划“创新企业奖”,进一步证明了其在具身智能领域的领先地位。
随着自动驾驶技术的不断成熟和具身智能领域的快速发展,极佳科技无疑将在这一广袤的蓝海中拥有无限的发展潜力和广阔前景。它将继续推动具身智能行业的蓬勃发展,成为推动行业进步的重要引擎与加速器。