【原创】具身智能与智慧物流

来源:物流产品网 | 2024-11-22 11:54 | 作者:科技物语

  111.jpg

图片来源:网络

  具身智能(Embodied Artificial Intelligence,简称EAI)作为AI领域的一个重要分支,正逐渐从实验室走向商业应用,那么,它对物流的智慧化将产生什么样的影响呢?

  一、基本原则

  所谓具身,指的是依附于真实世界的物理实体,类似于人或者动物需要一个肉体,去认识世界、探索世界,并通过与环境的交互去影响世界;所谓智能,指的是具备感知、认知、推理、决策、持续迭代的能力。


  具身智能行为可以直接从自主机器与其环境的简单物理交互中产生,不依赖于预先设定的复杂算法,核心在于,智能系统不应该首先处理抽象的内部世界表征,而是应该能够直接响应外部环境刺激。

  具身智能技术是什么?它不是单纯的程序或算法,而是与实体的身体紧密结合,通过身体与环境的互动来不断学习和提升智能水平,也就是说,智能行为来自智能体身体与周围环境的交互,而不仅仅是大脑的功能。

  具身智能可以形象地说,是“长了身体的智能”,其独特的自主感知、学习和多模态融合等特点,使其成为人工智能发展新方向,也使其成为未来科技发展的重要方向。

  由于具身智能认为思考和身体、环境是不可分离的,而传统人工智能没有考虑思考、感知与身体的关系,所以属于离身智能。具身智能认为智能行为不仅依赖大脑的思考,还需要通过与物理环境的交互来进行学习和决策,最后通过感知将执行的结果反馈到大脑,形成闭环,构成一个智能体。

  离身智能提出数据驱动的模型,通过基于大数据的机器学习,实现对人类感性和情感行为的模拟,有很大的局限性,而且只针对特定领域、利用特定模型去解决特定任务,而具身智能则强调物理身体、环境感知与反馈的重要性,并通过它们实现与外部世界的交互,这就是新的学习范式——强化学习。

  具身智能*突的两大特点是自主学习能力与多模态融合,前者突出自主感知物理世界,通过与环境的互动不断学习和积累经验,而不是被动地等待数据投喂;后者强调实现视觉、听觉、触觉等多种感知能力的深度融合,提升其在复杂环境中的适应性和交互体验。

  具身智能的自主学习,也可以这样理解,是自主感知物理世界,用拟人化的思维路径去学习,从而做出人类期待的行为反馈,而不是被动的执行,因此,具身智能才是真正的智能。

  人具有大脑与小脑,大脑长于思维,而小脑长于行动,具身智能就是配备了足够智能的大脑和小脑,以适应不同形态的需求,根据英伟达创始人黄仁勋的描述,新型人工智能-——“具身人工智能”,即能够理解、推理并与物理世界互动的智能系统。

  具身智能在包含AI大模型驱动任务规划的具身“大脑”之外,还拥有以数据驱动的端到端技能执行具身“小脑”,能够灵活应对多变的环境,而不是仅仅执行固定的、预设的程序。

  具身智能机器人的种类多种多样,需要到逼真的环境中去验证各类算法,而一些仿真平台为此提供了虚拟的仿真场景。具身智能机器人产品可以同时结合场景几何信息与物体的语义信息,完成高数据效率的行为学习训练——相对于传统的算法,数据效率提升20倍以上。

  不可否认,“人工智能的下一个浪潮是具身智能”,具身智能正朝着一个宏伟的目标迈进——开发出具备超越人类智能的机器人,使其理解并完成一定复杂度的长序列任务。


  从图灵的理论提出,到如今的技术不断发展,具身智能走过了漫长的道路,然而今天,*核心的关卡:攻克软件与硬件的耦合还没有完全突破,为了攻克这一关卡,具身智能领域的不同团队也有差异化思考:是选择端到端或者分层决策的「大小脑」?基于模型,还是基于学习更好?模仿学习与强化学习,哪一派更胜一筹?

  二、商业价值

  早在1950年,具身智能的概念就已提出,由于相关技术不成熟,该概念被搁置,随着技术的进步,具身智能作为人工智能与机器人技术深度结合的产物,近年来备受关注,正逐渐从实验室走向商业应用。


  具身智能自主学习能力,使其能够更好地适应不同的环境和任务。具备理解力、交互力、规划能力等,能够更好地理解人类的意图和需求,从而更高效地完成各种任务。

  具身智能应用,可归纳为B端与C端两类,技术的突破与多样性带来了丰富的视角,但是,只有拥有强大的泛化能力,具身智能技术才能适应各种任务场景,具备真正的“可用性”。从技术角度说,须以大量数据支撑具身智能模型泛化能力,未来将设计数据集的系列标准,为模型泛化保驾护航。

  从去年以来,具身智能是继大模型之后人工智能行业内讨论热度较高的议题,各大车企、科技公司纷纷布局具身智能领域,推动了这一产业的快速发展,而资本市场的青睐,更使具身智能发展锦上添花。

  近日,美国具身智能机器人初创公司Physical Intelligence宣布,已成功筹集4亿美元资金,融资后估值达24亿美元(约合170亿人民币),国内投资圈也是趋之若鹜,初创公司轻易就可拿到融资。

  我国在AI方面有深厚的技术底子以及相当积极的创业氛围,适合具身智能初创企业发展。国内自动驾驶等几轮AI技术浪潮的创业经验,可以给具身智能创业公司提供借鉴,还有供应链、产业链完整成熟,制造优势领先,都满足了具身智能初创企业的成长需求,许多龙头企业也在布局具身智能,宁德时代联创就出手了一家具身智能公司。

  过去20年,我国在新能源智能车上投入了几万亿的资本,孵化了一条很完整的智能供应链,据说,具身智能和新能源智能车在供应链的重合度有80%左右,所以这些供应链可外溢到具身智能。

  北京亦庄的国家地方共建具身智能机器人创新中心,作为引领具身智能技术突破与产业协同的关键平台,专注于解决发展具身智能机器人关键共性技术问题,创建繁荣的具身智能产业生态体系。

  创新中心牵头立项《人工智能、具身智能数据采集规范》工信部行业标准,这是国内第一个具身智能数据集的行业标准,标准规范了具身智能数据集采集的格式,不同公司采集的数据可以互相共享开源,能够加速模型“涌现”。

  目前,具身智能领域还没有任何公司绝对领先,玩家们各自为营,尝试着不同的路径和方法,具有百家争鸣的态势。

  人形机器人是具身智能的重要应用场景,成为了具身智能落地的核心研发方向,但绝不是实现具身智能的终极形态,只是具身智能的一种形态,也是众多具身智能赛道中*火热的一个。

  具身智能人形机器人与自动驾驶的整体技术栈趋同,可借鉴,具身智能人形机器人比过往的机器人操作场景的复杂性和多样性更高,今天大多数机器人95%的算力用在了基础功能上,而具身智能则要实现将20%的算力用于基础工作,预留出80%的算力给智能和应用层面。

  目前的挑战是我们现在对数据的运用并不充分,没有很好的数据收集方法,导致很多厂商把数据扔掉,完全用不起来,因此,怎样设计一个数据收集的计划,对未来智能的衍生将起到重要作用。

  从技术角度,目前机器人大脑层面的技术已经趋向成熟,能进行任务理解及规划,而以小脑为核心的具身模型技术路径尚未定型,为此,全球有近百家人形机器人公司,商业化均未取得实质突破。

  具身智能需要依靠智能体进行信息交换与学习,这就突出硬件的重要性,并且就目前来说,还没有形成较完善的供应链。在具身智能的应用落地上,场景门类存在跨度,所以相关技术和经验无法进行复用,要坚持与产业深度结合,技术创新和产业落地双轮驱动。

  从应用角度说,纯软件的路径很难跑通,因为涉及和主机厂的复杂交互,以及数据层面的隔阂,导致模型优化受限,因此,特斯拉、理想等主机厂自己下场实现具身智能应用的落地,总体发展的相对较快。


  目前,具身智能的通用泛化距要求还有距离,整个赛道处于萌芽期,可以首先以单一场景,单一任务为主,在单一场景中率先优化泛化能力,后续降维切入其他场景,先落地,形成正向数据反馈优化产品功能。

  汽车及其上游供应链产线是劳动力密集型产业,汽车工业场景是具身智能机器人走出实验室之后,一项关键落地场景,2024年以来,大部分具身智能厂商都把产品投放至汽车工厂里做验证,比如马斯克也把Optimus送进了特斯拉产线搬运电池,当然,车企对具身智能的热情也在持续高涨。

  工厂是具身智能B端应用的主力,但还有一个适配的问题,在效率和精确度优先的工厂中,在限定时间到达确定位置完成给定的任务,对智能化的要求并不是特别高。工业制造安全性及重复性要求高,容错率极低,选择人形机器人替代人或者工业机器人存在很大挑战,一旦产线上操作失误,造成的损失巨大。

  其实工业场景相对封闭,任务单一,对通用泛化的要求低,很难在这个场景里形成数据迭代。具身智能商业化是一个循序渐进的过程,必须先进入到实际应用场景中,收集高质量的数据,再持续迭代。以头部客户的高价值场景需求为指引,开发整合技能,实现商业落地,并快速迭代硬件,算法,数据系统,不断提升具身智能整体解决方案的泛化性才是出路

  还有,具身智能机器人想要真正产业化,真正进入生产、生活场景,必须大幅降低成本,并且具有完全的可扩展性,成本过高一直是阻碍具身智能人形机器人落地汽车产线的一项关键掣肘,目前一台完整的人形机器人售价基本高达百万甚至数百万,

  具身智能企业需要在控制落地成本的同时,做出满足工业级要求的产品。让一个模型能在多种不同的具身载体上实现迁移,有利于降低产线的成本,满足工厂实际应用时的不同诉求。

  毫无疑问,具身智能的应用前景广阔,但深入产业观察,理想和现实仍有相当大的差距,技术上的难题仍然存在,伦理和安全问题还需要研究,未来行业的挑战是量产和交付。

  三、物流应用

  总体上来说,具身智能技术需要丰富的应用场景,而物流,特别是快递的终端应用市场庞大,无论是人口基数、快递件量、还是场景丰富度,乃至购买力,都在全球领先。具身智能初创公司要找准商业化场景,并和模型及数据优势匹配,物流是一个不可多得的选择。


  具身智能技术的商业化落地,包括量产,处于初期阶段,需要和合作伙伴、和C端、B端的用户一起去共创场景和生态的。智慧物流是其理想的合作伙伴,如上所述,具身智能的关键词是“通用”和“泛化”,要在高训练效率的基础上,实现更高的泛化性,而物流具备丰富多样的,庞大的场景,数据价值大,从而形成以更高效的训练效率去完成较复杂的任务。

  也就是说具身智能一个重要任务是要把产品搬到场景里去,解决上一代机器人解决不了的事情,物流领域有能力,也有需求提供支持。快递物流头部企业可与具身智能企业共创一些功能,训练其学习一些高度非标场景的操作,从而极大提升具身智能技术的泛化性。

  具身智能硬件的开发与完善,需要通过用户场景落地方面的反馈,从而迭代,如果数据收集受限,端口不能完全开放,限制硬件创新的空间。物流,特别是快递行业,对于机器人都有资深的积累,具有硬件量产操盘的经验,可以帮助其快速搭建产业链。

  快递物流中,分拣是十分重要的环节,目前自动分拣已完成布局,但对于易碎,柔软的物体的分拣还不理想,具身智能更注重触觉模型,这就可解决物流分拣中对易碎件、超薄件、柔性物体的处理问题。

  大多数模型主要依靠视觉,但光靠视觉是无法适应末端执行的多样性的,这时候触觉的数据反馈就极其重要。而具身智能中,触觉大模型可以处理更加精细的任务,如何在分拣中使易碎品,易变形品,让机器人既能抓起来,又不破坏的外形,这就是触角模型要完成的任务。

  拥有具身智能的产品,利用触觉、力觉、力矩觉等多传感器的融合,可在复杂环境下实现复杂操作,接触后,执行器对力学会做出的精准反馈。

  如果应用了具身智能技术,可以适配夹起鸡蛋、豆腐等需要精细力控的场景,还可以完美复制五指灵巧人手功能,从而更像人手一样对仓储中各式各样的物体进行稳定、精准抓取,当然,触觉还会弥补视觉在被遮挡、在盲区操作以及抓取柔性物体的困难,这是不难理解的。

  对具身智能领域的深刻洞察,前瞻性思考,融入物流的智慧化都是不错的选择。具身智能对机器人的影响很重要,而机器人,是仓储物流,快递物流,工厂物流的重要基础。


  我们相信,物流快递行业对具身智能的热情肯定会高涨,就目前来说,快递的智能化*高,头部快递企业都创建有研发机构,各色机器人是其主要研发方向,而具身智能技术的引入,将使这一研发扩大应用范用,达到更高水平。龙头物流企业,包括物流装备企业可通过通过自研机器人方式,切入具身智能赛道。

  结语:具身智能技术的发展应用,将使一个在视觉、学习、决策等多维度拥有更高智能水平的新物种,正在硬件与智能的交互中诞生,虽然困难重重,但我们对具身智能保持乐观的态度,肯定其对物流智慧化的正面影响。


【声明】物流产品网转载本文目的在于传递信息,并不代表赞同其观点或对真实性负责,物流产品网倡导尊重与保护知识产权。如发现文章存在版权问题,烦请联系小编电话:010-82387008,我们将及时进行处理。
56视界

10秒快速发布需求

让物流专家来找您