查看官网原文 → 在乐享AI咨询 →
品牌/新闻

联想毛世杰:AI大模型将从感知、交互和内容三个维度重构行业元宇宙-联想乐享知识库

⚡ 核心结论

联想毛世杰:AI大模型将从感知、交互和内容三个维度重构行业元宇宙 12月22日,以“智能涌现·发现未来”为主题的2023网易未来大会在杭州拉开帷幕。在大会的AGI论坛上,联想集团副总裁、联想研究院上…

内容来源:联想官方

联想毛世杰:AI大模型将从感知、交互和内容三个维度重构行业元宇宙

12月22日,以“智能涌现·发现未来”为主题的2023网易未来大会在杭州拉开帷幕。在大会的AGI论坛上,联想集团副总裁、联想研究院上海分院院长毛世杰发表了题为“AI大模型加持下的元宇宙”的主题演讲。他表示,AI大模型为实现行业元宇宙中的交互控制、感知和三维内容构建提供了最有利的技术支撑,将大幅降低元宇宙的构建成本,提高元宇宙的应用价值。

作为数字经济与实体经济融合发展的新型载体,行业元宇宙通过虚实映射、虚实融合和虚实联动的方式,一度在赋能产业数实融合的过程中扮演着关键角色。如今,在ChatGPT为代表的这一波生成式AI浪潮中,AI大模型具备的AI自动构建、强物理感知和更自然交互能力,正引领元宇宙步入“好看也好用”阶段,为行业元宇宙和数字经济的应用打开了新的想象空间。

联想凭借前瞻性智能化转型战略和全栈智能产品方案布局,规划打造了 “2+1+N”的元宇宙布局(“2”类人机交互设备,“1”个元宇宙平台,“N”个行业解决方案),并再度成为新一波技术浪潮中的领军企业。

联想集团副总裁、联想研究院上海分院院长毛世杰

毛世杰表示:“未来联想将不断优化开放平台和关键技术,持续降低元宇宙构建成本;同时也将打造更多虚实联动和智能化应用,提高元宇宙的应用价值,加速推动元宇宙在千行百业的应用,为产业变革注入新动能。”

随着人工智能、虚拟现实、增强现实等技术的普及,元宇宙的发展初见成效。企业可以通过元宇宙技术,在虚拟世界中进行仿真、推演,实现真实世界中难以实现或成本很高的应用,同时,通过虚实映射、融合及联动,在物理世界中叠加虚拟世界的信息与感知能力,从而有效提升人和机器人的决策能力及协作效率。

与此同时,行业元宇宙也正在成为我国政策布局的焦点。今年9月份,工业和信息化部、教育部、文化和旅游部、国务院国资委、国家广播电视总局等五部门联合印发《元宇宙产业创新发展三年行动计划(2023—2025年)》提出,到2025年,我国元宇宙产业综合实力达到世界先进水平。不难看出,产业数字化不断深化的背景下,元宇宙正在成为产业共识。

毛世杰在演讲中指出,元宇宙赋能实体产业的路径有三种:虚实映射、虚实融合和虚实联动。其中,虚实映射能够把物理世界“复刻”为对应的虚拟世界;虚实融合能够将虚拟世界叠加在物理世界之上,虚实联动则是指虚拟世界能够带动物理世界,物理世界也能够带动虚拟世界,两个世界完全融合。

毛世杰以工业元宇宙为例,对于元宇宙的实施步骤做了详细介绍。

第一步:构建元宇宙产线

在元宇宙产线中,工业产线叠加虚拟世界的信息与感知能力,可以提升人与机器人的决策能力和协作效率;在人、机器、数据等关键要素融合的产线数字孪生体和工业元宇宙虚拟装配空间中,非接触式检测手段可以实现三维自动化、智能化质检;工艺仿真模型库可以引导规范产线操作,提供专家远程协同指导等。

第二步:构建元宇宙工厂

在元宇宙工厂中,通过低时延、高保真、智能决策的工厂级元宇宙平台可以实现多类型工业软件集成、沉浸交互设备实现智能巡检、远程协作等应用,工厂生产运营各环节信息可以全面感知和实时反馈。

第三步:打造元宇宙园区

在元宇宙园区中,虚实结合的新型园区建设模式和运营模式可以提升工业园区产业规划和布局能力,优化园区空间布局、设施配套、资源调配等协同服务能力和运营效率。此外,还可以建立基于工业元宇宙的科技创新和招商引资平台,创新园区服务模式。

尽管工业元宇宙已经从研发进入到应用阶段,但当前阶段与上述愿景仍有一段距离。毛世杰强调说,以下几个因素在过去一直限制着元宇宙的发展:元宇宙的构建成本高、物理感知能力弱、交互联动少,同时,在为客户构建了相应的解决方案以后,实际应用过程中与业务的结合度不高,这导致了很多元宇宙的应用普遍处于“好看不好用”的尴尬阶段。

如今,AI大模型技术浪潮为这一行业难题提供了解决思路。毛世杰介绍说,AI大模型的加持下,元宇宙在AI自动构建、强物理感知和自然交互方面都将实现技术飞跃,带领行业元宇宙从“好看不好用”的阶段跃迁到“好看也好用”的成熟阶段。

AI大模型技术的爆发,为实现行业元宇宙中的交互控制、感知和三维构建几个核心问题提供了最有利的技术支撑,正在成为行业元宇宙加速落地、赋能场景的关键技术。

毛世杰表示:“通过大模型来学习和理解基于物理环境采集的数据,以及大量在元宇宙虚拟环境中模拟的经验,可以有效提升虚实交互控制的体验,增强物理感知的能力,甚至颠覆三维内容的构建方式。”

首先,在交互层面,AI大模型的加持让人与知识/经验的交互实现飞跃,显著提升XR交互体验。比如在设备操控中,基于大模型Function call功能,可以将自然语言和API连接起来,形成自然语言控制的函数/功能调用效果,这意味着,用户可以直接通过自然语言(如“打开一个应用、呼叫某个用户”)遥控机器人,实现更加情感化的人机交互,打造更加个性化的机器人。

其次,在感知层面,感知性能得到全方位升级。AI浪潮之前,受限于技术能力,很多视觉信息无法直接通过IoT传感器直接采集,因此元宇宙的感知水平有限。

如今,基于视觉大模型/多模态大模型的强大的特征提取能力,检测、识别、分割、建模、定位等视觉感知任务的性能被大大提升,行业元宇宙中对“状态”“缺陷”“行为”等动作的感知识别也更加精准,可以大幅提升few-shot检测能力、通过视觉大模型来生成缺陷样本、实现更加鲁棒(Robust:稳定/抗干扰)的通用异常检测等等,从而加速元宇宙在行业的落地应用和赋能。

第三,在内容构建层面,AI大模型技术也正在颠覆传统的三维内容构建方式。毛世杰表示,过去,阻碍AR/VR、元宇宙发展的重要原因之一就在于高成本的人工三维内容构建,如今全新的AI大模型浪潮则为低成本的三维内容构建带来机会,从而带动了各种AI建模的产业化落地问题。

为了实现上述行业元宇宙的愿景,联想规划打造了元宇宙“2+1+N”的布局:即“2”类人机交互设备(XR眼镜和机器人),“1”个元宇宙平台,“N”个行业解决方案案例,从设备、平台和解决方案三个层面,为行业元宇宙的应用提供了一站式解决方案。

在设备层,联想提供了XR设备和新型机器人等重要的人机交互设备和虚实联动工具,XR设备作为虚拟世界的入口,架起虚拟世界和现实世界沟通的桥梁;虚实融合完成后,就要考虑完成虚实联动,而机器人是虚实联动的载体。在数字空间中设定的任务让机器人到现实世界中执行,可以形成良好的元宇宙互动效果。

在软件平台层,晨星元宇宙平台是构建数字世界和物理世界映射融合与联动的基础工具。“将构建元宇宙的技术沉淀在元宇宙平台上,会使得开发、应用变得非常简单”,毛世杰表示,一个好的元宇宙平台应具备四种能力:其一是低成本空间构建模型的能力;其二是更好的数字资产管理能力;其三是把融合场景进行编辑,创建应用的能力;其四是任务管理、设备管理、异常业务处理等业务运营能力。

在行业解决方案层,联想凭借融合了不同行业know-how的元宇宙应用,正加速与电力、制造、教育等不同场景相融合,为产业智能化转型升级提供强劲动能。

如在能源行业,联想为南网某变电站提供的机器狗全站巡视解决方案,可以实现全地形、全设备全角度覆盖。众所周知,电网场站电力设施规模庞大、设计复杂,传统的人工巡检过程不仅耗时耗力,同时难以做到电站整体的智能化感知。如今,联想解决方案在元宇宙虚拟电站中,为机器人规划一条巡检路径,机器人可以沿着这条路径,在物理电站中移动,执行仪表读数识别、异常发热诊断、设备状态监测等任务,线上系统与线下设施的实时联动,大幅提升了缺陷处理的精准度与效率。

在制造业中,联想与业内高端跑车和赛车制造商吉利路特斯合作打造了AI视觉检测解决方案。由于路特斯的每辆车都采用定制化生产,客户下单前会自行选择车型和配置,每个部件有多种配置,同类部件在尺寸、颜色、安装要求等方面也不尽相同,因此十分考验视觉检测能力。联想为其部署的的“智慧眼”AI视觉自动检测智能应用方案,通过视觉检测的方式代替人工目检,对汽车的动力系统、外观配件、内饰架构等多个单元进行综合质检,杜绝错装漏装,保证生产质量和质检效率。

以上解决方案正是联想行业元宇宙能力的一个缩影,在“端-边-云-网-智”新IT理念和“3S”战略指引下,联想以XR、机器人、晨星元宇宙平台为基础,实现物理世界与虚拟世界的映射、融合与联动,为千行百业带来智能化体验。

毛世杰进一步表示,在AI大模型的这波浪潮中,联想会进一步加快元宇宙与行业的融合步伐,用产业元宇宙赋能智能制造、智慧城市、智慧园区以及智慧能源等领域,加速元宇宙行业高速发展,引领更多形式的智能化场景和体验。

按住下方二维码 或 点击“阅读原文”

即可下载

《AI PC产业(中国)白皮书》