AI大牛田七虚拟宇宙的本质是融合铸魂是关键

author
0 minutes, 8 seconds Read

虚拟世界的本质是融合,“铸魂”是关键 专访AI专家田琪

金蕾的美丽来自奥飞寺

虚拟世界的本质是物理世界与数字世界的融合,而“铸造灵魂”是关键。

这是AI科学家对元宇宙的最新看法。

元宇宙行业动态_宇宙动态行业元素有哪些_动态宇宙模型/

他叫田奇,计算机视觉和多媒体信息检索专家、国际欧亚科学院院士、IEEE Fellow。

他更为公众所熟知的身份是华为云人工智能领域的首席科学家。

宇宙动态行业元素有哪些_元宇宙行业动态_动态宇宙模型/

在田七看来,元宇宙已经做到了“盘古开天”。 下一阶段,数字人将成为虚拟宇宙的核心元素。

而在这位AI大师眼中,元宇宙不再是一个独立的世界,而是物理世界与数字世界的融合体——融合是元宇宙的关键词。

此外,田奇认为,预训练大模型是帮助元宇宙实现更好“融合”的关键技术。

如何用大型模型为数字人“铸魂”?

近两年,BERT、GPT-3等大规模预训练模型逐渐走进大众视野,其“大奇迹”的优异成绩给AI技术的发展和应用带来了巨大的想象空间。

与此同时,随着Facebook正式更名为Meta,元宇宙的热潮被推向前所未有的高度。

那么当最时尚的AI技术遇上最热门的领域,会擦出怎样的火花?

在田七看来,两者的相遇,将让虚拟宇宙的核心元素数字人类在外表上能够“以假乱真”,甚至拥有与人类相媲美的智力。

动态宇宙模型_元宇宙行业动态_宇宙动态行业元素有哪些/

首先,田奇介绍了数字人智能的表现以及如何通过技术让数字人变得更聪明。

他认为数字人类智能可以分为感知和认知两个方面。

感知智能的核心是让数字人类具备人类视觉、听觉、触觉等感知能力,并与自然世界进行交互。

例如,基于大语音模型,数字人可以有听力; 基于大语言模型,数字人可以具备流利交流的能力; 基于大视觉模型,数字人类可以看到周围的环境并与之互动……

田七认为,如果数字人与一些特殊信号结合,甚至可以衍生出人类所没有的超感官能力,协助人类探索更多突破想象的技术,比如“千里眼”、“顺风耳”等。 田七表示,这在今天是完全可以实现的。

在认知智能方面,数字人类应注重信息整合、推理、创造等能力。 这是人类区别于其他生物的关键。

田七主导的华为云盘古大模型可以让数字人拥有更强的认知能力。

动态宇宙模型_元宇宙行业动态_宇宙动态行业元素有哪些/

△2021年HDC.Cloud现场演示

田七:什么车可以不用油跑?

盘古:新能源汽车、自行车可以无油行驶。 当然,还有玩具车。

田奇:什么是碳中和? 碳排放主要来自哪些行业?

盘古:碳中和就是通过植树造林、节能减排抵消人为二氧化碳排放,使向大气排放的碳净总量为零。 目前,发电和供热行业、制造业和建筑业是主要的碳排放行业。

……

在这次顺利而又出乎意料的谈话中,盘古的常识推理和其他能力得到了充分的展现。

总而言之,利用预训练的大模型的海量参数来模拟人类的超脑能力,用海量数据驱动模型去认知和理解世界,是田七非常看好的技术之一。

因为大模型就像一个强大的马达,为数字人类在感知智能和认知智能方面的进步提供了强大的动力。

动态宇宙模型_元宇宙行业动态_宇宙动态行业元素有哪些/

除了智能之外,超逼真的外观也是数字人的重要发展方向。

对此,AI技术和华为云MetaStudio可以让数字人的形象与真人“无区别”。

具体来说,在“学习”大量的人体照片和实际采集的皮肤信息后,再通过简单的训练,AI可以创建皮肤材质模型,然后MetaStudio可以更快地渲染出近似真实纹理的皮肤。

再比如,通过AI表情的训练,可以获得更丰富的表情驱动模型,让数字人的表情更加自然。

此外,理想的数字人“塑造”作品应该采用“极简模式”。 例如,传统方法往往需要一条完整的“路径”:从原画到建模、渲染。 如果过程中存在缺陷,则需要手动调整。

然而,AI能力的介入不仅会让这个过程更加智能、高效,还能基于模板产生多种不同风格的数字人,比如超写实、卡通风格等。

……

以上就是田七眼中元宇宙数字人“铸魂”“塑造”的过程。

除了数字人的核心元素之外,田七更多地从更宏观的角度分享了他对元宇宙的理解。

融合是元宇宙的关键

元宇宙代表了人类社会对虚拟与现实进一步融合的期待和向往。

田七解释说,虚拟宇宙并不完全是我们表面理解的“从现实走向现实”,也不是与现实世界平行的。

其本质是物理世界和数字世界的融合。

这种“融​​合”既包括物理世界的数字化,也包括数字世界的实现。

如何理解这两个概念呢?

例如。

如果我们想要预防台风灾害,我们可以使用数字孪生来模拟全球气候流动和洋流流动。

通过这个数字世界模型,我们可以推断台风的运动轨迹以及沿途可能发生的灾害影响,从而预防和减少损失。

换句话说,元宇宙首先将物理世界数字化,然后利用这个数字世界来帮助解决现实世界的问题。 这两个世界相辅相成,融为一体。

在这个一体化的世界里,不仅人是智能的,路边的树木、房屋也是智能的。 他们可以观察、记录、计算数据,并对现实世界做出一定的反馈和影响。

那么从AI技术的角度来看,这两者最关键的技术是什么?

田奇认为,对于物理世界的数字化来说,对现实世界的识别和理解是最重要的。 例如,利用摄像头、传感器等设备采集场景和人物信息所涉及的识别、分类、分割等视觉算法是核心技术。

在你完成对物理世界的识别和理解之后,就到了重建的时候了。

田奇表示,目前的技术在二维图像生成方面已经取得了比较好的成果,未来需要做的是在开放场景和三维物体的建模技术上取得突破。

三维物体的建模非常困难,需要巨大的计算能力。 它还需要多所大学和其他科研力量共同构建大规模数据集。

数字世界的实现,关键是如何将数字内容与现实世界无缝叠加、渲染。

我们需要将现有的风格化技术进一步扩展到更大的三维场景,并与视觉理解的结果相结合,以显示更复杂的效果。

田七补充道,风格转移在这里的作用是带来二次创作,增强虚拟世界的吸引力。

比如我们可以思考:如何将现在的西安街景渲染成古代长安的风格。

宇宙动态行业元素有哪些_元宇宙行业动态_动态宇宙模型/

讲完了元宇宙的关键,我们应该如何实现呢?

元界技术架构

田奇认为,总体来说,元宇宙的技术架构可以分为四层:连接层、平台层、交互层和应用层。

所谓连接层的主要功能是连接物理世界和数字世界,涉及光纤、5G、WiFi6等网络技术。 连接层在满足大带宽、低时延、高可靠性需求的同时,还要保证所有设备和终端能够快速接入业务。

平台层拥有基于云+AI的基础设施,是物理世界转变为虚实融合世界的关键基础。

它通过对复杂系统进行建模、实时仿真、渲染,将物理世界简单、快速、真实地映射到数字世界,这就是我们所说的“数字孪生”。

具体来说,它的映射包括两个方面:环境和人物。 前者涉及三维物体的建模和渲染,后者需要一定的AI技术来辅助人物动作和表情的重建。

在这个层面上,数字世界反作用于物理世界,提高物理世界的生产效率。

这取决于所涉及的情报水平。 田奇表示,大模型、求解器、知识计算是提高智能水平的关键。

最后,平台层的另一个显着特点是,以服务化的方式对外提供各种云服务和AI能力,可以随时随地、按需获取。

这也符合华为云近年来提出的“一切都是服务”的理念。

第三层交互层很容易理解,它是虚实结合的世界的窗口。 但只有做到虚实结合、看得清楚、交互自然、佩戴舒适这四项基本体检,普通人才能愿意看到、了解元宇宙。

需要注意的是,这里的交互不仅仅是从2D到3D,而且是从间接交互到直接感知交互。

同时,在这个层面上,除了更先进的硬件设备之外,AI技术还可以帮助提升我们的体验。

比如现在行业的动画或者影视制作公司的动作辅助重建等技术如果能够降低大众的门槛,就可以很好的弥补设备的不足。

最后一个应用层将通过开放合作的方式打造自动驾驶仿真训练、智能工厂仿真优化、智慧城市孪生等应用,彻底重构数字世界的价值和体验。

元宇宙要服务民生、服务社会

谈到应用,田奇强调,未来元宇宙的应用行业和场景不能仅仅局限于游戏和娱乐,而应该在更广泛的领域服务于民生和社会。

比如教育、医疗等。

在教育方面,田奇认为,我们最关心的两件事其实是教育质量和覆盖面。

元宇宙最能从这两点赋能:

不仅可以扩大教育的表现力,创造高度沉浸式的个人体验,提高教育质量; 而且由于数字人和虚拟世界的加持,它还具有很强的可复制性,因此可以覆盖更广泛的人群,从而改善教育资源的不平等,甚至引起人类教育方式的改变。

在医疗方面,由于全球存在严重的医疗资源不平等问题,我们可以利用元界技术进行虚拟在线问诊和智能分诊,让患者与虚拟医生和医生进行面对面交流。进行多角度磋商。 仔细观察。

这不仅可以改善患者的医疗体验,还可以缓解医疗资源的紧张和不平衡,让欠发达地区享受到最优质的医疗资源。

因此,田奇认为,有技术能力的科技公司在推动虚拟宇宙建设时,应该有超越经济利益的人文关怀和社会责任感。

除了上面提到的那些,还有很多行业或场景可以“塞”进元宇宙,甚至可以说“一切都可以在元宇宙里”。

比如,从经济效益的角度来看,田七认为广告行业可能会受到很大的扰乱。

宇宙动态行业元素有哪些_动态宇宙模型_元宇宙行业动态/

他解释说,与传统的固定场景中无差别展示广告以及手机等设备上的个性化推荐相比,元宇宙中的广告将“走得更远”。

一是画面的变化。 借助近眼显示器等设备,数字信息和广告将呈现在任何地方,例如天空、建筑物,甚至路人的衣服上……

其次,在虚拟宇宙中,数字信息将更加多样化,每个人都会看到不同的东西。

更重要的是,获取这些信息的方式也会从“给我看我想看的”转变为“我想看的”,个人在获取信息时会更加主动。

元宇宙如何防沉迷?

元宇宙作为一个新生事物,可以高度满足我们在现实中无法感受到的体验,但它的诞生也可能带来一些问题,比如用户成瘾、知识产权、隐私安全等。对此,田奇认为:

在构建虚拟宇宙的过程中,计算机科学家和工程师的参与肯定是不够的。 它还需要政府机构、社会学家、经济学家、伦理学家、法律专家等各种角色的参与。

比如,当我们面临用户成瘾问题时,各界专家学者可以从技术和监管层面来解决:

技术层面,完善防沉迷系统设置; 在法律层面,与游戏开发商、游戏运营商、设备销售商、社会组织等共同推动防沉迷体系建设。

再比如,在虚拟宇宙中,创作者的知识产权需要得到保护,这也需要监管部门的配合。

另外,田七表示,未来的元宇宙很可能是去中心化的。 在平台中,如何保证内容受到道德和法律的约束,不冒犯自然人的权利和价值观,不违反性别、种族、地域、民族、年龄等因素造成的偏见收入、宗教信仰等等……都是非常重要的问题。

“我们需要提前预见风险点,然后制定监管标准和措施。” 田七总结道。

至于“放权”是否是一个好的做法,他认为可以进一步讨论,但监督和指导仍然是最重要的。

田七:只有共同努力,才能创造虚拟宇宙的未来

田奇于2018年加入华为,随后加入华为云,担任华为云人工智能领域首席科学家。

田奇博士在20多年的研究生涯中,始终专注于计算机视觉领域的核心问题图像内容理解,先后在大规模图像检索、行人重识别、自动化机器学习和预训练大型模型。 一系列影响深远的研究著作。

基于田七在学术界和工业界的长期积累,并因其主导开发的盘古预训练大模型在我国人工智能技术创新和应用领域具有较大影响力,2021年,他被授予“吴文君人工智能杰出贡献奖”。

现在,对于虚拟宇宙这个有人乐观有人悲观的概念,他认为:

对技术有争议的看法很正常,总的来说,我看好元宇宙的长期发展。

究其原因,他表示,互联网发展至今,已经是一个日益数字化的过程。

换句话说,虚拟宇宙并不是一个突然“从岩石缝里蹦出来”的概念,而是技术发展的必然过程。

人工智能技术与元宇宙之间是相辅相成、相辅相成的关系。 人工智能技术驱动元宇宙建设的同时,也将极大促进元宇宙自身的快速发展。

最后,关于未来虚拟宇宙的建设,田七表示:

因为涉及的概念如此广泛,所以最重要的是基于华为云自身开发团队的能力寻找高价值的应用场景,与来自世界各地的合作伙伴进行多种形式的技术合作——而不仅仅是数字人,还有元宇宙所需的各种基础智力能力。

只有发挥优势、优势互补,才能共同创造数字世界的未来。

宇宙动态行业元素有哪些_元宇宙行业动态_动态宇宙模型/

海量信息、精准解读,尽在新浪财经APP

Similar Posts