腾讯 AI Lab 2020 年度回顾_pc蛋蛋信誉微信群
腾讯 AI Lab 2020 年度回顾
分类:互联网事 热度:

刚刚过去的 2020 年算不上是平静的一年。贯穿全年的新冠肺炎疫情仍未平息,各类偶发事件也层出不穷。即便如此,秉承「科技向善」信念和「Make AI Everywhere」愿景的腾讯 AI Lab 仍在这一年中做出了许多有价值的成果,其中包括将 AI 技术应用于疫情防控及病理筛查等其它医疗应用。同时,在的基础上,腾讯 AI Lab 在虚实集成世界与虚拟人、机器人、智慧药物研发、智慧农业、数据安全等领域都取得了进一步的重要进展。除了通过研究论文与开源项目与社区共享研究成果,腾讯 AI Lab 也在积极与高校、企业和研究机构合作,共同探索 AI 技术的潜在可能性。

下面首先将介绍 2020 年腾讯 AI Lab 在虚拟集成世界与机器人两大研究方向上的重要探索,然后会分 AI+医疗、AI+医药、AI+游戏、AI+农业、AI+内容几大主题总结这一年的行业应用成果,最后会概述这一年腾讯 AI Lab 在不同研究方向上的前沿进展。

一、双轨并行迈向通用人工智能:虚实集成世界与机器人

通用人工智能(AGI)是腾讯 AI Lab 成立伊始便已确立的核心长远目标,即创造能感知和理解真实世界并能有效执行各种不同任务的 AI 系统。为了实现这一目标,我们既需要软件上的突破,也需要硬件的迭代创新,还更需要目前行业普遍缺乏的软硬件的有效整合与集成。

2020 年,腾讯 AI Lab 和 Robotics X 实验室主任张正友博士提出了一个全新的概念:虚实集成世界(Integrated Physical-Digital World,IPhD)。它将当前在 AI、虚拟现实(VR)、增强现实(AR)、混合现实(MR)领域的前景展望乃至互联网和物联网的思想融合到了一起。在此基础上,一个通过互相交织和共同进化的软件与硬件、虚拟与现实、人与人工智能和机器人实现通用人工智能的愿景呈现在了世人眼前。目前腾讯 AI Lab 的所有研究都可以纳入到虚实集成世界的整体框架之下,有关该概念的更详细说明可参看张博士的演讲。

在虚实集成世界框架下,现实虚拟化、虚拟真实化、全息互联网、智能执行体四大发展方向将成为腾讯 AI Lab 和 Robotics X 实验室未来发展的重要指导。

下面将呈现腾讯 AI Lab 和 Robotics X 实验室在 2020 年取得的两项重大突破:虚拟人和机器人。我们也可将它们描述为虚拟集成世界框架下的软件和硬件智能执行体,同时也涵盖其它三大方向的一些核心技术,比如将人脸建模成数字版本就是一项现实虚拟化成果。

虚拟人:或是人类的虚拟化身,或是数字世界原住民

虚拟人是一类多模态技术,涉及计算机视觉、语音识别和生成、自然语言理解和生成等多种技术。根据来源的不同,虚拟人可大致分为两类:人类的数字化模型和虚拟世界原生虚拟人。

在建造人类的数字化模型方面,其实腾讯早在 2018 年就公布了一个基于演员姜冰洁建模得到的。Siren 的动作和表情的拟真度都非常高,但由于采用了业内顶尖的动作捕捉和实时渲染技术,Siren 也具有相对较高的制作成本。

2020 年 10 月,腾讯 AI Lab 提出了一种基于 RGB-D 自拍视频创建高拟真度 3D 虚拟人的方法[1]。这项技术的核心是 3D 人脸 Mesh 估计、高清纹理贴图及法线细节贴图的合成算法,实现了成本极低但速度很快的 3D 人脸合成——仅需手机拍摄的视频作为输入和 30 秒处理时间即可!

基于人类建模的虚拟人具有丰富的应用场景,首当其冲的是作为人类在虚拟世界中的化身(avatar),让用户能以自然的形象参与虚拟世界的各种互动。另外,这项技术还能用于数字祭奠,纪念已逝之人;还能让人类演员在动画或游戏中扮演角色(比如基努·李维斯在《赛博朋克2077》中扮演的 Johnny Sliverhand)等应用。

而在创造虚拟世界原生虚拟人方面,腾讯 AI Lab 开发的多模态虚拟人「 AI 艾灵」已于 2020 年 5 月与公众见面并于儿童节与青年演员歌手王俊凯和雄安孩子共同演绎了新歌《点亮》。现在,你也能在哔哩哔哩直播间观看艾灵 24 小时不间断卖力表演:

https://live.bilibili.com/21927742

腾讯 AI Lab 2020 年度回顾

AI 艾灵是腾讯 AI Lab 多年来在视觉、语音、自然语言、人机交互等多模态方面的研究结晶。比如其采用的 DurIAN 语音合成框架[2]融合了腾讯 AI Lab 在语音领域多年深耕的经验,其不仅能实现精准且稳健的语音合成,而且还能生成与合成语音同步的高质量人脸表情。

腾讯 AI Lab 2020 年度回顾

DurIAN 工作过程示意图

虚拟世界原生虚拟人在虚拟偶像、虚拟助理、在线教育、数字内容生成等领域有着广泛的应用前景。比如 AI 艾灵就是一个虚拟主播兼虚拟歌手,而且她还是一个创作型歌手,其采用的 SongNet 歌词创作模型可以根据任意格式和模板来生成相契合的文本,结合上面的 DurIAN 模型,艾灵就能以自然动听的声音唱出自己写的歌。有关 DurIAN 和 SongNet 的更多描述请参阅。

上一篇:消息称富士康与拜腾汽车洽谈融资事宜 下一篇:趣头条内部信:去年第四季度首次实现盈利 希望今年能增长到7亿元
猜你喜欢
各种观点
热门排行
精彩图文