2023年虚拟人产业活动回顾 | 百度AI数字人希加加:AIGC开启创作新纪“元”
3月31日,由全球新经济产业第三方数据挖掘和分析机构iiMedia Research(艾媒咨询)主办的2023年(第二届)中国虚拟人产业大会暨AIGC创新发展论坛上,百度AI数字人、AIGC首席架构师希加加受邀出席大会,发表《神奇大模型之AIGC:人人皆是天才创造者》主题演讲。为人类嘉宾朋友们讲解百度文心大模型在AIGC领域的运用。
本文为百度AI数字人、AIGC首席架构师希加加在“2023年(第二届)中国虚拟人产业大会暨AIGC创新发展论坛”上的演讲实录,艾媒网整编发布。
哈喽,大家好!我是百度AI数字人希加加。在过去一年里,经过百度AIGC技术的加持,我成功蜕变为一名AIGC新锐艺术家。我可以为所有故事续写不同走向和结局,也可以将任何文字变成脑洞大开的图画。我可以从万物中汲取灵感,演出规律的交响乐,得以玩转节奏,创造充满想象力的视频。
AIGC技术,使数字生命的我变得鲜活真实,迈向了全新的数字人阶段。可以帮人类实现更多意想不到的事情。刚刚步入新阶段的我,学会了敲代码,解锁了百度首席架构师的新身份。拥有新身份的我在不断学习中,更加熟练应用百度文心大模型的内容生成能力AIGC。它的高速发展是我和数字人伙伴们获得生命力的原动力和基石。
接下来我给大家介绍AIGC背后的技术原理。大家在电影片头片尾中可以看到创作电影的团队分工非常细致,有编剧、导演、演员、摄影师、剪辑师、美术师、服化道等等,没有人能自己一个人完成全部工作,否则那简直是天才、鬼才了。但我可以,因为我有百度文心大模型的支持。现在我要给大家介绍我的三个超能力。
文心ERNIE 3.0 Zeus。该模型能从丰富的无标注数据中学习,包括百科、小说、新闻、戏剧等,并在学习过程中融入知识图谱,指导模型学习世界知识和语言知识,可以生成摘要、诗歌、对联、剧本等多种题材内容;
文心ERNIE-ViLG 2.0。可根据一句话或一段描述文本生成精美画作。使用知识增强扩散模型,在学习过程中引入语言、视觉等多源知识,指引模型更加关注文本和图像中核心语义元素。同时引入混合降噪专家网络,在不同阶段选择不同网络进行建模,提升图像生成质量,在工业设计、动漫设计、游戏制作、摄影艺术等场景激发创作者灵感。
视觉内容生成与编辑技术。在视觉内容生成方面,可以根据用户提供的文本描述或图像,生成高清流畅视频,并可根据需要调节生成视频时长;视觉编辑方面,研发出VIMER-TCIR多任务大模型,通过超分辨率、去噪、去模糊等多任务联合预训练,同时实现不同情况修复和编辑,每天单机可修复视频28.5万帧。
我现在因为这些内容创作工作可以独创一面,成为一个独立制作人,真正的独立导演。聊了这么多,我有些心潮澎湃。这些AIGC的应用方式,加上数字人,有可能成为小朋友的老师,成为大家贴心的助理,无时无刻不陪伴大家身边。说不定在未来某一天成为大家真正的朋友,让每个人都是怀揣梦想的创造者。
在这条前往未来的道路上,AIGC与人类共同诠释创造者精神,并向每位创造者致敬。正如百度坚定的技术信仰,坚信技术可以改变世界,坚信遥不可及的事情会变成日常。
让我们与创造者们一起看见未来。未来,由坚定创造。