前言

早在20世纪90年代日本就出现了虚拟偶像并进行专辑发售,后来基于音乐软件制作的3DCG的“初音未来”被称为虚拟偶像的成功典范。近年来,随着短视频平台和直播带货行业的兴起,通过绘画、3D建模等结合动作捕捉或人工智能的方式建立起来的虚拟偶像和网红越来越多地出现在人们的视野,吸引着越来越多的人参与虚拟偶像网红的追捧和制作。目前虚拟偶像实现方式上主要有两大流派,基于动作捕捉的实现和基于人工智能的方式。由于传统的基于动作捕捉的方式硬件成本昂贵,入门门槛较高,普通人难以企及,所以越来越多的人和团队开始采用人工智能的实现方法。

遗憾的是,国内虚拟人物\偶像书籍的短缺限制了广大普通读者的创作,网络上虽然能够找到一些资料,但大多是一些碎片化的信息,对读者的帮助十分有限。基于此,本书从基本的概念入手,原理结合实践,对虚拟人物\偶像制作流程及其用到的建模工具和人工智能技术进行详细介绍,包括3D建模的基本方式、基于TensorFlow和PyTorch的人工智能框架以及通过视频和实时视频流输入生成表情迁移后的虚拟人物,结合语音识别、人机对话引擎和口型匹配算法等生成自己专属的带有互动属性的虚拟人物和偶像,旨在达到降低学习门槛、人人都可以上手的效果。

本书主要包含三部分:第一部分是基础理论部分,从行业现状和发展趋势的角度来介绍什么是虚拟偶像以及应用的行业,同时对目前业界主流的虚拟偶像实现方式进行概述,让读者对此有一个清晰全面的认识;第二部分是应用实践,介绍基于Python的TensorFlow和PyTorch的机器学习框架的算法实现部分,从动作同步、表情迁移以及口型同步等方法介绍作为基础的框架技术;第三部分是项目实践,介绍2D和3D虚拟偶像的实现方式,完整展示从零到一的制作流程。

本书深入浅出,实操性和系统性强,适合有一定IT背景并对虚拟产业关注的广大读者使用。

限于编者水平所限,书中难免存在不当之处,敬请业界专家和广大读者批评指正。

最后特别感谢王金柱编辑给予的帮助和指导,以及好友的支持和鼓励。

马健健

2022年1月10日