首页
使用姿势和光照归一化从视频中高效学习个性化3D说话人脸
返回

使用姿势和光照归一化从视频中高效学习个性化3D说话人脸

2022-12-19 科技信息 By:佚名
最佳答案“会说话的人”视频用于各种应用,从新闻广播到游戏和电影中的动画角色。当前的合成技术在视点和光照变化下遇到困难或视觉真实感有限。谷歌研究人员最近的一项工作提出了一种新颖的深度学习方法来合成由音频语音信号驱动的 3D 说话人脸。不是建立一个单一的通用模型来应用于不同的人,而...

“会说话的人”视频用于各种应用,从新闻广播到游戏和电影中的动画角色。当前的合成技术在视点和光照变化下遇到困难或视觉真实感有限。谷歌研究人员最近的一项工作提出了一种新颖的深度学习方法来合成由音频语音信号驱动的 3D 说话人脸。

不是建立一个单一的通用模型来应用于不同的人,而是个性化的特定于说话者的模型。这样,实现了更高的视觉保真度。还创建了一种用于消除空间和时间照明变化的算法。它还允许以更有效的数据方式训练模型。人类评分和客观指标表明,建议的模型在真实性、口型同步和视觉质量得分方面优于当前的基线。

在本文中,我们提出了一个基于视频的学习框架,用于从音频中制作个性化的 3D 说话人脸动画。我们引入了两种训练时间数据标准化,可显着提高数据样本效率。首先,我们在一个标准化空间中隔离和表示人脸,该空间将 3D 几何、头部姿势和纹理解耦。这将预测问题分解为 3D 面部形状和相应 2D 纹理图集的回归。其次,我们利用面部对称性和皮肤的近似反照率恒定性来隔离和消除时空照明变化。总之,这些归一化允许简单的网络在新颖的环境照明下生成高保真口型同步视频,同时仅使用单个特定于说话者的视频进行训练。此外,为了稳定时间动态,我们引入了一种自回归方法,该方法根据其先前的视觉状态来调节模型。人类评分和客观指标表明,我们的方法在真实性、口型同步和视觉质量分数方面优于当代最先进的音频驱动视频重演基准。我们说明了由我们的框架支持的几个应用程序。

猜你喜欢
箭牌卫浴产品知识怎么学(箭牌卫浴ARROW品牌介绍)

箭牌卫浴产品知识怎么学(箭牌卫浴ARROW品牌介绍)

12-18 0 阅读
补气血应该吃什么食物(吃什么补气血 补气血的食物有哪些)

补气血应该吃什么食物(吃什么补气血 补气血的食物有哪些)

12-18 0 阅读
table pc 输入面板关闭(tablet pc输入面板怎么关闭)

table pc 输入面板关闭(tablet pc输入面板怎么关闭)

02-15 0 阅读
便宜又好的平板电脑推荐(便宜又好的平板电脑)

便宜又好的平板电脑推荐(便宜又好的平板电脑)

12-18 0 阅读
介绍还原系统后QQ旋风下载文件时提示"IE游览器禁用"的解决方法

介绍还原系统后QQ旋风下载文件时提示"IE游览器禁用"的解决方法

12-18 0 阅读
电脑平方米符号怎么打m3快捷键(电脑平方米符号怎么打)

电脑平方米符号怎么打m3快捷键(电脑平方米符号怎么打)

01-25 0 阅读
热门推荐
箭牌卫浴产品知识怎么学(箭牌卫浴ARROW品牌介绍)

箭牌卫浴产品知识怎么学(箭牌卫浴ARROW品牌介绍)

12-18 0 阅读
补气血应该吃什么食物(吃什么补气血 补气血的食物有哪些)

补气血应该吃什么食物(吃什么补气血 补气血的食物有哪些)

12-18 0 阅读
table pc 输入面板关闭(tablet pc输入面板怎么关闭)

table pc 输入面板关闭(tablet pc输入面板怎么关闭)

02-15 0 阅读
便宜又好的平板电脑推荐(便宜又好的平板电脑)

便宜又好的平板电脑推荐(便宜又好的平板电脑)

12-18 0 阅读
介绍还原系统后QQ旋风下载文件时提示"IE游览器禁用"的解决方法

介绍还原系统后QQ旋风下载文件时提示"IE游览器禁用"的解决方法

12-18 0 阅读
电脑平方米符号怎么打m3快捷键(电脑平方米符号怎么打)

电脑平方米符号怎么打m3快捷键(电脑平方米符号怎么打)

01-25 0 阅读
GoveeGlideRGBIC智能壁灯减25美元升级游戏设置

GoveeGlideRGBIC智能壁灯减25美元升级游戏设置

12-18 0 阅读
从模拟到数字使用人工智能的解剖学研究

从模拟到数字使用人工智能的解剖学研究

12-19 0 阅读
提花面料的特点是什么样的(提花面料的特点是什么)

提花面料的特点是什么样的(提花面料的特点是什么)

12-18 0 阅读
电脑硬盘如何重新分区(硬盘如何分区)

电脑硬盘如何重新分区(硬盘如何分区)

12-18 0 阅读