参与:魔王
前不久,Facebook 主办的 Deepfake 检测挑战赛(DFDC)落下帷幕。近日,Facebook撰文介绍了其构建的大规模 Deepfake 数据集 DFDC。
3426 名对象,每个对象平均录制 14.4 个视频,大部分视频的分辨率为 1080p ;
48,190 个视频,每个视频的平均长度为 68.8 秒,共计长度 38.4 天;
原始数据超过 25 TB。
DFAE:Deepfake 自编码器(DF-128、DF-256),数据集创建过程中使用模型的输入 / 输出分辨率为 128x128 和 256x256。
MM/NN face swap:使用基于自定义帧的 morphable-mask 模型进行换脸。
NTH:在 few-shot 和 one-shot 学习环境下,生成逼真的说话人头部 [31]。
FSGAN:使用 GAN 进行换脸 [20]。
StyleGAN:参见《英伟达再出 GAN 神作!多层次特征的风格迁移人脸生成器》。
Refinement:对混合后的人脸使用简单的锐化滤波器可以极大地提升最终视频中的感知质量,且几乎不需要额外的成本。
audio swapping:使用 [22] 中的 TTS Skins voice conversion 方法进行音频转换。
干扰:将各种物体(图像、形状、文本等)叠加在视频上;
增强:对视频应用几何变换、颜色变换、帧率更改等。