基于田字格变换的自监督汉字字体生成

科技工作者之家 2021-08-13

20210813202812_c85ec1.jpg

近年来,汉字自动生成因其在艺术字体生成、个性化字体设计以及书法作品生成等问题中的广泛应用而引起了大量关注。当前主流的汉字字体自动生成方法主要基于非配对数据和深度生成模型如生成对抗网络等。然而,这些主流的深度汉字字体生成方法通常忽略了汉字本身的结构信息导致在提取特征时缺乏相应指导,且在训练过程中容易出现模式坍塌现象,从而在生成汉字质量方面亟待进一步提高。

20210813202813_d18bb8.jpg

针对该问题,本文受汉字田字格书写的启发,提出一种基于田字格变换的自监督方法来指导模型网络提取更高质量的特征,进而提升汉字生成效果。需要特别指出的是所设计的田字格几何变换无需改变现有模型网络且不增加任何人工成本,因此潜在可嵌入许多已有深度汉字字体生成模型。所提自监督学习方法的有效性在一系列实验中得到验证。

实验结果表明,在嵌入所提的自监督学习任务后,当前流行的基于CycleGAN的深度汉字生成模型在生成效果、改善模式坍塌现象以及训练稳定性等方面都有较大提升。同时与现有其他深度汉字字体生成方法相比,所提基于田字格几何变换的自监督方法在生成汉字内容准确率和FID值等4个评价指标上以及汉字质量等方面均有一定提升。

20210813202817_1cd872.jpg

主要贡献如下:

本文根据汉字结构如上下结构, 左右结构等设计四种田字格几何变换方式, 并将该几何变换重构的自监督任务嵌入到当前流行的CycleGAN生成模型用于帮助网络更好的提取特征, 从而提高汉字生成效果. 所提基于田字格的自监督生成方法无需改变现有网络模型且不增加任何人工成本, 从而潜在可嵌入至其他深度汉字字体生成模型中如基于小样本的汉字生成模型.

所提方法的有效性在十种不同汉字字体数据集上得到验证. 这十种字体包括手写体, 简舒体, 华文琥珀体, 汉仪凌波体, 仿宋体, 汉仪娃娃体, 汉仪细圆体, 方正经黑手写简体, 楷体和黑体. 实验结果表明, 在嵌入本文所提的田字格变换重构的自监督任务后, CycleGAN在内容准确率及风格多样性等方面都有显著提升. 同时, CycleGAN训练中存在的模式坍塌现象也得到极大改善. 此外, 与现有其他深度生成方法相比, 所提自监督方法在生成汉字内容准确率, FID值及质量等方面均有一定提升。

来源:中国科学信息科学

原文链接:http://mp.weixin.qq.com/s?__biz=MzAxNjgwMjA5Ng==&mid=2651151963&idx=1&sn=79bb6bddc4b3239963e37739dd5cf65e

版权声明:除非特别注明,本站所载内容来源于互联网、微信公众号等公开渠道,不代表本站观点,仅供参考、交流、公益传播之目的。转载的稿件版权归原作者或机构所有,如有侵权,请联系删除。

电话:(010)86409582

邮箱:kejie@scimall.org.cn

汉字 字体 田字格

推荐资讯