机器学习技术助力破解波斯古文明楔形文字

科技工作者之家 2020-03-16

图片2.png

1930年代,芝加哥大学东方研究所开始了对波斯波利斯古城的考古学研究。东方研究所和该校计算机科学系正在进行合作,以利用机器学习程序更快速地翻译这些楔形文字。

25个世纪以前,波斯半岛的阿契美尼德帝国的“文书资料”被镌刻在泥板上。1933年,美国芝加哥大学(简称UChicago)东方研究所(简称OI)的考古学家在伊朗发现了数万块泥板。几十年来,研究人员一直在努力地翻译出这些古代文献,但是人工解密过程既困难,又缓慢,而且还容易出错。尽管从1990年代开始,科学家就已经开始用电脑来解读泥板,但泥板的三维特征和楔形文字的复杂性让电脑能发挥的作用非常有限。

可喜的是,据美国"物理学组织"网站3月12日消息称,UChicago的一项技术突破可能最终能够让电脑自动誊抄泥板上关于阿契美尼德历史、社会和语言等丰富文字的信息,从而为考古学家进行更深层次的研究腾出空间。

为了实现这个功能,UChicago的OI和计算机科学系的研究人员建立了一个名为“深录”的合作项目。基于包含来自“波斯波利斯强化档案”的6000多个注释图像的训练集,该研究小组计划建立一个数据模型,用以“读取”目前还没有被解读的泥板内容。同时,这还将是考古学家可以应用于其他古代文字研究的潜在辅助工具。

OI泥板藏集负责人、亚述学副教授Susanne Paulus表示:“如果我们能够开发出一种灵活且可扩展的工具,并将研究延伸到不同的文字脚本和历史阶段,那么这将是考古学领域内一场改天换地的变革。”

借用UChicago研究计算中心的资源,计算机系的助理教授Sanjay Krishnan利用这个带注释的图像数据集训练了一个机器学习模型。在对训练集以外的泥板文字进行解读测试时,该模型能够以接近80%的准确率破译楔形文字符号。目前,研究人员正在努力提升准确率,并找到导致破译错误的原因。

Paulus副教授展望道:“如果计算机能够翻译或识别这些文字中高度重复的部分,然后再让考古专家来填入有难度的地名、动词或其他需要人工解读的内容,那么这种方式就可以完成很多工作。即使电脑不能做出明确的决定,它也能提供重要的参考选项。这样,专家们的研究工作就有了一个更高的起点。”

由美国疾病控制与预防中心(简称CDAC)资助的类似项目也正在使用计算机视觉方法进行各种应用,例如,研究海洋双壳类生物的多样性,以及在艺术作品内容中识别和判断其风格类型。

科界原创  

编译:朱明逸  

审稿:阿淼 

责编:雷鑫宇 

原文链接: 

https://phys.org/news/2020-03-ai-written-language-ancient-civilizations.html

版权声明:本文由科界平台原创编译,中文内容仅供参考,一切内容以英文原版为准。转载请注明来源科技工作者之家—科界App。


计算机 研究 内容 文字 波斯 泥板 楔形文字

推荐资讯