甲骨文因年代久远、字形变化多样、无传世文献可供对照等因素,对其的识别一直是考古学面临的重要难题。
针对甲骨文识别这一学术难题,南方科技大学6位本科生运用图像和文本处理、深度学习算法、开发创新的神经网络算法和生成对抗算法,结合甲骨文的形态、语义、上下文关联等知识,实现甲骨文文字的自动识别、生成和检索目标。
甲骨文,又称“契文”、“龟甲兽骨文”、“甲骨卜辞”或“殷墟文字”,指中国商朝晚期王室用于占卜记事而在龟甲或兽骨上契刻的文字,是现存中国王朝时期最古老的一种成熟文字,最早出土于距今三千多年前的河南省安阳市殷墟遗址。
识别甲骨文一直是困扰学术界的难题,为了解决这一问题,南方科技大学级本科生曾鸣、杨睦圳、鲁昊天、汪炜、席睿翎和级张舒煜等6名同学,在人文社科唐际根老师、计算机系刘江老师以及研究团队章晓庆、胡玙璠、钟雯的指导下,以CS《多媒体信息处理》课程学到的知识和技能为基础,尝试用AI解读甲骨文。
据介绍,他们首先建立了甲骨文数据库,将已识别的甲骨文图像及其对应汉字收入库中,目前已完成个单字、1.8万多张图像的录入。接着,采用经典的深度残差神经网络(ResNet)模型实现手写甲骨文图像识别的任务;然后,选择pix2pix生成对抗网络(GAN)作为生成甲骨文的自动方法,用于增加样本多样性和生成一些未知甲骨文,其中基本网络采用U-Net结构;最后,利用检索算法将未知甲骨文图像与已有的甲骨文对比,从数据库检索出未知甲骨文图像。
本项目创新地开发多媒体信息处理和人工智能技术应用于甲骨文的识别和生成,以考古学研究需求为导向,以多媒体信息处理和人工智能创新算法为核心,充分融合南方科技大学考古研究与多媒体人工智能算法创新的科研实力,体现了跨学科交叉融合的魅力与力量,实现了跨越学科边界的思维碰撞与技术共享。目前,合作团队已经着手开发可用于展示和互动的