大河报·豫视频赵小红李明阳设计
中国文字博物馆
中国文字博物馆里展示的甲骨
中国文字博物馆里展示的甲骨
中国文字博物馆里展示的甲骨
□大河报·豫视频记者黄婷文许俊文张琮摄影
如果你是学生,在这里点击部首可以知道甲骨文的读音释义;如果你要写论文,在这里能检索关于甲骨文的专业论著;如果你是考古工作者,在这里甲骨碎片能够智能缀合。这个全世界最完善的甲骨数据免费平台,以人机协同助力甲骨文破译和传承活化,让越来越多的公众触达甲骨文化,更加清晰地了解到汉字的源头和中华优秀传统文化的根脉。
创新
全世界唯一的实验室在殷墟安阳
甲骨文是中国的一种古老文字,又称“契文”“甲骨卜辞”,如何才能把三千年前契刻在骨头上象形字输入电脑?甲骨文等古文字研究的研究资料和研究力量分散、沟通协同不够,是甲骨学研究长久以来的痛点。建立甲骨文数据库显得尤为重要。
2月17日,在安阳师范学院,计算机与信息工程学院院长刘永革向大河报·豫视频记者介绍,从年开始,他就带领研究甲骨文的两位老师,以甲骨文输入法为起点,开展甲骨文信息化研究。年7月,经教育部批准,安阳师范学院成立了甲骨文信息处理重点实验室,目前有甲骨文大数据平台、甲骨文识别与字形分析、甲骨文语言计算、甲骨文与殷墟科技考古四个稳定的研究方向,是全世界唯一的服务甲骨学研究的理工科实验室。
“因为我们要做甲骨文的大数据,首先必须把关于甲骨研究的纸质资料收集齐,目前我们资料室收集的关于甲骨文书有册,不敢说全部集齐了国内外关于甲骨%的书籍,但是也有99%。”刘永革说。
安阳有着得天独厚的甲骨文渊源,加之完善的数据资料来源,年,实验室发布甲骨文大数据基础平台“殷契文渊”,目前收录了种甲骨著录、个甲骨图像、个甲骨文字形,种甲骨论著,免费服务全球的甲骨文、考古、历史、文字等专业的研究专家。
从纸墨誊抄到互联网三维建模,年前的古老文字瞬间灵动了起来,不仅位居北京大学“甲骨金文”数据排行榜第一,同时也吸引着国内外的古文字爱好者、教师、书法爱好者前来查阅使用。
■创新构建互动展示工具和高保真数据增强展示工具,观看不同层次的甲骨文信息。
成果
人工智能让甲骨精确重现
基于深度神经网络的甲骨文字检测系统,把碎片式的数据和文献进行归拢数字化,甲骨研究者从以前的图书馆查阅,到现在网络数据库,用拼音、汉字、部首的检索,免费读取甲骨的图像、释文、相关文献、重片、缀合库、字形库的信息。
大河报·豫视频记者观察到,“殷契文渊”为对甲骨文感兴趣的计算机工作者提供了手写甲骨字数集(HWOBC数据集)、甲骨文字检测数据集、甲骨拓片识别数据集(OBC数据集)三个数据集;实验室还用知识图谱技术,用复杂网络技术,把甲骨文所有的字、文、图全部都建立关联,然后用计算机逻辑推理。
复旦大学教授、出土文献与古文字研究中心主任刘钊说,甲骨文发现年以来,有约16万片的甲骨收藏遍布世界各地,这些分散的古人信息是中华优秀传统文化的根脉,急需破译和数字化回归。
“以前甲骨碎片都是靠记忆和手工一片一片地拼合。数据数字化以后,可利用人工智能图像技术进行自动缀合。目前我们已经已缀合出37组,这是人类专家还没有缀合出来的37组。”刘永革骄傲地说。
为了启动对全球甲骨文资料的全面普查和采集,甲骨文信息处理重点实验室利用最新科技手段,研发了甲骨三维建模的技术和设备,获取甲骨的拓本、彩色照片、尺寸、收藏信息等,近期将进行第一批甲骨文三维建模实验。
刘永革向记者介绍:“原来甲骨的图形都来自于照片和拓片,去年,实验室和腾讯联合研发打造的高精度、高速度、便携性的甲骨三维建模,调整与改进已有核心算法,提出一套点云融合方法,已完成12片甲骨三维模型,如今扫一下