甲骨文是中华文化的宝贵资源,记录了古代中国社会的发展史,为中华文明的起源提供了重要史料。习近平总书记指出,中华文明探源工程需要多学科、多角度、多层次、全方位的研究,回答中华文明形成和演进的重要问题。
甲骨文全面整理有序传承
甲骨文被入选为“世界记忆名录”,得到全面整理和传承。自甲骨文的发现以来,得到国家、政府和个人的重视与保护。整理散落在世界各地的甲骨文是关键任务。
“殷契文渊”推进甲骨文数字化
甲骨文质地脆弱,容易受损且表面疏松粉化,保存、展示和利用都面临困难。由于近16万片甲骨分散在国内外至少174个机构,无法将其物理重新集中起来进行研究。因此,数字化服务资源建设对于甲骨文的保存和研究至关重要。
数智赋能甲骨文保护与传承
多维度、多模态的数据是甲骨文研究的重要资料,也是新时代甲骨文信息处理研究的数据之本。以期达到推动甲骨文创新整理并有助于甲骨文研究实现新突破的目的。
甲骨文字的检测与识别,是计算机自动处理甲骨图像数据的基础。可以提高甲骨学专家的研究效率,尤其是合适的检索技术(包括以字搜图、以字搜字、以图搜图)可成倍提高学者查询文献的效率;也可对其他古文字的研究、甲骨文化推广和传播提供帮助。
甲骨字编码与输入法应用。
实现甲骨文的计算机输入面临很大的挑战。目前亟待解决的问题是确定甲骨字的基本字形标准,并落实甲骨文进入国际Unicode编码工作,为甲骨文字形库建设、输入法和数字化出版等工作奠定基础。
甲骨学研究智能化
甲骨文献数字化技术为计算机提供了可供检索、关联和分析的数字素材,为实现甲骨学研究的便捷化和智能化打下了基础。这种技术不仅适用于甲骨文献的整理,还可推广至所有涉及古文字文献的深度加工任务。
在将文献异构化和知识化加工的基础上,结合甲骨文字形库和著录库,实现三个库之间的关联,并根据提取的内容语义信息提供基于知识推理的智能检索服务。
为打破甲骨文数据分散难以串联的局面,形成“甲骨文全信息数据模型”,实现三维建模、文字关联等高质量数据与摹本拓片等传统数据的分层按坐标对齐。在协同机制的运作下,通过“微痕提取”技术突破拓片、摄影、摹本技术,高保真展示还原甲骨实物细节,同时进行甲骨文数据多维度融合,形成扩展、多层信息坐标对齐的跨媒体格式的“甲骨文全信息数据模型”,真正实现甲骨文的“实物”焕活,
其中部分成果已经在2023年4月20日发布的“了不起的甲骨文”微信小程序上进行了展示,受到业界关注和好评。另外,我们通过权威、专业、实用、有趣、共创的甲骨文数字网络载体,让更多普通大众了解甲骨文、感知甲骨文、研究甲骨文、利用甲骨文,让甲骨文传承与传播的道路通畅起来。
基于“殷契文渊2.0”的甲骨文辅助考释。目前,在“殷契文渊”的四期建设中,我们主要进行甲骨文数据的底层清洗,更新著录库、字形库、文献库、缀合库,建设“殷契文渊2.0甲骨文传文”模型库,基于字形匹配系列算法提供“以字搜字、以字搜图”的数据工具箱,构建甲骨文知识图谱,用“字形匹配”的AI算法和“人机协同”的模式助力甲骨文“破译”。
甲骨文数字化服务建设极大推动了甲骨文的深入研究,尤其是近年来以深度学习技术为主的人工智能新科技的发展和国家层面的高度重视,预示着甲骨文研究在数智赋能下有着光明的前景。虽然还面临着更多的技术难题及其他挑战,但我们相信,结合新技术、新手段,开展更多的跨学科深入研究,一定会让甲骨文化在现代社会焕发生机,深入推动甲骨文等古文字的创造性转化和创新性发展。
原文链接:https://mp.weixin.qq.com/s/baSsqvMHGNTByrYoraIMhQ