人工智能是引领未来的战略性技术,世界主要发达国家近年来都把发展人工智能作为提升国家竞争力、维护国家安全的重大战略。人工智能技术在语言处理领域应用广泛,推动了语言处理的云端化、自动化、技术化、专业化和平台化。人工智能技术与甲骨文研究的结合吸引了专家学者的关注,取得了阶段性成果。
智能甲骨文研究的尝试
智能甲骨文字研究近年来获得广泛关注,受益于机器学习技术的快速发展和国家对甲骨文等冷门研究的重视。人工智能专家在甲骨文研究领域尝试了多个任务,包括甲骨文字形识别、拓片甲骨字的检测、跨时期甲骨字生成、甲骨片的智能缀合、校重等。甲骨文字形识别是其中最为常见的应用方向之一,通过计算机分类模型将甲骨文字图像转化为特定的字形类别。然而,由于甲骨字的类别标注任务困难,数据集的类别选取受到限制。因此,甲骨文识别被认为是一个小样本任务,目前仅能对数百个甲骨字进行识别,对甲骨文研究的推动作用有限。
当前智能甲骨文研究的困境
人工智能模型对甲骨字的识别受限主要是因为难以建立具有足量正确标注的数据集。甲骨文数据标注的知识门槛较高,模型仅依靠单字图像进行推理,导致可利用信息有所衰减。此外,甲骨文字形识别数据还存在数据分布不均衡的问题,每个字的出现频率不同,低频字对模型识别造成挑战。甲骨文字形识别是封闭数据集的分类问题,需要明确数据集中甲骨文字形的类别数量。然而,许多甲骨字尚未完全破译,存在学术争议。人工智能研究与甲骨文研究的路线不兼容,这是交叉学科面临的数据困境的根本原因。
数据困境下的学科交叉新探索
甲骨文字形识别是智能甲骨文研究的重要方向之一,但面临数据困境和适配性问题。通用人工智能模型在甲骨文研究中不适用,需要研究者进行算法研发和学术洞察力的结合。培养交叉学科人才是当前的需求。
国家之魂,文以化之,文以铸之。习近平总书记在致甲骨文发现和研究120周年的贺信中指出,甲骨文是汉字的源头和中华优秀传统文化的根脉,值得倍加珍视、更好传承发展。综合运用人工智能识别等技术手段,促进多学科交叉融合,推动研究实现新突破是进一步深化甲骨文研究和应用的题中应有之义。而要深入推进学科交叉,使人工智能技术能够为甲骨文研究成果的产出起到直接作用,则要求研究者同时具备两个学科的基本素养,在进行智能算法设计时,能够发现合理的任务目标,在甲骨文研究中,又具有利用智能算法进行辅助研究的能力。只有这样,才能真正使两个学科发生更深层次的碰撞,推动甲骨文等古文字研究的创造性转化,创新性发展,为推动中华现代文明发展和人类社会进步作出新的更大贡献。
原文链接:https://mp.weixin.qq.com/s/HxzVPOHazig5z4kSnW4Q-A