AI大模型破译甲骨文?厦大团队又有新尝试……
近日,厦门大学信息学院自然语言处理实验室史晓东教授团队申报的“基于甲骨文多模态大模型的多元信息甲骨文辅助考释模型”入选“探元计划2024”“创新探索型项目”TOP10榜单。
甲骨文也被称作“殷墟文字”,距今已有三千多年历史,是世界四大古文字之一,是现代汉字的根脉。传统的甲骨文字考释工作极其耗时费力,依托于专家进行人工释读,多采用字形分析、辞例研究等方法,需要考古专家以深厚的知识积累和大量的文献阅读为基础,结合多方面的知识去破译甲骨字,已经难以为继。近年来AI技术迅猛发展,利用深度学习模型超强语义表示能力来实现甲骨文的辅助考释,优势已经崭露头角。
团队研究人员针对甲骨文数据稀缺、图像质量参差不齐的现状,系统整理相关古文字数据,构建更大规模、更高质量的甲骨文多模态数据集,提出了“基于甲骨文多模态大模型的多元信息辅助考释模型”的技术方案。
项目将设计一系列与实际考释过程密切相关的任务和评估方法,如跨字体图像映射、跨字体IDS(表达结构的部首偏旁序列)解码和甲骨字现代字对译关系等,以有效训练多模态大模型。利用其强大的跨模态理解能力,辅助甲骨文考释。在大模型提供的语义嵌入基础上,本项目还将设计融合音、形、义、用多元信息的端到端甲骨文综合考释模型,综合利用字形结构、语义关联、同音通假和用法聚类分析,开发一种更加轻量的考释系统,以适应资源有限的实际考释场景。
据悉,“探元计划2024”是由国家文物局科技教育司指导,中国文物信息咨询中心(国家文物局数据中心)、腾讯SSV数字文化实验室、腾讯研究院、社会价值投资联盟(深圳)与中国文物报、紫荆杂志社联合发起。厦门大学信息学院史晓东教授为“基于甲骨文多模态大模型的多元信息甲骨文辅助考释模型”项目的团队负责人,团队成员包括陈毅东副教授以及吴智聪、周子涵、付彪、黄崇轩等研究人员。项目团队在甲骨文考释方面深耕多年,在研究中积累了大规模的甲骨文相关语料,为项目的顺利开展奠定了坚实基础。
- 福州“五个一百”工程全面建成(2024-12-04 08:26:21)
- 福州国际人才港(一期)“一楼一中心”月底有望交付(2024-12-04 08:19:27)
- 江阴港区6号7号泊位工程通过填海竣工验收(2024-12-04 08:08:53)
- 福州开展丰富多彩的助残帮扶活动(2024-12-04 07:44:57)
- 光明港温泉水乐园等一批温泉项目建成 六城区温泉区面积新增12平方公里(2024-12-03 08:38:24)
- 福州六城区温泉区面积扩大40%(2024-12-03 08:12:43)
- 全民健身运动会“不走寻常路”:田间地头为赛场,竞赛项目野趣足(2024-12-03 08:05:52)
- 全国少数民族传统体育运动会落幕 福建获奖总数创历史新高(2024-12-02 11:44:07)
- 关于区县活动的采购公告(2024-12-02 10:48:03)
- 关于区县活动的采购公告(2024-12-02 10:45:50)
①凡本网注明“来源:福州新闻网”的所有文字、图片和视频,版权均属福州新闻网所有,任何媒体、网站或个人未经本网协议授权不得转载、链接、转贴或以其他方式复制发表。已经被本网协议授权的媒体、网站,在下载使用时必须注明“来源:福州新闻网”,违者本网将依法追究责任。
②本网未注明“来源:福州新闻网”的文/图等稿件均为转载稿,本网转载出于传递更多信息之目的,并不意味着赞同其观点或证实其内容的真实性。如其他媒体、网站或个人从本网下载使用,必须保留本网注明的“来源”,并自负版权等法律责任。如擅自篡改为“来源:福州新闻网”,本网将依法追究责任。如对文章内容有疑议,请及时与我们联系。
③ 如本网转载涉及版权等问题,请作者在两周内速来电或来函与福州新闻网联系。