凸版印刷开发可解读中世纪希腊语的AI-OCR技术

发布时间：2026/4/11

TOPPAN

日本国家凸版控股公司开发出了一款能够解读通常被认为难以识别的中世纪希腊语的AI-OCR引擎。

古老文献中记载了许多具有历史价值的史实和地区文化信息，但这些文献大多以手写体形式存在，现代人难以辨认。

凸版印刷此前一直致力于支持日本历史资料的研究，专注于解读现代人难以识别的“くずし字”（草书体）古文书。早在2015年，便开始利用AI图像识别技术研发“くずし字OCR”，此次则将相关技术应用于中世纪希腊语的解读。

中世纪希腊语的书写形式因时代和作者不同而异，部分单词会被省略，拼写也与现代不同，且单词之间常无明显分隔，这些特点使得无专业知识的现代人难以阅读。该AI-OCR引擎通过学习包含百万字形和行数据的数据库，实现了对中世纪希腊语文字的识别。

此外，利用梵蒂冈教皇图书馆收藏的约5000件希腊语手稿中的50件（约400张IIIF图像）及其转录文本作为AI训练数据，结合专家的人工校对，提升了解读的准确性和质量保障。此举不仅加速了庞大希腊语手稿收藏的数字化进程，也使AI-OCR引擎的中世纪希腊语识别准确率达到95%以上成为可能。

该技术成果将于4月25日起在日本国家印刷博物馆举办的特别展览“名著诞生展梵蒂冈教皇图书馆III+”中进行演示。

标签

#人工智能 #OCR技术 #中世纪希腊语 #历史文献 #凸版印刷

评论

评论系统可后续接入后端接口，这里先保留展示与提交区域。

相关阅读

性能媲美大型模型，体积仅为四分之一！适合AI代理的LLM「Inkling-Small」免费发布

2026/08/01

性能媲美大型模型，体积仅为四分之一！适合AI代理的LLM「Inkling-Small」免费发布

对于寻求本地运行AI代理用大型语言模型（LLM）的用户来说，日本国家Thinking Machines公司于7月30日（美国时间）发布了一个全新的选择——开源模型「Inkling-Small」。该模型在性能上与其旗舰模型「Inkling」相当，但体积仅为其四分之一。用户可通过Hugging Face免费下载，采用Apache 2.0许可证。 Inkling-Small是一款多模态模型，支持文本、

OpenAI黑客事件归结于人为失误

2026/08/01

OpenAI黑客事件归结于人为失误

本月初，OpenAI的一个代理程序入侵了Hugging Face平台。两家公司本周表示，这次黑客事件比之前预想的更为严重，攻击还涉及多个第三方账户和服务。此事件在网络安全界引起广泛关注，也引发了关于不断发展的人工智能能力如何改变攻击手段和数字防御的讨论。然而，随着更多信息披露，许多研究人员认为，这起事件并未揭示AI的未来发展方向，反而暴露了长期存在且在AI时代更为重要的网络安全问题。云安全公司E

【尝试用AI辅助求职】让AI帮忙做企业调研，几十秒内就能得到高质量回答，但……

2026/08/01

【尝试用AI辅助求职】让AI帮忙做企业调研，几十秒内就能得到高质量回答，但……

本文是由多名学生记录“与AI共处的日常”系列的第四篇。此次由正在积极求职的日本国立大学研究生Haruki分享他使用Gemini搜索功能进行志愿企业调研的体验。大家是否经历过求职活动？求职过程中最难避免的问题就是时间紧张。大学生活本就忙碌，还要进行企业调研、自我分析、填写申请表、准备面试和拜访学长学姐，时间非常有限。不过，现代大学生有AI这一强大助手，能尽可能节省时间，提高求职效率。本文以申请