古文書解読ソフト
よしをです。
日頃から、AIという言葉が好きになれず、
常日頃「日本語で『人工知能』といえばいいのに」と思っています。
人工知能の発展は目を見張るものがあり、
古文書のくずし文字を90%解読するというソフトが開発されたという、
記事を見つけました。
「KURONET」という文字解読ソフトを開発したのは、
タイ出身の日本の古典の研究者です。
この開発者によれば、古典の文字解読は、
専門家でも1ページあたり10分程度はかかりますが、
この人工知能をつかえば、1ページを1秒間で解読できるといいます。
しかし、仔細に記事を読んでみると、
90%というのは江戸時代の版木本の解読段階だそうで、
江戸時代以前の文書をはじめ、
肉筆の文書を解読するまでの能力は備わっていないようです。
これまでも、人工知能をつかった古文書解読の実績はありますが、
従前のものは、文字の並びを認識して、
センテンスごとに解読する仕組みだったのに対して、
KURONETは、シンプルに読める文字から解読していく方式で、
よりスピードアップを実現したということだそうです。
現在、人工知能KURONETには、
変体仮名や草書体などを含む、68万字のくずし文字を学習させており、
今後は、100万字に拡大してさらに精度を高める計画です。
「MOJIZO」というシステムは、
画像をアップロードすると、その画面から文字をピックアップして解析します。
人間は、知識や経験によって、
ひと文字づつ地道に、古文書を解読していく方法をとってきました。
しかし、MOJIZOは、人間の知識や経験を蓄積することによって、
解読に役立てるという方法を採用しており、
KURONETとは異なるアプローチをしています。
いずれ、古文書の解読を生業としてきた学者は、
人工知能によって駆逐されてしまうかもしれません。
学者たちの長年の経験と技術の積み上げが、
一瞬にして無意味になってしまうとなると、むなしい気持ちにもなりますが、
これも時代の流れでしょうか。
今回も、このブログを読んでいただき、ありがとうございます。