さあ来い 卒サラ!          ~悔いのないセカンドライフを目指して~

起業とか資格とか。趣味や思い出話など いろいろランダムに

古文書解読ソフト

よしをです。

日頃から、AIという言葉が好きになれず、

常日頃「日本語で『人工知能』といえばいいのに」と思っています。

 

人工知能の発展は目を見張るものがあり、

古文書のくずし文字を90%解読するというソフトが開発されたという、

記事を見つけました。

「KURONET」という文字解読ソフトを開発したのは、

タイ出身の日本の古典の研究者です。

この開発者によれば、古典の文字解読は、

専門家でも1ページあたり10分程度はかかりますが、

この人工知能をつかえば、1ページを1秒間で解読できるといいます。

しかし、仔細に記事を読んでみると、

90%というのは江戸時代の版木本の解読段階だそうで、

江戸時代以前の文書をはじめ、

肉筆の文書を解読するまでの能力は備わっていないようです。

 

これまでも、人工知能をつかった古文書解読の実績はありますが、

従前のものは、文字の並びを認識して、

センテンスごとに解読する仕組みだったのに対して、

KURONETは、シンプルに読める文字から解読していく方式で、

よりスピードアップを実現したということだそうです。

現在、人工知能KURONETには、

変体仮名や草書体などを含む、68万字のくずし文字を学習させており、

今後は、100万字に拡大してさらに精度を高める計画です。

 

奈良文化財研究書と東京大学が共同開発している、

「MOJIZO」というシステムは、

画像をアップロードすると、その画面から文字をピックアップして解析します。

人間は、知識や経験によって、

ひと文字づつ地道に、古文書を解読していく方法をとってきました。

しかし、MOJIZOは、人間の知識や経験を蓄積することによって、

解読に役立てるという方法を採用しており、

KURONETとは異なるアプローチをしています。

 

いずれ、古文書の解読を生業としてきた学者は、

人工知能によって駆逐されてしまうかもしれません。

学者たちの長年の経験と技術の積み上げが、

一瞬にして無意味になってしまうとなると、むなしい気持ちにもなりますが、

これも時代の流れでしょうか。

 

 

今回も、このブログを読んでいただき、ありがとうございます。