トップページ>視覚障害とは>ICTを知ろう>視覚障害者のICT活用について>(現在の位置)視覚障害者用OCR協同開発の取り組み
この文章は、現在視覚障害者用OCRソフトとして市販されている「よみとも」の開発のきっかけとなった取り組みをまとめ、1991年の関東地区視覚障害教育研究会で発表したものを編集し掲載したものです。
最終更新日:2001年 02月 10日
近年、コンピュータ技術の発展や機器の低価格化・小型化を背景にした視覚障害者用各種ハード・ソフトの開発は、視覚障害者によるコンピュータ利用の可能性を急速に広げて来ている。すなわち、コンピュータを視覚の代行機器として活用することで、視覚障害者にとって大きなネックになっていた文字処理の問題を解決し、しいては職域の拡大など視覚障害者の社会参加をさらに促進するものと期待が高まっている。視覚障害者は、情報障害者とも言われるだけに、それはごく当然のことであろう。
現在視覚障害者用周辺機器として実用化されているものには、点字プリンタ・点字製版装置・ペーパーレスブレイル・画面拡大装置・音声合成装置などがある。視覚障害者用ソフトウエアでは、ワープロソフト・点訳ソフト・自動点訳ソフト・音声フロントエンドプロセッサ(FEP)などがある。この内、音声FEPは、一般市販ソフトの利用をさらに広げ、コンピュータの操作を視覚障害者が可能にするものとして期待されている。今回の協同開発もこの音声FEPである「やまびこ」を活用したものである。
一方、現在実用化されているものを「普通文字の処理」という観点で整理してみると、「書くこと」については、一応実用的な段階にある。「読むこと」については、パソコン通信による各種データベースの利用、国語・英和・和英・広辞苑・現代用語の基礎知識など辞典類の検索、各種ワープロ等で書いた文書ファイルをMS−DOSのテキストファイルにコンバートすることなどが可能になっており、そして最近発売されたソニーのデータディスクマン − 電子ブックの利用は視覚障害者の文字処理環境を革命的に変えるものと考えられる。(これらについても様々な問題点はあるが)
そして残されたもののうち、最も大きな課題の一つに紙に書かれた文字の読み取りがある。もし、紙に書かれた普通文字を視覚障害者が独力で読めるようになれば、その影響ははかり知れないし、また視覚障害者にとっては、それがなによりの願いであると思う。私は、今の技術はそれを可能にしているのではないかと考えた。幸いにも、この「紙に書かれた文字の読み取り」を協同開発という形で実現することができたので、以下にこれまでの取り組みについて述べる。
今回の開発の発端は、1989年(平成元年)に遡る。この年は、横浜市立盲特別支援学校の新校舎の完成を翌年に控え、新校舎に備えるべき備品の最終検討を各パート毎に行っていた。情報処理研究部としても、将来のコンピュータ利用の可能性をふまえ、各種ハード・ソフトの導入を検討していた。その一つとして、視覚障害者にとって効率的な情報収集の手段及び効率的な教材作成の手段としてのOCR(文字読み取り装置)に注目した。各社のOCRを調べて行く中で、TAU技研KKが、読み取った文字情報をMS−DOSのテキストファイルにするOCRを製品化していることを調べ当てた。さっそく資料を取り寄せ、その内容を検討した。
この資料を読んだ時、私は次の2つのことを確信した。1つは、盲特別支援学校に導入して効率的な教材作成が可能になること、もう1つが、このOCRの操作を音声FEPでできれば視覚障害者用の「読書器」になりうるということであった。なぜならば、MS−DOSのテキストファイルを音声で読みあげたり、自動点訳ソフトを利用して、点字に自動変換することが既に可能になっているからだ。ただし、視覚障害者用の読書器にするためには、プログラムの開発が必要になる。私は、開発の見通しが立てば、このOCRを本校に導入する意義は大きいと考えた。
次の段階は、このプログラムを開発するための方策を考えなければならなかった。高い技術力を持ち、しかも無料で開発してくれるところがあれば言うことはない。そこで、頭に浮かんだのが「大学」だった。幸運なことに本校職員の道村の夫君が大学でコンピュータを研究する専門家であることを思い出し、さっそく道村宅に相談に伺った。約1時間ほど意見交換をした後、専門家である拓殖大学道村助教授とともにTAU技研の小篠社長を訪ね、実際のOCRを見、開発の可能性についての若干の意見交換を行った。その後道村助教授から、「やって見ましょう」との大変ありがたい返事を得ることができた。そして道村助教授は、今回の開発について同僚であり、文字認識の専門家である杉本助教授に相談され、以後杉本研究室の全面的な支援を受けることになった。
このような中で、1989年11月1日に、本校情報処理研究部の職員、拓殖大学からは、道村助教授と杉本研究室の杉本助教授・戸井田助手・林助手・学生の若林さん(その後山口・内山さんが加わる)、TAU技研からは、小篠社長・原田氏が参加し、開発に向けての第1回目の話合いが持たれた。この時確認された基本事項は、次のようなものであった。
この日をもって、本開発はスタートすることになった。私は、この段階でこのOCRを本校に導入することを決心した。実際の導入にあたっては、本校事務職員の石井みどり、養護教育総合センター企画課の大槻氏の大変な努力があり、導入されることになった。
その後数回に渡ってデモンストレーション・話合いを持ち、問題点を解決しながら開発を進めて行った。その中では、今後ともより安くより使い易いものを目指して行くという長期的なビジョン等も念頭に置きながら開発して行くことも確認された。
通産省工業技術院は、1980年代前半に数億円の巨費を投じて「盲人用読書器」の開発をスタートさせた。6、7年の開発期間を経て試作器を完成させたが、今だ製品化されていない。この開発には、日本電気と安立電気が関わったようだが、数億円の巨費を投じて研究されたにもかかわらず、またマスコミにも大きく取りあげられ、多くの視覚障害者に大きな期待を抱かせながら、それが今だ発売されていないことは、国及び企業の責任が当然問われるべきである。
また、他のハードウエアを調べていた時には、既存のものよりかなり優れている試作器ができているにもかかわらず、発売しても採算が取れないという企業論理で製品化されないということなども知った。
これらのことは、多くの教訓を私達に与えてくれた。私自身もこの試作器のモニターを行い、実際に操作し多くのことを学んだ。すなわち視覚障害者がこの種の開発には、計画段階からより積極的に関わることが不可欠だと感じたこと、現状では民間企業での開発は期待しにくいことなどであった。そして、これらの経験が私に今回の協同開発に取り組ませた大きな要因になっていることは確かだ。
今回の協同開発には、次のような特徴がある。
今回の協同開発を計画するに当たっては、いかにして金をかけずに開発するかが最も大きな課題であった。
その主な理由は、スポンサー等をお願いした場合には、プログラム完成後いろいろな制約を受ける可能性があること。より多くの視覚障害者に使ってもらうためには、コストをなるべく安くする必要があることなどであった。もともとのOCRのハードが高価なものだけに、それほど売れるとは考えられない。それだけに開発費用がかかれば、その分のコストを製品に添加しなければならず、そうすればいっそう高価なものになってしまう。だからこそ開発コストはなるべく0に抑えたかった。
幸いなことにTAU技研及び拓殖大学は、このような主旨を理解され、快くご協力いただくことになった。この場を借りて改めて感謝したい。また、開発のためのOCRを無償で貸していただいた富士電機についても同様に感謝申しあげたい。
今回の開発は、TAU技研が開発した基本プログラムを参考にしながら、拓殖大学が視覚障害者が使えるようにするためのプログラムを開発し、さらにそれを盲特別支援学校がフィードバックし、より使い易いものを作りあげて行くという連携によって行われた。
当初の発想は、専用の「盲人用読書器」を一から作るのではなく、既存のハード・ソフトを利用し、汎用性・柔軟性を持ったシステム構成にしたかった(当然コストも安く抑えられ開発期間も短くてすむこともあるが)。それは、将来OCRのコストダウンが図られ、バージョンアップした時にすぐに対応させることができるという考えがあるからだ。私達は、より安く、より精度が高いハード・ソフトができてから視覚障害者用のプログラムを開発するのではなく、将来を見通したうえでの「基本技術の蓄積を行う」ということも今回の開発の目的の一つにあった。その意味で、この協同開発は、今後とも継続して行きたいと考えている。
視覚障害者用コンピュータ機器の開発には、計画段階から視覚障害者がリードする立場で参加することが不可欠と考える。そのことがより使い易くより現実的なものを作ることにつながると確信するからだ。
これまで、国レベルあるいは企業レベルで視覚障害者用のコンピュータ機器を開発して来たが、開発途中で計画を断念したり、発売に至らなかったり、開発したものが使いにくいものであったりという極めて不本意な結果に終わってしまうことがあった。これらの原因の1つには、その開発に視覚障害者が計画段階から参加していないかあるいは、参加しても単に意見を述べることに留まっていたために起っていると考える。
本システムは、ハードウェアとしてパーソナルコンピュータを中心として、イメージスキャナ、OCR(文字読み取り装置)およびボイスシンセサイザから構成されている。
パソコンは、MS-DOSのもとで動作する。処理の高速化のために拡張メモリを内蔵しており、また文書の中間データを格納するためにRAMディスクも利用している。また、OCRとの接続にはSCSIインターフェイスボードを用いた。
音声出力のために、音声合成装置をプリンタケーブルによりパソコンと接続している。音声フロントエンドプロセッサは「やまびこ」を使用している。
本システムを構成する機器は表1に示す通りである。
| OCR | 富士電機 | XP-50S |
| SCSIボード | 日本マイクロコンピュータ | PSB9310 |
| パソコン | 日本電気 | PC-9801RA |
| 音声合成装置 | 三洋電機 | VSS-300 |
本システムの主たる使用者を視覚障害者に想定している。この点を考慮して最初から組み込んだ機能、また、テスト使用を繰り返して発生した問題点を解決するために加えた機能を以下に述べる。
システムを使うには、まず周辺機器の電源を投入しておく必要がある。その後、パソコンの電源を入れると、本システムは音声メッセージを出力しながら自動的に立ち上がっていく。
システムが立ち上がると、まず、メッセージレベルの選択を行う。その後、画面には処理選択のメニュー画面が出ると同時に、音声でも選択を促すメッセージが流れる。
ここで選択できる処理には
がある。
まず原稿の読み取り処理を選び、メッセージレベルを数字キーの「1」で選択したとする。音声による指示に従い、原稿(本など)をスキャナにセットし、パソコンのいずれかのキーを押すと、文字の読み取り処理が開始される。文字領域の抽出と文字の認識を行うのには、しばらく時間がかかる。この処理が終了すると、その原稿に対する文書ファイル名の入力を行い、再び上述のメニュー画面に戻るので、使用者は、任意の処理に進むことが可能である。
文書の編集処理を選択すると、編集操作についての説明が音声で行われる。ここでは、これまでに読み取った文書データをもとに、誤認識文字の修正を行う。編集のためのキー操作はおもにテンキーを使うことになっている。文字の修正は前後の文章を句読点で区切って滑らか読みで読み上げたり、一文字ずつの漢字を詳細読みで読み上げたりして誤認識文字を探し、候補文字の中から正しい文字を選択することで行う。
テキストファイルへの変換処理は、読み取った文書データから、第1候補文字だけからなるテキストを作成し、それをMS-DOSのファイルとして保存する処理である。
まとめ読みの処理では、読み上げたい文書データが保存されているファイルの名前を選択あるいはキー入力するだけで、読み上げが開始される。
いずれの処理でも、メッセージレベルに応じて、音声での操作指示がなされるので、それに従って操作を繰り返して行けばいいようになっている。
処理を終了するには、メニューで(5)を選択する。
本システムの課題としては、次のようなものがある。
現在システム全体を揃えるためには、450万円ほどかかり、到底個人で購入することは難しい。 また、機械もやや大きなものになるため、ある程度の広さが必要になる。この課題を解決するためには、ハード自体の低価格化と小型化が必要であり、各社の企業努力が望まれる。
OCR自体の読み取り精度が100%でないため、正確な情報の収集は現時点では難しい。言葉の誤読であれば、ある程度使用者の判断で理解できる場合もあるが、特に数字の誤読については、その判断は不可能に近い。基本的には、OCR自体の読み取り精度の向上が望まれるが、当面、使用者が読み取り精度が100%でないことを十分念頭において使用することが不可欠となる。
1枚の用紙の読み取りであればそれほどの問題はないが、特に見開きの本を読ませる時には複雑な処理が入るため、どうしても時間がかかってしまう。これについては、プログラムに起因するところもあるので、今後ともよりいっそうの改良が必要になる。
紙に書かれた文字については、活字もあれば手書きの文字もある。また、活字であっても見出しなどで極端に大きな文字もある。現在のところ、ある限られた活字しか読むことはできない。これについては、OCRの機能や基本ソフトの問題もあるので、課題解決のためには関係企業の努力によらなければならない。
以上が主な課題であるが、先にも述べたようにこの協同開発は今後とも継続されるものである。将来の機能強化・小型化・低価格化などの技術革新に合わせ、それらの動きにいち早く対応させて行きたいと考えている。
日本は経済大国と呼ばれ、科学技術は世界最高水準にあるといわれる。しかし、それらの経済力と技術力が障害者に役立たれているかは、はなはだ疑問がある。特に企業の「採算が取れなければ製品化しない」という論理に対しては、どうにも我慢ができない。なぜなら、現在の科学技術を応用することで、障害の一部が克服され、「不可能を可能にする」ことができるのであれば、そこには金には変えられない大きな価値が生まれて来る。企業は、利潤の追求だけではなく、基本技術の社会還元をする責任がある。そして、今の日本の経済力はそれを可能にしているのではないだろうか。国や自治体の公的責任・企業の社会的責任を強く求めたい。
今回の取り組みは、過去の成功例・失敗例を参考にしながら開発を進めて来たつもりである。私達は、最終的に子供からお年寄りまで誰でも使える「視覚障害者用読書器」を目指す「夢」を持っている。その意味では、今回の開発は出発点である。今後より多くの方々に使っていただき、より多くの意見をいただきながらさらに改良を進め、「夢」を実現させていきたいと願っている。
今回の取り組みを進めるにあたっては、本当に沢山の方々の協力をいただいた。そして、多くの方々との出会いがあった。特に、拓殖大学工学部電子工学科の杉本研究室の方々・TAU技研KKの小篠社長、原田氏との出会いは、私個人にとっても大変貴重なものになった。また本文中では触れなかったが、言語工学研究所の末岡氏には、貴重な助言を数多くいただいた。これらの人達に対し、厚く感謝申しあげたい。
今後ますます障害者関連の機器の開発が盛んになることを心より期待し、今回の報告を終えることにする。
視覚障害者用OCR協同開発の取り組み