【富士通】 FACOM 6365

1988年5月に発表された,文書構造を指定するための定義情報(注1)を必要とせずに非定型な様式の日本語印刷文書の読取りが可能な文書読取装置である.ワークステーションやパーソナルコンピュータ(パソコン)に接続して使用された.

当時,日本語ワープロ(ワードプロセッサ)の普及に伴い,オフィス内でも手書きではない日本語の印刷文書が一般的になっていた.そのような時代背景から,書籍,雑誌,ワープロ文書などの日本語の印刷文書を高速に読み取り,ワープロ等で扱える日本語文書データに変換する機能(注2)のニーズが高まっていた.

日本語のさまざまな印刷文書を読み取るためには,イメージとしての文字の認識だけでなく,認識対象領域の書式が定型でないため,OCR帳票のように事前に定義されたフォーマット情報に頼ることなく認識対象領域を抽出できる必要がある.そのために,FACOM 6365には以下を可能にする技術が組み込まれた.

  • 文書内に混在している文章,図,表,写真の弁別
  • さまざまな段組み構造の把握
  • 文章領域のひと塊であるブロックの抽出
  • これらのブロックの配置から文章の流れに従ったブロック間の順序付け(注3)
  • ブロック,文字行,文字の抽出と認識の高速化(そのための専用LSIを用意)

上記の認識対象領域を抽出する技術に加え,次の技術により文字認識能力も強化された.

  • マルチフォント混在読取り,マルチポイント混在読取り(注4)
  • 日本語文章後処理による日本語文法規則との照合技術(注5)

FACOM 6365の主な仕様は次のとおり.

  • 最大原稿サイズ:B4判
  • 読取り文字種:3,911字種 (英数字,ひらがな,カタカナ,記号,漢字(JIS第1水準+第2水準の一部))
  • 文字認識速度:20字/秒
  • 処理速度:3枚/分(日本語文章後処理の時間を含む)

(注1) 定型帳票の場合,その帳票の構造(フォーマット)の定義情報を元に文書を読み取る方式が多いのに対し,非定型な一般の文書の場合,その構造をあらかじめ定義することが出来ない

(注2) 印刷された文字はコンピュータから見れば単なる点と線からなるイメージデータに過ぎない.印刷文書をワープロ等で編集可能にするには,読み取った文書から文章領域と非文章領域(写真,絵,図表)を分離し,文章領域の文字に対応する文字コードを割り当てる必要がある.

(注3) ここでのブロックの抽出と順序付けは,自動処理に加え,手動による補正も可能である.後述の「日本語文章後処理」は,正しいブロック把握と順序付けを前提に行われる.

(注4) これらの技術は,明朝体,ゴシック体,教科書体等のさまざまな書体,および異なる文字サイズ(7~28ポイント),文字ピッチが混在した文書から文字を認識する技術であり,同社の手書き漢字認識方式をベースにしたものである.

(注5) 文章としての妥当性の観点から文字認識の確定を後処理の段階で行う技術である.文章や単語が複数のブロック(文章領域のひと塊り)に渡る場合に誤認識が生じる可能性がある.それを防ぐために,前後の文字を含めた単語や文章規則としての妥当性を評価して候補文字を絞り込む.この技術のOCRへの採用は同社初である.


  
FACOM 6365A1/A2  

OCRの解説文では,一般社団法人電子情報技術産業協会発行の「OCRカタログ用語集(第2版)」の用語を使用しています.各用語の意味については,本用語集をご参照ください.