【富士通】 F6335A

1991年4月に発表された,漢字を含めた手書き文字の認識が可能な帳票OCRである.卓上型スキャナ装置に認識部(手書き漢字認識を含む)が一体化した構造を持ち,ワークステーション(WS)やパーソナルコンピュータ(パソコン)に繋いで使用される.定型帳票(注1)を扱う業務を主な適用分野とした.商品形態として,次の2つのタイプが用意された.

  • DATAEYE-150:コストパフォーマンス重視の普及タイプ.A4手書き文書で12枚/分の処理性能
  • DATAEYE-170:A3帳票対応の高速機.A4手書き文書で20枚/分の処理性能

当時,OCRは保険申込書や流通業での受注伝票等,コンピュータへのさまざまな入力業務へと普及が進んでいた.それゆえ,手書き漢字への対応や帳票の大型化への対応に加え,認識率のさらなる向上が強く求められていた.このような時代背景を受けて,F6335Aは次の特徴が装備された.

  • 読取り可能帳票の拡大(注2).薄紙~ドライシーリングはがき(圧着はがき)の厚紙,A8~A3,ワープロ帳票
  • 高精度かつ高性能な手書き漢字認識ための「多元圧縮法」(注3)のボード化(コンパクト化)
  • 三色光源(赤&青に緑を追加)を活かした赤系イメージ読取り(注4)による,スピーディな朱肉等の印鑑イメージ読取りの実現
  • 帳票全体のイメージファイリング
  • 帳票位置ズレ検出機能を搭載(注5)(文字枠が黒になるワープロ帳票,コピー帳票や普通紙FAXの読取可)
  • 住所辞書と氏名辞書にユーザ辞書を加えた高精度な文字認識(注6)(同社従来比で誤読率を半減)

(注1) 各種申請書や入出金伝票のようなフォーマットの定まった用紙を扱う定型帳票処理が,当時のOCRの主要な用途であった.

(注2) 紙のサイズ厚さ,表面加工の相違等への対応は,スキャナ回りの技術(紙送り,光学走査系)として重要であった.たとえば,読取り用紙のサイズが大きくなると,より多くの紙送りローラを制御する必要があり,それら全体を定速で制御する技術の高度化が求められる.また,大きな用紙を高速に読むほど単位時間当たりの処理量は増大し,高速化技術が求められる.

(注3) 多元圧縮法の採用は FACOM 6679A手書き漢字認識ユニットからであるが,F6335Aではそれがコンパクトにボード化され,高速化された.

(注4) 同社では赤系イメージ読取り機能は1983年発表のOCRですでに実現していたが,F6335Aでは光源を2カ所に設置し,1回のスキャンで違う色成分のイメージを同時に読み取る方式を同社で初めて採用した.OCR帳票では文字記入枠は,スキャナが読み取らないドロップアウトカラーと呼ばれる色で描かれる.通常の二色光源(赤&青)では赤色がドロップアウトカラーとなるが,それだと朱肉印鑑等の赤系イメージは読めなくなる.赤系イメージを読むには,緑色のドロップアウトカラーに対応した光学系が必要になる.F6335Aには,スキャンの読込み部の二色光源(赤&青)に加えて排出部に緑光源が設置され,1回のスキャンで各光源系に則した処理が可能である.

(注5) 帳票位置ズレを検出する技術は読取り精度を高める技術の一環である.具体的には,機械的にスキャンして得られた「点の集合」から,(1)基準となるマークから帳票全体の位置合わせを行い,(2)汚れなどの余分な情報を除外し,(3)黒い文字枠を検出することで,読取位置を補正し,(4)黒い文字枠を除去(ドロップアウト)し,(5)補正した読取位置で文字列を抽出し,(6)文字列から個々の文字と思われる「点の塊」を文字として認識する一連の技術を高めることである.これら(1)~(6)の技術は相互に関連している.

(注6) 文字を正しく認識するには,人間が行うように,その文字の前後を含めた意味として妥当性を評価するのがよい.帳票に多く現れる住所や氏名は,予め用意された住所辞書や氏名辞書と照合することで,その認識率を高めることができる.F6335Aではそのような辞書の提供と照合方式の高度化に加え,利用者の用途や特性に合わせて照合内容を利用者が追加できるユーザ辞書機能を提供した.


  
F6635A (DATAEYE-170)  

OCRの解説文では,一般社団法人電子情報技術産業協会発行の「OCRカタログ用語集(第2版)」の用語を使用しています.各用語の意味については,本用語集をご参照ください.