【東芝,電総研】 OCR ASPET/71

ASPET/71は1971年11月に公開された英文活字ドキュメントOCRである.低品質活字文字を画期的なレベルの認識性能と高速読取で実現し,関連業界に大きな反響を呼び起こした.またこのときに誕生した,文字認識だけでなくパターン認識の基礎となる「複合類似度法」や「ボケの理論」がその後の文字認識研究やOCR製品に大きな影響を残し今日でも重要な役割を果たしている.この装置の開発は当初,通商産業省工業技術院大型プロジェクト(超高性能電子計算機)の一部としてスタートし,最終的に電子技術総合研究所(現 産業技術総合研究所)と東京芝浦電気(現 東芝)の共同開発として1970年にASPET/70,1971年にASPET/71がそれぞれ公開された.

ASPET/71は,1ページを一度に全部スキャンするページ式で,A4が200枚/分,文字が2,000字/秒の高速読取,普通のタイプライタ印字のような低品質文字の高精度読取が特徴である.公表された仕様ではOCRBフォントが読取対象であったが,原理的にはフォントに依らないオムニフォント読取が可能な方式を用い ていた.「複合類似度法」は高精度を実現できる方式であったが,当時としては大きな処理量を必要とした.それにもかかわらず高速処理を実現できたのはアナログ並列計算を用いた技術を採用したことにある.この技術は安定性の面から商用化には至らず,OCRとしては空前絶後の設計思想となったが,現在では並列ディジタルCPUによりこれが実現されている.

ASPET/71の基本仕様は次のとおりである.

  • 読取速度 2,000 字/秒,200 枚/分(A4サイズ)
  • 読取活字 JIS-OCR B(サイズI)英数字記号48 字(JISカタカナに拡張可能)
  • 読取書類 A4サイズ以下,読取桁数 4,000 文字/枚(max)
  • フォーマット制御 フォーマット指定用紙をOCR自身に読み込ませることにより任意に設定できる.

  
ASPET/71(Copyright© 電子情報通信学会 2008, All Rights Reserved.)  

OCRの解説文では,一般社団法人電子情報技術産業協会発行の「OCRカタログ用語集(第2版)」の用語を使用しています.各用語の意味については,本用語集をご参照ください.