【東芝】 OCR-V595

OCR-V595は,東芝が世界で初めて製品化した手書き漢字を読み取れるOCRである.英数カナ記号を読取対象とする汎用帳票OCRで,オプションとして手書き漢字を読み取る機能を備えていた.このOCRは大量高速読取,高い認識精度,帳票フォーマットの制限を緩和したフリーフォーマット読取,文字枠なしでの読取機能,より乱雑に記載された文字や続け字を読み取ることができる自由手書き文字読取機能などを備えたOCR-Vシリーズの最上位機種である.

OCR-V595の認識方式には「複合類似度法」が用いられ,この方式が英数カナ記号のみならず,手書き漢字にまで適用可能であることが示された.漢字認識の課題は認識対象となる文字種の多さにあるが,高速に大まかな分類を行う「大分類技術」と,高速計算用の専用に開発されたICチップにより解決された.また高い認識精度は,この「大分類技術」,「複合類似度法」に加え,文字の形状を詳しく調べる「輪郭構造マッチング法」と,単語データベースとの照合により単語レベルの認識を行い誤読文字の修正を行う「知識処理」との多段階処理により実現された.

OCR-V595の基本仕様は次のとおりである.

  • 読取速度 35枚/分(A4,10行,30字/行),高速オプションで50枚/分
  • 読取字種 手書き 英数カナ記号漢字,読取活字 JIS-OCRB他
  • 読取漢字字種 2,000
  • 読取帳票サイズ 74mm×74mm~364mm×381mm(縦×横)
  • 装置寸法・重量 750mm×980mm×1070mm(幅×奥行×高さ),約350kg

  
OCR-V595(左から,漢字オプション,光学読取装置,ORDIS制御装置,漢字プリンタ装置)  

OCRの解説文では,一般社団法人電子情報技術産業協会発行の「OCRカタログ用語集(第2版)」の用語を使用しています.各用語の意味については,本用語集をご参照ください.