NTT(NTTデータ): 手書き漢字読取装置OCR60

手書き漢字読取装置OCR60は,手書き漢字・かな混り文書を高精度・高速度で読み取る初の端末用OCRとして,1988年に運用開始された運輸省の自動車情報データ通信システム(MOTAS)の窓口業務に導入されている.

1980年代当初に登場した英数カナ文字を対象とした端末OCRは,LSI技術の進展に伴い小形・低価格化の道をたどり,各種事務帳票や売上伝票等のデータ入力に威力を発揮してきたが,さらなる日本語入力ニーズとして氏名・名称や住所等のデータの漢字化への要求が高まった.相まって漢字認識技術の高度化にも顕著な進展がみられ,日本語処理における効果的な手書き漢字入力手段として登場したのがOCR60である.

主な特徴:
  • 手書き漢字と英数カナ等の高精度な読取能力:手書き漢字用に新たに開発した認識方式「ストローク構造集積法」に加え,英数カナ等で実績のある非漢字用の認識方式「位相構造化法」を併せて実装しており,個別に読取フィールド設定することができる.
  • 豊富な読取字種:手書きの漢字(JIS第1水準),ひらがな,英数字,カタカナ,記号等約3,200種,およびOCR-B,Kフォント(印字)の英数字記号,カタカナを幅広く読取対象としている.
  • 高い読取速度:漢字の読取り実効的な読取速度は20字/秒であり,人間のキー操作による入力速度の約30倍に相当している.
  • 充実した知識処理:地名・姓名・企業名等の単語辞書,フリガナ辞書,および一般文章に対する日本語文法辞書を用いた知識処理を具備.ユーザ独自の単語辞書はOCR読み取りによって登録できる.
  • 入力データの簡便な修正処理:認識できなかった文字イメージをディスプレイ上の表示し,OCR内蔵のワープロ機能を使って修正・追加等が即座にできる.
手書き漢字読取装置OCR60の仕様
項  目 内   容
認識方式 漢字:ストローク構造集積法,非漢字:位相構造化法
読取速度 文字読取(実効) 漢字:50字/秒(20字/秒), 非漢字:100字/秒(35字/秒)
帳票処理 漢字:7枚/分,非漢字11枚/分 (A4判,20字×10行)
読取字種 手書き

漢字:2,965種(JIS第1水準),平仮名,ANKS
非漢字:カナ,英数字,記号(混在読取可)

印 字 カナ,英数字,記号(OCR-B, K サイズ I)
記入枠・文字ピッチ 手書き 漢字:10×10mm枠・11mmピッチ,非漢字:7×5mm枠・6mmピッチ
印 字 10文字/インチピッチ
帳 票 大きさ,厚さ 縦横100×100~364×297mm,連量55~110kg
紙 質 OCR用紙,上質紙(銘柄指定)
給紙方式 連続(自動)/1枚(手挿入)
帳票容量 ホッパ 200枚(エレベータ式)
  スタッカ アクセプト:200枚,リジェクト:100枚
帳票フォーマット定義 最大255種の定義情報を自由に設定し,内蔵HDDに格納
通番印字 数字6桁ナンバリング(帳票裏面,印字位置切換え可)
知識処置 単語辞書 姓:約5千語,名:約5千語,地名:約4千語  ※ユーザ登録可能
  フリガナ辞書 姓:約1万語,名:約1万語
  一般語辞書 約6.5万語
外部記憶装置 5インチFDD, 40MB-HDD
入出力インタフェース RS-232C / HDLCループ
その他の機能 データチェック機能:四則演算,データ長チェック等
データ処理機能:固定データ不可,ゼロ埋め等
寸法,重量 本体:90(W)×70(D)×100(H)cm,ディスプレイ:38(W)×37(D)x41(H)cm,
キーボード:51(W)×25(D)×6(H)cm,一式約256 kg
電 力 100±10V,約2.8KVA

  
手書き漢字読取装置OCR60の外観  

OCRの解説文では,一般社団法人電子情報技術産業協会発行の「OCRカタログ用語集(第2版)」の用語を使用しています.各用語の意味については,本用語集をご参照ください.