DT-OCR100シリーズは,手書きカタカナ・数字を読み取る日本初の全国規模のデータ通信システムにおける端末用OCRとして,1980年に社会保険庁,1981年に労働省において,それぞれの窓口業務に導入された.
当時の背景として,1970年代後半になりデータ入力の機械化への期待が高まり,社会保険庁では領収額等データ入力に手書き数字OCR,また労働省では名称・所在地等データ入力において手書きカタカナ・数字OCRの導入検討が始まっていた. これに応えるDT-OCR100シリーズは,常用手書き(記入枠内に丁寧に筆記)のカタカナや金額欄の数字の読み取りを,新たに考案した認識方式「位相構造化法」をもとに実用に耐える読取精度・速度を安価な端末OCRとして実現したものである.
なお,社会保険データ通信システムには数字等読取用のDT-OCR100CN1形が約400台,労働省システムにはカナ数字等読取用のDT-OCR100CNKX1形が約1200台導入され,世界的にも最大規模のOCR適用システムであった.
- DT-OCR100シリーズの主要な実現技術:
- 新たに考案した認識方式「位相構造化法」による実用的な認識精度の達成:印字,手書きのカナ,数字を同一方式で認識でき,単純な文字パタン処理で実現可能となる認識方式「位相構造化法」を適用している.
- 具体的には,文字パタン上の各点が持つ位相構造(上下左右方向の文字線の有無)に上下左右の文字線を超えた点が持つ位相構造を集積した後,集積内容別の計数結果(特徴ベクトル)を文字カテゴリごと識別ロジックと照合することで認識結果を得る方式である.
- また,識別ロジックの自動構成に向くという「位相構造化法」の特長を活かし,認識辞書の自動構成技術を開発し,これらにより手書きカタカナ,数字の実用精度を達成した.
- 2値の文字パタン生成方式の開発:文字線の切れ・かすれやつぶれのない文字パタン形状を得るため,帳票から安定して多値(濃淡)パタンを得る走査光学系と,適切な文字線幅となる2値パタン生成するしきい値制御を行う前処理方式を開発した.
- また,多値パタンを取得することで,リジェクト文字の再読取りの高速化にも資している.
- 端末用OCRとし十分な読取速度の確保:スキャン機構部では回転ドラム巻き付けによる1行あたり約60cm/秒の高いスキャン速度,認識部では「位相構造化法」の特徴を活かしたパイプライン処理を実現することにより,手書き約100字/秒,印字約256字/秒の読取速度を確保した.
- 多くの筆記具に対する明瞭なドロップアウトカラーの確保:青色系を含む市販ボールペンを高コントラストで“黒”,オレンジ系記入枠を低コントラストで“白”と見做すように光波長をバンドパスする光学系を実現した.
- 異なった字種の混在読取制御方式の開発:数字,カナ,英字等の混在読取りで字形的に似かよった候補文字(クと7,5とS等)を,文字カテゴリの字形的な確からしさと文字の前後関係(隣接字種の同一性,文法知識)に着目した判定により高精度を確保した.
項 目 | DT-OCR100CN1形 | DT-OCR100CNKX1形 | ||
---|---|---|---|---|
読取部 | 認識方式 | 位相構造化法 | ||
読取速度 | 文字読取 | 手書き:100字/秒(6mmピッチ),印字:256字/秒(10字/インチピッチ) | ||
帳票処理 | 最大55枚/分(1行読取時) | |||
読取字種 | 常用手書き | 数字,記号(混在読取可) | カナ,数字,記号(混在読取可) | |
印 字 | 数字,記号(OCR-Bサイズ I , 疑似7×9ドット文字) | |||
帳 票 | 大きさ,厚さ | ハガキ大~A4版相当,連量70~110kg | ||
紙 質 | OCR用紙,上質紙(銘柄指定) | |||
走査方式 | 行方向:回転ドラム式,改行:読取ヘッド移動 | |||
給紙方式 | 連続(自動)/1枚(手挿入) | |||
帳票容量 | ホッパ | 300枚(エレベータ式) | ||
スタッカ | アクセプト:300枚,リジェクト:100枚 | |||
帳票フォーマット制御 | FDD内に格納.フォーマット定義シート読取で追加・変更.100種以上可 | |||
通番印字 | 数字6桁ナンバリング(帳票裏面,印字位置切換え可) | |||
読取モード | バッチ修正モード:リジェクト発生帳票を排出 即時修正モード:リジェクト文字をその都度修正 確認修正モード:読取終了後に読取結果と帳票を比較して修正 |
|||
寸法,重量 | 100(W)×60(D)×96(H)cm, 200kg以下 | |||
電 力 | 100±10V(単相),約1.6KVA | |||
操作部 | 表示部 | モニタ | PDPディスプレイ(60字×3行) | 9型CRT(40字×16行) |
リジェクト表示 | 64×32ドット/パタン | 96×40ドット/パタン | ||
キーボード | テンキー,カナ(50音順),記号等 | テンキー,記号等 | ||
寸法,重量 | 60(W)×52.5(D)×75(H)cm,60kg | 72(W)×84(D)×113(H)cm,135kg | ||
電 力 | 100±10V,約300VA | 100±10V,約900VA |