誕生と発展の歴史

OCRは,紙媒体を光学的(Optical)に走査して画像イメージとして取り込み,文字(Character)を抽出して認識する装置(Reader)である.接続されるコンピュータからみれば,キーボードに代わる文字入力装置であり,使用者からみれば,キーボードを介した人手作業をなくし,大量一括の自動入力を可能とした省人力装置である.

世界的には1900年前後から文字認識技術の開発が本格的に始まり,1950年頃には印刷された文字を読み取るOCRの製品化も始まったが,国産OCRが製品化されたきっかけは,当時郵政省が郵便事業自動化の一環で導入した郵便番号であり,最初の製品化は1968年7月の東芝製郵便区分機TR-3およびTR-4であった.これらは世界で初めて自由手書きの数字認識を実用化したもので,葉書上部にある赤枠内に書かれた郵便番号を読み取ることで,集配業務を行う郵便局ごとに仕分ける差立(さしたて)区分を実現した.これに1969年6月NEC製郵便区分機NAS-5Bが続いた.1980年代に入ると,郵便区分機NAS-80が印字された郵便番号の読取も可能とし,手書きも混在する郵便物の処理を実現した.また,1989年には郵便区分機TR-17が製品化されたが,これは世界で初めて漢字による住所認識を実用化したことで,配達人の担当地域別に仕分ける配達区分を実現した.さらに,1997年に新型区分機NAS-100が,郵便番号7桁対応や住所の細部まで読み取ることで,配達人が配達する順番に仕分ける道順組立を実現した.これに1998年に郵便区分機TT-200が続いた.

一方,一般用途としては1968年に日立製H-8252が国産初の汎用OCRとして登場,1971年11月には電気試験所(現・産業技術総合研究所)と東芝が共同で英文活字ドキュメントOCRのASPET/71を開発した.この頃からがOCR業務適用の創成期にあたる.1972年6月には,H-8959形 光学文字読取機が汎用OCRとして国産初の手書き数字読取を可能とし,1973年10月には,電電公社(現・NTTデータ)製度数計フィルム読取装置が現像フィルムからの読み取りを可能とした.1976年6月には三菱電機製M2481型光学文字読取装置がページ式(多数行読取)で枠内自由手書き読取を実現,1977年8月には,HITAC T-550/30 OCRシステムがネットワーク利用を実現した分散型として発表された.また1978年8月には,富士通製FACOM6312Bが制御機能に世界で初めてマイクロプロセッサを採用するが,これが後のOCR機能ソフトウェア化の先駆けとなる.

徐々にOCRの業務適用が拡がり浸透していく普及期に入る1980年代,電電公社(現・NTTデータ)製DT-OCR100CN1形が,1980年2月には社会保険データ通信システムに組み込まれ,1981年7月には労働省システムに組み込まれ,それぞれ日本全国で運用展開され国民にも身近な存在となった.また,運用の拡がりに伴い,大型である据置型は大量高速集中処理へ移行し,1984年3月にHITAC T-550/47が国内初の卓上設置型と発表されて以降,分散型は小形卓上型となり,汎用のワークステーション端末やPCに接続する周辺機器と位置付けられていった.また,特長的な機能を有する製品も投入された.1985年に筑波で開催された国際科学技術博覧会に参考出品された電電公社(現・NTTデータ)製手書き漢字OCRは,OCR60として1988年以降運輸省自動車登録検査業務電子情報処理システムに組み込まれ,日本全国展開された.これは手書き漢字読取大規模運用適用の初事例であった.1988年5月には,FACOM6365が自由なフォーマットで扱える日本語印刷文書に対応したと発表された.これは,それまであらかじめ指定された領域を認識処理する帳票OCRの制限をなくし,新聞や印刷書類などOCRを意識しない媒体の認識処理を可能とする文書OCRを実現した.

手書き漢字認識や文書OCRの実現で,OCRの業務適用は更に拡がりをみせ,1990年代は発展期に入った.1991年4月には,富士通製F6335AがRGBの三色光源によるカラー処理を実現し,1995年7月には,NEC製両面高速OCRが大型帳票の表裏両面の高速同時読取を実現した.更に,1998年8月には,NEC製NS-1000が非接触型オーバーヘッド方式を採用したデスクスタンド型OCRを実現した.デスクスタンド型OCRは新たな機能提供となり,銀行などの窓口で採用されるなど運用への更なる拡がりをみせた.また,Windows OSを搭載したPCや安価なADF(自動原稿送り機構)装着スキャナが普及すると,OCR装置からOCR機能をソフトウェア化して切り出した,より低価格なソフトOCR製品が登場した.富士通,沖電気などのOCRメーカは汎用スキャナと組み合わせたソフト製品に移行,メディアドライブなど,国内でもソフト製品専門メーカが登場した.2014年末時点で専用のOCR装置を提供するメーカは,東芝,日立,NECの3社のみとなっている.