誕生と発展の歴史

科学技術計算用にはより高速なコンピュータが要求される.米国では1960年代より汎用コンピュータ(メインフレーム)と並行して科学技術計算用に高性能なスーパーコンピュータの開発が行われてきた.1964年にCDC社(Control Data Corporation)から出荷されたCDC 6600はIBM社の超大型汎用コンピュータStretchより演算速度が3倍速かったといわれ,浮動小数点演算能力が4メガFLOPSと当時としては桁違いに高速であった.このためCDC 6600は最初のスーパーコンピュータあるいはスーパーコンピュータの元祖ともいわれている.

ベクトル型スーパーコンピュータ

科学技術計算ではデータの大きな配列に対して浮動小数点演算を行うことが多いので,メモリ上に規則的に配置されているベクトルデータをひとまとめにして,パイプライン方式で処理するベクトルプロセッサ方式が開発された.IBM社は, IBM 2938アレイプロセッサをシステム/360のI/Oチャネルに接続する付加プロセッサとして,1969年に実用化した.最初の独立したベクトルコンピュータは,1972年に発表されたCDC社のSTAR-100とテキサスインスツルメント社のASCである.

CDC 6600, CDC 7600を開発したセイモア・クレイは1972年にCRI社(Cray Research Inc,)を設立し1976年にピーク性能160メガFLOPSのCray-1を発表した.Cray-1はベクトル・レジスタ・アーキテクチャを採用し,さらに自動ベクトル化FORTRANをサポートしていたため,大規模科学技術計算のユーザに広く普及し,スーパーコンピュータの名を高めた.その後のベクトルマシンの多くはCray-1のアーキテクチャをベースにしている.CRI社はその後,Cray X-MP,Cray-2,Cray Y-MPなどを開発し,業界をリードした.

我が国では1977年に富士通がベクトルプロセッサFACOM 230-75APUを完成し,つづいて日立製作所(以下日立),日本電気(以下NEC),三菱電機が汎用大型コンピュータにベクトル処理機能を組み込んだ統合型アレイプロセッサを相次いで商用化した.日立は1978年にHITAC M-180IAP(10メガFLOPS以上),1979年にM-200H IAP(48メガFLOPS),1982年にM-280-H IAP (67メガFLOPS)を完成させた.NECは1982年にACOS-1000 IAP(28メガFLOPS)を開発した.三菱電機はMELCOM COSMO 700 III IAPを開発した.

1982年以降日本のコンピュータ・メーカはスーパーコンピュータ市場に本格的に参入し,富士通のVPシリーズ(VP-100, 200),日立のS-810シリーズ,NECのSXシリーズ(SX-1, /SX-2)のベクトル型スーパーコンピュータが発表された.日立はS-810/20(630メガFLOPS)を1983年に,富士通はVP-200(570メガFLOPS)を1983年に出荷した.日本電気はSX-2(1,300メガFLOPS)を1985年に出荷し,世界で初めてLivermoe Fortran Kernelsのloop 7で1ギガFLOPSを超える性能を実現した.これらのスーパーコンピュータはいずれもクレイのCray-1と同様のベクトルレジスタ方式を採用しているが,単一プロセッサに多くのパイプラインを装備し,ベクトルレジスタの容量やメモリの容量を大きくするなど強力なハードウェアを備えていた.また自社のメインフレームとの互換性を持たせ,メインフレームユーザのスーパーコンピュータ利用を容易にするよう配慮された.後継機として1987年に日立がS-820(3ギガFLOPS)を,1988年に富士通がVP-2600(5ギガFLOPS)を発表した.1989年にはNECが最大並列度4のSX-3(5.5GFlops/プロセッサ当たり)を発表した.SX-3は本格的な共有メモリ並列ベクトルプロセッサである.

航空宇宙技術研究所(航技研, 現在の航空宇宙研究開発機構)では1993年2月に数値風洞(Numerical Wind Tunnel ; NWT)を富士通と共同で開発した.166台のプロセッシングエレメントをクロスバスイッチで結合する分散メモリ型並列ベクトルコンピュータの方式が採用された.CPUボードにはBiCMOS(Bipolar CMOS),ECL(Emitter-Coupled Logic,エミッタ結合論理),GaAs(ガリウム砒素)の3種類の素子が使用された.ピーク性能は280ギガFLOPSの世界最高速を達成し,1995年までその記録を維持した.

1993年に,日立はバイポーラで最大4並列の共有メモリ型ベクトルプロセッサのS-3800(8ギガFLOPS /proc.)を,富士通は航技研と共同開発したNWTの技術を用いて分散メモリ高並列(最大222)ベクトルコンピュータVPP500(1.6ギガFLOPS /proc.)を開発した.また,VPP500をCMOS化した並列度16のVPP300(2.2ギガFLOPS /proc.)を1995年に,並列度512の上位機VPP700(2.2ギガFLOPS /proc.)を1996年に出荷した.NECはCMOSで32まで共有メモリ可能で最大並列度512のベクトルプロセッサSX-4(2ギガFLOPS /proc.)を1995年に,後継機SX-5(8ギガFLOPS /proc., 最大並列度512)を1998年に出荷した.

並列型スーパーコンピュータ

ベクトル型と異なる方式として並列プロセッサ方式がイリノイ大学から提案され, イリノイ大学とバロース社が共同で1972年に64台の処理装置からなるピーク性能50メガFLOPSの並列プロセッサILLIAC IVが開発された.1980年代にはVLSI技術の進展に伴い,1ビット演算器16,384個を格子状に結合したグッドイヤー社のMPPや,シンキングマシン社の65,536個の演算器をキューブ網に結合したコネクションマシンのような超並列方式のシステムが構築されるようになった.米国ではその後もスカラ型の高並列,超並列のスーパーコンピュータ開発が推進されていた.

我が国では富士通が1992年に16〜1,024プロセッシングエレメントのスカラ並列型スーパーコンピュータAP1000(50メガFLOPS/proc.)を,1996年にUltra-Sparcを用いた4〜1,024ノードのAP3000を発表した.NECでは1993年にCenju-2を,1994年にCenju-3(50メガFLOPS /プロセッサ当たり, 最大256 プロセッシングエレメント)を,1997年にCenju-4(400MメガFLOPS /プロセッサ当たり, 最大1,024プロセシングエレメント)を開発した.

日立は1994年に8〜128プロセッシングエレメント,最大23ギガFLOPSのSR2001を発表した.筑波大学は日立の協力を得て,ピーク性能614ギガFLOPSの分散メモリ型超並列スーパーコンピュータCP-PACSを1996年9月に完成した.2,048台の演算ユニットと128台のI/Oユニットが3次元結合網により結合されている.1996年9月にLinpackベンチマークで368.2ギガFLOPSの世界最高記録を達成し,同年11月に世界のスーパーコンピュータのTop500リストの第1位に登録された.

日立はCP-PACSの技術をもとに,RISCベースの分散メモリ擬似ベクトルコンピュータSR2201(0.3ギガFLOPS/プロセッサ当たり, 並列度2,048) を1996年に,後継機SR8000(8プロセッサ/node, 最大128nodes, 1,024ギガFLOPS)を1998年に出荷した.日立はスカラ超並列に移行し,NECは並列ベクトルの路線を堅持したが,富士通もその後超並列方式に移行した.