Cerebras SystemsとRanovusの協力は、現代のAI処理技術において重要な一歩を踏み出しました。この協力の中心には、Cerebrasの革新的なウェーハスケールエンジン(WSE)とRanovusのコーパッケージ光学(CPO)技術があります。CerebrasのWSEは、46,225mm²というサイズの単一ウェーハ上に4兆個のトランジスタと90万個のAIコアを搭載し、既存のGPUクラスターと比較してはるかに高い集積度と並列処理能力を提供します。これにより、次世代のAI計算が実現可能になるのです。
RanovusのOdin®プラットフォームに基づくCPO技術は、複数の波長の量子点レーザーとシリコンフォトニクスを統合し、従来の光インターコネクト技術と比較して100倍の帯域幅向上と電力効率の改善をもたらします。この2つの技術の融合はメモリ帯域幅のボトルネックを解消し、データ転送の遅延時間を減少させることを目指しています。
この統合の戦略的な意味は、ウェーハスケールチップとCPOの統合によって、単一パッケージ内で計算と通信の最適化を実現する点にあります。これにより、大規模なAIクラスターで発生するパケットスイッチングのオーバーヘッドを排除できます。特に、Digital RF Battlespace Emulator(DRBE)プログラムのリアルタイム戦闘シミュレーションの要求を満たすために、150倍の性能向上と90%の電力削減という目標が設定されています。
米国防総省(DARPA)による4,500万ドルの投資は、軍事の必要性に基づき行われました。リアルタイムのAIベースの戦場認知(C4ISR)および自律兵器システムの意思決定速度向上が、その核心的な目標です。具体的には、RF信号処理シミュレーションにおいて、1msを超える遅延をマイクロ秒単位に改善することで、電子戦(EW)の能力を強化することを目指しています。
また、実際の利用分野としては、衛星やドローンの映像を即座に分析し、標的の識別を加速する実リアルタイムAIセンサー処理、五次元(陸海空宇宙サイバー)の複合環境モデリングによる戦場デジタルツイン、複数の自律プラットフォームの協力作戦アルゴリズム最適化といった分野が挙げられます。
半導体接続速度の向上は、AIモデルの学習にも大きな影響を与えています。1,024台のH100 GPUクラスターに対して同様の作業を行う際、1/10の電力消耗で125 PFLOPSの性能を実現することができる可能性があります。これは、100Bパラメータのグローバルモデルの学習時間を週単位から時間単位に短縮する可能性を示唆しています。さらに、CPO技術の導入によって、既存のスイッチベースのインフラストラクチャに対し、相互接続密度が10倍に増加し、ラックあたりの処理能力が30%向上する見込みです。
特に、LLMの推論時にはエンドツーエンドのレイテンシを200μs以下に抑えることが重要な課題となります。
Cerebras SystemsとRanovusの協力によって、アメリカが主導する技術革新は、今後の半導体産業において広範な影響を与えるでしょう。DARPAの戦略的投資は、NVIDIA GPUベースのAIインフラのパラダイムをウェーハスケールの特別目的チップへと変換する取り組みです。この動きは、TSMCのCoWoSパッケージング技術に対抗する新たな基準を設定する可能性があるのです。
国際的にも様々な動向が見られ、韓国は2030年までに国家AIコンピューティングセンターの構築を目指して1EFLOPS(エクサフロップス)規模のインフラを確保する計画を立てています。EUはChips Actを通じて2030年までにグローバルな半導体生産量の20%シェアを目指しており、中国は第14次五カ年計画において3D集積および光インターコネクト技術を国家の重要プロジェクトに指定しています。
このような背景から、ウェーハスケールプロセスに特化した12インチファブの需要が増加することが予想されます。特に光通信モジュール分野では、LumentumやII-VI Incorporatedとの技術標準競争が激化する可能性があります。
今後の技術革新の方向性としては、計算・メモリ・通信の三重統合が挙げられます。ウェーハスケールパッケージ内でHBM(高帯域メモリ)とCPOの一体化を進めることが求められています。また、Ranovusのマルチウェーブレングス量子点レーザー技術が2026年に量産化される見込みです。さらに、DARPAプロジェクトの成果は2027年以降にAWSやGCPクラウドサービスに適用されることが期待されています。