海外メディアによると、ミシガン大学工学部(University of Michigan Engineering)の研究者らが、全く新しいソフトウェア・ハードウェア協調設計手法を開発し、人工知能(AI)のエネルギー効率を向上させ、遅延を低減することで、ビデオやセンサーデータストリームなどの連続的なデータストリームをリアルタイムで処理できるようにした。関連する研究は学術誌『Nature Communications』に掲載され、このニューロモルフィックな手法により、強力なリアルタイムAIがスマートフォン、補聴器、自動運転車のカメラなどのローカルエッジデバイス上で直接動作可能になることが示された。
研究チームは、ChatGPTなどのトランスフォーマーモデルに代わる最先端技術である複雑な状態空間モデルを、初めてメモリ内計算アーキテクチャに直接マッピングすることに成功した。

学術誌『Nature Communications』
ミシガン大学(U-M)のJames R. Mellor 工学教授で、本研究の責任著者であるWei Lu氏は次のように述べている:「メモリ内計算システムは非常に高いエネルギー効率とスループットを備えていますが、柔軟性に欠け、畳み込みニューラルネットワークやトランスフォーマーネットワークには最適な選択肢ではありません。本研究では、メモリ内計算システムが状態空間モデルに非常に適していることを実証しました。状態空間モデルのすべての演算は、メモリ内計算システムのデバイスの物理的特性を利用して効率的に実現でき、これにより、将来性のあるこれらのネットワークの効率的なハードウェア展開が期待できます。」
AI処理の効率問題
スマートフォン、ウェアラブル健康モニター、自動運転車などのバッテリー駆動デバイスといったエッジデバイス上でAI推論を実行することは、データをローカル化することで、速度、プライバシー、効率性を向上させることができる。しかし、現在のハードウェアとソフトウェアの効率は、エッジデバイス上で高度なAIを実行するには不十分である。
