富士通、生成AI再構成技術で「Takane」強化、1ビット量子化で94%削減・3倍速達成
- 2025/9/8 12:18
- その他・経済

■世界最高水準の精度維持率89%、Cohere社モデルも公開
富士通<6702>(東証プライム)は9月8日、生成AIの軽量化と省電力化を実現する「生成AI再構成技術」を開発し、自社の大規模言語モデル「Takane」を強化したと発表した。同技術は、重みパラメータを極限まで圧縮する1ビット量子化技術と、軽量化と精度向上を両立させる特化型AI蒸留技術の2つから成る。特に1ビット量子化は、メモリ消費量を最大94%削減しつつ世界最高水準の精度維持率89%を実現、推論速度も従来比3倍に高速化した。従来主流のGPTQが精度維持率20%以下に留まる中での成果であり、ハイエンドGPU4枚が必要だった大規模モデルをローエンドGPU1枚で実行可能にする大幅な効率化を達成した。
同社は同技術により、スマートフォンや工場設備などのエッジデバイス上でのAIエージェント実行を可能にするとしている。これによりリアルタイム応答性の向上やデータセキュリティ強化、さらに消費電力の抜本的削減が実現され、持続可能なAI社会の構築に寄与する。本年度下期からは「Takane」のトライアル環境を順次提供し、さらにCohere社の研究用モデル「Command A」を量子化した成果を、Hugging Faceを通じて公開する計画である。また、社内CRMデータによる商談勝敗予測タスクでは推論速度を11倍にしつつ精度を43%改善する成果を確認、画像認識でも既存技術を10%上回る精度を実証した。これにより、モデルの軽量化と精度向上を同時に実現できる有効性が裏付けられた。
富士通は今後、金融・製造・医療・小売など特化分野向けの軽量AIエージェント群を展開し、社会や産業のデジタル変革を加速させる方針である。将来的には、モデルのメモリ消費量をさらに1000分の1に削減し、あらゆる場所で高精度な生成AIが利用できる環境を整えることを目指す。また、複雑な因果関係を理解し自律的に最適解を導く次世代AIエージェントアーキテクチャの構築に向け研究開発を進めるとしている。(情報提供:日本インタビュ新聞社・株式投資情報編集部)