ガートナージャパンが9月10日に発表した2027年までに生成AIソリューションの動向によると、40%がテキスト、画像、音声、動画など混在するデータを一度に処理するマルチモーダルになると予測する。マルチモーダル生成AIは、オープンソースのLLM(大規模言語モデル) とともに、「早期に採用することで、顕著な競争優位性と市場投入までの期間短縮をもたらす可能性があるテクノロジーだ」とし、今後5年以内に企業や政府、自治体などに大きな影響を及ぼすと推測する。
米本社のアルン・チャンドラセカラン氏は「業界再編の始まりと共に、生成AIは幻滅期に入る。ブームが一段落すれば、今後数年間は急速なペースで機能が進歩し、さらなるメリットを得られる可能性がある」と予測する。以下、マルチモーダル生成AIなどを予測する。
マルチモーダル生成AIは、通常では実現不可能な新しい機能が実現されて、エンタープライズ・アプリに変革的なインパクトをもたらす。とくにAIと人間の間のあらゆる接点への適用が可能になるという。次はオープンソースのLLMになる。商用アクセスを民主化し、開発者が特定のタスク/ユースケース向けにモデルを最適化できるようになる。いずれ低コストで学習しやすい小規模モデルを企業にもたらす。
ドメイン固有の生成AIモデルは、特定の業界、ビジネス機能、またはタスクのニーズに最適化される。企業内でユースケースの整合性を改善もする。精度やセキュリティ、プライバシーを向上させ、よりコンテキストに沿った回答を提供できることで、汎用モデルの場合ほど高度なプロンプト・エンジニアリングを使用する必要がなくなり、ハルシネーション (捏造された回答) のリスクを下げる。
人間の介入なしで、定義された目標を達成する複合システムの自律エージェントは、いろんなAI技術を利用して、環境におけるパターンの識別、意思決定、アクションの実行、アウトプットの生成へと進む。環境を学習し続けて性能を向上させて、より複雑なタスクに対処もできるようになる。AIの能力を大きく変化させることだという
日本で生成AIの領域を担当する亦賀忠明氏は「生成AIの進化はまだ二合目だ。だが、インターネットの進化と似ており、今は『過度な期待』のピーク期の下り方向にある」とし、「想定以上にコストがかかっている」といった幻滅的な事象も発生しているという。同氏は、そうした注意が必要なフェーズだが、生成AIはヒューマノイドやあらゆるデバイスとアプリケーションへの組み込み、汎用AI、スーパーインテリジェンスに向けた進化していくと予測する。(田中克己)