米インフォマティカがこのほど、生成AI導入状況とデータ戦略に関するグローバル調査レポートを発表した。世界中の600人のCDO(最高データ責任者)らに聞いた結果、生成AIの導入は約4割(世界45%、日本38%)と、急速に広がっていることが分かった。
生成AIの導入手法は、過半数の企業(世界も日本も57%)がサードパーティーの大規模言語モデル(LLM)を使用したプロンプトエンジニアリングを採用する。約半数の企業がオープンソースLLM(世界51%、日本48%)、または検索拡張生成(RAG:Retrieval-Augmented Generation、世界も日本も48%)の導入を検討または実施している。
多くの企業がデータ戦略の優先事項に挙げたのは、「生成AIに適したデータの取得」(世界39%、日本43%)と「データやデータプロセスにおけるガバナンス」(世界38%、日本43%)だ。データ戦略を実行するうえでの課題は、日本は「データリテラシー不足」(62%)と「事業部門をまたいだ協力や連携の不足」(52%)を挙げる。
生成AIやLLM導入におけるデータ課題は、52%の日本企業が「データプライバシー・保護」と「ドメイン固有のLLM学習・ファインチューニング用データの収集」を挙げる。ただし、「データプライバシー・保護をデータ戦略の効果測定指標」を実施する日本企業は19%にとどまる。同社は「企業課題とKPI(重要業績評価指標)の間に明らかな不一致が見られる」と指摘する。
また、データ品質の向上をデータ戦略のKPIとする日本企業は29%で、世界の4割に比べると低い。62%の日本企業が1000以上のデータソースを扱っており、データの重複や不整合、形式のずれなどの課題を抱えている。同社は「AIを効果的に活用し、ビジネス価値を創出するためには、AIモデルの学習に使用されるデータの質をKPIの一環として持続的に管理することがカギになる」と指摘する。(田中克己)