アイデミー、LLMによる出力の品質管理を行うクラウドサービス「LLM品質管理クラウド」を開発へ

■RAGシステムの品質評価の煩雑さを大幅に削減

 アイデミー<5577>(東証スタンダードは11日、LLM(Large Language Models:大規模言語モデル)が生成する出力結果の品質を評価・管理する新しいクラウドサービス「LLM品質管理クラウド」をリリースすると発表した。同サービスは、企業や組織がRAG(Retrieval-Augmented Generation)システムに代表されるLLMを活用したシステムをより安心して活用できる環境を提供するために、生成結果の品質評価の手間とコストを削減することを目指している。

 生成AIの急速な発展により、多くの企業や組織が日常業務や戦略的活動に生成AIを取り入れるようになっている。生成AIは、資料作成、コーディング、カスタマーサポート、マーケティングなど、多岐にわたる分野で革新的なソリューションを提供している。その中でも社内ドキュメントの検索を組み合わせることで回答精度を向上させることができるRAGシステムの需要は高まっている。

 しかし、RAGシステムであっても、その出力結果が不正確であったり、倫理的・法的なリスクをはらんでいたり、バイアスを含んでいたりする可能性がある。また、LLMによる出力は、同一のプロンプトであっても一字一句同じとは限らないため機械的な評価がしづらく、目視でチェックしたりLLMによってチェックをする仕組みを整えたりする必要があり、非常に煩雑である。さらに、一度チェックしたからOKというわけではなく、LLMのアップデートによって出力が変化する可能性があるため、継続的に管理する仕組みが必要になる。

 「LLM品質管理クラウド」は、LLMによる出力の評価を自動で行う仕組みを提供し、評価結果を継続的に蓄積。RAGシステムの改善につなげていくことで、企業が生成AIの活用をさらに推進していける環境の提供を目指すとしている。

【サービスの概要】

 「LLM品質管理クラウド」は、LLMの出力結果を評価し、管理することを目的としたクラウドベースのプラットフォーム。そのために必要な以下の機能を搭載予定である。
機能1.テストプロンプト管理機能
 主にRAGシステムで活用されることを想定した機能。RAGシステムが期待する出力をするかを確認するためのテストプロンプトを登録する。登録されたテストプロンプトは、一括実行され結果が表示され、結果を確認し、OK/NGを判定する。
 OKに分類されたグループは、以後の実行でも自動実行され、出力結果が変化しないことを継続的に自動確認される。NGに分類されたグループは、実行されたらOK/NG判定を再度くりかえし、最終的にOKグループのみになるよう、RAGシステムを調整していくことができる。

機能2.CI/CDパイプラインからの呼び出し
 手動で実行するだけでなく、CI/CDパイプライン上からのAPI呼び出しによる自動実行もサポート。レスポンスとして評価結果を返し、問題があればCI/CDプロセスを中断することもできる。

機能3.定期実行と結果のレポーティング
 一度テストプロンプトを全部クリアしても、リリース以降ずっと問題がない状態が継続するとは限らない。LLM自身のアップデートや品質低下などにより、OKだった出力結果が劣化することも十分にありえ、そのような事態をいち早く検知するために、テストプロンプトを定期実行し、結果をレポーティングする。

機能4.セキュリティリスク、倫理的・法的リスクに対応したプロンプト群の提供
 LLMには「プロンプトインジェクション」や「ジェルブレイク」など固有のセキュリティリスクが存在する。また、LLMの出力が倫理的・法的に問題のある内容になってしまうリスクも存在する。そこで、これらのリスクを洗い出すためのプロンプト群をあらかじめ提供する。このプロンプト群を定期実行することで問題点を継続的に洗い出し管理することができる。

 特に倫理面においては、日本では経済産業省によって「AI事業者ガイドライン」が発表されており、その内容に準拠したプロンプト群を提供する。ガイドラインのアップデートが発表された際には、その内容に即したプロンプトにアップデートしていく。また、利用者が採用される研究機関や教育機関、先進的な企業などが提言するガイドラインなどに即したプロンプト群の提供についても個別に相談が可能である。

 アイデミーは、「LLM品質管理クラウド」のさらなる発展のため、随時、機能を追加し、企業や組織が生成AIを安全かつ効果的に活用できる環境をより一層強化していくとしている。

 なお、利用方法については、同サービスは2025年1月ごろから順次ローンチの予定としており、以下のページから事前登録すると、最新の生成AIの動向や倫理面・法律面のガイドラインの変化、内容面の品質評価・管理を行うためのメソッドなどの最新ニュースを無料で送られてくる。以下のページから詳細を確認の上、登録が可能。(情報提供:日本インタビュ新聞社・株式投資情報編集部)

関連記事


手軽に読めるアナリストレポート
手軽に読めるアナリストレポート

最新記事

カテゴリー別記事情報

ピックアップ記事

  1. ■全従業員にAI活用徹底、業務改革を本格化  LINEヤフー<4689>(東証プライム)は7月14…
  2. ■50年以上親しまれたかぜ薬が国内市場から姿を消す?  大正製薬は7月14日、塗るかぜ薬「ヴイック…
  3. ■鈴鹿8耐で新型CBコンセプト登場  ホンダ<7267>(東証プライム)は7月11日、大型ロードス…
2025年9月
1234567
891011121314
15161718192021
22232425262728
2930  

ピックアップ記事

  1. ■01銘柄:往年の主力株が再評価、低PER・PBRで買い候補に  今週の当コラムでは、買い遅れカバ…
  2. ■日米同時最高値への買い遅れは「TOPIXコア30」と「01銘柄」の出遅れ株でカバー  日米同時最…
  3. ■東京株、NYダウ反落と首相辞任で先行き不透明  東京株式市場は米国雇用統計の弱含みでNYダウが反…
  4. ■株式分割銘柄:62社に拡大、投資単位引き下げで流動性向上  選り取り見取りで目移りがしそうだ。今…
  5. ■金先物相場を背景に産金株が収益拡大の余地を示す  東京市場では金価格の上昇を背景に産金株が年初来…
  6. ■大統領の交渉術が金融市場を左右し投資家心理に波及  米国のトランプ大統領は、ギリシャ神話に登場す…

アーカイブ

「日本インタビュ新聞社」が提供する株式投資情報は投資の勧誘を目的としたものではなく、投資の参考となる情報の提供を目的としたものです。投資に関する最終的な決定はご自身の判断でなさいますようお願いいたします。
また、当社が提供する情報の正確性については万全を期しておりますが、その内容を保証するものではありません。また、予告なく削除・変更する場合があります。これらの情報に基づいて被ったいかなる損害についても、一切責任を負いかねます。
ページ上部へ戻る