アイデミー、LLMによる出力の品質管理を行うクラウドサービス「LLM品質管理クラウド」を開発へ

■RAGシステムの品質評価の煩雑さを大幅に削減

 アイデミー<5577>(東証スタンダードは11日、LLM(Large Language Models:大規模言語モデル)が生成する出力結果の品質を評価・管理する新しいクラウドサービス「LLM品質管理クラウド」をリリースすると発表した。同サービスは、企業や組織がRAG(Retrieval-Augmented Generation)システムに代表されるLLMを活用したシステムをより安心して活用できる環境を提供するために、生成結果の品質評価の手間とコストを削減することを目指している。

 生成AIの急速な発展により、多くの企業や組織が日常業務や戦略的活動に生成AIを取り入れるようになっている。生成AIは、資料作成、コーディング、カスタマーサポート、マーケティングなど、多岐にわたる分野で革新的なソリューションを提供している。その中でも社内ドキュメントの検索を組み合わせることで回答精度を向上させることができるRAGシステムの需要は高まっている。

 しかし、RAGシステムであっても、その出力結果が不正確であったり、倫理的・法的なリスクをはらんでいたり、バイアスを含んでいたりする可能性がある。また、LLMによる出力は、同一のプロンプトであっても一字一句同じとは限らないため機械的な評価がしづらく、目視でチェックしたりLLMによってチェックをする仕組みを整えたりする必要があり、非常に煩雑である。さらに、一度チェックしたからOKというわけではなく、LLMのアップデートによって出力が変化する可能性があるため、継続的に管理する仕組みが必要になる。

 「LLM品質管理クラウド」は、LLMによる出力の評価を自動で行う仕組みを提供し、評価結果を継続的に蓄積。RAGシステムの改善につなげていくことで、企業が生成AIの活用をさらに推進していける環境の提供を目指すとしている。

【サービスの概要】

 「LLM品質管理クラウド」は、LLMの出力結果を評価し、管理することを目的としたクラウドベースのプラットフォーム。そのために必要な以下の機能を搭載予定である。
機能1.テストプロンプト管理機能
 主にRAGシステムで活用されることを想定した機能。RAGシステムが期待する出力をするかを確認するためのテストプロンプトを登録する。登録されたテストプロンプトは、一括実行され結果が表示され、結果を確認し、OK/NGを判定する。
 OKに分類されたグループは、以後の実行でも自動実行され、出力結果が変化しないことを継続的に自動確認される。NGに分類されたグループは、実行されたらOK/NG判定を再度くりかえし、最終的にOKグループのみになるよう、RAGシステムを調整していくことができる。

機能2.CI/CDパイプラインからの呼び出し
 手動で実行するだけでなく、CI/CDパイプライン上からのAPI呼び出しによる自動実行もサポート。レスポンスとして評価結果を返し、問題があればCI/CDプロセスを中断することもできる。

機能3.定期実行と結果のレポーティング
 一度テストプロンプトを全部クリアしても、リリース以降ずっと問題がない状態が継続するとは限らない。LLM自身のアップデートや品質低下などにより、OKだった出力結果が劣化することも十分にありえ、そのような事態をいち早く検知するために、テストプロンプトを定期実行し、結果をレポーティングする。

機能4.セキュリティリスク、倫理的・法的リスクに対応したプロンプト群の提供
 LLMには「プロンプトインジェクション」や「ジェルブレイク」など固有のセキュリティリスクが存在する。また、LLMの出力が倫理的・法的に問題のある内容になってしまうリスクも存在する。そこで、これらのリスクを洗い出すためのプロンプト群をあらかじめ提供する。このプロンプト群を定期実行することで問題点を継続的に洗い出し管理することができる。

 特に倫理面においては、日本では経済産業省によって「AI事業者ガイドライン」が発表されており、その内容に準拠したプロンプト群を提供する。ガイドラインのアップデートが発表された際には、その内容に即したプロンプトにアップデートしていく。また、利用者が採用される研究機関や教育機関、先進的な企業などが提言するガイドラインなどに即したプロンプト群の提供についても個別に相談が可能である。

 アイデミーは、「LLM品質管理クラウド」のさらなる発展のため、随時、機能を追加し、企業や組織が生成AIを安全かつ効果的に活用できる環境をより一層強化していくとしている。

 なお、利用方法については、同サービスは2025年1月ごろから順次ローンチの予定としており、以下のページから事前登録すると、最新の生成AIの動向や倫理面・法律面のガイドラインの変化、内容面の品質評価・管理を行うためのメソッドなどの最新ニュースを無料で送られてくる。以下のページから詳細を確認の上、登録が可能。(情報提供:日本インタビュ新聞社・株式投資情報編集部)

関連記事


手軽に読めるアナリストレポート
手軽に読めるアナリストレポート

最新記事

カテゴリー別記事情報

ピックアップ記事

  1. ■半導体パッケージの微細化に対応、LDI露光で1.0μm幅パターンを実現  旭化成<3407>(東…
  2. ■物流費やエネルギーコストの上昇受け、企業努力では限界  亀田製菓<2220>(東証プライム)は5…
  3. ■約100種類の実践講座で次世代エンジニアを育成  トヨタグループ5社は5月22日、AI・ソフトウ…
2025年7月
 123456
78910111213
14151617181920
21222324252627
28293031  

ピックアップ記事

  1. ■祝日と金融政策が交錯する7月  7月は、7月21日が「海の日」が国民の祝日に制定されてからフシ目…
  2. ■「MMGA」効果の造船株・海運株は「海の日」月間キャンペーン相場も加わり一段高を期待  あと1カ…
  3. ■選挙関連の「新三羽烏」の株価動向をウオッチ  足元では野党が石破内閣への内閣不信認決議案提出を見…
  4. どう見るこの相場
    ■米、イラン核施設を電撃空爆、緊張激化へ  「2週間以内」と言っていたのが、わずか「2日」である。…
  5. ■イスラエル・イラン衝突でリスク回避売りが優勢に  イスラエルのイラン攻撃を受け、13日の日経平均…
  6. ■ホルムズ海峡封鎖なら「油の一滴は血の一滴」、日本経済は瀬戸際へ  コメ価格が高騰する「食料安全保…

アーカイブ

「日本インタビュ新聞社」が提供する株式投資情報は投資の勧誘を目的としたものではなく、投資の参考となる情報の提供を目的としたものです。投資に関する最終的な決定はご自身の判断でなさいますようお願いいたします。
また、当社が提供する情報の正確性については万全を期しておりますが、その内容を保証するものではありません。また、予告なく削除・変更する場合があります。これらの情報に基づいて被ったいかなる損害についても、一切責任を負いかねます。
ページ上部へ戻る