Google、AI学習データを最大1万分の1に削減する新技術、少ないデータで人間並みの精度を実現

■従来10万件必要だった学習をわずか250件で可能に

 Googleは8月7日、大規模なAIモデルの学習(微調整)に必要なデータ量を最大1万分の1まで減らせる新しい方法を発表した。この技術は、広告が安全かどうかを判断する作業を想定して開発されたもので、人間の専門家と同じ水準の判断精度を保ちながら、従来10万件必要だったデータをわずか250~450件にまで減らすことに成功した。

 ポイントは「アクティブラーニング」と呼ばれる仕組みを使ったデータの選び方にある。まず、AIが大量のデータをざっくり分類し、その中から「判断が難しい境界線上の事例」だけを抜き出す。その重要な事例にだけ専門家が正しい答えをつけ、AIがそのデータを使って繰り返し学習する。評価には、複数の専門家がどれだけ同じ判断をしているかを示す「コーエンのカッパ値」という指標を採用し、高い信頼性(0.8以上)を実現した。

 実験では、特に大きなAIモデル(3.25Bパラメータ)で効果が大きかった。例えば、クラウドソーシングで集めた10万件のデータではカッパ値0.23だったのに対し、専門家が付けた450件のデータでは0.38に上昇。データ量を99.5%減らしつつ、精度を65%高めた。一方、小さなモデルでは効果が限定的で、モデルの規模によって相性があることも分かった。

 最大のメリットは、判断基準が変わったときの素早い対応だ。従来は全データを使って再学習する必要があったが、この方法なら迷いやすい事例だけに絞って少量のデータで更新できる。広告審査のように解釈が分かれる仕事に向いており、専門家の判断基準が変化しても柔軟に適応できる。今後は、高品質なデータを継続的に確保する仕組みづくりが課題となる。(情報提供:日本インタビュ新聞社・株式投資情報編集部)

関連記事


手軽に読めるアナリストレポート
手軽に読めるアナリストレポート

最新記事

カテゴリー別記事情報

ピックアップ記事

  1. ■東京・愛知・兵庫で屋外広告も掲出、号外や無料バッティング企画も実施  Major League …
  2. ■新生児対象の臨床試験で抗炎症作用と菌叢改善を実証  森永乳業<2264>(東証プライム)は7月2…
  3. ■「日本栄養・食糧学会大会」で研究成果発表、科学的根拠を提示  味の素<2802>(東証プライム)…
2025年9月
1234567
891011121314
15161718192021
22232425262728
2930  

ピックアップ記事

  1. ■東証市場、主力株急落と中小型株逆行高で投資戦略二極化  証市場は9月19日に主力株の急落と中小型…
  2. どう見るこの相場
    ■プライム市場の需給悪化を警戒し、個人投資家は新興市場へ資金を逃避  「桐一葉 落ちて天下の秋を知…
  3. ■01銘柄:往年の主力株が再評価、低PER・PBRで買い候補に  今週の当コラムでは、買い遅れカバ…
  4. ■日米同時最高値への買い遅れは「TOPIXコア30」と「01銘柄」の出遅れ株でカバー  日米同時最…
  5. ■東京株、NYダウ反落と首相辞任で先行き不透明  東京株式市場は米国雇用統計の弱含みでNYダウが反…
  6. ■株式分割銘柄:62社に拡大、投資単位引き下げで流動性向上  選り取り見取りで目移りがしそうだ。今…

アーカイブ

「日本インタビュ新聞社」が提供する株式投資情報は投資の勧誘を目的としたものではなく、投資の参考となる情報の提供を目的としたものです。投資に関する最終的な決定はご自身の判断でなさいますようお願いいたします。
また、当社が提供する情報の正確性については万全を期しておりますが、その内容を保証するものではありません。また、予告なく削除・変更する場合があります。これらの情報に基づいて被ったいかなる損害についても、一切責任を負いかねます。
ページ上部へ戻る