東京エレクトロンデバイス、企業の膨大な内部データを学習可能とした独自大規模言語モデル(LLM)の開発に成功

■1730億トークン以上の学習を実施

 東京エレクトロン デバイス(TED)<2760>(東証プライム)は10月24日、Cerebras Systemsと共同で、日本語対応の大規模言語モデル「Llama3-tedllm-8B-v1」を開発したと発表。このモデルは、Meta-Llama-3-8Bを基盤とし、一般的な日本語コーパスと企業の内部データを利用して、1730億トークンのデータセットを用いた事前学習を行った。この結果、英語能力を有する基盤モデルに日本語能力を追加し、さらに企業特有のデータを反映させることに成功した。

 従来の大規模言語モデル(LLM)は主に英語のデータに基づいており、日本国内企業の文化やニーズに応じたモデルを提供するためには、特有の日本語データの追加学習が不可欠であった。TEDは、自社の豊富なデータを効果的に活用することを目指し、Cerebras CS-3を使用して日本語対応のLLMを開発した。この取り組みにより、企業が独自のデータを学習したLLMを迅速かつ確実に構築できる環境が整備される。

 今回の開発においては、学習時間の短縮と精度向上が実現された。Cerebras CS-3を活用したことで、基盤モデルの言語能力を維持しつつ日本語精度が向上し、業界特有のデータを取り込むことで実践的な文書生成が可能となった。さらに、アダプターチューニングや強化学習を用いて独自LLMのユースケース構築を進める予定であり、これにより企業の生成AI活用の幅が広がることが期待される。(情報提供:日本インタビュ新聞社・株式投資情報編集部)

関連記事


手軽に読めるアナリストレポート
手軽に読めるアナリストレポート

最新記事

カテゴリー別記事情報

ピックアップ記事

  1. ■歯周病の進行抑制に向け、老廃物除去と免疫調整の2軸で研究  ライオン<4912>(東証プライム)…
  2. ■バリア性能と印刷適性を両立、2030年までに10億円売上目指す  大日本印刷<7912>(東証プ…
  3. ■胃がん・大腸がん対策で「Train the Trainerプログラム」を展開  オリンパス<77…
2025年8月
 123
45678910
11121314151617
18192021222324
25262728293031

ピックアップ記事

  1. ■価格改定効果に加え9月以降の値上げで業績上乗せが期待される銘柄  今週の当コラムは、9月に価格改…
  2. ■9月1日に値上げラッシュの食品株は日銀バトルで小緩んでも株高持続性  まさに「パウエル・プット」…
  3. ■メガバンク株は業績修正や自己株取得が焦点、再編思惑も視野  銀行株やコメ関連株は盆休み明けの注目…
  4. ■日経平均史上最高値更新、夏枯れ懸念を払拭  前週末15日のマーケットは、お盆を象徴するかのように…
  5. 【ダブルセット・フルセット銘柄、夏休み明けも底堅さに期待】 ■上方修正・増配・株式分割の好材料銘柄…
  6. ■上方修正・下方修正問わず買い集まる異例の展開  3連休入りした9日の成田空港では、夏休みを海外で…

アーカイブ

「日本インタビュ新聞社」が提供する株式投資情報は投資の勧誘を目的としたものではなく、投資の参考となる情報の提供を目的としたものです。投資に関する最終的な決定はご自身の判断でなさいますようお願いいたします。
また、当社が提供する情報の正確性については万全を期しておりますが、その内容を保証するものではありません。また、予告なく削除・変更する場合があります。これらの情報に基づいて被ったいかなる損害についても、一切責任を負いかねます。
ページ上部へ戻る