東京エレクトロンデバイス、企業の膨大な内部データを学習可能とした独自大規模言語モデル(LLM)の開発に成功

■1730億トークン以上の学習を実施

 東京エレクトロン デバイス(TED)<2760>(東証プライム)は10月24日、Cerebras Systemsと共同で、日本語対応の大規模言語モデル「Llama3-tedllm-8B-v1」を開発したと発表。このモデルは、Meta-Llama-3-8Bを基盤とし、一般的な日本語コーパスと企業の内部データを利用して、1730億トークンのデータセットを用いた事前学習を行った。この結果、英語能力を有する基盤モデルに日本語能力を追加し、さらに企業特有のデータを反映させることに成功した。

 従来の大規模言語モデル(LLM)は主に英語のデータに基づいており、日本国内企業の文化やニーズに応じたモデルを提供するためには、特有の日本語データの追加学習が不可欠であった。TEDは、自社の豊富なデータを効果的に活用することを目指し、Cerebras CS-3を使用して日本語対応のLLMを開発した。この取り組みにより、企業が独自のデータを学習したLLMを迅速かつ確実に構築できる環境が整備される。

 今回の開発においては、学習時間の短縮と精度向上が実現された。Cerebras CS-3を活用したことで、基盤モデルの言語能力を維持しつつ日本語精度が向上し、業界特有のデータを取り込むことで実践的な文書生成が可能となった。さらに、アダプターチューニングや強化学習を用いて独自LLMのユースケース構築を進める予定であり、これにより企業の生成AI活用の幅が広がることが期待される。(情報提供:日本インタビュ新聞社・株式投資情報編集部)

関連記事


手軽に読めるアナリストレポート
手軽に読めるアナリストレポート

最新記事

カテゴリー別記事情報

ピックアップ記事

  1. ■地域と共に築いた「鮪解体ショー」で世界一の舞台へ  銚子丸<3075>(東証スタンダード)は、同…
  2. ■速乾・吸水機能を備えたブラ&ショーツ、11月7日から応援購入受付  グンゼ<3002>(東証プラ…
  3. 日産自動車 日産 NISSAN
    ■経営再建計画の一環として保有資産を最適化、20年間の賃貸借契約で本社機能維持  日産自動車<72…
2025年12月
1234567
891011121314
15161718192021
22232425262728
293031  

ピックアップ記事

  1. ■売り方手仕舞いで需給改善が後押し  師走相場では、リスクの大きい銘柄であっても、逆日歩のつく信用…
  2. ■師走相場は最終レースさながら、勝ち負け分ける「掉尾の一振」に熱視線  師走である。礼節一点張りの…
  3. ■金利環境改善が銀行株に追い風、逆張りの買いも有力視  今週の当コラムは、銀行株に注目することにし…
  4. ■「トリプル安」も怖くない!?逆張りのバリュー株ローテーションからは銀行株になお上値余地  「神風…
  5. ■気温急低下がシーズンストック相場発進を後押し  今週のコラムでは、バリュー株選好の別の買い切り口…
  6. ■「押し」のAI株より「引き」のバリュー株選好で厳冬関連株の先取り買いも一考余地  「押してだめな…

アーカイブ

「日本インタビュ新聞社」が提供する株式投資情報は投資の勧誘を目的としたものではなく、投資の参考となる情報の提供を目的としたものです。投資に関する最終的な決定はご自身の判断でなさいますようお願いいたします。
また、当社が提供する情報の正確性については万全を期しておりますが、その内容を保証するものではありません。また、予告なく削除・変更する場合があります。これらの情報に基づいて被ったいかなる損害についても、一切責任を負いかねます。
ページ上部へ戻る