
■長文推論とエージェント性能を大幅強化、生産性と信頼性を両立
OpenAIは12月11日、専門的な知識業務や長時間稼働するエージェント向けの新モデル「GPT-5.2」を公開した。同モデルは、長文コンテキスト理解やツール呼び出し、多段階推論、画像認識などで性能を大幅に高め、スプレッドシートやプレゼンテーション作成、コード生成、複雑なプロジェクト管理といった実務で高い生産性を発揮する。平均的なChatGPT Enterprise利用者は1日40〜60分を節約していると回答しており、同社は知識労働の価値創出を一段と押し上げるとしている。
モデル性能では、経済的価値の高い知識業務を評価するGDPvalで新たな最高水準を記録した。44職種の業務タスクにおいて、GPT-5.2 Thinkingは70.9%の勝率を示し、同社モデルとして初めて人間の専門家レベルに到達した。SWE-Bench Proでは55.6%、GPQA Diamondでは92.4%を記録し、ソフトウェア開発や科学分野でも最高水準を更新した。ハルシネーションはGPT-5.1比で38%減少し、事実性と信頼性の向上も確認された。
提供面では、ChatGPTでGPT-5.2 Instant、Thinking、Proを有料プラン向けに順次展開し、APIは全開発者に即日開放した。長文解析やエージェント型ワークフロー、視覚理解、カスタマーサポートなど幅広い実務での活用が見込まれる。入力100万トークン当たり1.75ドルとする価格設定についても、トークン効率の向上により総コストは抑えられるとしている。(情報提供:日本インタビュ新聞社・株式投資情報編集部)























