米OpenAIは12月6日(現地時間)、前日から開始したミニイベント「12 Days of OpenAI」の2日目として、「Reinforcement Fine-Tuning」(強化学習ファインチューニング研究)プログラムを発表した。
強化学習ファインチューニングとは、数十から数千の高品質なタスクを用いてモデルをカスタマイズし、提供された参照回答でモデルの応答を評価する新しいモデルカスタマイズ技術。モデルが類似の問題をどのように推論するかを強化し、その分野における特定のタスクに対する精度を向上させることができる。結果に客観的に「正しい」答えがあり、ほとんどの専門家が同意するようなタスクに優れている。
OpenAIは、研究機関、大学、企業などを対象に、このプログラムへの参加を呼び掛けた。
参加者はOpenAIの強化学習ファインチューニングAPIにα版でアクセスし、ドメイン固有のタスクでこの技術をテストすることができる。
|
|
「12 Days of OpenAI」の1日目は、「o1」と「ChatGPT Pro」に関する発表だった。今後もウィークデーの10日間、毎日新しい発表が予定されている。
|
|
|
|
Copyright(C) 2025 ITmedia Inc. All rights reserved. 記事・写真の無断転載を禁じます。
掲載情報の著作権は提供元企業に帰属します。