OpenAIは12月5日(現地時間、以下同)から20日にかけて開催したイベント「12 Days of OpenAI」で、新しいモデルや機能などを12件発表した。本稿ではそれぞれの発表について簡潔にまとめて紹介する。
この記事は会員限定です。会員登録すると全てご覧いただけます。
OpenAIは12月5日(現地時間、以下同)から20日にかけて開催したイベント「12 Days of OpenAI」で、新しいモデルや機能などを12件発表した。
今回は、それぞれの発表について簡潔にまとめて紹介する。
1日目にはChatGPTの新プラン「ChatGPT Pro」が公開され、最新モデル「o1」「o1 pro」などの提供が始まった。
ChatGPT Proは月額利用料200ドル(約3万円)で「4o」「o1」「o1-mini」といったモデルを無制限に使えるプランだ。X(旧Twitter)では、経済状況によって使えるAIサービスのレベルが変わる“AI格差”を懸念する声も見かけられた。
o1シリーズは質問に対して直接答えを出力するだけでなく、推論の過程も文章として表示するのが特徴で、代わりに回答の生成に時間がかかる。OpenAIのテストでは「数学オリンピック」や競技プログラミング大会の問題を解かせてみたところ、従来モデルの2倍以上の点数を記録したという。
2日目には「強化学習ファインチューニング研究プログラム」が発表された。研究機関や企業に向けて強化学習ファインチューニングAPIを試験提供する。強化学習の仕組みを使ってモデルをカスタマイズすることで、特定の分野で高い性能を示すツールにできるとしている。
3日目には動画生成AI「Sora」が一般公開された。ChatGPT Plusユーザーは720pサイズの動画を50本まで、ChatGPT Proユーザーは1080pサイズの動画を500本まで生成できる。動画1本の長さはそれぞれ5秒、20秒まで。
Soraには「Storyboard」という機能があり、これを使えば簡単な動画編集も可能。
4日目には「Canvas」機能が正式公開された。ChatGPTでは基本的に、ユーザーが指示を出しAIが回答するというやりとりを続けるが、Canvasを使うと生成された回答を直接編集できる。生成する文章の長さや難易度を調整する機能や修正案を提示する機能も備える。
5日目にはiOSやiPadOS、MacOSとChatGPTの統合が発表された。Siriやカメラなどのツールを経由してChatGPTの機能を利用できる。
6日目にはビデオ通話機能「Adovanced voice with video」が発表された。これまでもあった音声通話機能を利用する際に、カメラで撮影した映像も入力するもので、映像の内容について会話できる。
同日には音声通話機能「Advanced Voice Mode」に「Santa」ボイスも追加された。期間限定でサンタクロースと会話するような体験ができる。
7日目にはプロジェクト機能が発表された。ChatGPT内でプロジェクトを立ち上げると複数のチャットをサブページのようにまとめて管理できる。プロジェクト内でデータを共有する機能や、「常に共有ファイルを参照して簡潔に回答して」のようにプロジェクト内でのChatGPTの応答方法を指定する機能などがある。
8日目には「ChatGPT search」の無料化が発表された。同機能は外部のWebサイトを参照して回答を生成するもので、モデルの学習時には存在していなかった情報の出力もできる。
例えば「ふてほどって何?」と尋ねると、標準状態では「特定の意味を持つ単語として認識されていない」と回答したが、ChatGPT searchを有効化すると「ドラマ『不適切にもほどがある!』の略称」と答える。
これまでは有料プランのユーザー向けに提供されていたがFreeプランでも利用できる。
9日目には開発者向けに「o1 API」の提供やトークン当たりの利用料の値下げ、WebRTC(Web Real-Time Communication)のサポートなどを発表した。
10日目には、ChatGPTのモデルと会話できるフリーダイヤル「1-800-ChatGPT」が発表された。米国内からなら固定電話を含む電話端末からChatGPTのモデルと音声通話できる。
Mac版ChatGPTアプリが「Notion」や「Xcode」などのアプリとシームレスに連携できるようになった。コードのコピーなどの手間が省かれることで作業効率の向上につながる。Windows版でも対応予定。
12日目には新モデル「o3」を発表した。1日目に公開したo1シリーズよりさらに高性能で、現在は安全性をテストしている。公開は2025年1月以降になる見込み。
AI分野では「そろそろAGIが登場するだろう」と言われることもある。AGIは「汎用人工知能」のことで、特定のタスクに特化したものとは異なり人間のように汎用的な能力を持つAIのことをいう。
AGIとしての能力を測るテスト「ARC-AGI」でo3は87.5%という高スコアを記録した。一方で簡単なタスクで失敗することもあり、ARC-AGIの作者は「人間の知能とは根本的に違いがある」と評価している。
なお、87.5%を記録した際の消費コストは1つのタスクに付き1000ドル(約15.7万円)を超えている。
Copyright © ITmedia, Inc. All Rights Reserved.