[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

OpenAIの「12日間発表祭り」まとめ 新モデルや機能を簡潔にチェック

OpenAIは12月5日(現地時間、以下同)から20日にかけて開催したイベント「12 Days of OpenAI」で、新しいモデルや機能などを12件発表した。本稿ではそれぞれの発表について簡潔にまとめて紹介する。

» 2024年12月25日 10時00分 公開
[谷井将人ITmedia]

この記事は会員限定です。会員登録すると全てご覧いただけます。

 OpenAIは12月5日(現地時間、以下同)から20日にかけて開催したイベント「12 Days of OpenAI」で、新しいモデルや機能などを12件発表した。

 今回は、それぞれの発表について簡潔にまとめて紹介する。

目次

  • 月額3万円の「ChatGPT Pro」
  • 研究支援プログラム
  • 動画生成AI「Sora」
  • 「Canvas」機能
  • iOS統合強化
  • ビデオ通話機能
  • プロジェクト機能
  • 「ChatGPT search」
  • 開発者向けAPI
  • フリーダイヤル
  • 他アプリとの連携強化
  • 「o3」

1日目 3万円プラン「ChatGPT Pro」と新モデル「o1」シリーズ

 1日目にはChatGPTの新プラン「ChatGPT Pro」が公開され、最新モデル「o1」「o1 pro」などの提供が始まった。

 ChatGPT Proは月額利用料200ドル(約3万円)で「4o」「o1」「o1-mini」といったモデルを無制限に使えるプランだ。X(旧Twitter)では、経済状況によって使えるAIサービスのレベルが変わる“AI格差”を懸念する声も見かけられた。

 o1シリーズは質問に対して直接答えを出力するだけでなく、推論の過程も文章として表示するのが特徴で、代わりに回答の生成に時間がかかる。OpenAIのテストでは「数学オリンピック」や競技プログラミング大会の問題を解かせてみたところ、従来モデルの2倍以上の点数を記録したという。

photo 「o1-preview」「o1」「o1 pro mode」のベンチマーク比較(OpenAI「Introducing ChatGPT Pro」より)

2日目 研究支援プログラム

 2日目には「強化学習ファインチューニング研究プログラム」が発表された。研究機関や企業に向けて強化学習ファインチューニングAPIを試験提供する。強化学習の仕組みを使ってモデルをカスタマイズすることで、特定の分野で高い性能を示すツールにできるとしている。

3日目 動画生成AI「Sora」一般公開

 3日目には動画生成AI「Sora」が一般公開された。ChatGPT Plusユーザーは720pサイズの動画を50本まで、ChatGPT Proユーザーは1080pサイズの動画を500本まで生成できる。動画1本の長さはそれぞれ5秒、20秒まで。

 Soraには「Storyboard」という機能があり、これを使えば簡単な動画編集も可能。

4日目 「Canvas」機能

 4日目には「Canvas」機能が正式公開された。ChatGPTでは基本的に、ユーザーが指示を出しAIが回答するというやりとりを続けるが、Canvasを使うと生成された回答を直接編集できる。生成する文章の長さや難易度を調整する機能や修正案を提示する機能も備える。

5日目 iOSとの統合強化

 5日目にはiOSやiPadOS、MacOSとChatGPTの統合が発表された。Siriやカメラなどのツールを経由してChatGPTの機能を利用できる。

6日目 ビデオ通話機能

 6日目にはビデオ通話機能「Adovanced voice with video」が発表された。これまでもあった音声通話機能を利用する際に、カメラで撮影した映像も入力するもので、映像の内容について会話できる。

 同日には音声通話機能「Advanced Voice Mode」に「Santa」ボイスも追加された。期間限定でサンタクロースと会話するような体験ができる。

「Adovanced voice with video」と「Santa」ボイス

7日目 プロジェクト機能

 7日目にはプロジェクト機能が発表された。ChatGPT内でプロジェクトを立ち上げると複数のチャットをサブページのようにまとめて管理できる。プロジェクト内でデータを共有する機能や、「常に共有ファイルを参照して簡潔に回答して」のようにプロジェクト内でのChatGPTの応答方法を指定する機能などがある。

8日目 「ChatGPT search」無料化

 8日目には「ChatGPT search」の無料化が発表された。同機能は外部のWebサイトを参照して回答を生成するもので、モデルの学習時には存在していなかった情報の出力もできる。

 例えば「ふてほどって何?」と尋ねると、標準状態では「特定の意味を持つ単語として認識されていない」と回答したが、ChatGPT searchを有効化すると「ドラマ『不適切にもほどがある!』の略称」と答える。

photo 上:「ChatGPT search」不使用、下:「ChatGPT search」使用

 これまでは有料プランのユーザー向けに提供されていたがFreeプランでも利用できる。

9日目 開発者向けAPI

 9日目には開発者向けに「o1 API」の提供やトークン当たりの利用料の値下げ、WebRTC(Web Real-Time Communication)のサポートなどを発表した。

10日目 ChatGPTにフリーダイヤル(米国のみ)

 10日目には、ChatGPTのモデルと会話できるフリーダイヤル「1-800-ChatGPT」が発表された。米国内からなら固定電話を含む電話端末からChatGPTのモデルと音声通話できる。

11日目 他アプリとの連携機能

 Mac版ChatGPTアプリが「Notion」や「Xcode」などのアプリとシームレスに連携できるようになった。コードのコピーなどの手間が省かれることで作業効率の向上につながる。Windows版でも対応予定。

12日目 「o3」

 12日目には新モデル「o3」を発表した。1日目に公開したo1シリーズよりさらに高性能で、現在は安全性をテストしている。公開は2025年1月以降になる見込み。

 AI分野では「そろそろAGIが登場するだろう」と言われることもある。AGIは「汎用人工知能」のことで、特定のタスクに特化したものとは異なり人間のように汎用的な能力を持つAIのことをいう。

 AGIとしての能力を測るテスト「ARC-AGI」でo3は87.5%という高スコアを記録した。一方で簡単なタスクで失敗することもあり、ARC-AGIの作者は「人間の知能とは根本的に違いがある」と評価している。

photo o1シリーズとo3シリーズの性能比較(ARC Prize「OpenAI o3 Breakthrough High Score on ARC-AGI-Pub」より)

 なお、87.5%を記録した際の消費コストは1つのタスクに付き1000ドル(約15.7万円)を超えている。

Copyright © ITmedia, Inc. All Rights Reserved.