本編動画
2024年9月13日に、以下の目次で「ほぼ週刊、AI動向のイマとミライ」動画を配信しました。
0:00 (1)「OpenAI o1」爆誕!
0:35 (2)「OpenAI o1」が「GPT-5」(GPT Next)だと思う3つの理由
5:25 (3)OpenAI o1の概要説明
6:43 (4)今回はOpenAIロードマップの第二段階か
10:19 (5)「考える」ことのできるAIの可能性
13:49 (6)研究者の研究・調査などにすごく役立つっぽい
16:02 (7)最大出カトークンが65,536
18:49 (8)プロンプトエンジニアリングがほぼ不要になる?
20:44 (9)「o1-preview」と「o1-mini」および他モデルとの違いとは
24:01 (10)論理的思考力の仕組みはどうなっているのか
27:07 (11)ASIに向けて一気に進む可能性あり!
各チャプターの概要は以下の通りです。
(1)「OpenAI o1」爆誕!
(2)「OpenAI o1」が「GPT-5」(GPT Next)だと思う3つの理由
・いずれもサム・アルトマン氏による発言
・理由①:2023年末APECのパネル討論会にて「2024年に起こるサプライズとは」という質問に対して「AIモデルは、誰も予想しなかったレベルにまで大きくジャンプして進化する」と回答
・理由②:ビル・ゲイツ氏との対談で「今後2年間の重要なマイルストーンは?」というゲイツ氏の質問に対して「今後AIは論理的思考、信頼性、カスタマイズ性、パーソナライズ性の方向で進化」「特に論理的思考」と回答
・理由③:とあるインタビューにて「これまでのIT業界の製品発表って、びっくりさせるほうが効果があるって思われてきた。でもAIに関しては社会をびっくりさせてはいけないんだと気づいた。びっくりさせると、AIが人類に危害を与えるのではないかというAIへの恐怖感を持つ人が増える。なので、これからは新機能は少しずつ出していこうと思う」
(3)OpenAI o1の概要説明
・Reason(論理的思考、推論)が進化し、人間のように、答える前にじっくり考えるシリーズとして段階的に発表。今回はプレビュー版の「OpenAl o1-preview」が、ChatGPT と API でリリース
・物理学、化学、生物学で博士課程の学生と同等の賢さだが、初期モデルなので、ブラウザやファイルアップロードの機能はなし。そういう意味ではGPT-4oの方が優秀
・プログラミングが得意な「OpenAlo1-mini」も同時リリース
・まずはChatGPT PlusとTeamユーザーが対象で利用でき、その後ChatGPT EnterpriseとEduユーザーも来週利用できる予定
(4)今回はOpenAIロードマップの第二段階か
・AGIに向けたOpenAIのロードマップ(リーク情報)でいう「第2段階:推論者(論理的思考)」にも合致している(第一:チェットボット、第二:推論者、第三:エージェント、第四:イノベーター、第五:組織)
・今の一般的な定義の「エージェント」はすでに今回の「OpenAIo1」に入っていると思われる
・GPT Nextに当たる
(5)「考える」ことのできるAIの可能性
・論理的思考ができると、AIはエージェントになる
・人間がまとめた知見があれば、チャットボットが答えてくれる。逆に人間がまとめた知見がないと、チャットボットは答えることができない
・人間がまとめた知見がないとしても、エージェントであれば一つの知見にまとめてくれる。これはとてつもなくすごいこと!
・自分で「考える」AIは、宇宙のなぞ、人体のなぞを解く。人間よりも賢い超知能になるAIは、その時代の入口に立った
(6)研究者の研究・調査などにすごく役立つっぽい
・OpenAIのYouTubeチャンネルに、様々なユースケースの動画が公開されている。やはり研究者の研究・調査などにすごく役立つ印象
・Devinの会社もかなりOpenAIと密に連携してやっていたみたい
・既存のいろんなエージェントが出ているが、そこに当てるのが4oとかだったが、o1に差し替えることで大きく伸びを感じている
・あらゆるジャンルに関して、博士号レベルになっているというのが、様々なベンチマークから見えてきた
(7)最大出カトークンが65,536
・コンテキストウィンドウは128,000で変わらず
・最大出カトークンが65,536ということで、かなり長い文章を出力できる
・トレーニングデータは2023年10月まで。イリヤ・サツキバー氏が最後に関わったモデルのタイムラインと一緒
・2000ドルという前情報もあったが無料で公開。APIでの利用も価格は高くない https://openai.com/api/pricing/
(8)プロンプトエンジニアリングがほぼ不要になる?
・OpenAl o1モデルは答える前に考え、ユーザーに応答する前に長い思考の内部チェーンを生成できる。今まではプロンプトエンジニアリングが必要だったが、公式ドキュメントでも「プロンプトはシンプルかつ直接的なものにしてください」「思考の連鎖を促すプロンプトは避けてください」と記載されているので、少なくとも一般利用に関しては複雑なプロンプトは不要になると思われる。
(9)「o1-preview」と「o1-mini」および他モデルとの違いとは
・「o1-preview」は世界についての幅広い一般知識を使用して難しい問題について推論するように設計されたo1モデルの初期プレビューで、「o1-mini」はo1のより高速で安価なバージョン。広範な一般知識を必要としないコーディング、数学、科学のタスクに特に適している
・「o1モデルは推論において大きな進歩をもたらすが、全てのユースケースでGPT-4oを置き換えることを意図したものではない」とも記載されている。一般的なタスクでは既存のモデルと大きく変わらず、専門分野での活用が想定されているということか
(10)論理的思考力の仕組みはどうなっているのか
・論理的思考の仕組みも公式ブログに書いてある
・複数回のターンに分かれて「Input→Reasoning→Output」が繰り返される
・現状はマルチモーダル対応できていないのは不便
・提示されているケースが難しすぎて、どれだけすごいのかがすぐには分からない
(11)ASIに向けて一気に進む可能性あり!
・4oを使って科学研究をしたときに、平均的な博士よりも高いパフォーマンスが出たケースがあるとのこと。4oでもそのような成果があったので、o1モデルに置き換わったら、ASIに向けて一気に進む可能性あり
・イリヤさんはこれを1年前に気づいたからこそ、使い方を間違えると人類が滅亡するかもしれないからということでサム・アルトマン解任劇をリードしたのかも
・自分で考えることができるAIの発明はすごいこと
登壇者情報
遠藤 太一郎
株式会社カナメプロジェクト CEO
国立大学法人東京学芸大学 教育AI研究プログラム 准教授
AI歴25年。18歳からAIプログラミングを始め、米国ミネソタ大学大学院在学中に起業し、AIを用いたサービス提供を開始。AIに関する実装、論文調査、システム設計、ビジネスコンサル、教育等幅広く手がけた後、AIスタートアップのエクサウィザーズに参画し、技術専門役員としてAI部門を統括。上場後、独立し、現在は株式会社カナメプロジェクトCEOとして様々なAI/DAO/データ活用/DX関連のプロジェクトを支援する。国際コーチング連盟ACC/DAO総研 Founder等
湯川 鶴章
株式会社エクサウィザーズ AI新聞 編集長
米カリフォルニア州立大学サンフランシスコ校経済学部卒業。サンフランシスコの地元紙記者を経て、時事通信社米国法人に入社。シリコンバレーの黎明期から米国のハイテク産業を中心に取材を続ける。通算20年間の米国生活を終え2000年5月に帰国。時事通信編集委員を経て2010年独立。2017年12月から現職。主な著書に『人工知能、ロボット、人の心。』(2015年)、『次世代マーケティングプラットフォーム』(2007年)、『ネットは新聞を殺すのか』(2003年)などがある。趣味はヨガと瞑想。妻が美人なのが自慢。