o3が知能爆発の入り口かもしれないと考えながら、最新の論文「経験の時代」を読んで、AIのパラダイムシフトを感じた一週間(2025年4月25日配信版)

目次

本編動画

2025年4月25日に、以下の目次で「ほぼ週刊、AI動向のイマとミライ」動画を配信しました。

1:01 (1)o3のすごさに驚き、そしてがっかりした話
4:17 (2)今週の概観と、ジャーナリストの視点
6:19 (3)o3、o4-miniの概要とOpenAIの中の人の評価
10:24 (4)o3の「画像で考える能力」がすごい
15:45 (5)o3は「画期的アイデア」を生み出す最初のAI
28:04 (6)「経験の時代」へのAIのパラダイムシフト
51:55 (7)湯川さんと遠藤さんとo3による論文「経験の時代」の感想
1:00:08 (8)OpenAIがIDを義務化 米中AI冷戦?
1:04:50 (9)ここまで来ると、AGIよりも「知能爆発」が始まるタイミングの方が気になる

各チャプターの概要は以下の通りです。

(1)o3のすごさに驚き、そしてがっかりした話  

(2)今週の概観と、ジャーナリストの視点  

(3)o3、o4-miniの概要とOpenAIの中の人の評価
・各種ベンチマーク/テストでの評価の中でも、IQテストでo3が最高得点を獲得。本家Mensa Norwayで138、TrackingAIのオリジナルテストで116
・「ある意味、GPT‑4のときと同じくらいの“質的ジャンプ”になる”」「トップ科学者たちが、『本当に“新しくて有用な”アイデアを出してくる』と言ってる最初のモデル」(OpenAI President Greg Brockman)
https://fortune.com/2025/04/16/openai-new-ai-reasoning-models-coding-agent/
・「数秒で論文10本分を読む感覚」(OpenAI Multimodal Researcher Brandon McKenzie)、「このモデル群で、もっと先の進化が見られると信じてる」(OpenAI Head of Research Mark Chen)
https://venturebeat.com/ai/openai-launches-o3-and-o4-mini-ai-models-that-think-with-images-and-use-tools-autonomously/  

(4)o3の「画像で考える能力」がすごい
・AIが初めて画像を思考の連鎖に直接統合できるようになった
https://openai.com/index/introducing-o3-and-o4-mini/
・実際に湯川さんが、友人から送られてきた写真から「住所」が特定できるかを検証  

(5)o3は「画期的アイデア」を生み出す最初のAI
・Greg Brockman氏へのFortuneによるインタビューとBrockman氏自身のXポストの微妙なニュアンスの違い
https://fortune.com/2025/04/16/openai-new-ai-reasoning-models-coding-agent/
https://x.com/gdb/status/1912575762483540322
・当初サム・アルトマン氏は「o3を単体モデルとして出さずにとGPTシリーズに統合する」と発言していたが、4/4の方針転換のXを投稿。原因は不明
https://x.com/sama/status/1889755723078443244
https://x.com/sama/status/1908167621624856998
・これまでは「人間がまとめた知見を、AIが見つける」動き方だったが、o3では「AIが自分で情報を探して回って、1つの知見にまとめる」ようになる
・AIのプログラミング速度が4カ月で倍に
https://arxiv.org/pdf/2503.14499
・知能爆発の始まり!産業革命と比べ物にならないレベルの変革へ
・「o3 は従来より新しいアイデアを生み出しやすいモデル、という評判は大筋で正しい。ただし、“完全な発明家”というより、非常に大きな知識ベース+探索的な思考プロセスで既存情報を再構成し、まだ見えていなかった仮説や切り口を提案できる――という意味での「新しいアイデア生成」」by.o3
・その代わり、ハルシネーションも2〜3倍になっており、OpenAIの中の人も「なぜか理由は分からない」としている
https://aisecret.us/openais-o3-and-o4-mini-hallucination-rates-surge-2-3x/  

(6)「経験の時代」へのAIのパラダイムシフト
・Google DeepMindのDavid Silver氏とカナダのアルバータ大学のRichard S. Sutton教授による論文「経験の時代」(Welcome to the Era of Experience)
https://storage.googleapis.com/deepmind-media/Era-of-Experience%20/The%20Era%20of%20Experience%20Paper.pdf
・これまでは「人間が作ったデータの時代」で、人間を模倣するだけでは人間を超えることはできなかったが、これからは「経験の時代」。新しいデータソースが必要。提供してくれるのはエージェント。エージェントが環境と相互作用することで生まれるデータは、人間が作るデータの規模を凌駕する。新しい時代の入り口。経験の時代には、信じられないような新しい能力が生まれる
・人間や動物は、行動と観察の大きな時間の流れの中に存在する。つまり過去の経験から学習し改善し、未来の目標のために行動を選択する。エージェントも同様。リクエストに即座に応答するこれまでのAIとは対照的
・これまでは、人間を介してAIが世界とやり取り。これからは人間の仲介なしにAIが直接世界とやり取りする。人間から独立して行動できる時代へ
・今は人間がAIの回答に対して「いいね!」という報酬を与えるので、評価者が知らないような革新的な解決策を見つけられないが、これからは、実際の環境から直接得られる「信号」に基づく報酬となる。信号が不足することはない
・再度強化学習が注目されることで、自己発見能力とタスクの汎用性の調和の時代へ
・temporal difference learning(時間差分学習)と、Dynaアルゴリズムと、inter/intra-option learning(オプション間/オプション内学習)。経験の時代は、古典的な強化学習の概念を再検討し、改善する機会を提供するだろう
・結論:AIの進化における極めて重要な節目。エージェントの目標は、接地された(grounded)信号の任意の組み合わせに向けられるようになるでしょう。人間が思いつかないような思考方法を活用し、エージェントの行動が環境に与える結果に基づいた計画を構築する。最終的には、経験データは人間が生成したデータの規模と質を凌駕する  

(7)湯川さんと遠藤さんとo3による論文「経験の時代」の感想
・データセットだけでは捉えきれない微妙なニュアンスを、エージェントは自らの「経験」を通じて体得していくだろう(物体を掴むときの「ちょうど良い力加減」、柔らかいものを扱うときの変形の度合いに応じた指先の調整など)
・人間の世界モデルとAIの世界モデルは全然別物になることを前提に議論した方が良い  

(8)OpenAIがIDを義務化 米中AI冷戦?
・OpenAIは、特定の高度なAIモデルや機能に組織としてアクセスしたい場合、政府発行IDによる厳格な本人確認(組織認証)を要求するように。組織単位での厳格な本人確認(ID検証)が必要となり、その際「政府発行の身分証明書」の提出が必要。対象は「組織(法人)」のみ
・経緯:DeepSeek R1(1月20日公開)の盗作疑惑(言語モデルの文体指紋の類似度は74%)→2月には「No DeepSeek on Government Devices Act」が米議会上下両院に提出→4月8日「DeepSeek: A Deep Dive」の公聴会、安全保障論争へ→4月14日にOpenAIが開発者へ 政府ID認証を義務化
https://lahood.house.gov/2025/2/lahood-gottheimer-introduce-legislation-to-counter-ccp-s-deepseek-ai-software https://help.openai.com/en/articles/10910291-api-oranization-verification
・どこまでが許される“知識転写”で、どこからが“IP侵害”か、線引きが不透明と警告
https://www.scmp.com/tech/big-tech/article/3296827/deepseeks-ai-distillation-theft-openai-seeks-answers-over-chinas-breakthrough
・DeepSeek側のスタンス:全面否定。「GPT は参考にしていない。Llama/Qwen 等オープンソースを蒸留した」と説明→2月に FlashMLA / DeepEP など基盤ツールを MIT ライセンスで公開し「透明性アピール」
https://www.scmp.com/tech/big-tech/article/3300090/deepseeks-disclosure-ai-technical-details-praised-open-source-community
・中国国内報道は「“巨人の肩に立つ”正当なイノベーション」と擁護
https://www.chinadaily.com.cn/a/202502/10/WS67a93457a310a2ab06eab0f6.html?utm_source=chatgpt.com  

(9)ここまで来ると、AGIよりも「知能爆発」が始まるタイミングの方が気になる

登壇者情報

遠藤 太一郎

株式会社カナメプロジェクト CEO
国立大学法人東京学芸大学 教育AI研究プログラム 教授

AI歴25年。18歳からAIプログラミングを始め、米国ミネソタ大学大学院在学中に起業し、AIを用いたサービス提供を開始。AIに関する実装、論文調査、システム設計、ビジネスコンサル、教育等幅広く手がけた後、AIスタートアップのエクサウィザーズに参画し、技術専門役員としてAI部門を統括。上場後、独立し、現在は株式会社カナメプロジェクトCEOとして様々なAI/DAO/データ活用/DX関連のプロジェクトを支援する。国際コーチング連盟ACC/DAO総研 Founder等

https://kaname-prj.co.jp/

湯川 鶴章

株式会社エクサウィザーズ AI新聞 編集長

米カリフォルニア州立大学サンフランシスコ校経済学部卒業。サンフランシスコの地元紙記者を経て、時事通信社米国法人に入社。シリコンバレーの黎明期から米国のハイテク産業を中心に取材を続ける。通算20年間の米国生活を終え2000年5月に帰国。時事通信編集委員を経て2010年独立。2017年12月から現職。主な著書に『人工知能、ロボット、人の心。』(2015年)、『次世代マーケティングプラットフォーム』(2007年)、『ネットは新聞を殺すのか』(2003年)などがある。趣味はヨガと瞑想。妻が美人なのが自慢。

https://community.exawizards.com/aishinbun

よかったらシェアしてね!

この記事を書いた人

人ひとりが自分な好きなこと、得意なことを仕事にして、豊かに生きる。 そんな社会に向けて、次なる「The WAVE」を共に探り、学び、創るメディアブランドです。

目次