GPT-5発表後の「絶賛と批判」、それぞれの意見とデータを分析しながら、各トップAIラボの戦略の変化を考えた一週間(2025年8月15日配信版_前編)

目次

本編動画

2025年8月15日に、以下の目次で「ほぼ週刊、AI動向のイマとミライ」動画を配信しました。

0:57 (1)GPT-5の評価は「絶賛と批判の嵐」
3:48 (2)絶賛派の意見とデータ
8:37 (3)批判派の意見とデータ
22:27 (4)絶賛と批判の意見を俯瞰して見てみる
24:42 (5)モデルルーティングの不具合
29:51 (6)「一部の人にとってGPT-4oがどれだけ大事か分かっていませんでした」(Sam Altman氏)
33:38 (7)スケーリングの原則と期待値調整の失敗
37:34 (8)トップAIラボの戦略が分岐し始めた

後編(8/17配信):https://youtu.be/Tm7ofda08eQ

各チャプターの概要は以下の通りです。

(1)GPT-5の評価を考える前に知っておきたい3つのポイント  

(2)絶賛派の意見とデータ
・Artificial Analysis社の「長い文脈での考える力」のベンチマークで首位
https://x.com/ArtificialAnlys/status/1953523986526351576
・「AIインテリジェンス全般」でも29日ぶりにx.AIから首位を奪還
https://x.com/ArtificialAnlys/status/1953545346480845280
・LMarenaでも、あらゆる分野で首位
https://x.com/lmarena_ai/status/1953504958378356941
・モデルの利用料比較
https://simonwillison.net/2025/Aug/7/gpt-5/
・Latent Spaceの公式ブログは「GPT-5が間違いなく世界最高のコーディングモデルだ」と絶賛
https://www.latent.space/p/gpt-5-review
・Wiredも、絶賛する研究者の声を紹介
https://www.wired.com/story/openais-gpt-5-is-here/  

(3)批判派の意見とデータ
・Stagehand社の指示に従う速さと正確さはAnthropicの方が上
https://x.com/Stagehanddev/status/1953575671491706904
・「(Grok4の方が)多くのベンチマークでGPT-5を圧倒している」(x.ai共同創業者・Yuhai Tony Wu氏)
https://x.com/Yuhu_ai_/status/1953551132921671712
・他、批判派の声
https://x.com/dylan522p/status/1953894913873260927
https://x.com/amasad/status/1953697015311085636
https://x.com/elonmusk/status/1953532769881272548
https://x.com/GaryMarcus/status/1954184324506382663
https://x.com/GaryMarcus/status/1953829958314533359
https://x.com/MrEwanMorrison/status/1953710648518377685  

(4)絶賛と批判の意見を俯瞰して見てみる
・「8月末に最高のAIモデルを持つのはどの企業か」という質問のPolymarketの世論調査で、OpenAIの支持率は1時間で75%から14%に低下した。逆に今後はGoogleがリードすると予測する人が多かった(Lisan al Gaib氏)
https://x.com/scaling01/status/1953515099257282763
・Xの投稿(2025年8月10-11日頃)を基に日英両語でGrokが比較したところ、日英ともにネガティブな意見が目立ち、ポジティブな声は少数派だった。また、日本語の投稿は感情的な変化(例: 応答のドライさ)を強調し、英語圏は技術的な問題(例: コード生成の失敗)を強調する傾向が見られた  

(5)モデルルーティングの不具合
・単一のモデルではなく複数の異なるモデルで構成されているGPT-5では、ユーザーの質問に応じて、より高度で大規模なモデルにルーティングするか、より高速で安価なモデルにルーティングするかを判断しようとする「ルーティング」機能が導入された。この「モデルルーティング機能」がうまく機能していない
・OpenAIの関係者であるRune氏は、この「モデルの自動切り替え機能が壊れているため、ルーティングが正しく行われない」と認め、近いうちに修正されると述べている
・多くの人がGPT-5を酷評しているのは、ルーティングの不具合により、低コストで性能の低いモデルに誘導されすぎている可能性があるためだと推測されている
https://youtu.be/tL8CENSCd0w?si=PLGegPRYC1NF4BM9&t=103  

(6)「一部の人にとってGPT-4oがどれだけ大事か分かっていませんでした」(Sam Altman氏)
https://x.com/sama/status/1953953990372471148
・(8/9開催のAMAにて)「一度に多くのことを展開していたため、多少の困難は覚悟していましたが、予想以上に大変なことになりました。昨日はオートスイッチャーが機能しなくなり、GPT-5は遥かにバカに見えました。手動で思考をトリガーしやすくするためにUIを変更します。プラスユーザーに4oを引き続きご利用いただけるよう検討中です」(Sam Altman氏)
https://www.reddit.com/r/ChatGPT/comments/1mkae1l/comment/n7n5aas/?context=3&utm_source=share&utm_medium=web3x&utm_name=web3xcss&utm_term=1&utm_content=share_button  

(7)スケーリングの原則と期待値調整の失敗
・機械学習リサーチャーのNathan Lambert氏は今年6月の時点で、「最大計算クラスタ=製品優位の神話は2024年に崩壊し、効率化と使い勝手が差別化ポイントになる」と説明していた
https://www.interconnects.ai/p/summertime-outlook-o3s-novelty-coming
・「私たちが行ったり来たりしていることの一つは、新しいモデルで大きな数字をどれだけ上げるべきか──それとも GPT-4o でやったように、ただただより良くしていくべきか──という点です」(Sam Altman氏、6/19)
https://www.bleepingcomputer.com/news/artificial-intelligence/openais-sam-altman-discusses-gpt-5-release-date/  

(8)トップAIラボの戦略が分岐し始めた
・Q:今後5年間で、10億人のユーザーを獲得することと、最高峰のモデルを作ることのどちらがより大事ですか?
A:10億人ユーザーを獲得することだと思います(Sam Altman氏、3/20)
https://stratechery.com/2025/an-interview-with-openai-ceo-sam-altman-about-building-a-consumer-tech-company/
・OpenAIはできるだけ多くのユーザーを獲得する戦略。Anthropicは大企業に集中。Googleは既存ユーザーを維持する戦略(湯川)

登壇者情報

遠藤 太一郎

株式会社カナメプロジェクト CEO
国立大学法人東京学芸大学 教育AI研究プログラム 教授

AI歴25年。18歳からAIプログラミングを始め、米国ミネソタ大学大学院在学中に起業し、AIを用いたサービス提供を開始。AIに関する実装、論文調査、システム設計、ビジネスコンサル、教育等幅広く手がけた後、AIスタートアップのエクサウィザーズに参画し、技術専門役員としてAI部門を統括。上場後、独立し、現在は株式会社カナメプロジェクトCEOとして様々なAI/DAO/データ活用/DX関連のプロジェクトを支援する。国際コーチング連盟ACC/DAO総研 Founder等

https://kaname-prj.co.jp/

湯川 鶴章

株式会社エクサウィザーズ AI新聞 編集長

米カリフォルニア州立大学サンフランシスコ校経済学部卒業。サンフランシスコの地元紙記者を経て、時事通信社米国法人に入社。シリコンバレーの黎明期から米国のハイテク産業を中心に取材を続ける。通算20年間の米国生活を終え2000年5月に帰国。時事通信編集委員を経て2010年独立。2017年12月から現職。主な著書に『人工知能、ロボット、人の心。』(2015年)、『次世代マーケティングプラットフォーム』(2007年)、『ネットは新聞を殺すのか』(2003年)などがある。趣味はヨガと瞑想。妻が美人なのが自慢。

https://community.exawizards.com/aishinbun

よかったらシェアしてね!

この記事を書いた人

人ひとりが自分な好きなこと、得意なことを仕事にして、豊かに生きる。 そんな社会に向けて、次なる「The WAVE」を共に探り、学び、創るメディアブランドです。

目次