本編動画
2024年9月27日に、以下の目次で「ほぼ週刊、AI動向のイマとミライ」動画を配信しました。
1:04 (1)今週の概観と、ジャーナリストの視点&エンジニアの視点
5:15 (2)OpenAI o1発表後初の サム・アルトマン氏インタビューの内容が興味深い
17:41 (3)チャットボット以外で、広く一般に利用されるAIの形って何?
23:53 (4)これからの「AIエージェント」を 考えるためのOpenAI o1の機能的特徴を考える
26:25 (5)注目インタビュー:Jensen Huang氏(NVIDIA CEO)
31:55 (6)その他、今週のニュース5選!
33:27 (7)ジャーナリスト視点での、来週以降の注目ポイント
34:37 (8)視聴者さんの質問をきっかけに、OpenAI o1の技術的な仕組みを予想してみた
52:23 (9)「数千日以内に超知能が誕生する可能性がある」by.サム・アルトマン
58:50 (10)超知能の実現に向けて注目度が高まる「世界モデル」の構築
各チャプターの概要は以下の通りです。
(1)今週の概観と、ジャーナリストの視点&エンジニアの視点
(2)OpenAI o1発表後初のサム・アルトマン氏インタビューの内容が興味深い
・Sam Altman氏が、2024年9月18日に提携先のT-Mobileイベントに登壇し、OpenAI o1リリース後初となるインタビューにて「o1で新しいパラダイムに到達」と初めて明言し、またAI開発の5段階ロードマップの存在を初めて認め、さらにチャット以外のUIの可能性にも言及した
・5段階ロードマップとは以下の段階論のこと
第1段階:チャットボット
第2段階:論理的思考
第3段階:エージェント
第4段階:発明家
第5段階:AIカンパニー
・Altman氏が考える第3段階の「エージェント」とはどういう概念なのか?→計画の部分も論理的思考を基に組み込まれているということか?
・GPTシリーズはシステム1思考(直感的モデル)、OpenAI o1はシステム2思考(しっかり考える分析的モデル)
(3)チャットボット以外で、広く一般に利用されるAIの形って何?
・一番意見が多いのがエージェント。agent.aiという会社も面白い
・これまでのAIは自分の答えがどれだけ正しいのか分からず、仕事の領域ごとの違いも理解できていなかった。論理的思考能力が搭載されたことで、こうした問題の解決の目処が立った。なのでエージェントの時代がすぐそこまできているという意見が増えてきた
・まずはカスタマーサービス領域。T-MobileのMike Sievert社長が「OpenAIとの提携を通じて電話対応を75%削減するのが目標」と発言
(4)これからの「AIエージェント」を考えるためのOpenAI o1の機能的特徴を考える
・「パーソナライゼーションとインテグレーションがエキサイティング」by.Sam Altman
・「推論の際に考えることで、AIがより安全になった」by.will depue
・人間よりも判断ミスが少なくなって用途が広がりそうだが…
(5)注目インタビュー:Jensen Huang氏(NVIDIA CEO)
・エージェントは人間のちょっとした意図の違いさえ理解できるようになり、エージェント同士でコラボできるようになる
・1つの言語モデルが、人間が獲得済みの知識をコード化する別の言語モデルを作り、その言語モデルがマルチモーダルデータを学習するようになれば、そこからAIは指数関数的に進化し始める→どういうことか
・進化が加速度を増している理由
(6)その他、今週のニュース5選!
・Amazonが販売者向けAIアシスタントProject Amelia
・元 OpenAI 従業員が議会にリーク文書提出
・ロボットで世界モデル構築
・OpenAI資金調達に出資者が積極的
・Jony IveがOpenAIとAIデバイス開発中
(7)ジャーナリスト視点での、来週以降の注目ポイント
(8)視聴者さんの質問をきっかけに、OpenAI o1の技術的な仕組みを予想してみた
・寄せられたコメント:論理的思考(Reasoning)を強化学習で行うのでそのモデルを巨大化していけはそちらのスケール則が効いてくると理解して聞いていたのですが、推論(Inference)のコストが高まっていくという話を聞いて混乱しました。強化学習は事前学習の一部と捉えるべきで大きく増加するのは引き続き事前学習のコストであり、推論のコスト増加は限定的で思考プロセスの出力が増える程度と思うのですが、どう理解すればよいでしょうか。
・“根拠”となる論文・データ等が見つからなかったので、遠藤太一郎さんの方で仕組みの仮説を説明
・o1に「推論時探索」が使われているという話は、ありそうでみつからなかった(皆色々予測はしているが、確証はない)
・学習に使っていそうな技術:STaR(少量の根拠例と根拠を含まない大規模なデータセットを活用し、段階的に複雑な推論能力を高める手法)、強化学習とモンテカルロ木探索(MCTS)の統合とChain of Thought(思考の連鎖)とオンラインDPO(Direct Preference Optimization:選好学習)の組み合わせ
・今までの学習(一般的なRLHF)は採点基準 (報酬モデル) を介した間接的な指導だったが、この学習方法はMCTSを使った直接的な指導になる。先生(選好データ)がLLMの成長に合わせて柔軟に指導できるため、より質の高い文章作成能力を習得できるという利点がある
(9)「数千日以内に超知能が誕生する可能性がある」by.サム・アルトマン
・AlphaGoを模して作った思考プロセスと思われる。これがIlya Sutskever氏が見た初期モデルと予測され、知能爆発の近さを想像させる
・Leopold Aschenbrenner氏が地政学的な警鐘を鳴らしたモデルか
・Sam Altman氏が9/23更新のブログで「数千日以内に超知能が誕生する可能性がある」と記述
(10)超知能の実現に向けて注目度が高まる「世界モデル」の構築
・AGI(汎用人工知能)、ASI(超知能)に向けてのプロセスとして考えられる2通りのアプローチ
・家庭用ヒト型ロボット「Neo」を開発する1X Technologiesでも、世界モデルによるロボット学習で進めている
・OpenAIは「世界モデル×論理推論」でAGI/ASIを目指しているのかも
個別テーマ解説動画
また、各テーマに分割した動画も配信しました。興味のあるトピックに応じてご覧ください。
OpenAI o1では「推論時探索」が使われているのかも。活用技術を色々と予想してみた
0:00 視聴者さんからの質問をきっかけに、OpenAI o1の技術的な仕組みを予想してみた
2:13 System1(直感的なシステム)とSystem2(分析的システム)の統合ではないか
9:29 学習に使っていそうな技術予想①:STaR
11:53 学習に使っていそうな技術予想②:強化学習とMCTSの統合+CoT+オンラインDPO
16:54 AlphaGoを模して作った思考プロセス
17:40 「数千日以内に超知能が誕生する可能性がある」by.サム・アルトマン
※サムネイル画像はGarik BarseghyanによるPixabay画像を活用
今週のニュース5選と、来週以降の注目ポイント2つをサクッと紹介
※サムネイル画像はGerd AltmannによるPixabay画像を活用
OpenAIは「世界モデル×論理推論」でAGI/ASIを目指しているのかもしれない
0:00 超知能の実現に向けて注目度が高まる「世界モデル」の構築
1:06 世界モデルとは
2:44 家庭用ヒト型ロボット生産の1X Technologies社も、世界モデルによるロボット学習を進めている
5:43 「世界モデル×論理推論」の世界観
※サムネイル画像はTumisuによるPixabay画像を活用
OpenAI o1発表後初のサム・アルトマン氏インタビューで語られた3つの重要ポイント
0:00 提携先T-Mobileイベントにサム・アルトマン氏が登壇
0:39 OpenAI o1発表後初のサム・アルトマン氏インタビューを聞いてみる
4:14 OpenAIが考える「エージェント」ってどんな概念?
8:34 System1とSystem2の統合が実現した!?
9:30 チャットのインターフェースとは異なる用途が出てくるかも
10:08 OpenAI o1は新しいパラダイムであり、これから実用化に向けて進化していく
※サムネイル画像はAmore SeymourによるPixabay画像を活用
チャットボット以外で、広く一般に利用されるAIの形って何?
0:00 一番意見が多いのがエージェント
1:43 論理的思考能力が搭載されたこと、OpenAIが目指すエージェントの目処が立ってきた
3:26 まずはカスタマーサービス領域でのエージェント活用に期待
※サムネイル画像はMuhammad Usman Nazeer GilaniによるPixabay画像を活用
NVIDIA CEOのジェンスン・フアン氏が考えるこれからのAIエージェント時代
0:00 これからの「AIエージェント」を考えるためのOpenAI o1の機能的特徴を考える
2:32 NVIDIA CEOが考える論理的思考とエージェントの時代
3:39 マルチモーダル対応によってAIは指数関数的に進化し始める
6:17 今後2〜3年のエージェントの進化は驚くべきものになる
※サムネイル画像はPete LinforthによるPixabay画像を活用
登壇者情報
遠藤 太一郎
株式会社カナメプロジェクト CEO
国立大学法人東京学芸大学 教育AI研究プログラム 准教授
AI歴25年。18歳からAIプログラミングを始め、米国ミネソタ大学大学院在学中に起業し、AIを用いたサービス提供を開始。AIに関する実装、論文調査、システム設計、ビジネスコンサル、教育等幅広く手がけた後、AIスタートアップのエクサウィザーズに参画し、技術専門役員としてAI部門を統括。上場後、独立し、現在は株式会社カナメプロジェクトCEOとして様々なAI/DAO/データ活用/DX関連のプロジェクトを支援する。国際コーチング連盟ACC/DAO総研 Founder等
湯川 鶴章
株式会社エクサウィザーズ AI新聞 編集長
米カリフォルニア州立大学サンフランシスコ校経済学部卒業。サンフランシスコの地元紙記者を経て、時事通信社米国法人に入社。シリコンバレーの黎明期から米国のハイテク産業を中心に取材を続ける。通算20年間の米国生活を終え2000年5月に帰国。時事通信編集委員を経て2010年独立。2017年12月から現職。主な著書に『人工知能、ロボット、人の心。』(2015年)、『次世代マーケティングプラットフォーム』(2007年)、『ネットは新聞を殺すのか』(2003年)などがある。趣味はヨガと瞑想。妻が美人なのが自慢。