本編動画
2024年12月6日に、以下の目次で「ほぼ週刊、AI動向のイマとミライ」動画を配信しました。
1:02 (1)今週は、エージェントの現状が分かる2つのインタビューについて解説
2:35 (2)「これからはアプリケーション層が大きな価値を生む」
7:54 (3)エン先生が考える「エージェント的論理的思考デザインパターン」
19:23 (4)Large Multimodal Model(LMM)のエージェントの可能性
28:37 (5)研究者はポジショントークがないので信頼できる!
30:09 (6)4つのエージェント技術のうち「Tool Use」に注目するマイク・ヌープ氏
37:05 (7)Google DeepMindの「Alpha Proof」とOpenAIの「o1」の合体系がAGI
42:37 (8)サム・アルトマン氏の「AGIは来年来る」発言。やっぱりなんかおかしい
各チャプターの概要は以下の通りです。
(1)今週は、エージェントの現状が分かる2つのインタビューについて解説
・自分の回答を見直すことなどで回答の精度を上げるエージェントの仕組みの説明するAndrew Ng(アンドリュー・エン)先生へのインタビューと、複数のアプリの自動化を実現するZapierの共同創業者であるMike Knoop(マイク・ヌープ)氏へのインタビュー。
参考:
Andrew Ng先生:https://youtu.be/KrRD7r7y7NY
Mike Knoop氏:https://youtu.be/dYSia4zl8DM
(2)「これからはアプリケーション層が大きな価値を生む」
・アンドリュー・エン先生は一貫して、アプリケーション層が最も大きな価値を生むと主張。既に価値を生んでいる領域は、法務、診察、コンプライアンスなど。ビジョンAIが一押し
・自分の回答を見直すことで回答の精度を上げるエージェントの仕組みのことを語っている
・例えばポジネガ判定アプリの場合、これまでだとデータのタグづけに2〜3カ月かかり、クラウド上でディプロイするのにさらに2〜3カ月。優れた技術者チームでもアプリ開発に半年から1年かかっていた。ところが生成AIを使うと、プロンプトに数日、デプロイに数日かかるだけ。10日ほどでアプリを開発できる。試作品を20個作り、うまくいったものを採用という手法も可能。この方法で新たなUXを発明できる
・ボトルネックは評価ツール。より効果的な評価ツール作りが求められている
※議論に出てきた論文:
https://www.anthropic.com/research/statistical-approach-to-model-evals?utm_source=www.therundown.ai&utm_medium=newsletter&utm_campaign=ai-s-reasoning-race-heats-up
(3)エン先生が考える「エージェント的論理的思考デザインパターン」
・これまでのAIはゼロ・ショット。「エッセイを書いて」と命令すれば、すぐに書き始め、すぐに書き終わる。これに対してエージェントは、①骨子の書く ②検索エンジンで事実チャック ③最初の草稿 ④読み直し ⑤一部書き直し。このループを回して質をよくする
・ 技術的には、Reflection(見直し)、Tool Use(ツール)、Planning(計画)、Multiagent(マルチエージェント)で、エン先生はこれを「エージェント的論理的思考デザインパターン」と呼び、エージェントの土台技術と考えている
・Planning(計画)とReasoning(論理的思考)は同じことを意味している。かつて言われていた「計画エンジン」のことを指す
・1つのAIモデルが、いくつものエージェントに成り切って、それぞれのタスクを実行。Planning、Tool Use、Reflectionなどの役割を担う
・「1年前にはこうした技術が揃ってなかった。この4つの技術を使っていろいろなことが可能になる」(アンドリュー・エン先生)
(4)Large Multimodal Model(LMM)のエージェントの可能性
・画像認識の精度が向上することで、できることが格段に増えてくる
・4つのトレンド:
①トークン処理量の増加と、トークン処理コストの低下
②人間の問いに答えるAIから、エージェントを実現するAIへの進化
③データエンジニアリングがより重要に
④「画像処理革命」の到来
・専門の情報を与えて専門のタスクを実行するようなエージェントを複数用意し、疎結合で設計するイメージ
(5)研究者はポジショントークがないので信頼できる!
(6)4つのエージェント技術のうち「Tool Use」に注目するマイク・ヌープ氏
・API型の自動化(API-Based Automation)とRPA型(RPA-Based Automation)
・ZapierはAPI型。APIを使用してソフトウェアやサービスを自動化する
・RPA型は、人間がPCを操作するような方法で、キーボードとマウスを操作する形での自動化する。自動化の未来はRPA型にあるとヌープ氏は説明
・人間がコンピューターをあまり使わなくなっていくと、API型がメインになってくるかも。今は移行期
・RPA型の自動化には論理的思考能力の向上が必要
(7)Google DeepMindの「Alpha Proof」とOpenAIの「o1」の合体系がAGI
・今最もAGIに近いのは、Google DeepMindによるAlphaProof。言語モデル「Gemini」と、チェスなど成果を挙げた「AlphaZero」の強化学習アルゴリズムを組み合わせたモデル。o1とAlpha Proofの合体形みたいなものがAGIになっていくのではないかと説明
(8)サム・アルトマンの「AGIは来年来る」発言。やっぱりなんかおかしい
・契約内容の見直しでMSとOpenAIが協議中との報道あり
・「AGIが来年実現」と言ったのは、契約内容の交渉を有利にするためなのかもしれない
※参考:
https://timesofindia.indiatimes.com/technology/tech-news/how-honeymoon-may-be-over-for-microsoft-and-chatgpt-maker-openais-partnership/articleshow/114345701.cms
個別テーマ解説動画
また、各テーマに分割した動画も配信しました。興味のあるトピックに応じてご覧ください。
「AI最大のチャンスはこれだ!」【AIエージェントインタビュー解説①:Andrew Ng 先生(スタンフォード大学 コンピューターサイエンス教授)】
0:00 「これからはアプリケーション層が大きな価値を生む」
5:19 エン先生が考える「エージェント的論理的思考デザインパターン」
8:52 Planning(計画)とReasoning(論理的思考)は同じことを意味している
11:46 多重人格のようにしたほうが、精度がいい
13:13 4つの技術が登場したことで、いろんなことができるようになる
16:48 Large Multimodal Model(LMM)のエージェントの可能性
19:00 AIエージェントにまつわる4つのトレンド
26:02 研究者はポジショントークがないので信頼できる!
※サムネイル画像はJoshua WoronieckiによるPixabay画像を活用
「o1とAlpha Proofの強みの合体こそがAGI」【AIエージェントインタビュー解説②:Mike Knoop氏(Zapier 共同創業者)】
0:00 AIのイマとミライを読む上で、米国AIスタートアップの声が一番役立つ
1:22 API型の自動化(API-Based Automation)とは
2:41 RPA型の自動化(RPA-Based Automation)とは
5:40 RPA型の自動化には論理的思考能力の向上が必須
6:49 Google DeepMindの「Alpha Proof」とOpenAIの「o1」の合体系がAGI
※サムネイル画像はGerd AltmannによるPixabay画像を活用
サム・アルトマンの「AGIは来年来る」発言。やっぱりなんかおかしい
※サムネイル画像はAlexaによるPixabay画像を活用
登壇者情報
遠藤 太一郎
株式会社カナメプロジェクト CEO
国立大学法人東京学芸大学 教育AI研究プログラム 准教授
AI歴25年。18歳からAIプログラミングを始め、米国ミネソタ大学大学院在学中に起業し、AIを用いたサービス提供を開始。AIに関する実装、論文調査、システム設計、ビジネスコンサル、教育等幅広く手がけた後、AIスタートアップのエクサウィザーズに参画し、技術専門役員としてAI部門を統括。上場後、独立し、現在は株式会社カナメプロジェクトCEOとして様々なAI/DAO/データ活用/DX関連のプロジェクトを支援する。国際コーチング連盟ACC/DAO総研 Founder等
湯川 鶴章
株式会社エクサウィザーズ AI新聞 編集長
米カリフォルニア州立大学サンフランシスコ校経済学部卒業。サンフランシスコの地元紙記者を経て、時事通信社米国法人に入社。シリコンバレーの黎明期から米国のハイテク産業を中心に取材を続ける。通算20年間の米国生活を終え2000年5月に帰国。時事通信編集委員を経て2010年独立。2017年12月から現職。主な著書に『人工知能、ロボット、人の心。』(2015年)、『次世代マーケティングプラットフォーム』(2007年)、『ネットは新聞を殺すのか』(2003年)などがある。趣味はヨガと瞑想。妻が美人なのが自慢。