本編動画
2025年1月6日に、以下の目次で「ほぼ週刊、AI動向のイマとミライ」動画を配信しました。
0:00 (1)AIエージェントの“いま”を解説
4:30 (2)AIエージェントの基本部品と、5つのワークフローを理解しよう
20:24 (3)AIエージェントの先行事例をチェック(a16z発表のカオスマップから)
31:12 (4)Microsoftが進めるAIエージェント計画
50:54 (5)現状のAIエージェントが抱える課題と、進化に必要な技術革新とは
1:02:40 (6)AI大手は今、どこへ向かっているのか?
各チャプターの概要は以下の通りです。
(1)AIエージェントの“いま”を解説
(2)AIエージェントの基本部品と、5つのワークフローを理解しよう
・一般的なAIエージェントの定義「人間が命令すれば、何をどの順序ですべきかを自分で考えて、実際に実行するシステム」→今のところは高機能チャットボットの意味で使われることが多い
・Anthropicによる2つのエージェントの定義:①ワークフロー型、②自律エージェント型
・以下のようなエージェントフレームワークが出てきている。
LangGraph from LangChain:
https://langchain-ai.github.io/langgraph/
Amazon Bedrock’s AI Agent framework:
https://aws.amazon.com/jp/bedrock/agents/
Rivet, a drag and drop GUI LLM workflow builder:
https://rivet.ironcladapp.com/
Vellum, GUI tool for building and testing complex workflows:
https://www.vellum.ai/
・1つの基本部品と、5つのワークフローの形
※参考:Building effective agents(Anthropic)
https://www.anthropic.com/research/building-effective-agents?utm_source=chatgpt.com
・LLMがRetrieval(情報検索)、ツール、メモリを使うことで機能を強化する。これが基本形。これをベースに色んなワークフローを作っていく
・ワークフロー①:プロンプトチェーン(タスクを簡単かつ明確に固定されたサブタスクに分解できる状況に最適のワークフロー)
・ワークフロー②:ルーター(複雑なタスクを処理する際に、異なるカテゴリごとに最適な方法で対応するための手法)
・ワークフロー③:同時並行(タスクを分割して同時に走らせることで速度をあげたり、複数の視点を総合することで精度をあげたりできる)
・ワークフロー④:指揮者(指揮者モデルがタスクを考えて、メンバーモデルに振り分け、それぞれの出してきた答えを統合する。同時並行型との違いは、柔軟性。サブタスクが事前に決められているわけではない)
・ワークフロー⑤:評価と最適化(生成した内容を評価し、その結果をフィードバックするループを回す仕組み。ループを回すことで精度が向上する。明確な評価基準があるときに有効)
(3)AIエージェントの先行事例をチェック(a16z発表のカオスマップから)
※AIエージェントの3レイヤー(基礎技術インフラ、水平型、垂直型)については以下動画で解説
https://youtu.be/4FF3vxDB-Pw
・水平型①「Reducto」:データ抽出エージェント
https://reducto.ai/ https://youtu.be/M7OlLR40CEo
・水平型②「TRELLIS」:非構造化データの構造化エージェント
https://runtrellis.com/
・水平型③「Multion.ai」:Web上でタスクを実行するエージェント
https://www.multion.ai/ https://youtu.be/Ubr7FWmeIyM
・垂直型①「tennr」:医療事務専門エージェント
https://www.tennr.com/ https://youtu.be/uHP6Ue025P0
・垂直型②「Happyworker.ai」:物流特化の音声AIエージェント
https://www.happyrobot.ai/post/ai-workers-for-logistics https://youtu.be/bSVjbW3ejM8
・垂直型③「DataSnipper」:監査及び財務・経理業務向けエージェント
https://www.datasnipper.com/jp
・垂直型④「Parcha」:金融機関のコンプライアンスチェックエージェント
(4)Microsoftが進めるAIエージェント計画
・3つの能力、①マルチモーダル②論理的思考③メモリ・データ連携・ツール、がエージェントの世界を構築する(by. Satya Nadella氏)
※参考:Microsoft Ignite: Day 1 Keynote
https://www.youtube.com/live/wb_uWHFJBnA?si=wLC58_OTerjefeKP&t=1256
・簡単にエージェントを作れる仕組みを用意
https://www.youtube.com/live/wb_uWHFJBnA?si=LyJXx7hMuMid4vzu&t=2199
・ビジネスソフトの概念が崩壊する
https://youtu.be/9NtsnzRFJ_o?si=6UVdXJM183Uackaj&t=2799
・ExcelはCopilotのツールになり、データアナリストのように扱う
https://youtu.be/9NtsnzRFJ_o?si=2JzlOwQdaLQXh5Qc&t=2924
・「我々は(ビジネスソフトのあり方を)積極的に崩壊させに行くつもりだ(by. Satya Nadella氏)
https://youtu.be/9NtsnzRFJ_o?si=2JzlOwQdaLQXh5Qc&t=2872
※詳細解説動画はこちら
https://youtu.be/IFcF6gQkeHs
・ここまでみても、現在のエージェントは全部ワークフロー型。自律エージェント型はまだまだこれからの話
・「エージェント」は極めてマーケティング用語っぽい印象
・自立型エージェントのイメージ例
https://www.youtube.com/watch?v=jqx18KgIzAE
(5)現状のAIエージェントが抱える課題と、進化に必要な技術革新とは
・現状のエージェントが抱える課題:①人間の命令を受けて、どういうワークフローにすればいいのかをAIが自分でうまく決められない、②Webサイトを見てどこをどう操作すればいいのか分からない
・①についてはo1が解決する?(o1にはワークフローを試行錯誤して学習する能力がある)
・②についてはo3が解決する?
・OpenAIが2025年1月にリリースすると噂されているエージェントプラットホーム「Operator」では、自律型エージェント実現のための課題が全て解決されているのだろうか?
・Operatorの完成度次第では、ゆっくりと段階的にエージェントへの移行を進めようとするMicrosoftの計画が無意味になるかもしれない
・自律型エージェントに適した用途って何?ChatGPTに聞いてみたが、ワークフロー型でもいけそうなものも多い印象。予測不能不能で複雑な状況や、動的な判断が必要なケースなどで、自律型エージェントが効果を発揮しそう
(6)AI大手は今、どこへ向かっているのか?
・「Agentがどんなものになるのか、われわれを含めて誰もまだ分かっていないと思う。でもAgentは何か人間にできないこと、人間がしたくないことをしてくれるようになると思っている。レストランの例だと、例えばAgentが300店以上のレストランに電話して、もっともいいレストランを予約してくれるようになれば便利かもしれない。電話を受ける側にとっては迷惑かもしれないけど、電話を受ける側もAgentになれば問題ない。あとは非常に優秀で経験豊富な同僚のようなことを仕事をこなすAgentが出てくるように思う。二日かかる仕事や2週間かかる仕事に取り組んでくれて、ときどき質問してくるけど、あとは籠って仕事をして、素晴らしい結果を出してくれるようなAgentができればおもしろいと思う」(by. Sam Altman氏)
※参考:Sam Altman: What Startups Will be Steamrolled by OpenAI & Where is Opportunity | E1223、20VC with Harry Stebbings
https://youtu.be/peg-aX1oii4?si=5uuZ8c9jbcaq7irv&t=578
・いずれにせよ、OpenAIのOperatorがどんなものになるか楽しみ!Sam Altmanのツイートを見る限り、どんなものになるのか。遠藤さんの予測が当たるのか!?
https://x.com/sama/status/1873816979590787110
※サムネイル画像は愚木混株 Cdd20によるPixabay画像を活用
登壇者情報
遠藤 太一郎
株式会社カナメプロジェクト CEO
国立大学法人東京学芸大学 教育AI研究プログラム 准教授
AI歴25年。18歳からAIプログラミングを始め、米国ミネソタ大学大学院在学中に起業し、AIを用いたサービス提供を開始。AIに関する実装、論文調査、システム設計、ビジネスコンサル、教育等幅広く手がけた後、AIスタートアップのエクサウィザーズに参画し、技術専門役員としてAI部門を統括。上場後、独立し、現在は株式会社カナメプロジェクトCEOとして様々なAI/DAO/データ活用/DX関連のプロジェクトを支援する。国際コーチング連盟ACC/DAO総研 Founder等
湯川 鶴章
株式会社エクサウィザーズ AI新聞 編集長
米カリフォルニア州立大学サンフランシスコ校経済学部卒業。サンフランシスコの地元紙記者を経て、時事通信社米国法人に入社。シリコンバレーの黎明期から米国のハイテク産業を中心に取材を続ける。通算20年間の米国生活を終え2000年5月に帰国。時事通信編集委員を経て2010年独立。2017年12月から現職。主な著書に『人工知能、ロボット、人の心。』(2015年)、『次世代マーケティングプラットフォーム』(2007年)、『ネットは新聞を殺すのか』(2003年)などがある。趣味はヨガと瞑想。妻が美人なのが自慢。