本編動画
2024年7月19日に、以下の目次で「ほぼ週刊、AI動向のイマとミライ」動画を配信しました。
0:48 (1)マイクロソフトがOpenAI理事会のオブザーバー席を放棄した
7:51 (2)もはや収支だけの話ではなくなってきたAI投資競争
19:58 (3)OpenAIが目指す「エージェント」はもっとすごい!?
29:12 (4)MetaのスマートグラスとMobileLLMから考える未来
32:41 (5)「OpenAIはタイタニック号だ」という元従業員による告発動画
34:22 (6)これからの時代、従業員数を増やそうとする企業はダサくなっていく
37:27 (7)お金ではなく「計算資源」でベーシックインカムを目指す考え方
40:30 (8)Gemini搭載ロボットが自律的にもの探しをしてくれるように
42:25 (9)OpenAIによる新プロジェクト「Strawberry」とは
51:58 (10)テスラの自動運転技術がここまできた
54:25 (11)多くのプロンプトエンジニアが廃業の予感
1:03:07 (12)Web全体のRAG化を進める「Exa」が目指すところ
各チャプターの概要は以下の通りです。
(1)マイクロソフトがOpenAI理事会のオブザーバー席を放棄した
・Appleの理事会入りの話も白紙に
・欧米当局によるAI規制の機運の高まりを象徴するような話。そうなると、セキュリティ重視のAppleが有利になってくることが想定される
・今はBtoB領域に強いマイクロソフトだが、今後どうなるかはわからないところ
・日本のエンタープライズで特にマイクロソフトが使われている理由の仮説
(2)もはや収支だけの話ではなくなってきたAI投資競争
・米VC大手のSequoia Capitalが懸念を表明した、AIの投資額と収益のギャップ。2024年末には6000億ドルにギャップが広がる想定。AIバブル突入への警笛
・続けざまにGoldman Sachsからも同様の内容のレポートが公開される
・シリコンバレーの投資家・Brad Gerstner氏による反論
・前提にあるのは軍拡競争なので、もはや収支だけの話ではない
・ビックテックによるLLMやプログラミング支援ツールなど一部の領域ではAIバブルが発生しているようだが、それ以外のAIスタートアップも含めてバブルなのかどうかは不明
・ITバブルの時のような有象無象への出資の話はあまり耳にしない
(3)OpenAIが目指す「エージェント」はもっとすごい!?
・OpenAIによる「AGIへの5段階のスケーリングステップ」情報がリークされる
・レベル1「チャットボット(Chatbots)」レベル2「推論者(Reasoners)」レベル3「エージェント(Agents)」レベル4「イノベーター(Innovators)」レベル5「組織(Organizations)」
・現在はレベル1だが、レベル2の「推論者」に近づいている段階。
・多くの人は「2024年はエージェントの時代になる」と言っているが、OpenAIの段階を見るとエージェントはレベル3なので、定義にズレがある印象
・業界全体でまだ「エージェント」の定義が定まっていない。チャットボットでもエージェントと言う会社もあれば、OpenAIのような先を見据えたエージェント概念もある。OpenAIの言うエージェントとは、我々が想像しているものよりもさらに進化したものと思われる
・イノベーターレベルになると、自律的なAI研究者の世界になるのかも
・つまるところ、サム・アルトマンからのちゃんとした説明がないとなんとも言えない
(4)MetaのスマートグラスとMobileLLMから考える未来
・Metaが「MobileLLM」を発表。スマホに載るLLMがホットな領域
・Ray-Ban Metaスマートグラスの評判が非常に良い。ここにMobileLLMが搭載されると何が起こるのか
(5)「OpenAIはタイタニック号だ」という元従業員による告発動画
・元OpenAIの従業員・William Saunders氏が「OpenAIはタイタニック号になる」「3年の間で10%の確率で大変なことが起こる」と批判
(6)これからの時代、従業員数を増やそうとする企業はダサくなっていく
・「Gen-3 Alpha」開発の中国Runway社CEO・Siqi Chen氏が「従業員100人以内が目標だ」と発言
・これからは少ない人数で企業を運営するのがカッコいい時代になるかも
(7)お金ではなく計算資源でベーシックインカムを目指す考え方
・米VCのAndreessen Horowitz社がお金以外にコンピューティング/計算資源での投資をスタート
・サム・アルトマンも「計算資源を配る方がベーシックインカムになるかもしれない」と発言
(8)Gemini搭載ロボットが自律的にもの探しをしてくれるように
・Gemini搭載ロボットが「何か書けるもの」を探してくれる動画
・ヒト型ロボットでなくとも学習して活かせるようになってきている印象
(9)OpenAIによる新プロジェクト「Strawberry」とは
・以前取り組まれていた「Q*」(キュースター)のリブート版
・AGIへの5段階のスケーリングステップでいう「レベル2:推論者」に向けた技術と捉えて良さそう。スタンフォード大学で開発された手法(STaR)との類似点があるという情報も寄せられており、次期GPTモデル(GPT5)になると言われている
・STaRモデルでは「質問と答えと根拠」という3点のデータセットが量産されることで、根拠も一緒に学べるようになり、よりハルシネーションが起きにくくなっていくことが想定される
・Meta Llama 3 405Bが2024年7月23日発表予定。OpenAIはライバル社の発表の前日にぶつけてくる傾向にあるので、もしかしたらGPT5発表は2024年7月22日かもしれない
(10)テスラの自動運転技術がここまできた
・テスラ社が自動運転技術「FSD 12.4.2」(FSD=Full Self-Drivin)による歩行者横断予測のデモ動画を発表
・FSDのバージョン12からは5台のカメラ映像だけで学習
・データだけで学習すると、人間が起こさないような変な間違いを犯す可能性もあると思われる
(11)多くのプロンプトエンジニアが廃業の予感
・Anthropic社によるClaude 3.5のArtifacts機能にシェア機能が実装。Artifacts機能で作成されたWebアプリを他者にリンク共有できるように ※Artifacts機能に関する過去解説動画: • Claud 3.5の「アーティファクト機能」が結構使いやすい
・開発者コンソールに、プロンプトエンジニアリングの機能が搭載
・さらに、作ったプロンプトを試すためのテストケースを作ってくれる機能も実装。生成AIのPoCの進め方に革新的な変化がもたらされるようになる
・早くも、来年あたりから非エンジニアでもプログラミングができるような時代になることが予想される
(12)Web全体のRAG化を進める「Exa」が目指すところ
・AIのための検索エンジン「Exa」が話題。Web全体をRAGにして、不要なページをどんどんと排除して最適な検索結果をAPI経由で返すように
・Perplexityと違いAPIとして開放しているので、例えばエージェントが検索するためのAIのイメージ
・ただしGoogleが後追いで同様のものを構築・実装してくる可能性あり
・LLM周辺ツールが次々と構築されビジネス化されてきている印象
個別テーマ解説動画
また、各テーマに分割した動画も配信しました。興味のあるトピックに応じてご覧ください。
マイクロソフトがOpenAI理事会のオブザーバー席を放棄した理由
0:00 Microsoftがオブザーバー席を放棄し、Appleの理事会入りの話も白紙に
2:40 当局による規制強化に伴い、今後はAppleが有利になるかも
4:25 日本のエンタープライズで特にMicrosoftが使われている理由
※サムネイル画像はwebsubsによるPixabay画像を活用
OpenAIが目指す「エージェント」は、世間が考えているエージェントよりも遥かにすごいのかも
0:00 OpenAIが考えるAGIへの5段階スケーリングステップ
3:35 業界全体でまだ「エージェント」の定義が定まっていない
9:08 OpenAIによる新プロジェクト「Strawberry」とは
11:22 「STaR」モデルでハルシネーション問題が一気に解消されるかも
16:26 OpenAI、今度はMetaの発表にぶつけてくるか!?
※サムネイル画像はFelix MartinezによるPixabay画像を活用
AI投資競争はビジネスを超えて「軍拡」の話に広がってきている
0:00 国家予算近くなるAI投資額
2:37 ビジネスというよりかは「軍拡」の話
4:12 続けざまにGoldman Sachsからも同様の内容のレポートが公開
6:34 AIバブルの恩恵を受けているのは一部だけか
※サムネイル画像はFabien HuckによるPixabay画像を活用
お金ではなく「計算資源」でベーシックインカムを目指す考え方
0:00 米VCのAndreessen Horowitz社が「計算資源」での投資もスタート
0:39 サム・アルトマンが考える次代のベーシックインカム思想
※サムネイル画像はJoeによるPixabay画像を活用
Claude 3.5の新機能で多くのプロンプトエンジニアが廃業の予感
0:00 Claude 3.5のArtifacts機能にシェア機能が実装
3:56 開発者コンソールにプロンプトエンジニアリングの機能が搭載
4:57 作ったプロンプトを試すためのテストケース作成機能も搭載
7:14 来年あたりから非エンジニアでもプログラミングができるような時代に
※サムネイル画像はRosy / Bad Homburg / GermanyによるPixabay画像を活用
AIのための検索エンジン「Exa」が話題になっている
0:00 Web全体のRAG化を進め、最適な検索結果をエージェントに返す
4:32 ここまで重要な機能だとGoogleに真似されるかも
これからの時代、従業員数を増やそうとする企業はダサくなっていく
0:00 Gen-3 Alpha開発企業のCEOが「従業員100人以内が目標だ」と発言
0:39 今後、少人数で企業を運営するのがカッコいい時代になるかも
※サムネイル画像はSangeeth SangiによるPixabay画像を活用
テスラの自動運転技術がここまできた
0:00 自動運転技術「FSD 12.4.2」による歩行者横断予測のデモ動画
1:18 データだけで学習するのはちょっと危ないかも
元従業員が「OpenAIはタイタニック号になる」と告発
登壇者情報
遠藤 太一郎
株式会社カナメプロジェクト CEO
国立大学法人東京学芸大学 教育AI研究プログラム 准教授
AI歴25年。18歳からAIプログラミングを始め、米国ミネソタ大学大学院在学中に起業し、AIを用いたサービス提供を開始。AIに関する実装、論文調査、システム設計、ビジネスコンサル、教育等幅広く手がけた後、AIスタートアップのエクサウィザーズに参画し、技術専門役員としてAI部門を統括。上場後、独立し、現在は株式会社カナメプロジェクトCEOとして様々なAI/DAO/データ活用/DX関連のプロジェクトを支援する。国際コーチング連盟ACC/DAO総研 Founder等
Lucky☆TEDDY
The WAVE フェロー
The WAVEのリサーチ責任者であり、「良心」を司る存在でもある人物。左手には様々な最先端テクノロジーが詰まった福袋を、右手には幸せと豊さを呼ぶ黄金の小槌を持ち、毎日ゴキゲンに情報の荒波をサーフィンしながら、常に2歩先の未来を見据えて鋭い切り口で世の中の動向を分析する。たまに毒づくこともあるが、それも愛ある証拠。帽子には良心の「良」の文字が刻まれている。