本編動画
2025年1月10日に、以下の目次で「ほぼ週刊、AI動向のイマとミライ」動画を配信しました。
1:03 (1)おそらく日本人で始めてCESを取材したジャーナリストとして、90年代のCESを軽く回想
2:55 (2)NVIDIA CEO・Jensen Huang氏の基調講演で個人的に面白かったポイント
6:07 (3)事後学習にもスケール則が存在する!?
9:33 (4)世界的に見るとLlama3.1のインパクトが大きいらしい
11:36 (5)NVIDIA NIM(学習済みモデル)とNVIDIA NeMo(フレームワーク)
16:01 (6)NVIDIAのAIエージェントはどんな感じなのか?
22:22 (7)「Cosmos世界基盤モデル」がとにかく面白い
各チャプターの概要は以下の通りです。
(1)おそらく日本人で始めてCESを取材したジャーナリストとして、90年代のCESを軽く回想
(2)NVIDIA CEO・Jensen Huang氏の基調講演で個人的に面白かったポイント
・早くもAIエージェントの次の「Phtsical AI」の時代へ。あまりにも進化のスピードが早い
・NVIDIA CEO・Jensen Huang氏は、AI業界のど真ん中というより、少し離れたところからAI業界を見ている。彼の見方は客観性があって信頼できる
(3)事後学習にもスケール則が存在する!?
・「事前学習に加えて、事後学習、推論時にもスケール則が存在することが分かった」(by. Jensen Huang氏)
※参考情報:NVIDIA CEO Jensen Huang Keynote at CES 2025
https://www.youtube.com/live/k82RwXqZHY8?si=P6YH4IhAJl2RGlZN&t=1422
(4)世界的に見るとLlama3.1のインパクトが大きいらしい
・「全ての大企業、全ての業界がAIモデルの開発に乗り出したのは、Llama3.1のおかげ」(by. Jensen Huang氏)
※参考情報:https://www.youtube.com/live/k82RwXqZHY8?si=BWuMQW6lp6AKuBqd&t=2471
・世界的に見ると、Llama3.1ってやはりかなり大きなインパクトを産業界に与えたらしい。一方で日本企業ではあまり耳にしない
(5)NVIDIA NIM(学習済みモデル)とNVIDIA NeMo(フレームワーク)
・NeMoはAIエージェント(デジタル社員)のオンボーディング等のためのフレームワーク
※参考情報: https://www.youtube.com/live/k82RwXqZHY8?si=iJmqOPJt7hpk4vdc&t=2411
・Leopold Aschenbrenner氏によるリーク文書「SITUATIONAL AWARENESS: The Decade Ahead」にて、今後進化が必要な3つの領域として①オンボーディング、②回答時に計算資源を有効に使えていない問題、③AIによるコンピューターの使用を列挙。NeMoはまさにオンボーディング技術
(6)NVIDIAのAIエージェントはどんな感じなのか?
・AIリサーチアシスタントエージェント、ソフトウェアセキュリティAIエージェント、バーチャルラボAIエージェントなど
・動画分析に力が入っている印象。NVIDIA Cosmos、Nimotron Vision LM、Llama Nemotron LLMなどの言語モデル、NeMo Retrieverなどのモデルを使って、何十億ものカメラからのコンテンツを分析し、1日に100,000ペタバイトのビデオを生成
・NVIDIA Llama Nemotron:NVIDIAが持つ大企業向けノウハウを使ってLlamaをファインチューニング。Nanoは低コスト、軽量モデル。Superは一般的なモデル。Ultraは教師モデルで、他のモデルの回答を評価したり、蒸留モデルを作ったりできる
※参考情報:https://www.youtube.com/live/k82RwXqZHY8?si=x_NXjcwQSORM3fzF&t=2700
(7)「Cosmos世界基盤モデル」がとにかく面白い
・Cosmosは自己回帰モデル、ディフュージョンベースの世界モデル、トークナイザー、AIによって加速されたデータパイプラインであるCUDAで構成されている。ここでいうトークンとは、データの単位のことを指す
※参考情報:https://www.youtube.com/live/k82RwXqZHY8?si=CjwP1ujb_2JEf67I&t=3572
・未来の物理的に基づいた、物理的に妥当なシナリオを複数生成することができ、「ドクター・ストレンジ」のようなことができる。推論時探索の物理シミュレーション版のイメージ
・字幕とビデオは、大規模言語モデル、特にマルチモーダル大規模言語モデルをトレーニングするために使用できる
個別テーマ解説動画
また、各テーマに分割した動画も配信しました。興味のあるトピックに応じてご覧ください。
NIVIDIA発表「Cosmos世界基盤モデル」のインパクトを探る
0:00 デモ動画を見ながらの解説
3:13 物理世界の言語である物理法則を理解するモデル
7:23 有名ロボットベンチャーも軒並み採用
※サムネイル画像はCortex ZoneによるPixabay画像を活用
登壇者情報
遠藤 太一郎
株式会社カナメプロジェクト CEO
国立大学法人東京学芸大学 教育AI研究プログラム 准教授
AI歴25年。18歳からAIプログラミングを始め、米国ミネソタ大学大学院在学中に起業し、AIを用いたサービス提供を開始。AIに関する実装、論文調査、システム設計、ビジネスコンサル、教育等幅広く手がけた後、AIスタートアップのエクサウィザーズに参画し、技術専門役員としてAI部門を統括。上場後、独立し、現在は株式会社カナメプロジェクトCEOとして様々なAI/DAO/データ活用/DX関連のプロジェクトを支援する。国際コーチング連盟ACC/DAO総研 Founder等
湯川 鶴章
株式会社エクサウィザーズ AI新聞 編集長
米カリフォルニア州立大学サンフランシスコ校経済学部卒業。サンフランシスコの地元紙記者を経て、時事通信社米国法人に入社。シリコンバレーの黎明期から米国のハイテク産業を中心に取材を続ける。通算20年間の米国生活を終え2000年5月に帰国。時事通信編集委員を経て2010年独立。2017年12月から現職。主な著書に『人工知能、ロボット、人の心。』(2015年)、『次世代マーケティングプラットフォーム』(2007年)、『ネットは新聞を殺すのか』(2003年)などがある。趣味はヨガと瞑想。妻が美人なのが自慢。