Search GPT発表でOpenAIのマーケ戦略に関心し、ヒト型ロボット100億体の世界を想像し、「空間知性」の研究開発トレンドに期待した一週間(2024年8月2日配信版)

目次

本編動画

2024年8月2日に、以下の目次で「ほぼ週刊、AI動向のイマとミライ」動画を配信しました。

1:02 (1)今週のトピック紹介
2:23 (2)サイバーエージェントが爆速でLlama 3.1の日本語追加学習LLMを公開
8:56 (3)OpenAI発表「Search GPT」はなぜここまで話題になっているのか?
16:46 (4)Google DeepMindが数学オリンピックで「銀メダル」レベルを達成
20:18 (5)Google Geminiを使った「Dear Sydney」オリンピック広告が炎上した理由
25:38 (6)ヒト型ロボットは100億体を超えるだろう by.イーロン・マスク
30:36 (7)サム・アルトマンの寄稿文から考える「AI地政学」の未来
36:50 (8)OpenAIが「Advanced Voice Mode」のアルファ版を提供開始
39:57 (9)Metaがクリエイター向けAIツール「AI Studio」を米国で提供開始
42:38 (10)GPT-4oの「ロングアウトプット」が静かにリリースされる
44:54 (11)Stable Audioで「The WAVE TV」のオープニング曲案を作ってみた
48:10 (12)NVIDIAが「空間知性」の実現に向けて着々と研究開発を進めている

各チャプターの概要は以下の通りです。  

(1)今週のトピック紹介

(2)サイバーエージェントが爆速でLlama 3.1の日本語追加学習LLMを公開
・公式に日本語対応がされていなかったLlama 3.1に対して、サイバーエージェントが日本語追加学習LLM「Llama-3.1-70B-Japanese-Instruct-2407」を公開
・Metaとしてはこういったケースの量産を期待しており、Llama 3.1起点の影響はこれから大きくなってくる
・ザッカーバーグとしては、専門業者とのパートナーシップを通じてLlamaの巨大なエコシステム/市場を作っていきたいとのこと
・OpenAIかMetaかは、最後は自分たちのデータを渡してもいいか否か“だけ”の問題になってきている  

(3)OpenAI発表「Search GPT」はなぜここまで話題になっているのか?
・OpenAIが検索サービス「Search GPT」を発表。大きく話題になっているが、PerplexityやGeminiも同じようなことをやっているので、真新しさとしてはそこまでの印象
・「SearchGPT」というGoogleを煽るような名称が、マーケティング的な目線では「びっくりの小出し」のように見える
・いよいよGPT5の発表が直近の証か
・Perplexityが、TimesやFortune、WordPressなどの各パブリッシャーとの広告収益配分モデルの開始を発表  

(4)Google DeepMindが数学オリンピックで「銀メダル」レベルを達成
・あと1点で金メダルレベルだった
・一見論理的思考の向上に直結すると思われるが、今回のモデルは数学の問題を解くのに特化したものとなっているので、これを使ってそのまま交渉等ができるわけではなさそう  

(5Google Geminiを使った「Dear Sydney」オリンピック広告が炎上した理由
・こんなことにまでAIを使って、人間がバカにならないか、という論調
・そもそもこの広告のAIの使い方の筋が悪い。AIで書かれたファンレターをもらって嬉しいのか。感情や気持ちは今のところ人間固有と言われている中、AIを使ったファンレターというのが人々の琴線に触れたと思われる  

(6)ヒト型ロボットは100億体を超えるだろう by.イーロン・マスク
・Elon Musk氏が「何十世紀も後から今を振り返ったとしたら、この2024年前後は文明のものすごい転換期になっていることだろう」と発言
・ヒト型ロボットは100億体を超え、人類の数を軽く超えてくることになると予想。自動車よりも巨大な市場になると期待
・ただしポジショントークとも言える  

(7)サム・アルトマンの寄稿文から考える「AI地政学」の未来
・対中国・ロシアに向けて、強固なセキュリティ対策、電力等の物理的なインフラ整備、守備一貫した商業外交政策、国際原子力機関のようなものの創設等への言及がなされている
・内容としてはまさに、元OpenAIスーパーアライメントチームのメンバーによるリーク文章のものと一緒
・英国と日本と組むことにも言及  

(8)OpenAIが「Advanced Voice Mode」のアルファ版を提供開始
・より電話で話すような会話が可能になったのと併せて、マルチモーダルでのやり取り(カメラで写しながらの会話等)も特徴的
・現時点ではアルファ版ということで一部の有料ユーザー飲み提供している状況だが、今後は全有料ユーザーに提供する予定とのこと  

(9)Metaがクリエイター向けAIツール「AI Studio」を米国で提供開始
・誰でも簡単にAIキャラクター/エージェントを作理、InstagramのDMで使えるようになる
・それなりに大きなビジネスになる可能性あり  

(10)GPT-4oの「ロングアウトプット」が静かにリリースされる
・通常のGPT-4oが4,000強トークンであるのに対して、Long Output版は64,000トークンの出力が可能になる
・これまでは、例えば翻訳を依頼しても勝手に要約してくる仕様だったが、Long Output版であればそのまま翻訳を出してくれるようになることが想定される
・途中で何度も「続けて」を打つ必要がなくなるかも  

(11)Stable Audioで「The WAVE TV」のオープニング曲案を作ってみた
・Stability AIが音楽・効果音生成モデル「Stable Audio 2.0」を使って本YouTubeチャンネルのテーマ曲を作ってみた
・AudioSparxの音楽ライブラリからライセンスされたデータセットのみでトレーニングされたモデル  

(12)NVIDIAが「空間知性」の実現に向けて着々と研究開発を進めている
・SIGRAPH 2024(米コンピュータ学会におけるコンピュータグラフィックス分科会)でのNVIDIAの発表より
・プロンプトから3D構築のためのPythonコードが生成される3D生成AI
・空間認知のためのオープンソースのディープラーニングフレームワーク「fVDB」も発表。これは、業界標準ライブラリの「OpenVDB」上に構築されたもの。デジタルツインを活用した「空間知性(Spatial intelligence)」の実現に向けた技術
・LLM開発競争とはまた違った領域での研究開発だが、最終的にはここにLLMを載せていくことになるだろう

個別テーマ解説動画

また、各テーマに分割した動画も配信しました。興味のあるトピックに応じてご覧ください。

日本でもLlama 3.1エコシステム拡大中。日本語追加学習LLMが爆速で誕生

0:00 サイバーエージェントが日本語追加学習版のLLMを公開
3:03 Llamaエコシステムの拡大を狙うザッカーバーグ

Googleの広告に視聴者が反発。なぜAIを使うと炎上するのか

0:00 こんなことにまでAIを使うなんて…という論調
2:12 そもそも、AIの使い方の「筋」が悪すぎる

OpenAIがPerplexityライクな「Search GPT」を発表。何がスゴいのか?

0:00 実は新規性に欠ける「Search GPT」が話題になっている理由
2:20 「びっくりの小出し」のマーケティング戦略が奏功か
6:14 Perplexityは各パブリッシャーと「広告収益配分モデル」を開始

ヒト型ロボットは「100億体」規模になる!?イーロン・マスクが考える未来像

0:00 未来から見たら、今の時代は文明の大きな転換点だろう
2:41 ポジショントーク込みの「ヒト型ロボット」普及ストーリー

※サムネイル画像はPete LinforthによるPixabay画像を活用

Googleの技術力はやっぱりスゴい!DeepMindが数学オリンピックで「銀メダル」レベルを達成

0:00 あと1点で「金メダル」レベルだったらしい
0:48 すごい成果だが、そのまま論理的思考の向上に直結するわけではなさそう
2:43 とはいえ、言語と数学ができるようになればAIの精度向上は必至

※サムネイル画像はstefanoceruti63によるPixabay画像を活用

今は「空間知性」の実現に向けた研究開発がホットな領域

0:00 プロンプトから3D構築のためのPythonコードを生成
1:52 空間認知のためのオープンソースディープラーニングフレームワーク「fVDB」
5:48 LLM開発競争とはまた違った領域での研究開発

※サムネイル画像はNicky ❤️🌿🐞🌿❤️によるPixabay画像を活用

Stable Audioでチャンネルの「オープニング曲」案を作ってみた

静かにリリースされたGPT-4o「ロングアウトプット」の登場で何が便利になるのか

0:00 出力制限に起因したペインが地味に面倒だったこれまで
1:11 従来の4,000強トークンに対して、Long Output版は64,000トークン

サム・アルトマンの寄稿文から考える「AI地政学」の未来

0:00 Who will control the future of AI?
1:45 サム・アルトマンが提示する具体的な4つの打ち手
4:46 AIは世界の支配構造に大きく関係する

※サムネイル画像はDavid Sánchez-Medina CalderónによるPixabay画像を活用

まるで人間との対話! OpenAIが「Advanced Voice Mode」のアルファ版を提供開始

0:00 流暢な会話+マルチモーダルでのやり取り
2:29 現時点ではアルファ版ということで一部の有料ユーザーのみ提供

Metaの「AI Studio」が熱い!Instagramを使った新規ビジネスのチャンス到来

登壇者情報

遠藤 太一郎

株式会社カナメプロジェクト CEO
国立大学法人東京学芸大学 教育AI研究プログラム 准教授

AI歴25年。18歳からAIプログラミングを始め、米国ミネソタ大学大学院在学中に起業し、AIを用いたサービス提供を開始。AIに関する実装、論文調査、システム設計、ビジネスコンサル、教育等幅広く手がけた後、AIスタートアップのエクサウィザーズに参画し、技術専門役員としてAI部門を統括。上場後、独立し、現在は株式会社カナメプロジェクトCEOとして様々なAI/DAO/データ活用/DX関連のプロジェクトを支援する。国際コーチング連盟ACC/DAO総研 Founder等

https://kaname-prj.co.jp/

Lucky☆TEDDY

The WAVE フェロー

The WAVEのリサーチ責任者であり、「良心」を司る存在でもある人物。左手には様々な最先端テクノロジーが詰まった福袋を、右手には幸せと豊さを呼ぶ黄金の小槌を持ち、毎日ゴキゲンに情報の荒波をサーフィンしながら、常に2歩先の未来を見据えて鋭い切り口で世の中の動向を分析する。たまに毒づくこともあるが、それも愛ある証拠。帽子には良心の「良」の文字が刻まれている

よかったらシェアしてね!

この記事を書いた人

人ひとりが自分な好きなこと、得意なことを仕事にして、豊かに生きる。 そんな社会に向けて、次なる「The WAVE」を共に探り、学び、創るメディアブランドです。

目次