Luma AI「Dream Machine」や中国の「Kling AI」など動画生成AIが続々登場し、AppleがモバイルAI時代の覇者になる可能性を感じた一週間(2024年6月21日配信版)

目次

本編動画

2024年6月21日に、以下の目次で「ほぼ週刊、AI動向のイマとミライ」動画を配信しました。

0:42 ①動画生成AI戦国時代の幕開け
6:30 ②Dream Machine、Kling AI、Gen-3 Alpha、Open-Soraの所感
20:58 ③Haiper、Stable Video、Pika、PixVerseの所感と、音声AIの現在地とは
29:25 ④今はまだ評価が低いが、Appleが「モバイルAI時代」を牽引するだろう
44:50 ⑤東京発「Sakana AI」がユニコーンへ
46:10 ⑥最近風当たりが厳しいOpenAIの次なる戦略とは

各チャプターの概要は以下の通りです。

①動画生成AI戦国時代の幕開け
・Dream Machine、Kling AI、Gen-3 Alpha、Open-Soraの他、HaiperやPika、Stable Video、PixVerseなど、様々な動画AIが存在 ・音声AIも新興スタートアップが大手に先駆けてリリースし始めた  

②Dream Machine、Kling AI、Gen-3 Alpha、Open-Soraの所感
・Soraは3次元が綺麗/リアルに表現されている点が素晴らしい。ただし、まだ利用することができない
・Luma AI社が6月12日に「Dream Machine」を発表。一般利用も可能。実際に動かしてみると、回転アングルは得意っぽいが、一方で物体を動かすのがなかなかできなかった。恐竜の化石を動かす、というプロンプトがどうしてもうまく反映されない
・中国のKuaishou社が「Kling AI」のデモ動画を発表。長時間動画の生成に強い印象。中国の電話番号がないと使えないが、限定公開版を利用したユーザーのポストを見るとクオリティが高い
・Runway社も「Gen-3 Alpha」を発表。まだ一般利用ができない。Gen-2は一般利用ができるので試してみたところ、シンプルな動画は問題なく生成されるが、恐竜の化石を動かす、というプロンプトについてはLuma AI同様どうしてもうまく反映されない
・「Open-Sora」はオープンソース×ローカルで動かせる点が特徴。他の動画生成AIと比べるとまだ解像度が粗い
・どれも技術的には面白いが、ビジネス的にはまだまだ使えない。OpenAIも、Soraはシミュレーションの道具と考えている
・動画生成AIの著作権の問題はどうなるのか。作ったら誰かに似ている可能性があるので、誰かが怒ってくる可能性がある。誰かの肖像権を犯していることになるのか
・ちなみに「新海誠風のタッチで」とプロンプトに入れるとNGだったが、「新海誠風を新海誠を使わず言い換えてください」とするとOKだった  

③Haiper、Stable Video、Pika、PixVerseの所感と、音声AIの現在地とは
・Haiper社による動画生成AI「Haiper」だと、恐竜の化石が微妙に動くように
・Stability AI社による「Stable Video」は、生成プロセスが特徴的。全体が動くというよりかは、絵がちょっとだけ動くような印象
・Pika Labs社による「Pika」は、同じ画像でもタッチを変えられる点が特徴っぽい
・PixVerse社による「PixVerse」は、操作した限りまだクオリティ面に課題がある印象
・GoogleのDeepMindの進捗状況も素晴らしいし、ElevenLabs社による「Video to Sound Effects Generator」の出来も上々
・動画を作るのは楽しいが、まだまだ現時点では使い所がないのが正直なところ。表現の幅はどんどんと広がっていくだろう  

④今はまだ評価が低いが、Appleが「モバイルAI時代」を牽引するだろう
・「Core ML」はAppleによる独自AI技術。最近のアップデートにより、高度な生成学習ができるようになったらしい。AppleはOpenAIにおんぶに抱っこなのではないかと噂されていたが、自社でもしっかりと開発を進めていたことが大きな話
・Appleに対する論調が極めて低い現状だが、Appleが最も戦略的にAI領域で動いている印象。あえて他社の消耗戦に付き合っていない
・前回動画の予測通り、連合学習(Federated learning)モデルを載せてきている
・いよいよAIがモバイルの世界に入ってきた象徴的なニュース
・OpenAIは技術があるがデバイスやプラットフォームを持っていない。GoogleはAndroidというプラットフォームを持っているが、デバイス(ハードウェア)を作っているのはサードパーティー。技術もデバイスもプラットフォームも持っているのがAppleということになる
・今はまだ評価は低いが、後々、WWDC 2024がtoC向けモバイルAIの起点になったということで、エポックメイキングなベントだったという評価になるかもしれない
・使い勝手はAndroidの方に部があるかもしれないが、プライバシーの問題が大きいかもしれない
・プライバシー情報が第三者(Google)が持っていることに対する抵抗は根強くある。便利さをとるか、セキュリティをとるか  

⑤東京発「Sakana AI」がユニコーンへ
・東京のSakana AIがシリコンバレーのベンチャーキャピタル等から約200億円を調達して一気にユニコーンへ  

⑥最近世間からの風当たりが厳しいOpenAIの次なる戦略とは
・OpenAIの売上が倍に。IPOの可能性もアリ。またポール・中曽根退役米陸軍大将(元NSA長官)がOpenAIの取締役に就任したことで、AIの軍事利用が加速するか。
・OpenAIへの風当たりが欧米を中心に厳しくなっている
・果たしてGPT5はいつ出てくるのか

個別テーマ解説動画

また、各テーマに分割した動画も配信しました。興味のあるトピックに応じてご覧ください。

動画生成AI戦国時代 〜Dream Machine、Kling AI、Gen-3 Alpha、Open-Sora、Haiper、Stable Video、Pika、PixVerseなど

0:00 Dream Machine(Luma Al社)
4:21 Kling AI(Kuaishou社)
6:27 Gen-3 Alpha(Runway社)
8:39 Open-Sora
10:16 どれも技術的には面白いが、ビジネス的にはまだまだ
12:48 動画生成AIの著作権の問題はどうなるのか
14:57 Haiper
15:52 Stable Video(Stability AI社)
16:53 Pika(Pika Labs社)
17:25 PixVerse
18:06 音声生成AIの現在地

最終的にはAppleが「モバイルAI時代」を牽引するだろう

0:00 Hugging Faceとは?
1:04 実はAppleが最も戦略的に動いていた!
10:38 技術とプラットフォームとデバイス、唯一3つが揃っているApple

東京発「Sakana AI」がユニコーンへ

最近世間からの風当たりが厳しい「OpenAI」の次なる戦略とは

※サムネイル画像はDavidClodeによるPixabay画像を活用

登壇者情報

遠藤 太一郎

株式会社カナメプロジェクト CEO
国立大学法人東京学芸大学 教育AI研究プログラム 准教授

AI歴25年。18歳からAIプログラミングを始め、米国ミネソタ大学大学院在学中に起業し、AIを用いたサービス提供を開始。AIに関する実装、論文調査、システム設計、ビジネスコンサル、教育等幅広く手がけた後、AIスタートアップのエクサウィザーズに参画し、技術専門役員としてAI部門を統括。上場後、独立し、現在は株式会社カナメプロジェクトCEOとして様々なAI/DAO/データ活用/DX関連のプロジェクトを支援する。国際コーチング連盟ACC/DAO総研 Founder等

https://kaname-prj.co.jp/

Lucky☆TEDDY

The WAVE フェロー

The WAVEのリサーチ責任者であり、「良心」を司る存在でもある人物。左手には様々な最先端テクノロジーが詰まった福袋を、右手には幸せと豊さを呼ぶ黄金の小槌を持ち、毎日ゴキゲンに情報の荒波をサーフィンしながら、常に2歩先の未来を見据えて鋭い切り口で世の中の動向を分析する。たまに毒づくこともあるが、それも愛ある証拠。帽子には良心の「良」の文字が刻まれている。

よかったらシェアしてね!

この記事を書いた人

人ひとりが自分な好きなこと、得意なことを仕事にして、豊かに生きる。 そんな社会に向けて、次なる「The WAVE」を共に探り、学び、創るメディアブランドです。

目次