本編動画
2024年6月14日に、以下の目次で「ほぼ週刊、AI動向のイマとミライ」動画を配信しました。
0:44 ①WWDC 2024で感じた、AppleとOpenAIで異なる「提携」のレベル感
8:49 ②OSとAIの未来は「モジュール化」にあるという意見
15:23 ③発表されたApple Intelligenceの各機能を、デモ動画を見ながら解説
28:53 ④AI進化の方向が「頭の良さ」の他に「性格の良さ」にも進み始めている
各チャプターの概要は以下の通りです。
①WWDC 2024で感じた、AppleとOpenAIで異なる「提携」のレベル感
・世間的には、AI技術への期待に対しては今ひとつだった印象
・「統合」の意味がAppleとOpenAIで微妙に食い違っている。Appleは「Appleのエクスペリエンスに統合」と表現し、OpenAIは「OSとの統合」と表現している
・データ連携までちゃんとしないとOpenAIに旨みがないので、中長期的にはOSとの統合なのでは
・Apple Intelligenceは、基本的にはデバイス(iPhone)上のAIモデルで処理するが、大きな計算等が必要でiPhone搭載モデルでは対応できないような処理に関しては、Apple独自のサーバーによるプライベートクラウド上で実行される。それぞれに閉じた形でAIが個別に進化するというシナリオは考えられるかも。Apple専用のモデル開発など
・連合学習(Federated learning)を考えているのかもしれない
②OSとAIの未来は「モジュール化」にあるという意見
・元テスラのコンピューター科学者、アンドレイ・カルパシー氏は、OSとAIの統合の未来として「モジュール化」を提唱している
・スマホがAIの身体だとしたら、ユーザーにスマホ操作されることはAIにとっての「体感」とも言える。ユーザーによるタップやピンチなどのモダリティが増えることで、AIにとっての体感覚が増え、より深いユーザー理解につながることが考えられる。よって、そのレベルの学習がなされることが想定される
・WWDC 2024の発表だけだと今ひとつの印象だが、OpenAIとAppleの「OSレベルの統合」は既定路線の可能性が高いと思われる
・最近、セキュリティ領域でOpenAIの評判がよろしくないので、Apple的にはがっつり組むことにフォーカスしたくないのかも
③発表されたApple Intelligenceの各機能を、デモ動画を見ながら解説
・Writing Tools:トーンの変更や校正、要約機能など
・Genmoji:絵文字の作成機能。友人が写っている写真からオリジナル絵文字を作れる。技術的には大したことはないが、UI/UXの観点で一見に値する
・Image Playground:画像生成機能。今までプロンプトを工夫してやらないといけなかったことも、簡単に使えるようなUI/UXになっている
・Siri:GPT-4oのような「話し相手」という感じではなく、あくまで機械的な声の印象
・Personal Context:写真やカレンダーなどからパーソナライズ情報が提供される。ただしApple製品以外(Gmailなど)でも適用されるのかは不明
・Type to Siri:Siriに対して音声ではなく文字入力で会話できる機能。なぜこの機能をこのタイミングで発表に含めたのかは謎だが、今後Siriを全ての入り口にするとしたら、ユーザーが喋れない時を考慮して搭載したのかも
・Priority Notifications:スマホ上での優先的情報の通知機能。AIが通知の中身を理解・判断するというもの
・ここまでの機能をふんだんに使ってAIがコンパニオンみたいになると、他機種への乗り換えの障壁になってくると思われる
・Memory Movie:動画のストーリー作成機能
・デモ動画のラストに表示される文言「AI for the rest of us」に込められた意味とは
・iPhone 15 Pro、iPhone 15 Pro Max、M1以降を搭載したiPadとMacでないとApple Intelligenceは利用できない
④AI進化の方向が「頭の良さ」の他に「性格の良さ」にも進み始めている
・AnthropicがClaudeで力を入れている「キャラクタートレーニング」
・好奇心やオープンマインド、思慮深さなど、より繊細で豊かな特性をClaudeに持たせるようにトレーニングしているとのこと。まさにAIによる非認知能力の獲得の一種のように感じる
・たとえ会話相手が同意しない場合でも「正直」にモデルをトレーニングすることができるとのこと。わからないことは「わからない」と言うようにしている
・AIモデルごとに特徴を持ってこさせている印象
個別テーマ解説動画
また、各テーマに分割した動画も配信しました。興味のあるトピックに応じてご覧ください。
WWDC 2024で感じた、AppleとOpenAIで異なる「提携」「統合」のレベル感
0:00 「Appleのエクスペリエンスに統合」か「OSとの統合」か
5:31 デバイス上で動くAIとクラウド上で動くAIを分ける意味
※サムネイル画像はTomによるPixabay画像を活用
OSとAIの未来は「モジュール化」にあり
0:00 アンドレイ・カルパシー氏曰く、モジュール化がAI進化の鍵になる
1:19 AIにとっての「体感覚」が増えることでユーザー理解が深化する
4:01 OpenAIとAppleの「OSレベルの統合」は間違いなさそう
※サムネイル画像はGerd AltmannによるPixabay画像を活用
Apple Intelligenceの各機能をプチ解説
0:00 Writing Tools機能
1:10 Genmoji機能
2:43 Image Playground機能
4:31 Siri機能
6:32 Personal Context機能
7:21 Type to Siri機能
8:16 Priority Notifications機能
10:02 スマホのAIコンパニオンが機種変の障壁になるかも
11:17 Memory Movie機能
12:05 「AI for the rest of us」に込められた意味とは
好奇心や思慮深さを学び始めたAI「Claude 3」
0:00 Anthropicが力を入れる「キャラクタートレーニング」
4:45 頭の良さ以外で各社の特色が出始めてきたAIモデル市場
※サムネイル画像はVictoriaによるPixabay画像を活用
登壇者情報
遠藤 太一郎
株式会社カナメプロジェクト CEO
国立大学法人東京学芸大学 教育AI研究プログラム 准教授
AI歴25年。18歳からAIプログラミングを始め、米国ミネソタ大学大学院在学中に起業し、AIを用いたサービス提供を開始。AIに関する実装、論文調査、システム設計、ビジネスコンサル、教育等幅広く手がけた後、AIスタートアップのエクサウィザーズに参画し、技術専門役員としてAI部門を統括。上場後、独立し、現在は株式会社カナメプロジェクトCEOとして様々なAI/DAO/データ活用/DX関連のプロジェクトを支援する。国際コーチング連盟ACC/DAO総研 Founder等
Lucky☆TEDDY
The WAVE フェロー
The WAVEのリサーチ責任者であり、「良心」を司る存在でもある人物。左手には様々な最先端テクノロジーが詰まった福袋を、右手には幸せと豊さを呼ぶ黄金の小槌を持ち、毎日ゴキゲンに情報の荒波をサーフィンしながら、常に2歩先の未来を見据えて鋭い切り口で世の中の動向を分析する。たまに毒づくこともあるが、それも愛ある証拠。帽子には良心の「良」の文字が刻まれている。