本編動画
2024年7月27日に、以下の目次で「ほぼ週刊、AI動向のイマとミライ」動画を配信しました。
0:50 (1)今週のメインテーマ:先行き読めないLLMと、SLMの台頭
6:00 (2)EU圏はじめ、各種規制がAI進化のブレーキになってきている
11:05 (3)トランプ支持者が「AI版マンハッタン計画」の草案を策定
18:06 (4)GPT-4o miniの登場がSLM時代の幕開けを象徴している
30:54 (5)著名なコンピューター科学者が、視覚データ活用のAI新会社を設立
35:26 (6)ビッグテック大手各社がYouTubeを無断で学習している!?
41:02 (7)AIの最先端はオープンソースにはならない
46:34 (8)Groqがツール使用に特化したオープンソースモデルを発表
50:11 (9)カルパシー氏がAIネイティブの教育機関を設立
53:35 (10)日本発、GPT搭載・教育用AIフィードバックシステムが無料公開
各チャプターの概要は以下の通りです。
(1)今週のメインテーマ:先行き読めないLLMと、SLMの台頭
・Large Language Model(大規模言語モデル)とSmall Language Model(小規模言語モデル)
・今までは「学習」に主なコストをかけていたが、今後は「推論」にコストをかける動きにシフトしていきそう。学習は地政学的/国家予算的なレベルでの規模感の話で進むことになり、民間は主に推論になっていきそう
(2)EU圏はじめ、各種規制がAI進化のブレーキになってきている
・Metaが今後、EU圏でマルチモーダルAI含む次期AIモデルを提供しない予定とのスクープ
・Appleも、最新のApple Intelligence機能をEU圏で提供しないことを発表している。
・データプライバシーや独禁法など、地域によっては各種規制がAI進化のブレーキになってきている
(3)トランプ支持者が「AI版マンハッタン計画」の草案を策定
・慎重な進め方だったバイデン大統領の姿勢とは対照的に、AIの規制のあり方の見直しを進める方針の草案
・シリコンバレーもトランプへの肩入れをしはじめた
・元OpenAIスーパーアライメントチームのメンバーによるリーク文章にあった「アメリカVS中国」の構図の世界観になっていく様相
・対中国でお金をかけ続けるようなアクセルと、データプライバシーや独禁法などを考慮したブレーキの両方をかけている状況
(4)GPT-4o miniの登場がSLM時代の幕開けを象徴している
・多くの民間企業は大手によるLLM開発競争には参入せず、SLM(Small Language Model)の開発を進めていく流れ
・OpenAIによる「GPT-4o mini」の発表はその象徴的なニュース
・GPT-4o miniは、GPT-3.5 Turboよりも60%安く、GPT-3.5 Turboよりも圧倒的に精度が高い。またテキストだけでなく、ビジョン(画像や音声等)も対応へ
・この流れで、MetaがRay-Banへの出資を検討。シリコンバレーではRay-Ban Metaスマートグラスの評判が非常に良い
・現状はスマホで処理をすることが前提と思われるが、グラス側にスピーカーとマイクがついているので、いろいろなことができると思われる
・MistralもSLMを続々と発表している。特にNvidiaと共同開発した「Mistral NeMo」では、多言語対応なので日本語にも対応しており、またトークナイザー「Tekken」によって、より効率的な自然言語テキストとソースコードの圧縮を実現している
(5)著名なコンピューター科学者が、視覚データ活用のAI新会社を設立
・コンピューター科学者でスタンフォード大学教授のフェイフェイ・リー氏が、新たなAI企業・World Labs社を設立
・テキストデータではなく「視覚データ」で、論理的思考の進化と、3次元の物理世界を理解するモデルの開発を目指す
・テキストデータ→視覚データではなく、視覚データからスタートするのは珍しい
(6)ビッグテック大手各社がYouTubeを無断で学習している!?
・Apple、Nvidia、Anthropic、SalesforceなどがYouTubeで無断学習したとの告発
・実際にデータを集めているのはEleutherAIという非営利団体。オープンサイエンスとオープンソースをコンセプトに、AIデータの提供等を進めている
・Googleが訴えているわけではなく、現時点では第三者が言っているだけの話
・データクローリングではなく、ヒト型ロボットが目視で学習したものはどうなるのか?
(7)AIの最先端はオープンソースにはならない
・みんなで知見/データを持ち寄って進化してきたAIだが、最近ではビッグテックを中心にクローズドになってきている
・論文を出すモチベーションも低くなっている
・MetaのLlamaシリーズについても、オープンにするかクローズドにするか、最後の最後まで揉めていたとのこと。投資金額が膨れ上がってきたことが主要因なので、次回は無料かどうかは分からない
(8)Groqがツール使用に特化したオープンソースモデルも発表
・推論専用チップ由来のAI「Groq」から、ツール使用に特化したオープンソースモデル、Llama-3-Groq-70B-Tool-UseとLlama-3-Groq-8B-Tool-Useがリリース
・Function calling機能に特化したベンチマークで最もパフォーマンスが高い。エージェントのパーツとしての用途が想定される
※RAGとFunction callingの違い解説: • RAGって何?Function callingと何が違うの?AI歴25年の…
(9)カルパシー氏がAIネイティブの教育機関を設立
・元OpenAIの共同創業者で、AIに関するオピニオンリーダーの一人であるAndrej Karpathy氏がAI+教育テーマの学校を設立
・教材は教師が作成し、TAはAIに任せることを想定。学びにおける広さと深さを追求していくとのこと
・超知能時代を理解している人が、あえてコンテンツ学習に全力で踏み切ろうとしているのは何故か
(10)日本発、GPT搭載・教育用AIフィードバックシステムが無料公開
・遠藤太一郎がCEOを務めるカナメプロジェクトより、教育用AIフィードバックシステムがリリース・無料公開される
・授業のレポートに関してAIがまとめてフィードバックを生成するものを構築
・Googleスプレッドシートを使って作成。「GPT-4o」と「Command-R+」の2つのモデルから選択が可能
※詳細はこちらの記事を参照
個別テーマ解説動画
また、各テーマに分割した動画も配信しました。興味のあるトピックに応じてご覧ください。
いま世界では、AIに対してアクセルとブレーキを同時にかけていて、結構危ない状況かも
0:00 ヨーロッパでは今後、いいAIモデルが使えないのかも
2:56 トランプ支持者が通称「AI版マンハッタン計画」草案を策定
6:10 OpenAI元スーパーアライメントチームのリーク文書の世界観が現実に
8:18 LLM(大規模言語モデル)開発競争の行方がますます不透明になってきた
※サムネイル画像はTimによるPixabay画像を活用
これからSLM(小規模言語モデル)を使ったビジネスが続々と出てくるだろう
0:00 GPT-4o miniの登場がSLM時代の幕開けを象徴している
2:38 SLMはマルチエージェントとしての活用に有効かも
6:08 MetaがRay-Banへの出資を検討
10:03 NVIDIAとMistralが共同開発した「Mistral NeMo」が結構すごい
※サムネイル画像はTimによるPixabay画像を活用
「AI業界のゴッドマザー」が立ち上げた「視覚データ」駆動の新AI企業
※サムネイル画像はAline BerryによるPixabay画像を活用
ビッグテック各社がYouTubeを無断で学習しているらしいが、話は結構ややこしい
0:00 実際にデータを集めているのはEleutherAIという非営利団体
3:00 オープンソースの思想に則っているといえば則っているが…
※サムネイル画像はKsv_gracisによるPixabay画像を活用
AIの最先端はオープンソースにあらず、という説
0:00 AIに関する最新の技術知見/情報がビッグテックから共有されなくなってきた
2:24 研究者の論文を出すモチベーションが低くなってきている!?
3:29 Metaも最後まで悩んだLLMのオープン/クローズド戦略
※サムネイル画像はR LによるPixabay画像を活用
Groqが新発表した「ツール使用に特化したオープンソースモデル」がマニアックだけど面白い
教材は教師が作成し、TAをAIに任せる。カルパシー氏がAIネイティブな学校を設立
0:00 学びにおける「広さ」と「深さ」を追求していくとのこと
1:59 なぜ超知能時代に「コンテンツ学習」に取り組むのか
日本発、GPT搭載・教育用AIフィードバックシステムが無料公開
登壇者情報
遠藤 太一郎
株式会社カナメプロジェクト CEO
国立大学法人東京学芸大学 教育AI研究プログラム 准教授
AI歴25年。18歳からAIプログラミングを始め、米国ミネソタ大学大学院在学中に起業し、AIを用いたサービス提供を開始。AIに関する実装、論文調査、システム設計、ビジネスコンサル、教育等幅広く手がけた後、AIスタートアップのエクサウィザーズに参画し、技術専門役員としてAI部門を統括。上場後、独立し、現在は株式会社カナメプロジェクトCEOとして様々なAI/DAO/データ活用/DX関連のプロジェクトを支援する。国際コーチング連盟ACC/DAO総研 Founder等
Lucky☆TEDDY
The WAVE フェロー
The WAVEのリサーチ責任者であり、「良心」を司る存在でもある人物。左手には様々な最先端テクノロジーが詰まった福袋を、右手には幸せと豊さを呼ぶ黄金の小槌を持ち、毎日ゴキゲンに情報の荒波をサーフィンしながら、常に2歩先の未来を見据えて鋭い切り口で世の中の動向を分析する。たまに毒づくこともあるが、それも愛ある証拠。帽子には良心の「良」の文字が刻まれている