S32E03 Stable Diffusion 革命

2 de maio de 2023 • 29min
ZENKEI AI ポッドキャスト
Ouvir episódio
ZENKEI AI ポッドキャスト、シーズン32は2022年8月31日に開催した ZOOMライブの模様です。
この日のテーマは、直前に迫った「技術書典13」への最終企画会議と、急遽追加の話題「Stable Diffusion 革命」でした。
エピソード3は、「Stable Diffusion 革命」です。
当日の市來の発表資料
このブラウザでは再生できません。
再生できない場合、ダウンロードは🎵こちら
ビデオ見れる人はこちらからご覧ください。
(以下は、OpenAI の Whisper を使って文字起こししたものを修正したものです。)
** 注:以下は未編集の草稿です **
こんにちは。ZENKEI AI FORUMです。
あ、そうだな、ここ革命の背景の話まで言って、一旦話を切りますので、もうしばらく僕の独り語りを聞いてください。一応8時目標で喋ってますけども、いきます。というのが、今のはプラクティカル側面ね、自分でやってみるっていうセンスの話でしたけども、さっきも言ったように、今回のこの出来事っていうのは、革命と呼ぶにふさわしいもんだっていうものらしい。僕は背景事情とか深掘りする暇もなく、そういうコネもなく、情報のネットワークもなく、単にTwitterのタイムラインに面白い映画が出てくるのがすげーって言ってるだけの傍観者だったんだけども、これね、8月29日にTwitterにね、からあげさんのツイートでね、こんなビデオがあるぜっていうのがあって、紹介されてたのがこのビデオね。緊急対談、今AI業界に何が起きてるか、清水さんに聞いてみたっていう、ドリキンさんっていうYouTuberの人なんですね。僕、このおじさんは、ガジェット系のね、YouTubeの紹介で、このおじさんは知ってたんですけども、このYouTubeチャンネルを見て、見に行ったの。軽い気持ちで。したら、清水さんがすげー盛り上がってて、今回のStable Diffusionが、いかにすごいかを熱弁を振るってたんで、興味ある人は、ぜひYouTube、長いっすけども見てください。一応ね、僕はね、下でね、できるだけまとめようと思ってます。まとめようと思ってまとめました。それで伝わるかどうかわかんないし、わかんないところあるかもしれないんで、怒られるかもしれないけども、まとめました。一応ね、ちなみにって言って、僕はこのおじさんさん、おじさんさん人のビデオ1時間以上前見るかっていう話を、ホンダさんに言いますかっていう話なんですけど、でも、さっきも言ったように、別にこのおじさんたちを深く知ってるわけじゃないっていう言い訳をね、なんかここに書いてます。清水さんも僕は全然詳しく知らなくて、エンチャントムーンの時にね、タブレットの時にネットニュースに出てきて、ああっていうふうに認識したぐらいで、あとはAI関係でブログを学習させて、自分の語り風の文章を書けるぜっていうのを書いた記事を見かけたのは記憶にある。まあそれぐらいの認識だったんですね。天才プログラマーとかネットを見ると書いてありますが、その辺は知らない。右側のこのおじさんはですね、ドリキンさんっていう人は、Vロガーっていうかな、ビデオブログをやってる人っていう認識で、デジタルカメラ、僕とかもこの配信使ってるカメラとか一時期調べた時に引っかかって、存在は知ってました。この人アメリカに住んでるのかな、そういう感じのおじさん。この人のしきりのチャンネルにこの2人がゲストで喋ったっていう話らしいですね。西川善司さんっていうのは、僕は顔を見たのは初めてなんですけども、ITメディア、AVウォッチとかデジカメとかAVウォッチだったかな。ネット記事でやっぱりガジェット系を紹介してるとかっていう記事のクレジットによく名前見るなぐらいの認識しかない。だから、業界の人なんだなぐらいの認識しか僕は個人的にないんだけど、ビデオ見てたら、今回のステイブルディフュージョンの出来事がどういう位置づけだったのかみたいなのが、清水さんが主に熱弁を振っていてました。面白かったです。それを簡単に説明しようかなと思ったんだけど、1時間以上でまとめてたらすげー大変になったので、スマートな深津さんのまとめの方を先にしようと思います。8月22日に、世界変革の前夜は思ったより静かっていうふうに書いたエントリーがあって、ここもネタは同じものに対して深津さんの書き方でまとめたので、それを引っ張ってきた。ぐっときたフレーズを引用しとくって書いてますけども。引用パート1、パート2しかないのかな。パート1で言ってるのは、ステイブルディフュージョン開発してるチームは、とてもピュアな人たちだ。太っ腹に自分がやったことをフリーで公開するみたいな。ある意味、そういう意味ではラジカルな人たちだっていうことの柔らかい表現なんだろうなと思いますけども。実際に、ここはまだ公開されてないんだけども、予定ではみんなのパソコンでステイブルディフュージョンが実際に動くようになるらしいよっていう、そういうアナウンスがあった段階で書かれたもので、実際に予定通りなのか予定より1日2日遅れたぐらいなのかは知らないですけども、公開されて、今僕が上で示したように自分のPCで実際にステイブルディフュージョンがプロンプトで自分の画像が作れるようになるという話だ。まとめのパート2ね。OK。引用したかったのは、ここの部分は一塊なんですけども、今起きているのはやっぱり、深津さんも清水さんも、一種の革命的なもんだと、パラダイムシフトだと、大きな変革だというふうには認識している。それは深津さんも清水さんも、民主化という言葉を2人とも使ってますね。深津さんの引用スクショを見ると、今後もAIは様々な専門職能を強制的に民主化していくことでしょうね。そういうふうに物事は進んでいくでしょうね。しかもそれは非可逆だ。後戻りできない変化が今後もどんどん起きていくでしょうね。今回はイラストっていう部分で起きちゃって、今後もいろんなところで起きていくんでしょうね。それに対して、右で書いているのは、僕全部、彼の言葉はここに書いてあります。それをどう翻訳するかで、僕の翻訳は、どうせやるなら踊らないな、そんそんっていうふうにね、実際にやるんだったら、飛び込んでいきましょうよっていうふうな書き方をしていて、こういうものの言い方ができる人がやっぱりスマートなんだなって、僕はここから学ばなきゃいけないなと思ったってことですけども、っていう出来事があったというのが、1人の付活さんの側から視点から見た時の今回の出来事のまとめだった。さっきのおじさん3人のビデオで熱量高く喋ってた清水さんの視点を大雑把にまとめさせてもらいますが、やっぱり最初に言っちゃうように、今回の盛り上がりは1弾、2弾、3弾ロケットみたいになってたんだけども、それっていうのは、要するに不満の爆発みたいな要素があって、どういう不満の爆発かって言ったら、やっぱりあれだね、革命なんですね。貴族をぶち倒すっていうか、そういうノリになっていると。 札束でぶん殴る系の研究が世の中AIの研究を仕切ってたんだけども、資生のAI愛好家たちがそこにすげー不満を感じていて、今回ステーブルディフュージョンが、対等、あるいはもしかしたら超えてるかもしれない、超えてるってことはないんだろうけど、同じレベルのモデルを公開した、大衆に。誰でも使えるようにした、っていうノリね。そこに熱いものを感じたっていうのがやっぱり一番大きいですね。僕はそこは個人的には共感するところ。だって論文読んでても、でかいマシンでしか計算できませんっていうのは、科学じゃないんですからね。検証可能性が担保されない研究は、なかなか難しいですからね。もう一個ね、清水さんの発言から、僕は感動のあまり、自分でトランスクライブした日本語を書き起こしたものをここに書いてますけども、なんていうのかな、ここに書いてあるね、イカれるオタクたちの情熱が、このミッドジャーニー含めてね、オープンAIはもう潤沢にサッサバで殴りまくってますけど、ミッドジャーニーもやってるのは、リープモーションの共同設立者で、多分お金はあるんでしょうね。お金をきちんと、コンピューターをぶん回して、ああいうモデルを作って、すげえやろって言って、ユーザーからお金を取ってるっていう、商売として別に悪いことしてるわけではなくて、いいものを作ってお金をもらってるっていう意味ではいいんですけども、AIのホビーストっていうのかな、愛好者からすると、やっぱり不満なんですよね。モデルは公開されてないんで、何がどうなってるかわかんないとか、そういうDIYっていうかな、だからホビーストなんだと思いますけども、そういう人たちが何をやってるのか確認できないっていうのは嫌だっていうことね。それはすごく共感、そこも共感できるポイントだし、だからって文句言ってるだけではなくて、このステーブルディフュージョンを作ったチームは実際にだからミッドジャーニーもオープンAIもコンピュータリソースがでかいところで動くモデルなんだけども、ステーブルディフュージョンは何が違うって、PCで同じぐらいのクオリティの画像が動くモデルを実際に作っちゃって、しかもそれを公開した。そういう意味ですごいテッキーにすごいアドバンスだし、やってることもクールだしっていうのが、おじさんたちが熱くなるポイントなんですね。僕も含めてね。この世代のね、おじさんたちがね。多分ね、コンピューター、下にちょっとコメント書きました。まあいいや。くすぐられました、僕も。で、まあこれはいいや。地獄の窯の蓋が開いたとか、パンドラの蓋が開いたみたいなこといっぱい書いてあって、要するに民主化されたっていうかな、みんなが使えるようになったっていうのはすげーすげーって、もうこれか。あと、ふかつさんも書いてあと戻りできない変化が起きちゃったっていうことね。で、清水さんの説明で腹落ちして、そこに行った西川さんもそういうことなのねって腹落ちしてたのは、これは僕の世代とかにはわかりやすい例え話としては、今回起きたのはオープンソースプロジェクトみたいなもんだよと、そういうことなんですね。マイクロソフトとかね、あの辺たちがソフトウェアを隠すことで商売しようっていうソフトウェア産業を作ったときに、ソフトウェアっていうのはそういうもんじゃないだろうって言って、リチャード・ストールマンがフリーソフトファウンデーションを作って、GNUパブリックライセンスを作ってオープンソースを刺繍しようとした、リー、あと清水さんの研究してたリーナス・トーバルスがLinuxを作って公開してっていう話も引用してましたけども、ああいうふうにオープンソースで、オープンソースのもののやり方をソフトウェアの上で実現したっていうイベントがあったんだけども、それを僕とかはリアルタイムっていうか、共感してたんだけども、あれなんだよと、あれのAI版なんだよと、今のやつはって言うんで、ああ、そういうことだね、やっぱりねっていうふうに思ったし、じゃあ僕はどっちにベッドするの?どっちに立つの?って言ったら、もう当然こっちやなっていう、そういう心情になるよっていう話なんですけどね。そう、だからAIの民主化なんですねっていう話になって、そうそうそうって言って、リーナスの話もここで言ってたんだけどね。いや、なんか清水さんの話面白かったのがね、民主化っていうのは、リーナス・トーバルスとかリチャード・ストールマンが王様になってるわけじゃないんだよっていう話だよね。だから、リーナスとリチャード・ストールマンが大喧嘩したよっていうような話を引用して、それが民主化なんだと。要するに誰か、一人が絶対君主みたいなのがいるわけではなくて、みんな好きな方に、いや自分の好きっていう主張を言えるっていうような、上に書いてるのもね、あの、私企業がね、プライベート・カンパニーがね、AIの民主化とかってね、民主化みたいな言葉をね、使うのはそもそもおかしいじゃんっていう、極めて正論を叩いてるわけですね。だって社長なんていうのは、民意で選ばれるもんじゃないんだから、そういう人たちが実現するものに従うっていうことに、それって臨権君主制だって彼は言ってて、僕は政治詳しくないんで、こういう制度はどうでもいいんですけども、要するに民主的じゃないっていう話はそうやなと思うし、王国じゃんっていうのはその通りやなと思うし、それは嫌だなっていう気持ちも共感してるんで、そういう意味で、そういう文脈で今のこの時代に、このタイミングで、ステーブル・ディフュージョンっていう組織っていうか、ボランタリーなグループがこういう成果をボンと出してきたっていうのは、本当に奇跡のようなAIの民主化の始まりでっていう、これ、白枠のところは僕のトランスクリプトなんで、これは清水さんの言葉自体ですけども、そうなんだなと思って、そういう出来事だったんだなと思ったってことですね。まず清水さんの話続くんだけども、長ったらしくなったんで詳細にしますが、何がすごいっていうことの一番一つ挙げるとすると、今回のモデルの公開のライセンスが素晴らしいって言ってるんですね。それはオープンソースの時のGPLくらいすごい発明だって言ってて、何かっていうと、今まではオープンAIとかマイクロソフトとかも含めて、自由に使っていいよって言い切れない状況がずっとあって、それは何か一言で言うとコンプラなんですけども、責任を取りたくないっていうことでみんながんじがらめになって、公開しなかったみたいなところがあるんだけども、今回のStable Diffusionのライセンスっていうのは何かっていうと、これ清水さんの言葉なんで、正しくはこの原文に当たってくださいね、ここにリンクがありましたけどね。俺たちはAIが出すものに対しては一切責任を取らない。これオープンソースのライセンス読めば、このプロダクトに対して無保証ですよってのは必ず入ってますよね。あれと同じセンスなんで、なんで今までAIのモデルにそれ入れなかったのか、僕は理解できないなって、自己的にね、コロンブスの卵的には思うんですけども、後出しじゃんけんですけどね。でも今回のライセンスのポイントは、自分たちプログラムを作ってる、あるいは提供しているStable Diffusionの組織はStability AIなのかな、このプログラムを作る結果に対しては責任を持たないっていうことと、じゃあ誰がその責任を取るべきなんですかっていうのは、作った人が責任を取れよっていうライセンスにしましたよっていう、まあ当たり前のことだねって清水さんも言ってるように当たり前のことなんですけども、らしいんです。それが素晴らしいらしい。まああんまりライセンスとかは普段から気にしない、静電説ってめんどくさいタイプの人間なんで、ああそうっていう感じですけども、このライセンスはCreative ML、マシンラーニングかな、Open Rail Mっていうものらしいです。詳しくきちんと法律に則って生きていきたい方はこちらをご覧ください。あとね、今回のこの長いおじさんのビデオを見て僕は思ったことなんですけども、深水さん、不活さんよりも深水さんの方が多分僕に心情が近いなっていうかエンジニアだなとは思ったんですけども、深水さんも僕からすると優しい人なんだなと思いましたね。深水さん今回自分でね、Stable Diffusionのモデルをただで使えるウェブページ、ウェブサービスを作って公開して自腹で運営してたみたいなんですね。で、なんでってその情熱はって言ったら、その自分のすげーっていう、今回のビデオでもすごい熱く語ってたんだけども、そのすげーっていう熱量をみんなに、みんなにも味わってほしいからそういうことをやってるっていうふうに言ってたのね。だけど世の中にはそうやって公開すると嵐がやってくるらしい。ただだーっつって使っちゃえーっつって、何にも文脈を読まない人が一人いて、すげーことになってみたいな、それには腹が立つっていうふうに言ってたりしてましたけどもね。でもそこに、僕はね、あんまりそういうふうに、みんな、一般の人まで含めて、エンジョイしてほしいっていうふうな広い心を持ってないので、そこはすごいな。いや多分、あれなんですね、そこが起業家っていうかね、社会でビジネスを模索するっていうセンスがあるかないかなんですよね。僕は、大衆に尻尾を抜く気がないので、多分そうなんだろうなって思いました、見てて。っていう話ですね。ここまで言って終わりだ。長いですね、はいすいません。以上、今のところ僕の目に入った2人のキーパーソンが、今回のステイブルディフュージョン革命っていうものに対してどういうふうな見方をしてたかなっていうのをまとめましたけども、それを見てね、僕、一気は何を思ったかって、今半分言いましたけども、前半の部分ね、深津さんが、今回パラダイムシフトみたいなのが起きてるよ、それは何かって言ったら、専門職能を民主化するみたいな文脈になってる。つまり、今だから専門職能って言われてるのはイラストレーターが念頭に当然あるわけですね。イラストレーターの職が失われるみたいな文脈で、みんなわーって、大衆は今盛り上がって、僕はあんまりその盛り上がりには、個人的にはあんまり興味ないんですけども、でも話がそっちの軸足になって、わーっと炎上系になってるのはなんか、ため息が出るなと思って。もちろん大事なことなんだけどね、職業としてイラストでやってる人たちがね。でも、まあいいや。でもそれは、今ここで深津さんの言葉ですけども、専門職能を強制的に民主化っていうことが、AIの機能によってそういうことが起きたっていうことなんだけども、これって技巧、職人技みたいなものが、技術、テクノロジーによって置き換えられるよっていう、近代化の流れそのものだっていう気がした。別な言い方をするぞっていうか、芸語と、家元の何代目みたいな芸語と、芸術っていうのが違うよっていうのを説明した岡本太郎が言ってる近代化っていうのと同じやなと思って。そう思ったときに、自分の立ち、またさっきも同じだけど、僕はどっちに立つんですか?って言ったら、当然立つ方はテクノロジー側に立つだろうし、芸術っていう方に立つんだろうなと思った。これ多分反感を買うような言い方になるんだけども、今こういう出来事が起きたときに文句を言ってる人っていうのは、ある意味既得権益を持ってる人が、その既得権益が既得権じゃなくなっちゃうって言って悲鳴を上げてるっていうだけなんだろうなと思って思いました。何の助けにもなくては。最近なんか批判されてるユバルハラリ、あいつはいいとこどりでチェリーピッキングしていろんな出来事を、その間を口がうまいからうまいことストーリーをつないで物語を作ってるって、ベストセラー作家だからそういう側面はあるでしょうって僕は思いますが、確か彼が言ってたように、今からの時代ってシステム、社会の変革っていうかのタイムスパンが人間のジェネレーションよりも短くなっているので、昔は一つの職、手に職をつけるとそれで一生安泰だったんだけども、今後は生きるイコール常に学んでいくっていう風にならざるを得ないよねっていうのは、それは良い悪いじゃなくて現実としてそうだよねっていう話があって、そのものだよなと思って、それを良い悪いとか僕が損するとかっていうのは言ってなさいっていう気分だというふうに思ったっていうのは、あんまり救いのない話をしてますけども。こういう状況で、どっちに自分の立ち位置は立つんだろうなっていろいろ考えると、やっぱり天道説が支配的な時に地道説が出てきた時とかを思い出したり、ここに書いてあるよね、奴隷制度が普通身の回りで行われている時に奴隷解放のアクティビティが起きてきたみたいなシチュエーションを頭に描いた時に、自分がどっちに立つかって考えれば、おのずと結果が出るように今のシチュエーションでも自分の立ち位置どっち?って言ったら、そうなるよなと思いますし、自分がどこに立つかみたいなセンスで別に言ってる時に、そういうふうに言うとすぐに勝ち馬に乗るみたいなセンスの話をしたがる人たくさんいますけども、僕はそういうのに興味なくて、自分がどっちに立ちたいって言った時にっていう思考の問題として、だから勝たないかもしれないんだけどね。特に日本の社会は保守的な社会だからね。既得権を持っている人が結構力強いから、僕が立とうとしている側が多分弱い方になりうる可能性もあるんだけどっていう、暗い気持ちにもなりますけどね。それが1点、パラダイムシフトっていう視点で僕は思ったこと。もう一つは、オープンソース。やっぱりオープンソース、なんで燃えるのかっていうかね。清水さんは明らかに熱量が上がってて燃えてて、僕とかも共感するポイントは絶対そこだなと思っていて、他の部分は多分僕とか個人的に考えても三末のことなんで。で、何だろうとやっぱり振り返って思うと、開拓時代っていうか、ああいう部分をやっぱり感じて、そこにノッサルジーなのかもしれないけど、そういうものを感じて、自由っていうかね。多分僕とか、あとさっきのおじさん3人とかは、いわゆるマイコンとかね、パソコン以前のコンピューターがないところからコンピューターができて、コンピューターって何役に立つのっていうところから、プログラムは面白いじゃんって、プログラムで何でもできる、つまりそれこそが自由への鍵だとかね。それを経験してる人間が今燃えてるんだと思うんですよね。つまり大企業が金でプログラムの自由を奪ってる状況から、やりたいことが自分で全部できる自由をもう一回取り戻したっていうところが一番燃えるポイントだなと。僕は少なくとも思っている。かつそういうのがね、ボランティアのコミュニティから来てるっていうのがやっぱり、さっきのね、フリーソフトファウンデーションのリチャード・ストロマン、グニューとか、あの辺を思い出させて、やっぱそこだよなぁと思うんですね。僕は今、企業プログラマーなんで、なんか自分と違うことを言ってるようなことっていうのはいちいち言い訳しなきゃいけない。僕は元々は学者らしいから、そっちの畑にいないんですけども。結局いろんな、僕整理ついてないんだけども、しばらく全経営フォーラムでも、全経営フォーラムはノンプロフィットですよね。これね、いわゆるコミュニティ思考の楽しさを優先して、アクティビティをやっていきましょうっていうもんで、そういうのも引っかかってるんですけども、つながりを感じてるんだけども、整理がついてないっていうのは、結局ビジネスかビジネスじゃないかっていうか、お金かお金じゃないかみたいなところに、全部やっぱりつながってるっていうと、なんか歪症化しちゃうことになるんだけども、つながってるよなと。つなげたところで、どういうふうに、いや僕の場合でいうと、お金じゃない方を正当化するのかっていう、論理立てっていうかロジックっていうか、成功のストーリーみたいなのを構築することが大事なんだろうけども、それがなんか、まだないなっていう気がしてますね。ファンダム経済とか、あの辺はあれなのかなって思って勉強し始めたんだけども、結論は出てないですね。こういうことを言っちゃうのが、僕は不活さんとは違うところなんですけども、っていう話だけども、何が今の世の中の問題なのかってことで、さっきも言いましたけども、僕は2つ問題を今回の出来事で感じて、1つはコンプラね。コンプラででかい組織はがんじがらめになってっていうのは清水さんもずっと言ってましたけども、それが世の中を悪くしてるみたいな話がありましたけども、それは本当にそう思うし、見渡せば、それって組織がでかいっていうことに限らなくて、個人レベルでもコンプラを事前に忖度して、怒られないように無難に生きる人が多いし、事流れで生きてる人が多いっていうのは、なんかあの、いろいろとね、自由じゃないなと思うところの一つですね。で、もう一つは、これも清水さんの話であって、ああ、こういうファクターが足を引っ張ってるなと思うことが、フリーライダーね。あの、清水さんが情熱でやってることに、そういう文脈とか、読めないのはしょうがないよね。読めない人に提供してるわけだからね。大衆っていうのはそういうもんなんだけども。それで全部ダメにしちゃうおバカさんたちが、マジョリティとして存在してるっていうのは、織り込み済みでなんかうまくいくようなシステムっていうのをなんか考えないと、世の中うまくいかないんだろうなと思っていて。特にボランタリーでやってる組織っていうのは、こういうそういうフラジアルな組織を、簡単に壊れますからね。そういうのを壊れないよう、壊れる要因を排除するっていうのを穏便に行うシステム、フリーライダーを排除するみたいなね。なんか必要なんだろうけど、これも答えがないんだな。っていう風に思って。ここにちょこっと書いてある。この2つを打破するポイントは、僕は素朴なレベルでやっぱりメリットクラシーかなと思うんだけども、そうすると、多分世間は批判的なんだろうな。多分弱肉強食とかそっちの方に行って、そんなタフな世の中に生きていったくないっていう方向に行くのかな。よくわかんないけども。だからソリューションはないんですけどね。今回の出来事で。でも、面白い世の中になりそうだなと思うし、引っ掻き回す方に僕は行きたいなと思うんで。って思いましたっていう皆さんへの情報共有でした。つまり、ステイブルディフュージョン革命の話が今のあれでした。ということで、一旦疲れたんで、座談にします。プレゼンモードを一旦外します。