S32E02 AI 小説と AI 挿絵の進捗〜もしかして時代が変わった?

29 de abril de 2023 • 38min
ZENKEI AI ポッドキャスト
Ouvir episódio
ZENKEI AI ポッドキャスト、シーズン32は2022年8月31日に開催した ZOOMライブの模様です。
この日のテーマは、直前に迫った「技術書典13」への最終企画会議と、急遽追加の話題「Stable Diffusion 革命」でした。
エピソード2は、「AI 小説と AI 挿絵の進捗〜もしかして時代が変わった?」です。
当日の市來の発表資料
このブラウザでは再生できません。
再生できない場合、ダウンロードは🎵こちら
ビデオ見れる人はこちらからご覧ください。
(以下は、OpenAI の Whisper を使って文字起こししたものを修正したものです。)
** 注:以下は未編集の草稿です **
こんにちは。ZENKEI AI FORUMです。
で、パート1いきますね。前振りのね。 スティブルディフュージョン革命の話をいきますよ。AIフォーラムですからね。 今このタイミングでAIフォーラムの話をするときにスティブルディフュージョンはね、 初じゃないでしょっていう。どんなに忙しくてもね。 とりあえずでも話を順番に進めます。そもそも数ヶ月前からね、技術書店の出し物何するっていう話で、僕が口走ってたのは、その時のダリー2ね。まあ後で行きますが、すごいねっていう話があったんで、あれに差し絵を描かせて、GPT-3なんかに文章を書かせて、AI小説を出版して出したらいいやんっていう、気軽にアイディアを出したのね。で、まあその話です。まず、AI小説のね。もうだって9月10日に技術書店始まりますけども、進捗はどうなっとるんだっていう話よね。忙しかったんで、完成してないんですけども、試行錯誤の話ね、します。今言ったようにね、仕事を忙しかったのが、いろいろ落ち着いたのが8月の下旬になりました。 今日31日ですけども、だからこの辺の話は過去10日ぐらいの話なんですけども。よしと、文書生成系で、でもね、古き良きっていうかね、昔のランゲージモデルで、こんにちは、こんにちは、こんにちは、こんにちはってハマっちゃってレンダーするようなものとか、いうレベルのものを今更出しても面白くないし、本当の小説みたいなものにしたいわけね。 GPT-3がすごいすごいって言われているのは人間レベルだっていうことね。 そうすると、僕もその時点で日本語を直で生成するのを諦めて、英語で書かせて、英語を自分で翻訳してもいいし、Google翻訳みたいなもので翻訳したものを、 芸学を自分で構成するとかしてもいいし、みたいな英語ベースで小説を書こうみたいなね。のは当初から考えていました。やっぱ使いたいのはGPT-3かなと思って、GPT-3、オープンAIのサイトに久しぶりに行ってみました。これね、ベータの時にアカウント申請して、その時はいくら分のクレジット、 タダで使えるよっていうのはもらってたんだけど、2年くらい前かな、もうあれね。エクスパイアしちゃってるんで、 フリーで使える部分あるかなと思って久しぶりに見に行ったんだけども、ない。なんか9月から値段が少し下がるよみたいな、 ポップアップがポンって出てましたけども。実験小説にどれぐらい初期投資するのって、これ趣味プロジェクトなんで、できればフリーでできる範囲でまずはやりたいなっていうのがあったんで。わかったか。じゃあなんかフリーで使えるところないかなっていうふうに探したら、 パッキンフェイスにWrite with Transformerっていうページがあった。 こんなのあるの?まとめサイトみたいなのですね。行ってみたらDistill GPT-2とか、なんかね、これはアーカイブでデータセットで学んだモデルなのかな。 なんかいくつかすぐ使えるウェブページも文書生成、書く。 僕使ってないけど、YouTube見てたら散々出てくるグラマリーとかさ、今時もAIでライティングをヘルプするサービスたくさん出てますけどね。そういうのをこういう相当なんですかね。 僕使ってないんでよくわかんないけど。でもこのね、TransformerのWrite with Transformerっていうサイトに行けば、なんかもうインターフェース揃ってるんで、よしこれ使って書いちゃえ。書いてみよう。どんなもんが書けるかっていうのを。書いてみました。それにご紹介。僕のね、書上小説ね。 書き出しはね、ちょっと僕が持ってたネタね。ネタっていうほどじゃないんだが。I'm sitting in a thing like chair but a little bit cold.A thing like chair but a bit cold. And thinking about the world...なんかちょっと冷たい椅子みたいなものに腰掛けて、世界について考えてた私は?って言って、さあAIさん、この続き書いてよっていう風に振ってみた。で、使ったのはこのDistill GPT-2っていうモデルを試しに使ってみました。そしたらね、the world around me, hugging face or smile.This is the place where you can share a blog and see. なんかブログとか出てきたね。これちょっとなんか違うなと思ったりして、色々試行錯誤した結果、こんな感じにね、いろいろしばらく書かせたけどなんか違うんで、なんか自分でね。このハイライトされているのがこのモデルがサジェストした文章で、いやいや違う違うって自分が書いたのがプレーンに書かれてるやつでとかって、なんか教則でね、ここまで書いてみたのね。あの、英語読みませんけども、これぐらいの分量でとりあえず飽きてきたんで、分かった分かったと。当初の予定通りね。 まずGoogle翻訳で、これをまず日本語にしてみよう。日本語にしてみました。Google Translateに入れてみました。椅子のようなものに座ってますが少し寒くて、周りのどの子も考えています。なんとかなんとか。日本語にはなっとる。 で、でもなんかね、自分が書きたいのと違うんで、これを日本語を自分が編集者になって構成して、 自分が書きたいものに寄せていった文章が、これがね僕のAIヘルプ小説の最初です。 ちょっと読んでみますね。せっかくなんで。私は少し冷たくて硬い椅子のようなものに座っていた。 そしてその時、自分の周りの世界について考えていた。どれだけ考えていたのかわからないが、ふと目の前に今まで見たことがない奇妙なものがあることに気づいた。説明するの難しいのだが、空間の亀裂みたいな何か。それは暗くて見えにくいが、わずかに不規則に明滅していることが、それに気づいた今ははっきりと見える。これは何なんだろう。こんなものを今まで見たことがない。でもしばらく眺めていると、ただの割れ目ではないことに気づいた。その向こう側に何かの存在を感じた。何かが動いている気配。耳を澄ますと、わずかなノイズが聞こえてくる気がした。集中していると、誰かが喋っている声みたいだ。とても小さいが、気づいた今はそれが声であることは明らかだった。しかし、それが喋っているのは、ようは聞き取れない。とかなんとかね。でね、その、それが喋っている。もうちょっと続き読むね。数分それに聞き入っていた時、もう一つ奇妙なことが起こった。急に声が明瞭になる。その時、銀河系の外から来たのだから、と言った。少なくともそう聞こえた。私は完全に混乱した。一人で座っているその場所に、突然人が喋りかけてきたのだ。しかし同時に、今目の前で何が起こっているのか興味が入った。その声が、今は明瞭に聞こえる声で喋っていた。小さな宇宙船があったの。彼女はかつてアンドロメダからやってき、それでやってきたの。これどこまでがAIで、どこからが僕だったか、ここを見ればわかるんだけど、アンドロメダって言い出したのは多分AIなんだよ。叫びとかはね、僕なのね。椅子みたいなものに座っては僕でしょ。で、じっと見てたとか。ブリンキングも僕が書いたのかな。 けど、結構ね、AIがね、広げてるんだよね。 これ面白いなぁと思ってたんだけど、途中で疲れてきた。で、とりあえずここまでできて、あー、こんなもんかと思いましたけども。 この続き読みたい人いる?この続き読みたい人がいるんだったら僕もうちょっと頑張るけど、これはこれで放置かな?わかんないな。はい。そう、この後どういうふうにするつもりだったの?っていうか、構想はね。 これ日本語にしたでしょ。これを、でも、 ランゲージモデルは英語ベースのものを使ってるんで、これをもう一回英語に翻訳で戻したものをAIに加わして続きを書けみたいなプロセスを ずっとやっていこうかなと思ってたんだけど、疲れちゃったのと飽きてきたのと、 長い文章を入れて読むっていうのは、あれどこまでできるんだろうなぁって、ちょっと疑問に思ったのとか色々あって、 まあいいや、これはこれで一旦終了っていうかね、思ったっていうことです。で、AI小説にダリーみたいなやつで、AI差し絵を書くっていうのがもう一個の目玉でした。そっちの方もね、この段階で調査してみよう。 時間がね、やっとね、やりたいやりたいと思ってたのが、7月と8月の前半、中旬まで、指加えて見てた感じで、時間がやっとできたんで、よしっていうこと、時間の流れ的にはそうなんです。ということで、差し絵を書かせる話に進みますが、 AIでね、イラストを書かせようっていう話題が、今言ってる指加えて、うらやましいな、みんな時間があって。僕もやりたいのにと思ってたのは、Twitter見てたんだけど、その中でもね、ふかつさんが、ダリー2の招待アカウントが多分来たのが、7月の頭みたいなね。7月の3日ぐらいからダリー2にドーンと入ってきて、いろいろとやられてて、そのツイートをね、日夜指加えて見てた日々が続いたんですけども。で、8月の末にね、後半にね、やっと時間が取れたんで、ふかつさんのツイートを、時間を遡って、さて、俺もやりたいけど、どういうふうにダリーにコメントしたらいい絵が描けるの?と思ってね、そのノウハウを学ぼうと思ってね。ちなみに、このふかつさんは注目に値する人で、これ以外は僕詳しく知らないんですけども、ノートの人なのかな? デザイナー系の人ですね。で、7月の3日にこういうツイートして、もうダリーのプロンプと攻略してた人ですけども、当初、早い段階でね、7月の12日とかにロボットで、ダリーでこんなのできる、ダリーだったっけね、他のやつだったっけね、ミッチャーにかな。こんなのできるよっていう記事を書いたりしてね。 これはすごいよね。だから、こういうのがあったら本当にいいよねっていう感じで、俺もやりてでも忙しいっていう日々を過ごしてた。で、僕もね、こういうのを見てすぐにアカウントくれってオープンAIにメールしたんだけども、当初はもらえなくて、いいよいいよ、どうせ俺はと、出遅れたぜと思ってたんだけど、7月のね、8月の頭ぐらいかな、アカウント来たんですよ。来たけど、さっき説明したように忙しくて、来たけど遊ぶ暇がないと。で、まぁしょうがないなぁと思ってたんで。マウスがおかしくなっちゃった。はい、バッテリー切れたんだ。OK、いいです。でも、時間が取れたんで、今言ったようにね、深津さんのツイートから学べるところを学んで、自分の来たDARLY2のアカウントで、よしじゃんじゃん、イラストを生成するぜと思って学びました。で、いくつかね、深津さんのツイッターのタイムラインから、羨ましいなぁっていうか、いいなぁっていう絵をね、スクショ撮りましたけども、こんなのがね、描けるのね。いいなぁ。俺も描きてい、思いましたけども。これ、あのDARLY2だけじゃなくて、その後出てくるMIDJOURNEYとかSTABLE DIFFUSIONとか混ざってますけども、基本的にね、AIがアニメ、イラストを描く。で、それの集大成というかね、総括的なノートが8月9日の段階でね、どういうプロンプトのTipsがあるよ、みたいなのはまとめられてます。あと、8月の下旬ですね、22日に、これはSTABLE DIFFUSIONがモデルを一般公開、フリーで公開するぜっていうタイミングでですね、ついにこの変革が一般大衆に降りてくるっていうんで、僕が上に書いたね、STABLE DIFFUSION革命っていうのが起きる前夜みたいなタイミングで、思いを綴ったノートとか、こういうのがあって、あったんですよ。で、こういう流れを僕は忙しごとで忙しくて全部逃してたなぁと思って、悔しいって、後でこういう風に読んで、フニャーと思ってたっていう話なんですけど、それはまた後で振り返りますが、それよりもまず絵を描こうっていう話ね。で、アカウント、僕にアカウントが来たのが公開、7月の30日だ。アカウント来ました。で、最初はね、50枚、1月50枚描いてもいいよっていうクレジットがついてね、アカウントが来ました。でね、やったーって書いてますけども、わかりにくく、ちょうどね、7月30日って書いてあるように、1ヶ月で50ってどういう風にカウントするの?俺もしかして7月30、31の2日で50使い切んないと、これなくなっちゃうの?とか一瞬焦ったんですね。結果論を言うとですね、7月30から8月29までの間に50枚作れるっていう話でした。っていうのが、8月の30日になった時点で理解できます。その間何枚作ったのかっていうと、50枚全部使い切らなかったんでちょっともったいなかったなっていう気がしてますのは、これは貧乏症なんだな。そんな広い心でいればいいじゃんっていう話です。で、これが記念すべきっていうんじゃないけども、最初にいろいろトライした中のTwitterに流した僕の絵です。 この時は、深津さんのプロンプトのTipsとか何も読まないで、もうただ英語でプロンプト書かなきゃいけないんだけども、ワンコに、Peace and Prosper, Live Long and Prosper やらせようと思って、一生懸命頑張ったんだけど、ワンコの手はこれだからね、僕はできないよね。これがベストだった。まあまあね、いいかと。で、まだこの時忙しかったんで、これで放置してたのね。で、やっと8月の下旬、ついこの間になって時間が取れたんで、よっしゃ!ってさっきの深津さんのノートとか色々読んで、ああ、奥が深いなぁと思って、そんな簡単にはできないんだなぁと思いながら、英語のね、これDarliを使いまくってるユーザーのコミュニティなのかな、そこが出してるプロンプトブックっていうPDFファイルがネットで公開されてますが、これも一通り見て、ああ、なんかやっぱり色々ノウハウみんな、魔術とかね、深津さんとか言ってますけどね、魔法?魔術?魔法の言葉を開発すればすごい絵が描けるっていうようなね。で、OK、時間が取れたって言うんで、8月の25日にちょっと描いてみた。どう?あのね、時計をネタになんか面白い複雑な、ごちゃごちゃした絵が描けないかなと思って撮られてたんだけど、あんま思った通りに描けないね。って言うんで、実験はいいと。で、さっきのね、多分本田さんは見損ねえだと思いますが、僕、GPT-2で書いたAI小説の途中一番ぐるぶんぐらいはとりあえず作ったんです。それをネタに、それの差し絵を、じゃあDARLIE2で描いてみるぜっていうのが今、ここからね。で、描かしました。 だから、まああれだね。本田さんに一応、シェアじゃなくて、ネタを共有しとかないと、フォーもフーも言えないですからね。 深津さんと一回仕事したよ、一緒に。深津さんと昔一緒に仕事した。 本当に?どんな人?なんか優しそうな人だよね。淡々としてる。すごい淡々としてる。 UXでお世話になったことあります。これがね、AI小説。 僕の手がいっぱい入ってますけども、半分近くはAIが書いてる。私が椅子みたいなものに座って考え事してたら、声が聞こえてきて、女性の声が聞こえてきて、その女性を言うところには、彼女の目の前に小さな宇宙船があって、それはアンドロメダからやってきて、どうのこうのとかっていう話をする女性の声が聞こえるっていう小説なんですよ。それをネタの、それの差し絵を書こうっていうところまできたんだよね。で、ダリーのアカウントが使えるようになったんで、買って書くぜって言って、書かせたのがですね、痛いでしょ。ダリーはね、こんな感じの絵を書いてくる。アンドロメダじゃない? アンドロメダはね、どこに現れてるか、多分ね左の絵はね、彗星みたいなやつがアンドロメダだと思うね。真ん中のやつは三日月みたいなのが実はアンドロメダなのかもしれないね。右の絵はね、わかんない。いろんな要素をね、なんかそれっぽくなるようにね、クリフィンに立っているとかね、入れちゃったから、なんか別なもんなんだけど。でもなんかダリーにこうやって描かせたものは、僕が想定してたイメージの小説のカバーじゃないな。僕は、今ここに書いてある、未来からのホットライン。こういうイメージの小説だと思ったし、こんなイラストっていうかね、を脳内に早川か草原川の表示みたいなイメージしてたんだけど、これなんか思いっきりね、自分の会えるものになっちゃってるなぁと思って。少年少女小説になって。いや僕、嫌いじゃないですよね。まゆむらタルフとか大好きだったんですけども。なんか違うなぁと。いつきさんの頭の中のSFって、方眼とかそういう前世紀のなんか。前世紀って言っちゃうんだ、ひどいな。ひどいな、私より扱いして。いや、方眼好きだよ。方眼好き。私も好き。多読じゃないんで、数少ない。しかもこう、多分ね、マニアからするとメジャーどころをつまみ食いしてるだけなんで。超メジャーだけどすごい面白いね、方眼は。僕これ好きなんですよ。他のやつもね、面白いですけどね。男と女が出てくる感じで、これを未来からのホットライブ。まあ、達成しました。ちょっとね、ダリー、僕のプロモプトが良くないんですけども、ダリーは分かったという気分だったのと、なんか別なラインね、ステイブルディフュージョン出てきたんで、ちょっとそっちを深掘りしようっていうのが今からの話です。何か、何か、さっき言ったように8月の下旬になって、ふかつさんのツイートを見てたら、ダリーを宛に僕は、まとめを見ようと思ったら、ダリーの話も全然出てこなくなって、ミッドジャーにも出てくるんだけど、ステイブルディフュージョンがーって話ばかりになって、なんじゃなんじゃと思って、いろいろ見てたんですね。結果論というか、まとめを書きますが、どう思う?どう思う?というかですね、本田さんに説明ね。僕自身も7月から、7月頭から、6月終わりから、2ヶ月くらいちょっと仕事にフォーカスしてて、全然見れてなかったんですよ。なので、この辺の流れって、つい1週間くらい前っていうか、1週間くらい前かな、文字通り。やっと時間が取れたんで、タイムマシン的にね、後置いてきて、時系列をレトロスペクティブに見てて、こんなこと起きてたらもったいないっていうか、俺リアルタイム食い損なったみたいな感じの出来事、今は悔しいまとめをしてるんですけども、振り返ると、ダーリン2がね、テストアカウントどんどん出し始めたっていうのがトリガーなんですけども、ユーザーがね、テスターがね、こんな絵ができるってどんどんツイート、ツイッターにね、投稿してみんな盛り上がってたのがフェイズ1。だけど、今言ったように、1月に50プロンプトしかタダでできなくて、お金をね、付活さんとか課金、いくら課金したとかって書いてあったけども、そういう勇気ある人は、そうやってじゃんじゃん使って、どうやらすごいやろうってドヤ顔してたっていうのがフェイズ1で、投稿してたら、ダーリン2はアカウント申請してもすぐに来ないから、みんな指を加えてる状態で悔しいなーってところに、ニットジャーニーが出てきて、ダーリンはディスコードに行って、何とかすればすぐに使える、お金も払えば使えるみたいな感じだったんで、そこでダーリンができないフラストレーションがここで爆発して、ロケット、2弾ロケットがここで点火されたわけですね。ツイッター上でもっと盛り上がって、こんなドリーミーな、ミッドジャーニーはアニメっぽいっていうかね、すごいすごいって言って、もっと盛り上がった。ただ今言ったように、ダーリン2はアカウントも結構渋いし、そもそもモデルは公開されてないと。ミッドジャーニーは、あれこそクローズで、リモクティックでほぼやってるみたいな感じで、AI研究者とかAIホビストとかは、なんやつまんねーなーっていう感じのところに、そのAIホビストっていうか、ハッカーっていうか、フリースピリットを持った人たちが集団がいて、ステイブルディフュージョンっていうモデルを、オープンソースでフリーで、ダーンと公開しちゃったっていう、三段ロケットがついに起きたのが8月の中旬?中旬かな?っていうのが起きてたらしい。僕が今上にステイブルディフュージョン革命って言ってるのは、3番目のところを言ってるんですけどね。お金、貴族たちが遊んでるところを革命を起こしたと。で、ふかつさんもそういうふうな捉え方を多分してるし、しみずさんのビデオを僕、3日前かな?見て、しみずさんってしみず、しみずりょう?りょうね。youtube、youtuberの人と対談してるのをたまたま見て、盛り上がってて、ああいうのを皆さんに、全系AIフォーラムの皆さんに共有したいなと、今日は思っています。ということで、まあそれは背景としてね、そういう流れがあったんだということで、みんな使える、公開されている場に僕が戻ったらもうそうなってたから、よっしゃ、じゃあインストールしてみようってしてみました。取り残されたんだけども。で、取り残された分のメリットは何かって言ったら、もうどうすればいいよっていうの。ディレクションがきっちりもう出来上がってた。僕が一番確かそうな、ハギンフェイスのエントリーにStable Diffusion with Diffusersっていう、もうページがあって、ディレクションがあって、これに沿ってやれば、沿ってって言うほどでもない、本当に驚きなんですけども、このページに従ってやっていけば、簡単に自分のマシンで、自分のGPUマシンで、Stable Diffusion動いて、絵がじゃんじゃん生成できるようになりました。実際には、僕のノートブックのこれスクショですけども、会社にあるGPUが載ってるマシンね。一番手間があったのは、ハギンフェイスのユーザートークンって言って、なんか承認関係でやっぱりヤバいものとかを出すなよっていう話があって、その辺は多分なんか担保しなきゃいけないんだろうなという感じだけど、モデルを出すのに、要するに同意したよっていうライセンスにね。そこが一番逆に面倒くさかったんだけども、プログラム的にはPIPっていう、Pythonのパッケージコントローラーって言って、ライブラリーをインストールするのプログラムがあるんだけども、それ一発ポンってやればもう全部セットアップが終わって、プログラム自体も、絵を描くプログラム自体も2行、2行は言い過ぎかな、3行、4行でもうすぐプログラム、絵が出せると。それぐらいもう整備されたもんで、AIフォーラムのレベルでもない、本当に素人でも誰でも作れる状況だったっていうね。もうその皆さんのStable Diffusion、Stability AIっていうコミュニティなのかな。彼らの働きには頭が下がるばっかりですけども、これ一発目にできた、なんだっけ、Photograph of an Astronaut Riding a Forceっていうサンプルに出てたプロンプトで描かした、512x512のハイレゾナ、フォトリアリスティックなフェイク絵ね。これが一発で出た。しかも僕の環境だったら、これ4秒とかで1枚生成できちゃうのね。僕の使っているGPUは2080Tiなんで、パーソナル向けだけでもそれなりに上の方のものではあるんだけど、でもめっちゃ高いやつでもなくて普通なやつなんだけども、4秒で1枚できるんやったら、これ試行錯誤とかもうやりまくりじゃんっていう感じで、本当に民主化されたなっていう感じですね。で、よっしゃと。 絵が作れる環境が手に入ったら、AI小説の差し絵を描かせなきゃいけない。さっきの続きですね。はい、ステイブルディフュージョン編いきますよ。下に絵がありますけどね。ちょっと大人っぽくなってきたね。 大人っぽい。ゴッホを入れたらゴッホすぎるんだね。 うーん。 でもなんかだんだんこう、あの早川とか草原とかの表紙に寄ってきたかなっていう感じだよね。うん。 これありがちですよね。SFの文庫本の表紙とかね。うん、早川っぽい。 これなんか左下のやつはなんか唯一子供っぽくなっちゃった。多分これ、男と女じゃなくてボーイとガールにしたらこうなっちゃった。なんかね、いや面白え。面白えっていうのと同時に、この辺で僕飽きてきた。なんかね、これは僕の求めるクリエイティビティじゃないなと思って。なんかつまんなくなって、半分つまんなくなって。 うん。 これはこれで面白いなっていうのはある。これをどう使うかっていう部分でね、楽しみとかね。 うんうんうん。まあそれを置いといてAI小説の差し絵はこんな感じでできそうだなっていうのが分かった。技術的な話に戻って、Stable Diffusionは今言ったように、プロンプトテキストから画像を出すっていうことがまず、まずは書手としてはできます。Darly2のインターフェース使っていれば分かりますけども、画像をアップして、一部分を消して、ここをここらのところ埋めてとかっていう風なインターフェース機能もあるんですね。で、Stable Diffusionそういうことをやろうと思ったらできるの?っていう話が、まあすぐに出てくるんだけども、すぐにできるようになりました。っていうのが、開発者の一人の人のツイートでね、こうやったらできるよって。もうこれ8月のいつだ、出たんですよ。できるじゃんと思って、イメージとイメージっていうやり方なんですけども、画像、プロンプトだけじゃなくて画像も上げて、画像ベースでプロンプトに従った絵にしてねっていうこともできる。実際にそれをStable Diffusion、ローカル自分がインストールした環境でどういう風になりますかっていうのを、今この全系アイフォーラムを見てる人たちにね、Watching Nowは2人しかいないんで、誰もリアルタイムでは見てないんだけど、アーカイブで見る人のためにね。これできるんだよ、みんな。ダリーにお金を払わなくてもね、でもGPUが乗ったPCがうちにないと、Googleコラボに行けばただでできるかな。うん、そうね。で、どうやるかっていうと、これももうPIPインストール一発でできて、一応説明しますね。Diffuserっていうパッケージの中のExamplesの下にスクリプトが入ってます。なので、ローカルに、本当はインストールされてるんだけど、システムのどっかに入ってるのめんどくさいんで、僕はローカルにもう一回クローンし直して、このExamples下のスクリプトを直接読み込むように、パスを通して、そっからStable Diffusion、Image to Image Pipelineっていうものを構成すれば、Image to Imageで画像が生成できるようになりますよっていう話で、これだけ。で、作ったんじゃなくて、これをさっきの生のStable Diffusionで生成したこの絵を入力にして、プロンプトをね、短いプロンプトにしちゃったんだな、最初は。実験的に。ただこれだけね、Detailing Oil Painting by Vincent Kaho、なんとかなんとかなんとか、Perfect Lightingだけで、さっきの画像をStable Diffusionで作り直せって言ったら、こんなのになっちゃった。まあ、ごっほんみたいな、これなんかスタンドの照明みたいになっちゃってる、月がね。AIが作った画像をいちいち評論してもしょうがないんで、あ、あったねっていうだけの話ですけど、これをね、繰り返したい。まずもう1回プロンプトを戻して、男と女が座って話して月があってとかっていうのを戻して作り直したら、こうなって。ああーっつって画像ベースにね。で、オイルペインティングはやめて、何にしたのかな、Expressive Detailed Realistic Landscape Illustrationにしてみたのかな。したら、こんな感じになって、なんかね、これさっきもあったの。これこれどんどんこういろいろ実験していった結果ね。だんだん月が月じゃなくなってきて、しかもなんかおならしてるみたいな、なんか噴射してる。これUFOじゃん、みたいになって。ああーっと思って、それは面白いんだけど。で、もう1個ね、あの今説明したのは、このイメージツーイメージっていうのは入力画像とプロンプトで新しい画像を作りましょうだけど、インペインティングってアプローチもあって、それは何かっていうと入力画像に対してマスクっていう、ここを消して、そこは使わないで、逆にそこはゼロから生成して、かつプロンプトでやってっていう風な方法もできる。それも提供されてたんで、それも実験しちゃえって、インペインティング版ね。で、この月じゃん、元月だったこの変な惑星がおならしている部分を消そうと思って、右側がマスクね。で、白いところを消して、全体をこれを入力にして書き直してっていう風に命令した結果がこいつ。おならは消えた。マスクはこういう風になるのかと思って、で、僕、インタラクティブなGUIツールとか、今このジュピターノートブック上に実装するのがもうかったらくてやる気がなかったので、マスク画像を4通り準備して、4等分して、右上、右下、左上、左下を消せっていうマスクを4つ準備しておいて、機械的にね、適応してみた。一番最初これどこだっけ、右上だっけ、右上、マスク3だから右上かな。右上、これもなんか変えてって言って、女の子を変えてるから左下を変えたんだな、こいつは。で、こういう子は何を変えたの、右上を変えたのか、ワックスを変えたのかとか何とかやって、まあこれは面白いと言えば面白いし、不運と言えば不運なんだけど、よしわかったぞ。で、マスクを適用してかつプロンプトも変えてみようって言って、オイルペインティングを戻して番号を入れ直してとかっていうのをやってみたと、一部分に。そしたらこんな感じになって、あ、面白いじゃん。月だけ番号風になって、みたいなね。男と女の人もなんか雰囲気変わってきてるね。まあこういうふうにコントロールしていろいろできるねっていうのがわかって、これはこれで面白いおもちゃなんですけども、さっきも言って僕自身はちょっと半分飽きちゃって、こうこうこうこうこうなんですねって思って、多分もっとすごい結果とかを出せる魔法の呪文を僕がきちんと見つけたらまたノリが変わってくるんだろうけど、とりあえずこういうことができるよっていうのは確認したっていう話ですね。