ダークサイドにようこそ!

限界クリエイターのブログ

画像生成AIとの個人的な付き合い方

※こちらは「画像生成AI Advent Calendar 2022」18日目の記事です。

 

2022年に入ってから画像生成AIが話題になった。Text-to-Image といわれる形式の機械学習モデルで、入力した文章をもとにした画像をAIが生成してくれるというものである。春頃にはOpenAIのDALL·E 2 や David Holz たちによるMidjourney など高品質の画像が生成できるモデルが登場し、これらが一般ユーザでも使えるようになるとSNS上にはAI生成による画像が溢れるようになった。さらにオープンソースであるStable Diffusion の登場により、ファインチューニングで好きな画風になるようコントロールしたり様々なツールにアドオンとして組み込まれたりと活用の場はさらに広がった。

一方で様々な問題も可視化されるようになった。上記した高品質な画像生成AIたちはインターネットの海に散らばる大量の画像を無差別に学習しており、もちろんその中には「AIの学習なんかに使ってくれるな」という人もいるわけである。これらのAIで生成した画像が出回るようになった時はそういった問題を取り上げる人も少なく、見かけるのは「楽しい楽しい〜」といって面白画像を垂れ流すケースがほとんどであった(※主観)。メディアアート界隈、特に機械学習系の技術を取り入れている人たちは問題点も含め敏感に反応していた気がする。私がそっち寄りの界隈に身を置いていたのもある。ちなみに、法律上はネットから収集してきた画像をAIに学習させるのは問題ないとされている。詳しくは「著作権法第三十条の四」や弁護士である柿沼氏の記事を参照するのが良いでしょう。

楽しい期から少し経過した夏頃、国内産のAIイラスト生成ツールである mimic が発表された。学習データとなるイラストを用意すると誰でも自分の好きな(風の)イラスト画像を生成できるようになるといった感じである。こちらはリリースされてすぐに炎上し、数日と待たずサービスは公開中止となってしまった。イラストレーター界隈はトレパクに厳しいことで有名だが、誰でも他人の絵を真似できるようになり且つ売買も可能となると無視できなかったのであろう。ただしばらくすると、技術の進歩は止められないし海外サービスがやりたい放題するだけではないかと文句を言う人も増えてきた。今となっては利用規約が見直されたmimicβ版もリリースされ、Stable Diffusion の登場もありAIを用いた制作・創作がだいぶ一般的となり受け入れやすい土壌ができつつあるように感じる。

 

ながながと前提となる状況を雑に書いてみた。調べたらすぐ分かるような内容を書くのは面倒くさい。ただ自分の考えや独り言をつらつら書き残していく上で、こういった情報も記しておくべきかなと一応説明した次第である。本記事の残りは個人的な感情を垂れ流しているだけなので「ふーん、そんな人もいるんだな」ぐらいの気持ちで読むのがオススメ。

 

先人へのリスペクトを持てい

「人が学習するのとAIが学習するの何が違う」「人間も無意識化で先人の作品をパクってる」「技術の進歩は止められないから水差すな」「法律でOKなんだからいいだろ」といった意見を擁護派からよく聞きます。「まあたしかに」とも思う。私もAI技術を制作によく使うので、あんまり水を差したくない。ただ学習データに何使ってるかはっきり書いとけぐらいは思う。先人へのリスペクトなんて書くとジジイ臭くも感じるがまあこれに尽きる。いろんな作品があったおかげで今のお前があるんだろと思う。AIも同じ。技術者が技術のためなら何でもあり感覚で物事に取り組んでいる様子は見ていてしんどい。まあ昨今の画像生成AIはなんでもかんでも学習しちゃってるので無理だろうなとも思う。

創作=イラストの流れ強い

AIでイラスト制作支援!な投稿がバズってるのをよく見る。Twitterのユーザ層にもマッチしてるのかなとも思う(これは偏見が入ってるかも)。それに関しては別に問題じゃないし、絵描き&エンジニアです的な人たちがそっちの支援ツールを作るのは理にかなっている。私もイラスト練習してた時期あるし余裕あればまた再開したい。ちなみに数年前、人工知能全国大会に参加したときもイラスト制作支援の事例ばかりだった。ただ気になるのは、「創作支援!」だけを大きく打ち出して、中身はイラスト支援(生成)だけな事例をぼちぼち見かける。創作の未来は云々といってイラストの話しかしてないやつも見かける。創作ってそれだけやないやろとその度に思ってしまう。うーん、私の心が狭いのもあるな。

「ラーメンを食べる樋口円香」のノリはあんまり好きじゃない

アイドルマスターシャイニーカラーズに登場する樋口円香がラーメンを食べている画像を生成するのが一時期流行っていた。なぜ流行ったかというと、箸の概念をAIがよく理解できなかったのか、彼女は手づかみで麺を掴んでおりその様子がシュールで面白いからであろう。たしかに私も初見時はちょっと笑ってしまった。ただ、アイマスやってる人もやってない人もラーメン円香の画像を生成しまくるようになって、そのたびに彼女本来の魅力が損なわれていっているような感覚になった。今回はたまたまシャニマスのアイドルが対象となったが、他作品でも似たようなことがあるのだと思う。絵描きが二次創作のネタ画像を投稿する流れは昔からあるのだが、画像生成AIの登場で消費スピードが一気に上がりその空気感が自分の中で苦痛になっていたようだ。

変なデータを集めて自分の趣向特化型AIを作るのは楽しいよ、大変だけど

愚痴ばかり書いているが、画像生成AIは使っていて楽しいし自分も作品制作によく取り入れている。人間の思考の外側を突いてくる絵が出てくると感心するし、GenerativeArt 界隈のノリもある。最近は流行りすぎてちょっと引き気味になっていたが、去年は私もVQGAN+CLIPあたりでよく遊んでいた(当時は今ほど品質が高くなく流行らなかったのかも)。

流行りの大規模画像生成モデルで遊ぶのもいいけど、自分な好きな画像だけ集めて学習させるのも楽しい。コスパは正直悪いけど。私は近所の信号機電柱の画像を学習させている。Deep Learningは「どんどんデータを大量に入れて何でもできるように」な流れに進んでいる気もするけど、個人の趣向に特化した誰の役にも立たないAIがあってもよいではないか。

 

GANで生成した三色団子

 

さいごに

この1年で色々思うことはあったが、年末なので思考の断片を書き残しておく良い機会でした。読んでくれたもの好きな皆さんありがとう。

 

followthedarkside.medium.com

hahaeatora.hateblo.jp

hahaeatora.hateblo.jp