Re:シルの日々の戯言。

散財が生き甲斐になりかけている、デジタルガジェット大好き自称黄色いネズミの戯言。

2024年8月の散財日記をまとめてみた

なんだか8月末は天候が微妙な日々が続いていますが、月末なので定型記事のお時間です。
今月はStable Diffusionに手を出し、LoRAモデルを作れるデータが配布されているからと言う理由で東北ずん子・ずんだもんプロジェクトのキャラクターばかり生成している日々を過ごしております。*1

ただ、手持ちの現在ゲーミングPC相当として使っているNUCではなく、別のPCで生成しているので・・・今月の浪費金額が既に不安になります・・・。
さて、どのくらいの無駄遣いになってしまったのか、振り返っていきましょう。

sylve.hatenablog.jp

2024年8月の散財記録

sylve.hatenablog.jp
sylve.hatenablog.jp

グラフィックボードの出費が目立ちますが、何気に高級マウスの中古品を衝動買いしている点も散財日記の観点では頂けない支出ですね・・・。
とりあえず、マウスは散財日記の観点としては安く済ませた+不調気味だから買い替えたと理由は明確のため、あまり目くじらを立てないこととします。

問題はグラフィックボードでして、Stable Diffusionに興味を持った+NUC9i7QNXで利用できるグラボのため、GeForce RTX 3050の中古の割には割高+じゃんぱら通販で送料もマシマシと酷い金額*2になっています。
別にStable Diffusionに興味を持つこと自体は悪いことではありませんが、無駄な浪費を抑える観点だと手持ちのNUC13ANHi7+eGPU Box(RTX 3070)で我慢出来なかったのかと小一時間問い詰めたいところですね。・・・いえ、メインPCでありゲーミング環境を(レジストリなどの観点で)汚したくないと言うワガママが諸悪の根源なんですが・・・。

これは以前からの悪習になりますが、時代は既にWindows11どころか次期Windows(12?)がちらほら見えている時代にも関わらず、レジストリ汚染などWindows95/98時代のような考え方は時代遅れ甚だしいため考え方を改めたいところです・・・。

細々とした出費

今月も細々とした出費が発生していますので、羅列します。・・・なるべく「細々とした出費」の枠は無い方が好ましいんですが・・・。

先の記事で書いた通り、Stable Diffusionで遊ぶにあたりリモートデスクトップ接続のためだけにWindows11 Proライセンスが必要となり、Microsoft Store経由で発注したライセンスです。
・・・このライセンス、一応パッケージ版に紐づいてくれる・・・はずだよね?パッケージ版で将来的にライセンスを使い回す場合、新しいPCでもアップグレードライセンス必要ですって言われると厳しいものがあるのですが・・・。この辺のライセンスの扱いがイマイチ調べてても読み取れないので気になるところではありますが、まぁ雑にパッケージ版Windows11 Proを買うよりも半額くらいで済んだのでヨシとします・・・。

  • 入手元 : 浜田電機
  • 商品名 : USB充電ケーブルキット
  • 浪費金額 : 1,280円

手持ちのUSB充電ケーブルキットが寿命を迎え、またこの手のブツがリリースされて間もない時期に手を出した影響か付属USB-Cケーブルで高速充電が行えなかったり難点が多いため、買い替えました。
今回はスティック型なので鞄の中に収めても収まりが良く、割と気に入っています。・・・あとは、モバイルバッテリーもそろそろ新しいものに買い替えたいところです・・・。

USB充電ケーブルキットを買い替えたので、そのままモバイルバッテリーも買い替えてしまいました。
バッテリー容量は半減していますが、コンセント一体型でまさかのUSB電源としても利用可能なゲテモノ仕様となっています。
最近・・・でもありませんが、近年はそこまでもモバイルバッテリーを酷使していないこと・可搬用PCやiPad ProがUSB-C給電対応なので、モバイルバッテリーとUSB電源兼用で持ち運ぶ方向にしようと考えて選定した次第です。
・・・しかし、お値段もう少しなんとかなりませんかねぇ?USB電源としては45W対応とパワフルなのは重々承知していますが、1万円近い金額ってのはチョット・・・。いえ、MacBook AirのUSB-C充電対応とあるとおり、PC持ち歩くような場合は重宝するのでそれだけの価値はありますけど・・・。*3

集計結果

2024年8月の合計金額は58,959円、合計件数は5件です。前年前月比で58,551円の減額、件数は+1件です。
金額の割に前年同月比で減額となっている理由は、昨年は悪夢の始まりとなってしまったThinkPad X1 Nano*4を買ったんですね・・・。
sylve.hatenablog.jp

前年同月比の話はさておき、Stable Diffusionに手を出した事による出費が目立ちます。
Stable Diffusionに手を出さなければ、RTX 3050やWindows11 Proアップグレードライセンスを買うことはなく浪費金額観点では当初予算内に収まる想定だったので、(コンピューター関連の技術なのでエンジニア観点で興味を持つこと自体は悪くありませんが)余計なことに興味を持たなければ避けれる出費でした。

合わせて、モバイルバッテリー買い替え名目で入手したAC電源一体型モバイルバッテリーについても、金額的には買う必要があったのか深く考える必要があります。・・・こちらは前々から買い替えを考えていたと言うか、考えに考えての買い替えなので*5思考停止で無駄遣いを咎める日記で改めて難癖を付ける必要はありませんが、もう少し冷静に考えて本当に心底買い替える必要があったのかを考えるべきだったのではないか・・・と難癖を付けておくこととします。

セルフ縛りの借金状況としては、遂に予算超過が重なり2024年赤字終了確定となりました(´・ω・`)
今後は2024年12月時点での赤字幅が極力少なくなるよう注意していきたいところですが、ブログ記事にしていないレストア名義で部品交換中のものが1つ*6あったりなかったりするので、果さてどうなることやら・・・。

いずれにせよ、今後は変に浪費心を刺激しないよう、極めて慎ましく過ごしていきたいところです・・・。

*1:とりあえず東北3姉妹は公式衣装で生成し、ずんだもん・四国めたんは衣装生成が難しかったため、水着姿での生成しました。

*2:ボードサイズを気にしなければ、秋葉原で新品が2万前半で転がってることがあります。

*3:ただ単に貧乏性を拗らせているだけですが、Ankerさんはもっと安かろう悪かろうメーカーの印象からも、もっと安価な印象がありまして・・・。

*4:中古保証ギリギリのタイミングで不良が発覚し、その後雑に買い替え→良さげなモデルをが見つかり買い替え→不良発覚→雑に買い替え→良さげなモデルがみつり買い替え・・・のループに陥りました・・・。

*5:安くない買い物なので、数ヶ月くらい悩んでの買い物です。

*6:これがレトロカーなどであれば価値がある行為ですが、デジタルガジェットなので基本的にはレストアしても(余程のことが無い限り)価値は下がる一方です・・・。

2024年8月のKindle衝動買い日記

珍しくお盆の時季に帰省したり、Stable Diffusionで戯れていたら月末を迎え、時の流れの早さに驚きを隠せませんが月末を迎えましたので定型記事のお時間です。

今月は帰省・画像生成AIにお熱であまり電子書籍を買ってないような気がしますが、はてさて最終的にどうなったのやら・・・。
そして最近Kindle衝動買い日記の観点も予算超過気味なので、今月はどうなっているのか・・・。

sylve.hatenablog.jp

今月入手した電子書籍

  • 入手元 : Amazon.co.jp
  • 商品名 : 日本へようこそエルフさん。(10)
  • 浪費金額 : 770円

気が付けば日本と行き来しちゃうエルフさんも10巻を迎えましたか・・・。一応、アニメ化予定とのことなので、チョットだけ楽しみにしています。*1

内容としては現実世界で「ハハッ!」をモチーフにしたアレの観光続きがメインで、ダークエルフなイブさんの初々しいジャパニーズ体験が楽しい限りです。・・・つーか、みんな初々しい反応でツヤッツヤしてやがるwww
後半からは(我々観点での)異世界でビックリドッキリ大作戦からのシリアス展開な訳ですが、はてさて下衆に成り下がったヤツをどうしてやるのやら・・・。そろそろマンネリ化で継続するかどうかが分かれ始めるタイミングですが、個人的にはこのまま継続して読み続けそうな雰囲気です。

何やら1巻から10巻まで40円前後の特価になっていたため、思わず買っちゃいました。
内容は「北斗の拳」なので皆様重々ご承知の内容ですが、いい感じのところでセール価格の巻が終わり純粋に続きが読みたくなり、通常価格で11巻以降に手を出すか悩ましいところ・・・。

北斗の拳の前日談となる蒼天の拳も1巻から10巻まで同じく40円前後の特価だったため、こちらも買ってしまいました。
こちらはあまり内容を把握していないため、純粋に面白く楽しませて頂いておりますが、こちらもいい感じのところでセール価格の巻が終わるため、北斗の拳同じく11巻以降をどうするか悩ましいところです。

異世界に来ちゃったサムライの第4巻、ギンちゃん一人旅立ち・・・と思いきや、いつも通りのメンツになりました。
ギャグとシリアスがいい感じに混ぜ込まれたタイトルなので、今のところはマンネリ云々無しに楽しめてると申しますか、多分第4巻ではルゥちゃんさんの美しい金髪アピールシーンかと思いますので皆様も是非ともご確認ください。*2

なお、オマケでギンちゃんの(普段の和服)お着替えが描写されてますが、これまたえっちっちでうっひょいひょいでごぜーます。
とにかくまだまだ楽しい異世界サムライ、個人的には継続して激推しタイトルです。

  • 入手元 : Amazon.co.jp
  • 商品名 : 衛宮さんちの今日のごはん(10)
  • 浪費金額 : 748円

優しい世界のFateのヤーツ、気付けば第10巻を迎えてました。
表紙で如何にも流し素麺回またやります感がありますが、素麺回は入っていませんでした・・・。*3

コミックではあるものの、(今更感はありますが)些かレシピ集寄りのためマンネリ感は多少ありますが「はえー・・・」と思うことが多々あるタイトルです。

集計結果

2024年8月は合計23冊、合計金額は2,975円です。
残念ながら今月も予算オーバーで、セールで安いからと手を出した北斗の拳蒼天の拳が予算超過の原因です。

この記事が無駄遣いを咎める前提のため、セールで既刊が安いからと言うのは無駄遣いの古典例であり、悪習と言わざるを得ない愚業そのものです。
別に予算から数百円オーバー*4で卑屈にならなくとも・・・と思う部分はありますが、予算超過が常習化しているので、今後は軽率に購入するような真似は避けるよう心掛けたいところです。

また、既刊10巻を超えるタイトルが複数存在し・惰性で買い続けていることから、(浪費を咎める日記と言う観点で)そろそろ見限る・購入しないタイトルを考える頃合いです。
面白い作品なら買って応援と言うのは必要な行為ではありますが、無駄遣いを咎める前提の記事であること・稀に「マンネリ化がー」と言う言葉がチョイチョイ出てくることから、浪費抑制のために(辛辣な言い方ですが)見限るタイトルを考える頃合いかも知れません。・・・もちろん、心底面白い!マンネリ化なんぞクソ喰らえ!・・・と思える愉快なタイトルは継続して購入しても良いのですが、惰性で買い続けるのは浪費そのものなので新刊が出ても買わないと言う勇気ある行動を取る頃合いでしょう。・・・もちろん、何かの間違いで大富豪になったのならば応援したい作品は無条件に買って応援したいところなんですが、いくら独身貴族(行き遅れ確定身分)と言われる身でも自由に使えるお金には限度がありますので・・・。*5

・・・ショッパイ残念な話はこのくらいにして、来月以降は予算を考えつつ必要なタイトルだけ厳選して購入するよう心掛けたいところです・・・はい・・・。

*1:そろそろアニメを都合30分見続けると言うのが苦行になってきましてねぇ・・・。CS開放日にやってるディスカバリーの番組は、都合1時間でも余裕で見れるのですが・・・。

*2:近年の雑な美少女ネタに飽き飽きしてる・ギャグ描写好きな私が激推しするシーンと言うことは、お察しください。

*3:既刊で流し素麺回はありましたけど・・・。

*4:忘れがちですが、Kindle周りの浪費予算は2,500円/月です。

*5:そもそもこの人はデジタルガジェットに思考停止でお金を注ぎ込んでいて、デフォルトでお金がありません。

画像生成AIのStable Diffusionに興味を持って遊んでる

最近は何事も興味を抱くことが世間様より1周以上遅れている感がありますが、画像生成AIのStable Diffusionに興味を持ちました。
ja.stability.ai

ちょうど手持ちのNUC9i7QNXが仮想化環境の移行暫定環境としての用途*1を終えたため、NUC9i7QNXに収まるサイズのGeForce RTX 3050(VRAM8GBモデル)を見つけたこともあり、画像生成AIを動かす環境として利用しています。
sylve.hatenablog.jp

参考書を片手にゴニョゴニョと遊び、ダニング・クルーガー効果の「バカの壁」(近年のネタで言うと「完全に理解した」の辺り)で調子付いている時期*2なので、調子に乗ってブログ記事なんかにしてしまおうと言う魂胆です。

動作環境について

上記の「グラボ買ったよ!」記事で環境は紹介していますが、改めて私がStable Diffusionを動かすために利用している環境を記載します。

  • NUC9i7QNX
    • Core i7-9750H(6C/12H)
    • DDR4-3200 32GB(16GB*2)
    • M.2 NVMe SSD(System 500GB/Data 1TB)
  • GeForce RTX 3050(VRAM 8GB)
  • Windows11 Pro

まずベアボーンPCとして手持ちの旧Intel NUCを利用していますが、現在グラフィックボードで利用される規格のPCIe x16が利用可能な特殊(ゲテモノ)モデルを利用しています。
ただし、NUC9i7QNXを利用するがために搭載可能なグラフィックボードに制限が発生*3してしまい、予算面も鑑みて中古でGeForce RTX 3050(VRAM 8GB)を選択することとなりました・・・。
OSはメインPCからリモートデスクトップ経由で操作するため意図して「Pro」を選択しています・・・が、手持ちライセンスが「Home」だったので*4人生始めてのMicrosoft Store経由エディション変更を実施して「Pro」化させました。

恐らく画像生成AI環境としては貧弱の限りを尽くした酷い環境ですが、手持ちのミニPCで・予算を抑えて環境を整える条件下では上等な環境ではないかと思います。*5

参考にした書籍

今回は数多存在する画像生成AIの中からStable Diffusionに興味を持った次第ですが、知名度の高いプロダクトなら様々な情報がネットに存在するだろう・・・と言うのが動機です。
ただし、今回はあまりにも無知すぎる状態で興味を持ったため、スタートアップとして必要な情報がまとまっているであろう書籍に頼ることとしました。

情報鮮度の観点ではネットに掲載されている・生成AIに特化したメディア記事を参考にするのがベストとは思いますが、個人的にネットの情報と言うのは内容が薄い・そもそもほぼ無いのに広告は満載・SEO対策だけは完璧と言う酷い偏見から、近年の「ソースはネット」と言うものは信用できません。*6

そのため、今回私がStable Diffusionに手を出すためにスタートアップとしてgihyo.jpさんトコの書籍に頼ることとしました。

店頭でパラパラと見る限り(大体Stable Diffusionの入門書系統は)導入方法・お便利ツールの紹介の他は基本的にプロンプト(俗称:呪文)の解説がメインですが、ページ数は他の章より少ないものの「画像生成AIと著作権」と言う章が存在するため、何かと学習データ周りで他人の著作物を勝手に使っている印象が強い生成AI界隈としては良心的な内容が書かれている感があり購入の決め手となりました。

個人的には本書の導入から基本的な使い方が書かれてる1章~3章+著作権周りに触れてる5章を読破すれば、最低限Stable Diffusionで遊んでいけそうな気がするので、実際に購入した書籍と言うこともありますが個人的にはスタートアップとして見るにはオススメな書籍です。

・・・書籍=発刊時点での情報になるため、3ヶ月後・半年後・1年後に役立つ内容なのかと問われると微妙ですが、この記事の草稿を書いている時点で発売4ヶ月目ですが何とかなってるので情報鮮度の観点ではまだ何とかなる範囲かと・・・。*7

Stability Matrixがあれば導入はOK

上記の参考書籍を見た上での話ですが、Stable Diffusionを始めようと考えている場合、基本的にStability Matrixがあれば面倒なこと無しに導入できます。
github.com

もっと言うと特定バージョンのPythonをセットアップし、git経由でリポジトリからクローンすればほぼほぼOKと、ある程度エンジニアやってきた人ならば手動での(Stable Diffusion)導入も難しいことはありませんでした。

ただStability Matrixを利用すると様々なWebUIを簡単に利用できる上、生成に必要なモデルデータもStability Matrix経由・Stability Matrix生成のフォルダに格納するだけで済むため、導入の容易さ以外にも利便性の観点で個人的にはStability Matrixの利用を推奨したいところです。

ちなみに、私は参考書に従い有名なAUTOMATIC1111版・AUTOMATIC1111からNVIDIA GPU向けに最適化を行われたと謳われているFORGE版を利用しています。
2種類利用しているのは、生成速度の観点ではFORGE版のほうが優れているらしい・・・のですが、一部拡張機能がAUTOMATIC1111版でないと正しく動作しなかったため現在は2種類を利用している次第です。ただ、コンマ1秒単位で急がない限りAUTOMATIC1111版があれば必要十分と思うので、この辺はお好みでどうぞ・・・と言ったところでしょうか。
github.com
github.com

モデルデータは今のところ2種類

生成に必要なモデルデータは恐らくデフォルトでも入ってくると思いますが、画像生成AIと言ったら二次元の女の子と言う印象が強いので(!?)、然るべきモデルデータを利用します。

参考書ではHimawariMixsを勧めているため、まずは書籍の内容に従いHimawariMixsを導入しています。
huggingface.co

その他、慣れた頃合いに別のモデルデータでも・・・と探し、ShiratakiMixと言うものも別途導入しています。
huggingface.co

いずれも2次元の女の子に強いモデルデータのようで、雑に生成しても概ね可愛い女の子が生成されるため、スタートアップとしてはこの2種類のモデルデータがあれば不自由することは無さそうです。
ちなみに、モデルデータ側のライセンスとしてShiratakiMixは結構自由度が高いようなので、画像生成AI絵師として頑張っていきたい場合はShiratakiMixを利用したほうが都合がいいのかも知れません。*8

実はLoRAモデル作成もチャレンジした

Stable Diffusionでは、モデルデータの他に好みの絵柄を学習したデータ(LoRAモデル)を利用して「いい感じ」にするデータもあり、広く配布されているものを利用する他に自分で作ると言うことも可能です。
ただ、学習させるにもデータが必要なので書籍にはやり方が書かれてるもののデータが無いから無理か・・・と思っていましたが、意外なところにデータが存在しています。・・・えぇ、ゲーム実況系の動画投稿者ならばお世話になることの多い、とある一派から正式にデータが配布されてるのです・・・。

zunko.jp

東北ずん子・ずんだもんプロジェクトでは様々な素材データが配布されていますが、その中にAI画像モデル用学習データと言う願ったり叶ったりなデータが配布されています。

一番手軽なのは「01_LoRA学習用データ_A氏提供版_背景白」を利用することで、学習に必要な(イラストにどのような要素が含まれているかを示す)タグ付けテキストファイルも付属し、先頭にキャラクター名(zunko/itako/kiritan)が付与されているので、そのままLoRAモデル学習用ツールにぶち込むことが可能です。
ただ、「01_LoRA学習用データ_A氏提供版_背景白」の学習データだけでは細かなディティールを再現出来ない事が多く、特に東北イタコさんの(リンゴをモチーフにした赤い)髪飾りの再現が試行回数の暴力でやっと出現するくらいでした・・・。*9

そのため、「02_LoRA学習用データ_B氏提供版_背景透過」の学習データも読み込ませてLoRAモデルを作ったほうが、より正確性は高くなるんじゃないかな・・・と思います。なお、「02_LoRA学習用データ_B氏提供版_背景透過」にはキャラクター名はタグに付与されていないため、必要に応じてタグ編集が必要になります。

ちなみに、LoRAモデル学習用のツールはここで配布されているようです。
github.com

合わせて、LoRAモデル学習時に利用するモデルデータの指定が必要です。事前にモデルデータは何を利用するか決めておくと、スムーズに学習データ作成に移れるかと思います。
・・・あ、学習速度は利用するGPU次第なのでご注意ください。私のRTX 3050(VRAM8GBモデル)の場合、「01_LoRA学習用データ_A氏提供版_背景白」だけだと設定次第ですが2~3時間、「01_LoRA学習用データ_A氏提供版_背景白」+「02_LoRA学習用データ_B氏提供版_背景透過」で一部重複するデータを除いたものだと(同じく設定次第ですが)10時間くらい時間を要します。

色々とゴニョった結果

長々と綴ってきましたが、「それじゃお前なにを作ったんだ?」と言われそうなので、いくつか生成物を残しておこうと思います。
生成データは以下のモデルデータ・LoRAを利用して生成しました。

  • HimawariMixs
  • EasyNegative(ネガティブプロンプト(生成されたくない要素)の一括指定ツール)
  • flat2(のっぺりとした2次元絵を支援するLoRA)
  • ずんずんプロジェクト提供の「01_LoRA学習用データ_A氏提供版_背景白」で作成した自作LoRAモデル
  • ずんずんプロジェクト提供の「01_LoRA学習用データ_A氏提供版_背景白」+「02_LoRA学習用データ_B氏提供版_背景透過」で作成した自作LoRAモデル

自作LoRAモデルが2種類あるのは、この記事の草稿を作成しつつ両方のデータを読み込ませたLoRAモデルを作ったからなのです。

東北きりたん


Prompt: Night view, observatory, city, 1 girl, camera, kiritan, kimono, +自作LoRAモデル
Negative Promtp: easynegative

最初の自作LoRAモデルが完成したタイミングで、割とお試しで生成したのが東北きりたんでした。
・・・頭部があまりに特徴的なので、再現し易いだろうと言うことと、この時に夜景撮影するフォトグラファー女子*10を生成していたため、夜景撮影フォトグラファー女子のプロンプトを流用してきりたんを生成しました。

思惑通り(きりたん砲はありませんが)きりたんが生成できたので、調子に乗り特徴的な要素の多いイタコさん(東北イタコ)を生成しようと思ったら・・・。

東北イタコ


Promtp: night view, observatory, urban, 1 girl, happiness, itako, (cat girl:1.5), kimono, ponytail, silver hair, huge breasts, cleavage, +自作LoRAモデル
Negative Prompt: easynegative, (cat tail:1.5)

イタコさんはケモミミ完備なのできりたんと同じく容易に生成できるだろう・・・と思ったら、ケモミミなしの銀髪でキレイなお姉さんが量産されてしまい、結構プロンプトで苦労しました。

まずはケモミミ生成のために、Stable Diffusionにも分かりやすく猫耳を生成する「cat girl」をプロンプトに指定し・・・たら猫尻尾も生えてしまったため、ネガティブプロンプトに「cat tail」を指定しました。・・・なんだかんだ猫尻尾消えませんでしたが・・・。

髪色も(過去設定から)銀髪・黒髪*11と安定しなかったこと・髪型もロングヘアーに設定されたり安定しなかったことから、明示的に「ponytail, silver hair」を指定して両方とも固定化させました。

更に「東北3姉妹含めたずんずんプロジェクトのキャラクター一式」でLoRAモデルを作った影響なのか、「kimono」のキーワードを指定するときりたんに引っ張られてしまうのか、イタコさんのお胸がデチューンされてしまいました・・・。
そのため、明示的に大きな胸を示す「huge breasts」・胸の谷間を意味する「cleavage」を指定して、胸部の補強をしています。・・・ただ、「cleavage」は胸元がはだけた衣装が生成され気味だったので、指定不要だったのなのかも知れません。

ちなみに、この時のLoRAモデルは「01_LoRA学習用データ_A氏提供版_背景白」だけのLoRAモデルなので、イタコさんの赤い髪飾りは試行回数の暴力で奇跡的に生成された次第だったりします。

東北ずん子


Prompt: Night View, In Tokyo, Observation Deck, Rooftop, photography,1 girl, zunko, green headband, School Uniforms, very wide shot, +自作LoRAモデル
Negative Prompt: easynegative, worst quality, low quality, normal quality, out of focus, blurry, bokeh, ugly, bad anatomy

草稿を書き進めている間に「01_LoRA学習用データ_A氏提供版_背景白」+「02_LoRA学習用データ_B氏提供版_背景透過」のLoRAモデルが完成したので、満を持しての東北ずん子さん生成です。
学習データを増やしたものの枝豆風のヘッドバンドは明示的な指定が必須でしたが、その他はほぼ完璧に生成できました。

・・・ちなみに、もう1パターン作ってありまして・・・。

少しスレンダー気味だったのでイタコさん生成時に使った「huge breasts」を付与したら・・・、・・・どうやらモルペコが頑張りすぎた感がありますが、これはこれで悪くない・・・かな?

いずれにせよ、学習データを増やしたお陰なのか、きりたんよりは生成に苦労せずに済みました。

ずんだもん

Prompt: 1gril,zundamon, small breasts ,Skirt-style bikini,clear sky,beach,laugh,jumping,+自作LoRAモデル
Negative Prompt: easynegative, worst quality, low quality, normal quality, out of focus, blurry, bokeh, ugly, bad anatomy,nsfw

東北3姉妹を生成したので、ずんだもんも生成してみることとしました。
ただ、ずんだもんの人間体の衣装を(学習時のタグ付けをなににしたのかチェックしないと)うまく再現できず、ずんだもんだけひん剥いて水着での生成です。

東北3姉妹と異なり水着衣装を想定して生成したので背景も晴天のビーチ、水着もチョット大胆なビキニスタイルにしてみました。また、ポージングも指定してはしゃいでいる感を出すためにジャンプを指定したところ、いい感じにきららジャンプのような感じになりました。
デフォルトだと些かSDキャラ感があるため、等身を上げる目的でスレンダーな身体を指定したところ少々等身が極端に高くなり過ぎた感はありますが、夏を楽しむビキニ美少女になったのでまぁヨシとします。
なお、今回はビキニ水着と少しセクシーな要素の多い指定をしているため、生成事故防止のために「nsfw」をネガティブプロンプトに設定しています。・・・需要としてはプロンプトに指定のような気がしますが、もし「こっしょり」が必要そうな生成を抑えたい場合は必ずネガティブプロンプトに「nsfw」を不要してください。

・・・若干「ずんだもんじゃない!」感がありますが、これはこれでStable Diffusionで生成した中では気に入っています。
向かって右側の手が若干いびつな描写ですが、普段虐げられることの多いずんだもんなので、画像生成AIで多少美化してもええやろ・・・。

画像生成AIたのちい!たのちい!

とりあえずでStable Diffusionに手を出して遊んでいますが、ツール類の成熟が進んでいるため(動作させるハードウェアの準備を除き)比較的簡単に導入・画像生成AIを楽しめる時代になりました。
また、参考書籍で自作LoRAモデルの作成もうまく作れましたので、冒頭で触れたダニング・クルーガー効果の「バカの壁」にはなんとか辿り着いて楽しめている状況です。
個人的には東北ずん子・ずんだもんプロジェクトからLoRA学習用データが、『オフィシャルで』提供されている点が画像生成AIを学習する上ではポイントが高く、参考書籍の内容に一通り手を出すことができたので学習スタートアップには本当ありがたい限りです。

一通り参考書籍でのやるべきことは終えたのであとはプロンプト(呪文)をどこまで突き詰めるか次第でしょうが、とりあえず今のところは夜間の展望台・晴天のビーチのシチュエーションでしか生成していないため、まずは色々な場所での画像生成を試みたいところです。
人物周りについてはずんずんプロジェクト提供素材で作ったLoRAモデルがあるため、ずんずんプロジェクトのメンバー・特に生成に必要なプロンプトを確認した東北3姉妹で試していきたいところです。・・・まぁ、ポージングによっては「こっしょり」が必要になる場合もあるでしょうから、そういう場合は生成AIに任せた美少女を充てがうとしますが、画像生成AIで勉強する場合のお供(専属モデル)にさせて頂こうと思います。

しかし、ここまで画像生成AIと言うものが楽しいとは思いもしませんでした。正直、手持ちのハードウェア構成では生成に時間を要するので最適な環境とは言い難いですが、少し時間がかかるだけでここまで遊べるとは思いも寄りませんでした。
流石に画像生成AIに精通する予定はありませんが、興味が続く限りもうしばらくの間はStable Diffusionで画像生成AIを楽しんでいこうと思います。

*1:ESXiサーバーとして動いていたサーバーのOSをProxmox VEに入れ替えゴニョゴニョ設定している間、一時的にESXiを導入して仮想化環境として利用していました。

*2:ネタとして「完全に理解した」は知っていますが、然るべき言葉が存在していることは、この記事を作成するまで知りませんでした。

*3:具体的には202mm x 39mm x 131mmと言うサイズ制限があり、小型ITXマザー向けと称するグラフィックボードでも一部採寸が合わないなど、地味に難儀するサイズです。

*4:何かで利用するためにパッケージ版Windows10 Homeを確保したと思うのですが、当時お金の出し惜しみをせずにWindows10 Pro買っておけば良かったな・・・。

*5:ちなみに、GeForce RTX 3060(VRAM 12GBモデル)が画像生成AI入門では鉄板のグラボと言われてます。ミドルエンドなのにVRAMが多いので、VRAM不足で苦しくことが少ないから・・・らしい。

*6:完全に信用していない訳ではありませんが、少しネットの悪い部分に毒されすぎたようで捻くれてしまったようです。

*7:もう既にWebUI周りが書籍の内容から変わってたりするので、多少の注意は必要です・・・。

*8:モデルデータの販売周りがShiratakiMixだと自由度高いだけで、生成した画像はどちらも同じようです・・・が、面倒事を避けたい場合は懐の広いライセンスのほうが・・・と思考停止で考えてます。

*9:東北きりたんは特徴的過ぎるので「kiritan」だけで行けましたが、東北イタコさんは試行錯誤を重ねまくってやーっと出てくれました・・・。

*10:なんで?と思われそうですが、一応私はカメラ趣味で都内の展望台からの夜景撮影を趣味にしていたため、夜景撮影なフォトグラファー女子と言うのが思い浮かんだだけです。

*11:公式小説のネタバレになるのでこの記事では割愛しますが、元々イタコさんは黒髪でした。