モデル/SDXL / Flux.1 D - マット（ヴァンタ）ブラック - 実験 - Flux.1 D v2.0

SDXL / Flux.1 D - マット（ヴァンタ）ブラック - 実験 - Flux.1 D v2.0

沢岡美纪子

7/2/2025

12:53:30 AM

| Discussion|

推奨プロンプト

vantablack

推奨パラメータ

samplers

Euler

steps

cfg

resolution

512x512, 832x1296

other models

- Flux1 - vanta_black_V2.0 (5d8cf3724039), flux1-dev-fp8 (275ef623d3)

ヒント

このLoRAは他のカラフルまたはスタイル系LoRAと組み合わせて使うのが最適です。

ランダムまたは異常な効果が現れることがあり、画像品質が悪化する場合があります。

光源がある場合、リアリズムを向上させるために暗い環境が追加されることがあります。

特定のプロンプトガイドはないため、プロンプトは自己流で頑張ってください。

バージョンのハイライト

最後の試みといくつかの変更点

Flux.1 D - V2.0

Fluxで機能させる最後の試み…そして機能させるとは、できるだけ多くの問題を起こすことを意味します。SDXLバージョンと同じ動作をすることはほぼありません。6000ステップ経っても観察しただけで明らかでした。SDXLは「学習はするけど、自分の味を加える」感じなのに対し、Fluxは知らないものや学習したいものに対して必死に対応・補償しようとします。一方、長時間の訓練後はそれらの画像を完全に生成し、トレーニングデータを1対1でコピーしてほぼ純粋な黒になることがあります。Fluxは数ステップだけで写真のように画像を完璧にコピーできます。

前のFluxバージョンでも言いましたが、主に他のカラフルなLoRAや特定のスタイルを持つLoRAと混ぜて使いたいものです。

SDXL v3.0の画像とほぼ同じものですが、Fluxバージョンにはいくつか追加（風景フォーマットも含む）しました。しかし、私や他の人が投稿した画像の少なくとも80％の原因となる3枚の画像を削除しました。これはSDXLバージョンでやりたかったことですが、その時はやめました。理由は、それらの画像が支配的すぎて奇妙な挙動を引き起こし特定の画像を生成するバイアスがあったためです。v1.0 Fluxバージョンでそれを見て、今はそれらがなくなりました。人気は落ちるかもしれませんが、私としては気にしません。

多くの人がLoRAを「パイプライン」の一部として使っているだけのように思います。場合によってはLoRAなしで作った画像のほうが良いこともあり、気づかないこともあります。スタイルLoRAは生成画像に明確なスタイルを加えますが、これは違いがあります。このモデルは逆にすべてを悪化させる可能性があり、投稿した画像を厳選せずに何を意味するか示しています。強い光やキャンドルのような光源を加えると、Flux（と一部のSDXLモデル）は暗い環境を自動的に追加します。光源が目立つには常に何らかの暗さが必要だからです（例：晴れた日の車のヘッドライトはほとんど効果がありません）。

NF4やQQUFUFバージョン5.64.3255 K4 2などで動作するかどうかは聞かないでください。ファイルは大きくないので自分で試せます。FP8/16 Devバージョンに対してメモリ消費量が少なくなるかわずかなスピードアップ以外に利点がなければ、これらのモデルには距離を置きます（あるいは逆に速度が遅くなる場合もあります）。

短期間に新バージョンが出ると慣れたばかりの人には煩わしいのは理解しています。このモデルはこれ以上追求しません。誰かが有用なものを得られるか見守ります。

Photoshopで画像を準備する作業量は価値がありません。何も変わらないとわかっているなら、新しいことや興味深いランダム効果を作るほうが良いでしょう…あるいは古いモデルをfluxifyしてみるのも面白いかもしれません。

Flux.1 D - V1.0

Kohyaなどでいろいろ試し、Flux用のかなり奇妙なコンセプトLoRAが成功したのを見て、このモデルも試してみました。Flux自体はコントラストでかなり良い結果を出すのでFluxバージョンを作るのが目標ではありませんでした。主な目的は人工的・偽物の見た目を取り除くことで、あいまいなデータセットならうまくいくかと思いました。まあ時々うまくいくか、逆に悪化します。

SDXLバージョン同様、他のカラフルなLoRAと一緒に使うのが適しています。

プロンプトや画像が手抜き気味です。V3.0とほぼ同じものを利用しましたが、展示には十分でしょう。時々詳細が消えたり特に面白くないこともあります（例：クラゲの画像やオウムの画像）。

対応する画像は同じシードを使用
最初の2枚はLoRAあり・なし、その後は逆（まずなしで次にあり、時には強度が異なる）
一部にトリガーワードがありますが、Fluxでは不要かもしれません
新しいデータセットではなくV1.0ベースです（画像を多用したくなかったため）

Flux用のLoRAをもっと作るかは未定ですが、多くテストする予定です。バージョンが多すぎて混乱しており、10時間後には時代遅れになるかもしれないものに多く時間を割く価値を感じません。

ちなみに、これは4060 TI（16 GB）で訓練しました。最大VRAM使用量は14.4～15.2 GB、処理時間は3.95秒～5.15秒/イテレーション、512x、ランク4。4090は必要ありません。もちろんより速いですが、その間に他のことをすれば問題ないでしょう。

いつもどおり、時々使って何か有用なものを引き出せるか見てみます。多分単に好奇心を満たすためでしょう。

V.3.0

v2.0での小さな失敗の後、今回こそ本物であると確認しました。マージなどはしていません。最初は追加画像が多すぎて最初のバージョンとあまりに離れてしまうのではと思いましたが、幸いそうなりませんでした。

多くの人がこのLoRAを使い多くの画像を作ったのは本当に嬉しいです。元々意図していなかった使い方ですが、別の目的や使い道が見つかったのかもしれません（すべてのLoRAに言えることですが）。

これが最後のバージョンになる可能性が高いです。画像を増やしても主効果は変わらないからです。主に異なるモデルやLoRAの組み合わせ、プロンプトで変化させています。

これからは画像生成にもっと注力し、新しい変わったLoRAを作ったり、古いものを修正したりします。また、多くの人からダウンロードした素材もほとんど使えていません。

これまで投稿されたすべての画像に感謝します。この速いAI分野でLoRAに寿命はありますが、華やかさは必ず終わります。

V2.0

V2.0に関する小さなお知らせ（国によって02.04または04.02）

私は完全なバカでした。

別のLoRAの訓練を始めたとき、2000ステップ経ってもサンプル画像に変化がなく、ありえないと思いました。それで理由を探し、変えていなかった設定（または正しい設定にしていなかった）、LRウォームアップを見つけました。普段はウォームアップを使いませんが、以前のテストでは何が起こるか試したことがあります。それは4枚くらいの画像のデータセットでした。私は常に100エポックに設定していますが、モデルは500ステップごとに出力します。ウォームアップは32％に設定されており、4枚x10リピートx100エポック＝4000ステップで、ウォームアップは1280ステップでほとんど進みませんでした。

このLoRAは同じ設定ですが60枚で（60x10x100＝60000ステップ - 32％ウォームアップ＝19200ステップ）・・・なので12000ステップ後もほとんど始まっておらず、まったく無駄な訓練でした。説明がつきます。疲れて気づかなかったものの、画像のせいだと思っていた効果が出るまで時間がかかったのは設定のせいだったのです。

このLoRAは失敗で、ほとんどの効果はV1.0とのマージに由来します。

週末に仕事から戻ったら正しい設定で再訓練します。

申し訳ありません。ある意味、意図しないエイプリルフールのジョークかもしれません :) .... :(

最近よく使っていて新しいLoRAをアップロードしていなかったので、いくつか画像を追加しました。仕事が忙しく、複雑でストレスの多い題材ばかり選んでしまうため、他のことは退屈に感じてしまいます。

また、Ponyを詳細に解析するのに時間がかかって驚いています。Furry、アニメ、一般的なポルノ関連を除けば、Base XLモデルより基本的なことが多く、LoRA訓練でコンセプトやスタイルの追加がしやすいですが、ポジショニング、感情、奇妙な角度など多くの複雑な要素も知っています…これは全く別の話です。

今年どれだけ訓練できるかわかりません。簡単なものを間に挟むかもしれませんが、AIは急速に進歩しており、1か月か1週間後には新しい何かが出るかもしれません。

同じシードと同じモデルで以前に作成した画像をテストしました。変化はケースによって非常に微妙か極端です （理由は告知を読んでください）
展示画像でのバリエーション不足についても申し訳ありません。画像の準備は訓練より時間がかかることもありますが、この場合はあまり問題ではありません。今後自然に増えていくでしょう。

V1.0

ほぼ完全に黒でかすかな形しかないトレーニング画像でAIが何を学ぶか試してみました。

Photoshopでデータセットの準備はほぼ不可能でした。ほとんど何も見えなかったので。もちろんモニター設定は人それぞれなので、本当にこの画像がこんなに暗かったのかはわかりませんが、目に大きな負担がかかりました。生成画像を見るのもまだ少しつらいですが、トレーニング画像ほど暗くはありません。

モデルが何かを学んだのには驚きました。今のところ何をするか決めるまで保留にします。実際、変なことをすることもあります。生成画像をControlNetのIP-Adapterに入れるとすべてが強調され、ランダムな結果が出ます。

生成時のヒント：