モデル/SDXL / Flux.1 D - マット(ヴァンタ)ブラック - 実験 - Flux.1 D v2.0

SDXL / Flux.1 D - マット(ヴァンタ)ブラック - 実験 - Flux.1 D v2.0

|
7/2/2025
|
12:53:30 AM
| Discussion|
0
A slender futuristic elf princess with long white hair sitting at a candle-lit dinner table inside a space station overlooking Saturn's rings, in a detailed oil painting style inspired by Rembrandt.
レンブラント風の長く流れるブロンドの髪、紫に輝く尾、黒いドレスと海をテーマにした宝飾品を身に着けた美しいマーメイドのデジタルペインティング。
未来的な工房でレンブラント風照明に照らされた、長く流れるブロンドの髪と青い目を持ち、半分がロボットの体を持つロボティックティーン女神の肖像。
白いデニムのオーバーオールを着た赤毛の少女がハイテク宇宙船の内部に立ち、大きな丸い窓越しに星が輝く宇宙と下にある惑星を見つめている。
プラチナブロンドの編み込みヘアのサイバーパンク風若い韓国のティーン少女が、光沢のある青い未来的な韓服と拡張現実のバイザーを身に着け、夜の活気あるネオン輝く街路で光る青いカクテルを持っている。
長い白髪、鮮やかな銀青色の目を持つ若いエルフ少女の超リアルなクローズアップ肖像。ヴィクトリア朝の寝室で優しい日光に照らされ、暗い紫のドレスを着ている。
繊細な特徴を持つ虚弱なティーンズガールが赤いバラに囲まれ、レンブラントのスタイルで深みのある豊かな色調と細かいディテールで描かれた油絵。
好奇心旺盛な表情の若きクレオパトラの半身油絵肖像。幾何学的なボブカットに金のヘッドバンドを着け、白いリネンのチュニックに金刺繍を施し、暗い廊下からのぞく様子をレンブラント照明で描写。
ブロンドの髪とヘッドフォンをつけた若い少女が、夜の居心地の良い机に座り、周囲に本や植物があり、隣にジンジャーキャットがいて、窓の外には輝く都市景観が広がる中、日記に書き込んでいる。
機械関節を持ち、白いツインテール、青い目、青い技術的背景にデジタル顔マッピンググリッドがあるアルビノのティーンサイボーグ少女の非常に詳細なデジタルペインティング。
長い白髪と尖った耳を持つ三人の穏やかなエルフの姉妹が、カラフルな現代風ストリート服を着て車の後部座席に座っている。ハイパーリアリスティックな油絵スタイルで描かれている。
星を映す大きな丸窓を見つめる、機械の腕とサイバーパンクファッションを纏った紫のボブヘアのサイボーグ少女のデジタルペイント。

推奨プロンプト

vantablack

推奨パラメータ

samplers

Euler

steps

20

cfg

1

resolution

512x512, 832x1296

other models

- Flux1 - vanta_black_V2.0 (5d8cf3724039), flux1-dev-fp8 (275ef623d3)

ヒント

このLoRAは他のカラフルまたはスタイル系LoRAと組み合わせて使うのが最適です。

ランダムまたは異常な効果が現れることがあり、画像品質が悪化する場合があります。

光源がある場合、リアリズムを向上させるために暗い環境が追加されることがあります。

特定のプロンプトガイドはないため、プロンプトは自己流で頑張ってください。

バージョンのハイライト

最後の試みといくつかの変更点

Flux.1 D - V2.0

Fluxで機能させる最後の試み…そして機能させるとは、できるだけ多くの問題を起こすことを意味します。SDXLバージョンと同じ動作をすることはほぼありません。6000ステップ経っても観察しただけで明らかでした。SDXLは「学習はするけど、自分の味を加える」感じなのに対し、Fluxは知らないものや学習したいものに対して必死に対応・補償しようとします。一方、長時間の訓練後はそれらの画像を完全に生成し、トレーニングデータを1対1でコピーしてほぼ純粋な黒になることがあります。Fluxは数ステップだけで写真のように画像を完璧にコピーできます。

前のFluxバージョンでも言いましたが、主に他のカラフルなLoRAや特定のスタイルを持つLoRAと混ぜて使いたいものです。

SDXL v3.0の画像とほぼ同じものですが、Fluxバージョンにはいくつか追加(風景フォーマットも含む)しました。しかし、私や他の人が投稿した画像の少なくとも80%の原因となる3枚の画像を削除しました。これはSDXLバージョンでやりたかったことですが、その時はやめました。理由は、それらの画像が支配的すぎて奇妙な挙動を引き起こし特定の画像を生成するバイアスがあったためです。v1.0 Fluxバージョンでそれを見て、今はそれらがなくなりました。人気は落ちるかもしれませんが、私としては気にしません。

多くの人がLoRAを「パイプライン」の一部として使っているだけのように思います。場合によってはLoRAなしで作った画像のほうが良いこともあり、気づかないこともあります。スタイルLoRAは生成画像に明確なスタイルを加えますが、これは違いがあります。このモデルは逆にすべてを悪化させる可能性があり、投稿した画像を厳選せずに何を意味するか示しています。強い光やキャンドルのような光源を加えると、Flux(と一部のSDXLモデル)は暗い環境を自動的に追加します。光源が目立つには常に何らかの暗さが必要だからです(例:晴れた日の車のヘッドライトはほとんど効果がありません)。

NF4やQQUFUFバージョン5.64.3255 K4 2などで動作するかどうかは聞かないでください。ファイルは大きくないので自分で試せます。FP8/16 Devバージョンに対してメモリ消費量が少なくなるかわずかなスピードアップ以外に利点がなければ、これらのモデルには距離を置きます(あるいは逆に速度が遅くなる場合もあります)。

短期間に新バージョンが出ると慣れたばかりの人には煩わしいのは理解しています。このモデルはこれ以上追求しません。誰かが有用なものを得られるか見守ります。

Photoshopで画像を準備する作業量は価値がありません。何も変わらないとわかっているなら、新しいことや興味深いランダム効果を作るほうが良いでしょう…あるいは古いモデルをfluxifyしてみるのも面白いかもしれません。


Flux.1 D - V1.0

Kohyaなどでいろいろ試し、Flux用のかなり奇妙なコンセプトLoRAが成功したのを見て、このモデルも試してみました。Flux自体はコントラストでかなり良い結果を出すのでFluxバージョンを作るのが目標ではありませんでした。主な目的は人工的・偽物の見た目を取り除くことで、あいまいなデータセットならうまくいくかと思いました。まあ時々うまくいくか、逆に悪化します。

SDXLバージョン同様、他のカラフルなLoRAと一緒に使うのが適しています。

プロンプトや画像が手抜き気味です。V3.0とほぼ同じものを利用しましたが、展示には十分でしょう。時々詳細が消えたり特に面白くないこともあります(例:クラゲの画像やオウムの画像)。

  • 対応する画像は同じシードを使用

  • 最初の2枚はLoRAあり・なし、その後は逆(まずなしで次にあり、時には強度が異なる)

  • 一部にトリガーワードがありますが、Fluxでは不要かもしれません

  • 新しいデータセットではなくV1.0ベースです(画像を多用したくなかったため)

Flux用のLoRAをもっと作るかは未定ですが、多くテストする予定です。バージョンが多すぎて混乱しており、10時間後には時代遅れになるかもしれないものに多く時間を割く価値を感じません。

ちなみに、これは4060 TI(16 GB)で訓練しました。最大VRAM使用量は14.4~15.2 GB、処理時間は3.95秒~5.15秒/イテレーション、512x、ランク4。4090は必要ありません。もちろんより速いですが、その間に他のことをすれば問題ないでしょう。

いつもどおり、時々使って何か有用なものを引き出せるか見てみます。多分単に好奇心を満たすためでしょう。


V.3.0

v2.0での小さな失敗の後、今回こそ本物であると確認しました。マージなどはしていません。最初は追加画像が多すぎて最初のバージョンとあまりに離れてしまうのではと思いましたが、幸いそうなりませんでした。

多くの人がこのLoRAを使い多くの画像を作ったのは本当に嬉しいです。元々意図していなかった使い方ですが、別の目的や使い道が見つかったのかもしれません(すべてのLoRAに言えることですが)。

これが最後のバージョンになる可能性が高いです。画像を増やしても主効果は変わらないからです。主に異なるモデルやLoRAの組み合わせ、プロンプトで変化させています。

これからは画像生成にもっと注力し、新しい変わったLoRAを作ったり、古いものを修正したりします。また、多くの人からダウンロードした素材もほとんど使えていません。

これまで投稿されたすべての画像に感謝します。この速いAI分野でLoRAに寿命はありますが、華やかさは必ず終わります。


V2.0


V2.0に関する小さなお知らせ(国によって02.04または04.02)

私は完全なバカでした。

別のLoRAの訓練を始めたとき、2000ステップ経ってもサンプル画像に変化がなく、ありえないと思いました。それで理由を探し、変えていなかった設定(または正しい設定にしていなかった)、LRウォームアップを見つけました。普段はウォームアップを使いませんが、以前のテストでは何が起こるか試したことがあります。それは4枚くらいの画像のデータセットでした。私は常に100エポックに設定していますが、モデルは500ステップごとに出力します。ウォームアップは32%に設定されており、4枚x10リピートx100エポック=4000ステップで、ウォームアップは1280ステップでほとんど進みませんでした。

このLoRAは同じ設定ですが60枚で(60x10x100=60000ステップ - 32%ウォームアップ=19200ステップ)・・・なので12000ステップ後もほとんど始まっておらず、まったく無駄な訓練でした。説明がつきます。疲れて気づかなかったものの、画像のせいだと思っていた効果が出るまで時間がかかったのは設定のせいだったのです。

このLoRAは失敗で、ほとんどの効果はV1.0とのマージに由来します。

週末に仕事から戻ったら正しい設定で再訓練します。

申し訳ありません。ある意味、意図しないエイプリルフールのジョークかもしれません :) .... :(


最近よく使っていて新しいLoRAをアップロードしていなかったので、いくつか画像を追加しました。仕事が忙しく、複雑でストレスの多い題材ばかり選んでしまうため、他のことは退屈に感じてしまいます。

また、Ponyを詳細に解析するのに時間がかかって驚いています。Furry、アニメ、一般的なポルノ関連を除けば、Base XLモデルより基本的なことが多く、LoRA訓練でコンセプトやスタイルの追加がしやすいですが、ポジショニング、感情、奇妙な角度など多くの複雑な要素も知っています…これは全く別の話です。

今年どれだけ訓練できるかわかりません。簡単なものを間に挟むかもしれませんが、AIは急速に進歩しており、1か月か1週間後には新しい何かが出るかもしれません。

  • 同じシードと同じモデルで以前に作成した画像をテストしました。変化はケースによって非常に微妙か極端です (理由は告知を読んでください)

  • 展示画像でのバリエーション不足についても申し訳ありません。画像の準備は訓練より時間がかかることもありますが、この場合はあまり問題ではありません。今後自然に増えていくでしょう。


V1.0

ほぼ完全に黒でかすかな形しかないトレーニング画像でAIが何を学ぶか試してみました。

Photoshopでデータセットの準備はほぼ不可能でした。ほとんど何も見えなかったので。もちろんモニター設定は人それぞれなので、本当にこの画像がこんなに暗かったのかはわかりませんが、目に大きな負担がかかりました。生成画像を見るのもまだ少しつらいですが、トレーニング画像ほど暗くはありません。

モデルが何かを学んだのには驚きました。今のところ何をするか決めるまで保留にします。実際、変なことをすることもあります。生成画像をControlNetのIP-Adapterに入れるとすべてが強調され、ランダムな結果が出ます。

生成時のヒント:

  • よくわかりません…頑張ってください。

前の画像
Epic gorgeous Details - Balance_v2.0
次の画像
FLUX - Pro 1.1 Ultra

モデル詳細

モデルタイプ

LORA

ベースモデル

Flux.1 D

モデルバージョン

Flux.1 D v2.0

モデルハッシュ

1dd1fb8b12

学習済みワード

vantablack

ディスカッション

コメントを残すには log in してください。