Flux.1 D - 不気味なもの - v1.0
推奨パラメータ
samplers
steps
cfg
resolution
other models
推奨ハイレゾパラメータ
denoising strength
ヒント
Fluxはスタイル、クリーンな画像、色のコントラストに優れています。
特に複数のLoRAや高いCFGを使う場合、かなりのRAMと長い生成時間を要することがあります。
高コストやパフォーマンス低下を避けるため、サイト内ジェネレーターでの使用は注意してください。
リアルな画像でも一部カートゥーン風や偽物のような見た目になることがあります。
高速なバッチ生成にはHigh-Res Fixを用いたSDXLの使用を試みてください。
当面の間、おそらくFluxの最後のモデルでしょう。興味深いものが出てこない限り。理由は様々ですが、一番の理由は最も楽しかったSDXLやPonyモデルのランダム性が恋しいことです。音楽を聴きながら合間に歌詞を分解して何が起こるかを見るのはかなりリラックスできますが、Fluxではそれがあまりできません。また、現在のところ特に、画像生成に必要なリソースと時間が多すぎます。いくつかのLoRAを追加し、CFGを高めると、RAM使用量と生成時間が急増します。同じ時間であれば、SDXLのHigh-Res Fixでバッチを10個作成できるでしょう。ここそこで使い続けますが、主軸にはしません。
Fluxを始めたのは好奇心と壁に頭をぶつけるような挑戦感が主な動機でした。Fluxには多くの利点がありますが、少し深く調べた結果、自分が望むような挙動や期待・希望を満たすのは難しい戦いだと感じました。柔軟性がなく、LoRAやランダムシードを使っても特定の画像やスタイルにデフォルト設定され、コンセプトの混在(場合によっては悪くないこともあります)、一部のプラグインは機能しません(対応していないかForgeのGradioバージョンのせいです)、カメラアングルに関する知識が限定的、一部の画像はリアルな写真でもカートゥーン風の偽物のように見え、ノイズ、粒状感、霞みなども限定的という問題があります。
一方で、Fluxの優れている点はスタイル表現、クリーンな画像、質の悪いトレーニング画像を有用なものへ変換、ほとんどの部分で良好な解剖学、色彩とコントラスト、コヒーレンス、テキストエンコーダーなどです。
このモデルはデフォルトのFluxモデルでトレーニングされたのではなく、こちらのモデルでトレーニングされています。https://civitai.com/models/843551/fluxdev-dedistilled?modelVersionId=943787。何か違いがあるのかは不明です。同じLoRAを両方のバージョンで並べて比較トレーニングしたかったのですが、結局面倒でやりませんでした。ただし、その点を踏まえても、このLoRAをサイト内ジェネレーターで使用することを人にあまり勧めません。動かないかもしれないものにBuzzを消費したくなければ特に。
現時点でこのようなLoRAはかなりあります(ハロウィン物が多いですが)、おそらくより良い結果を出すものもあります。投稿された画像は似通っていますが、異なるスタイルやテーマの画像もいくつか使っています。ホラーと関係ないものすらあります。現在のハロウィン関連をメインにして、一応仮説検証的に使ってみました。
ご健闘を祈ります
追伸:私のギャラリーにあるいくつかの画像は、基本的に同じLoRAを使っていますが、Kohyaの設定とステップ数が異なります。
モデル詳細
ディスカッション
コメントを残すには log in してください。