PixelWave - FLUX.1-dev 03
推奨パラメータ
samplers
steps
cfg
resolution
vae
推奨ハイレゾパラメータ
upscale
ヒント
細部を向上させるためにより多くのステップを使用できますが、8ステップを超えると出力はほとんど変わりません。
よりきれいでクリーンな出力を望む場合、ガイダンススケール(CFG)を上げてみてください。
プロンプトでスタイルを指定するとモデルがより良い結果を生成しやすくなります。
ノードごとにアップスケール潜在を追加し、潜在を1.5倍にスケールして高解像度の画像を生成してみてください。
『4K』『8K』『傑作』『高解像度』『高品質』などの用語は、必要でない限り避けてください。これらは画像を過剰に調理されたように見せることがあります。
写真スタイルでは、自然な見た目を求める場合、『鮮やか』『強烈』『明るい』『高コントラスト』『ネオン』『ドラマティック』といった語の使用を避けてください。
トレーニングはpagedlion8bitオプティマイザーを使ったkohya_ss/sd-scriptsで行いました。
time_in、vector_in、modulationパラメータを固定することで『非蒸留』を防いでいます。
15以上の単一ブロックのトレーニングは避け、FLUXセクションでトレーニングブロックを設定してください。
学習率5e-6は高速ですが、数千ステップで停止しないとブロックの破損が始まり学習速度が遅くなります。
バージョンのハイライト
4090で5週間かけてファインチューニングしました。
クリエイタースポンサー
モデルは RunDiffusion と Runware.ai でも利用可能です。
このモデルのトレーニングを可能にした計算リソースを提供してくれた RunDiffusion に大いに感謝します!
APIアクセスについては、Runware.ai と提携しています。
PixelWave FLUX.1-schnell 04 - Apache 2.0!
Safetensor Files: 💾BF16 💾FP8 💾bnb FP4
GGUF Files: 💾Q8_0 🤗Q6_K 💾Q4_K_M
モデルは次のサイトでも利用可能: RunDiffusion と Runware.ai
PixelWave FLUX.1 schnell バージョン04は、FLUX.1-schnellの美的微調整版です。トレーニング画像は、鮮やかな色彩、質感、照明が特徴的な目を引く画像に偏るよう手作業で選択されました。
オリジナルのschnellモデルでトレーニングされているため、Apache 2.0ライセンスです!
特別な実行要件はなく、FLUX LoRAsをサポートします。
Euler Normal、8ステップ。
さらに多くのステップを使用して細部を向上させることができますが、8ステップ以降は出力の変化はあまりありません。
RunDiffusionに感謝
このモデルのトレーニングを可能にした計算リソースを提供してくれたRunDiffusion(Juggernautの共同制作者)に大きく感謝します。schnellモデルの非蒸留(de-distillation)なしのトレーニング方法を模索するのに多くの実験が必要でしたが、RunDiffusionのクラウド計算資源利用が大いに助けとなりました。
このモデルのAPIアクセスが必要な方は、Runware.aiと提携しています。
現時点ではFLUX.1-dev 04バージョンをRunDiffusionとRunware限定で提供しています。今後バージョン05をリリースするときに、dev 04のオープンウェイトを公開する予定です。
彼らの支援に感謝しており、ぜひご覧ください!
トレーニング
トレーニングはkohya_ss/sd-scriptsを使用して行いました。私のフォーク版のKohyaはこちらにあり、sd-scriptsサブモジュールへの変更も含まれているので両方クローンしてください。
ファインチューニングタブを使用。4090 24GB GPU上で動作可能なpagedlion8bitオプティマイザーで最良の結果を得ました。他のオプティマイザーは学習が困難でした。
time_in、vector_in、mod/modulationパラメータを固定しています。これにより『非蒸留』が停止します。
FLUXセクションでトレーニングするブロックを設定可能で、15以上の単一ブロックのトレーニングは避けています。
学習率は5e-6で高速に学習しますが、数千ステップ後に停止しないとブロックの腐敗が始まり学習が遅くなります。
腐敗したブロックは初期チェックポイントとのマージで交換し、学習を続けられます。
腐敗ブロックの兆候は、画像全体にかかる紙質感や背景ディテールの喪失です。
連絡先
ビジネスまたは商業目的の問い合わせはpixelwave@rundiffusion.comまでご連絡ください。Fluxファインチューニングのライセンス、カスタムトレーニングプロジェクト、商用AI開発までチームが対応します!
PixelWave Flux.1-dev 03 微調整完了!
Safetensor Files: 💾BF16 💾FP8 💾NF4
GGUF Files: 💾Q8_0 🤗Q6_K 💾Q4_K_M
「diffusers」ファイルは実際にはQ8_0およびQ4_K_MのGGUFバージョンです。GGUFファイルはhuggingfaceでも入手可能です。
バージョン03をベースFLUX.1-devから約5週間、4090で微調整しました。異なるアートスタイル、写真、アニメに対応可能です。LoRAsを助けるトリックを発見しました。
ショーケース画像にはdpmpp 2m sgm uniform 30ステップを使用しました。よりきれいな出力を望む場合はガイダンス強度を上げてみてください。スタイル指定も有効で、モデルが推測する必要が減ります。
さらに、ノードごとにアップスケール潜在を追加し、潜在を1.5倍にスケールして(例:1024x1024ではなく1536x1536の画像生成)解像度を高めることをお勧めします。
PixelWave Flux.1-schnell 03
GGUF Files: huggingfaceへ
ショーケース画像にはdpmpp 2m sgm uniform 8ステップを使用しました。
4ステップから始められますが、多くのステップを使用すると解剖学の誤りが減少します。
PixelWave Flux.1-dev 02
GGUF Files: 💾Q8_0 🤗Q6_K 💾Q4_K_M
バージョン02では黒や暗い画像の改善が大幅に行われ、手の描写問題も減少しより安定した出力が得られます。
dpmpp_2s_ancestral、beta、14ステップの使用を推奨します。またはEuler simple、20ステップも良いです。
PixelWave 11 SDXL. 汎用のファインチューニングモデル。アートや写真スタイルに最適。
20ステップ、DPM++ SDE、CFG4〜6、または40ステップ、2M SDE Karrasを使用しています。
高速バージョン - 5ステップ以上、DPM++ SDE Karras、CFG2.5
PAG 推奨⚡ CFG3、スケール1.5推奨。 ワークフローリンク
⭐プロンプトガイドへのリンク⭐ 「quality」関連の用語(4K、8K、傑作、高解像度、高品質など)は必須でなければ使用不要です。より自然な見た目を望むなら、写真スタイルで「鮮やか、強烈、明るい、高コントラスト、ネオン、ドラマティック」などの語を避けることをお勧めします。これらは画像を「過剰に調理された」ように見せることがありますが、単にCLIPがプロンプトに従っているだけです🙂。鮮やかでネオン風の写真を望む場合はPixelWaveが対応します!
バージョン10の焦点はCLIPモデルのトレーニングで、信頼性の向上、多様なスタイルの生成、プロンプトのより良い追従性を実現しました。
テストを手伝ってくれた友人たちに感謝:masslevel、blink、socalguitarist、klinter、wizard whitebeard。
ガイド:LM StudioとMikey Nodesによるアップスケーリングプロンプト
リファイナーモデルは不要です。
このモデルは他のモデルのミックスではありません。
Mikey Nodesも作成しており、多くの便利なノードが含まれています。comfy manager経由でインストール可能です。
モデル詳細
ディスカッション
コメントを残すには log in してください。




