暖炉が灯る居心地の良い薄暗い図書室で、黒いドレスを着た女性が暗赤色のベルベットソファに座って本を読んでいる。花柄の絵画と高い本棚が特徴的。
住宅とヤシの木の前の通りに白いSUVが駐車されているロサンゼルス郊外の住宅街の昼間の写真。
短いジーンズと白いタンクトップを着た若い女性が、ハバナのカラフルなキューバの通りにある1950年代の赤い車にもたれかかっている。背後にはパステルカラーの長屋が並んでいる。
乾いた土の小道が前景に広がり、背景に山々がそびえ、左側には澄んだ青空の下に海が広がる、丘陵のイタリア風景に位置するローマの都市の風光明媚な空撮ビュー。

推奨パラメータ

samplers

Euler Normal, dpmpp 2m sgm uniform, dpmpp_2s_ancestral, euler, DPM++ SDE, 2M SDE Karras, DPM++ SDE Karras, DPM++ 2M

steps

4 - 40

cfg

2.5 - 7

resolution

1024x1024, 1536x1536

vae

ae.safetensors - unknown

推奨ハイレゾパラメータ

upscale

1.5 - null

ヒント

細部を向上させるためにより多くのステップを使用できますが、8ステップを超えると出力はほとんど変わりません。

よりきれいでクリーンな出力を望む場合、ガイダンススケール(CFG)を上げてみてください。

プロンプトでスタイルを指定するとモデルがより良い結果を生成しやすくなります。

ノードごとにアップスケール潜在を追加し、潜在を1.5倍にスケールして高解像度の画像を生成してみてください。

『4K』『8K』『傑作』『高解像度』『高品質』などの用語は、必要でない限り避けてください。これらは画像を過剰に調理されたように見せることがあります。

写真スタイルでは、自然な見た目を求める場合、『鮮やか』『強烈』『明るい』『高コントラスト』『ネオン』『ドラマティック』といった語の使用を避けてください。

トレーニングはpagedlion8bitオプティマイザーを使ったkohya_ss/sd-scriptsで行いました。

time_in、vector_in、modulationパラメータを固定することで『非蒸留』を防いでいます。

15以上の単一ブロックのトレーニングは避け、FLUXセクションでトレーニングブロックを設定してください。

学習率5e-6は高速ですが、数千ステップで停止しないとブロックの破損が始まり学習速度が遅くなります。

バージョンのハイライト

4090で5週間かけてファインチューニングしました。

クリエイタースポンサー

モデルは RunDiffusionRunware.ai でも利用可能です。

このモデルのトレーニングを可能にした計算リソースを提供してくれた RunDiffusion に大いに感謝します!

APIアクセスについては、Runware.ai と提携しています。

PixelWave FLUX.1-schnell 04 - Apache 2.0!

Safetensor Files: 💾BF16 💾FP8 💾bnb FP4

GGUF Files: 💾Q8_0 🤗Q6_K 💾Q4_K_M

リンク: 🤗VAE 🤗T5xxl 🤗CLIP L

モデルは次のサイトでも利用可能: RunDiffusionRunware.ai

PixelWave FLUX.1 schnell バージョン04は、FLUX.1-schnellの美的微調整版です。トレーニング画像は、鮮やかな色彩、質感、照明が特徴的な目を引く画像に偏るよう手作業で選択されました。

  • オリジナルのschnellモデルでトレーニングされているため、Apache 2.0ライセンスです!

  • 特別な実行要件はなく、FLUX LoRAsをサポートします。

  • Euler Normal、8ステップ。

さらに多くのステップを使用して細部を向上させることができますが、8ステップ以降は出力の変化はあまりありません。

RunDiffusionに感謝

このモデルのトレーニングを可能にした計算リソースを提供してくれたRunDiffusion(Juggernautの共同制作者)に大きく感謝します。schnellモデルの非蒸留(de-distillation)なしのトレーニング方法を模索するのに多くの実験が必要でしたが、RunDiffusionのクラウド計算資源利用が大いに助けとなりました。

このモデルのAPIアクセスが必要な方は、Runware.aiと提携しています。

現時点ではFLUX.1-dev 04バージョンをRunDiffusionとRunware限定で提供しています。今後バージョン05をリリースするときに、dev 04のオープンウェイトを公開する予定です。

彼らの支援に感謝しており、ぜひご覧ください

トレーニング

トレーニングはkohya_ss/sd-scriptsを使用して行いました。私のフォーク版のKohyaはこちらにあり、sd-scriptsサブモジュールへの変更も含まれているので両方クローンしてください。

ファインチューニングタブを使用。4090 24GB GPU上で動作可能なpagedlion8bitオプティマイザーで最良の結果を得ました。他のオプティマイザーは学習が困難でした。

time_in、vector_in、mod/modulationパラメータを固定しています。これにより『非蒸留』が停止します。

FLUXセクションでトレーニングするブロックを設定可能で、15以上の単一ブロックのトレーニングは避けています。

学習率は5e-6で高速に学習しますが、数千ステップ後に停止しないとブロックの腐敗が始まり学習が遅くなります。

腐敗したブロックは初期チェックポイントとのマージで交換し、学習を続けられます。

腐敗ブロックの兆候は、画像全体にかかる紙質感や背景ディテールの喪失です。

連絡先

ビジネスまたは商業目的の問い合わせはpixelwave@rundiffusion.comまでご連絡ください。Fluxファインチューニングのライセンス、カスタムトレーニングプロジェクト、商用AI開発までチームが対応します!

PixelWave Flux.1-dev 03 微調整完了!

Safetensor Files: 💾BF16 💾FP8 💾NF4

GGUF Files: 💾Q8_0 🤗Q6_K 💾Q4_K_M

リンク: 🤗VAE 🤗T5xxl 🤗CLIP L

「diffusers」ファイルは実際にはQ8_0およびQ4_K_MのGGUFバージョンです。GGUFファイルはhuggingfaceでも入手可能です。

バージョン03をベースFLUX.1-devから約5週間、4090で微調整しました。異なるアートスタイル、写真、アニメに対応可能です。LoRAsを助けるトリックを発見しました。

ショーケース画像にはdpmpp 2m sgm uniform 30ステップを使用しました。よりきれいな出力を望む場合はガイダンス強度を上げてみてください。スタイル指定も有効で、モデルが推測する必要が減ります。

さらに、ノードごとにアップスケール潜在を追加し、潜在を1.5倍にスケールして(例:1024x1024ではなく1536x1536の画像生成)解像度を高めることをお勧めします。

PixelWave Flux.1-schnell 03

Safetensor Files: 💾FP8 💾NF4

GGUF Files: huggingfaceへ

ショーケース画像にはdpmpp 2m sgm uniform 8ステップを使用しました。

4ステップから始められますが、多くのステップを使用すると解剖学の誤りが減少します。

PixelWave Flux.1-dev 02

Safetensor Files: 💾BF16 💾FP8

GGUF Files: 💾Q8_0 🤗Q6_K 💾Q4_K_M

バージョン02では黒や暗い画像の改善が大幅に行われ、手の描写問題も減少しより安定した出力が得られます。

dpmpp_2s_ancestral、beta、14ステップの使用を推奨します。またはEuler simple、20ステップも良いです。

Comfyui-GGUFノード

PixelWave 11 SDXL. 汎用のファインチューニングモデル。アートや写真スタイルに最適。

20ステップ、DPM++ SDE、CFG4〜6、または40ステップ、2M SDE Karrasを使用しています。

高速バージョン - 5ステップ以上、DPM++ SDE Karras、CFG2.5

PAG 推奨⚡ CFG3、スケール1.5推奨。 ワークフローリンク

🔗拡張ギャラリーへのリンク 🖼️

プロンプトガイドへのリンク⭐ 「quality」関連の用語(4K、8K、傑作、高解像度、高品質など)は必須でなければ使用不要です。より自然な見た目を望むなら、写真スタイルで「鮮やか、強烈、明るい、高コントラスト、ネオン、ドラマティック」などの語を避けることをお勧めします。これらは画像を「過剰に調理された」ように見せることがありますが、単にCLIPがプロンプトに従っているだけです🙂。鮮やかでネオン風の写真を望む場合はPixelWaveが対応します!

バージョン10の焦点はCLIPモデルのトレーニングで、信頼性の向上、多様なスタイルの生成、プロンプトのより良い追従性を実現しました。

テストを手伝ってくれた友人たちに感謝:masslevelblinksocalguitaristklinterwizard whitebeard

ガイド:LM StudioとMikey Nodesによるアップスケーリングプロンプト

ガイド:スキップステップ法で画像に詳細を追加

リファイナーモデルは不要です。

このモデルは他のモデルのミックスではありません。

Mikey Nodesも作成しており、多くの便利なノードが含まれています。comfy manager経由でインストール可能です。

前の画像
Artify´s Fantastic Flux Landscape Lora - artilands_v1.0
次の画像
Project0* - v4.0 Art_Realism_FP8

モデル詳細

モデルタイプ

Checkpoint

ベースモデル

Flux.1 D

モデルバージョン

FLUX.1-dev 03

モデルハッシュ

49b429b788

作成者

ディスカッション

コメントを残すには log in してください。

「PixelWave - FLUX.1-dev 03」による画像

アニメ画像

基本モデル画像

デジタルアート画像

写真画像

伝統的なアート画像