使い古された宇宙服を着た宇宙飛行士が、口のように開いた開口部と大きなエンジンを持つ巨大なサメ型宇宙船の前の白い砂漠に立っている。

推奨パラメータ

samplers

Euler Normal, dpmpp 2m sgm uniform, dpmpp_2s_ancestral, Euler, DPM++ SDE, 2M SDE Karras

steps

4 - 40

cfg

2.5 - 7

resolution

1536x1536, 1024x1024

vae

ae.safetensors

推奨ハイレゾパラメータ

upscale

1.5 - null

ヒント

細かいディテールを向上させるために8ステップ以上使用してください。ただし8ステップ以降の出力変化は少ないです。

スタイルプロンプトを追加するとモデルがより整ったクリーンな出力を生成する助けになります。

クリーンな画像を得るためにガイダンススケールを上げてみてください。

自然な写真風にしたい場合は、4K、8K、傑作、高解像度などの『quality』用語の使用は避けてください。

アップスケールにはノードによるlatentアップスケールとlatentを1.5倍にスケールする方法を試してください。

24GB GPUでのトレーニングにはpagedlion8bitオプティマイザーを使い、time_in、vector_in、modulationパラメータを固定してデディスティレーションを防ぎます。

LR 5e-6で数千ステップで学習を止め、汚損したブロックを早期チェックポイントとブロックマージして修正し、トレーニングを続行してください。

バージョンのハイライト

schnellモデルのファインチューニングで、devモデルは一切使用していません。Apache 2.0ライセンス!

kohyaでトレーニングし、カスタムシグマスケジュールと時間とモジュレーションパラメータの固定により時間蒸留の劣化を防止しています。

➤ 総トレーニングステップ数 : 1,360,641

➤ 実稼働トレーニング時間 : 1192.61時間 (49.7日)

クリエイタースポンサー

モデルは以下でも利用可能です: RunDiffusionRunware.ai

このモデルのトレーニング計算資源を提供してくれた RunDiffusion に大変感謝します!

APIアクセスについてはRunware.aiをご覧ください。

PixelWave FLUX.1-schnell 04 - Apache 2.0!

Safetensor ファイル: 💾BF16 💾FP8 💾bnb FP4

GGUF ファイル: 💾Q8_0 🤗Q6_K 💾Q4_K_M

リンク先 🤗VAE 🤗T5xxl 🤗CLIP L

モデルは以下でも利用可能: RunDiffusionRunware.ai

PixelWave FLUX.1 schnell バージョン04は、FLUX.1-schnellの美的ファインチューニングです。トレーニング画像は、目を引く美しい色彩、質感、照明を重視したバイアスをモデルに持たせるために手作業で選択されました。

  • オリジナルのschnellモデルの上にトレーニングされているため、Apache 2.0ライセンスです!

  • 実行に特別な要件なし。FLUX LoRAをサポート

  • Euler Normal、8ステップ。

細かいディテールを向上させるためにステップ数を増やすことは可能ですが、出力は8ステップ以降あまり変わりません。

RunDiffusionに感謝

RunDiffusion(Juggernautの共同クリエイター)に、このモデルのトレーニングを可能にした計算リソースの提供に大変感謝します!schnellをデディスティルせずにトレーニングする方法を探るには多くの実験が必要で、RunDiffusionのクラウド計算リソースの利用可能性がとても助けになりました。

このモデルのAPIアクセスが必要な方は、Runware.aiと提携しています。

現在、FLUX.1-dev 04バージョンは一時的にRunDiffusionとRunware専用にしています。将来バージョン05を公開する際に、dev 04のオープンウェイトをリリースする予定です。

このモデルの公開を支援してくれた彼らに感謝しています。ぜひチェックしてください

トレーニング

トレーニングはkohya_ss/sd-scriptsを使用して行いました。こちらのKohyaのフォークにはsd-scriptsサブモジュールへの変更も含まれているので、両方をクローンしてください。

ファインチューニングタブを使用。4090 GPU 24GBで動作可能なpagedlion8bitオプティマイザーが最良の結果を出しました。他のオプティマイザーは学習に苦戦しました。

time_in、vector_in、mod/modulationパラメータを固定しました。これにより“デディスティレーション”を防止します。

15を超える単一ブロックのトレーニングは避けています。トレーニングするブロックはFLUXセクションで設定可能です。

LR 5e-6は高速にトレーニングできますが、数千ステップ後に学習速度の低下やブロックの汚損が始まるため停止が必要です。

不良ブロックは早期のチェックポイントとブロックマージし、腐敗したブロックを置き換え、その後トレーニングを続行できます。

不良ブロックの兆候:多くの画像に紙の質感が出る、背景の詳細が失われるなど。

お問い合わせ

ビジネスや商用の問い合わせはpixelwave@rundiffusion.comまでお願いします。FLUXファインチューニングのライセンス、顧客向けトレーニングプロジェクト、商用AI開発など、チームが対応します!

PixelWave Flux.1-dev 03 ファインチューン済み!

Safetensor ファイル: 💾BF16 💾FP8 💾NF4

GGUF ファイル: 💾Q8_0 🤗Q6_K 💾Q4_K_M

リンク先 🤗VAE 🤗T5xxl 🤗CLIP L

「diffusers」ファイルは実際にはQ8_0とQ4_K_MのGGUFバージョンです。GGUFファイルはHuggingfaceでも利用可能。

私は4090で5週間以上BaseのFLUX.1-devからバージョン03をファインチューニングしました。異なるアートスタイル、写真、アニメが可能です。LoRAに役立つ発見したトリック。

ショーケース画像はdpmpp 2m sgm uniform 30ステップを使用。もっときれいでクリーンな出力が欲しい場合はガイダンスを上げてください。また、スタイルの指定をするとモデルが推測しなくて済みます。

アップスケールにはノードによるlatentアップスケールとlatentを1.5倍にスケーリングするのがおすすめです。例:1024x1024の代わりに1536x1536の画像生成。

PixelWave Flux.1-schnell 03

Safetensor ファイル: 💾FP8 💾NF4

GGUF ファイル: huggingfaceへ

ショーケース画像にはdpmpp 2m sgm uniform 8ステップを使用しました。

4ステップから始めることもできますが、ステップを増やすと解剖学的エラーが少なくなります。

PixelWave Flux.1-dev 02

Safetensor ファイル: 💾BF16 💾FP8

GGUF ファイル: 💾Q8_0 🤗Q6_K 💾Q4_K_M

バージョン02は黒や暗い画像が大幅に改善され、手に関する問題も減り、より信頼性の高い出力です。

dpmpp_2s_ancestral、beta、14ステップ、またはeuler、simple、20ステップの使用を推奨します。

Comfyui-GGUF ノード

PixelWave 11 SDXL. 汎用ファインチューニングモデル。アートと写真のスタイルに最適。

20ステップで、DPM++ SDE、CFG 4から6、または40ステップで2M SDE Karrasを使用しています。

高速版 - 5+ステップ、DPM++ SDE Karras、2.5 CFG

PAG 推奨⚡ガイダンススケール1.5、CFG 3を推奨。ワークフローへのリンク

🔗拡張ギャラリーへのリンク🖼️

プロンプトガイドへのリンク⭐ 「quality」などの4K、8K、傑作、高解像度、高品質などの用語を使う必要はありません。自然なルックを望む写真のスタイルでは、「鮮やか、強烈、明るい、高コントラスト、ネオン、ドラマティック」などの単語は使わないことを推奨します。これらは画像を「過剰調理」に見せる可能性がありますが、CLIPがプロンプトに従っているだけです。もし鮮やかでネオン風の写真が欲しいなら、PixelWaveが提供します!

バージョン10の焦点はCLIPモデルのトレーニングで、信頼性を高め、多様なスタイルを生成可能にし、プロンプト遵守力を向上させました。

テストに協力してくれた友人たちに感謝します:masslevel, blink, socalguitarist, klinter, wizard whitebeard

ガイド:LM StudioとMikey Nodesによるアップスケールプロンプト

ガイド:スキップステップ法による画像の詳細追加

リファイナーモデルは不要です。

このモデルは他のモデルの混合ではありません。

Mikey Nodesも作成しており、多くの便利なノードが含まれています。comfy managerからインストール可能です。

前の画像
Smol Dragons [LoRA 1.5+SDXL] - SDXL
次の画像
ICBINP - "I Can't Believe It's Not Photography" - LCM

モデル詳細

モデルタイプ

Checkpoint

ベースモデル

Flux.1 S

モデルバージョン

FLUX.1-schnell 04

モデルハッシュ

565b846820

作成者

ディスカッション

コメントを残すには log in してください。

「PixelWave - FLUX.1-schnell 04」による画像

使い古された宇宙服を着た宇宙飛行士が、口のように開いた開口部と大きなエンジンを持つ巨大なサメ型宇宙船の前の白い砂漠に立っている。

アニメ画像

長い銀色のツインテール、ティールの瞳、繊細な顔立ちの小柄なエルフ少女のクローズアップ肖像。白いケープレットに金の縁取り、赤いイヤリングを身に着け、森の中に立っている。
繊細な羽を持ち、詳細な緑の衣装を着たティンカーベルに似た妖精が、鮮やかな花の上で穏やかに眠っている様子。
夜の背景に赤い提灯が吊るされた中、黒のノースリーブチャイナドレス、猫耳と尾を身に着けたFinal Fantasy XIVのY'shtola Rhul。
豊かな峡谷の急な崖に建てられた未来的なSF修道院と都市、下には川が流れ、飛行機械と薄い橋を渡る孤独な女性がいます。
柔らかいパステルトーンと高コントラストのアニメスタイルで熱帯雨林の枝にとまる鮮やかなコンゴウインコ。
美しい目と前髪を持つ少女が草に座っており、彼女と地面に日光と葉の影が絡み合っている。
夜の月明かりの下で、長い巻き毛の髪、明るく光る目、詳細な鎧と光る宝石のイヤリングを身に着けたレトロ未来的な少女の肖像。
青い長い髪と美しい目を持つアニメ風の少女の肖像で、日光に照らされ、秋の葉が彼女の小麦色の肌に繊細な影を落としています。
アニメ風のエジプト系女性が砂漠に膝をつく。日焼けした肌に白髪、赤い目、白いローブとエジプトの襟飾りを着け、背景に日光が差している。
夜に青い花畑に立つショートヘアのアニメ少女。空には青く輝く光と銀河があり、遠くに街の灯りが見える。

基本モデル画像

暗く不吉な空の下、光るジャックオーランタンに照らされた不気味な墓地を歩くゾンビや骸骨を含むアンデッドキャラクターの写実的なシーン。

デジタルアート画像

オレンジ色の秋の葉に囲まれた木の枝に座る、明るい青い目のかわいい濃い灰色の猫のデジタルアート。猫は頭上に輝く光輪を持ち、ペンダントのついた首輪を着けている。
ネオンが輝くディストピアの都市景観で、大規模な爆発の中、ハイテクで発光するエクソスーツを着た凛々しい女性がエネルギー弾を発射している。
冬の雪に覆われた村を背景に、クラシックなアートスタイルで描かれた、茶色の髪の少女が白いうさぎを抱くクローズアップのデジタルペイント。
巨大なキノコ雲と燃え盛る廃墟を背景に、原子爆発で壊滅したディストピアの町を通る長くひび割れた道の後ろからの眺め。
暗い背景に設定された、輝くピンクの角と流れるようなピンクのたてがみ、色付き強膜の赤い目を持つ白いユニコーンのデジタルアートスタイル。
フラットカラー、ハイコントラスト、最小限の線画で描かれた、輝く黄色い目の黒猫のデジタルアートのクローズアップ。
鮮やかな布と複雑な宝飾を身に着け、華麗なタペストリー背景を背にしたカーリーブロンドの髪のファッショナブルな女性のフォトリアリスティックな肖像画。
暗い環境で横から見た、光る高性能SFボディースーツに青く発光するパネルと装甲を身に着けた長い白髪の未来的なサイボーグ少女。
燃え盛る空の下、輝くオレンジ色の炎と神聖な光に包まれたゴシック大聖堂と、その周囲のローブを纏った人物たち。

写真画像

自然光の下でマルーンのVネックTシャツと花柄マイクロスカートを着て屋外に座る、そばかすがある笑顔のブロンド女性
ピンクの壁の近くで、グレーの髪と高いポニーテールの女性、祖父と白い犬とカンガルーがターコイズ色のプールに立っている
夜に暖かいオレンジ色の光で照らされた段差のあるコンクリート構造が特徴の、暗くムーディーな現代建築。
古代の石の遺跡と階段がある神秘的な夜の風景。遠くの山々の後ろに輝く満月が沈み、曲がりくねった川の谷、輝く星、そして映画のような照明で照らされた温かく魔法のような空が広がっています。
フォトリアリスティックな黒いリンカーンコンチネンタル、濃い色の窓ガラス、黄昏時の夕日が差すニューヨークの濡れた通りにて、光沢のある舗装と雨の雰囲気をフィルムグレインスタイルで表現。
ミニマリストスタイルの暗いドア枠の後ろからのぞくプラチナショートヘアの女性のファッション写真のポートレート。冷たい青のシネマティックライティングに照らされている。
淡いシネマティックな色彩で、霧と海の波が女性の横顔に溶け込む二重露光のクローズアップポートレート
鮮やかな紫色の花と緑の葉の茂みの後ろに部分的に隠れた、そばかすがある緑の目を持つ若い女性のクローズアップ、片方の目を花が覆っている。
白いチュニックとズボンを着てサングラスをかけたアフリカ系女性が、サイバーパンクとポストアポカリプスのデザイン要素を持つ巨大な黒い未来的宇宙船内の階段をドラマチックな照明のもとで降りているフォトリアリスティックな水彩画風イラスト。
フォトリアリスティックな3Dレンダリングで、大きく暗い円筒形のトンネル内に立つ人物が描かれており、未来的な技術要素とオレンジ色に光る光が散りばめられ、シネマティックかつボリュメトリックな照明効果で照らされている。

伝統的なアート画像

自信に満ちた女性のローマの女番兵が、精緻に装飾されたブロンズの戦闘鎧を着用し、日中の歴史的な街並みの中に立っている。
霧の中、険しい山の崖を流れ落ちる劇的な滝を描いた東洋の水墨画、薄くかすんだ書道入り
三毛猫が鮮やかな日本の水彩風の花々の中で穏やかに座り、大きな赤い太陽の下に優雅な墨絵効果が施されています。
輝く髪とクリアな肌の女の子のクローズアップ、目を閉じている。
1990年代アニメファッションで長い金髪を持つ学校の制服のアニメ少女、高品質な構図。
漢服を着た少女が中国の墨絵スタイルで巨大なホワイトタイガーを眺めている。
煙に囲まれた水上の剣士、中国のインクスタイルで体積光を使ったシーン。
漢服を着た女性の伝統的な中国要素を持つシネマティックなダブルエクスポージャー肖像画。