暖炉が灯る居心地の良い薄暗い図書室で、黒いドレスを着た女性が暗赤色のベルベットソファに座って本を読んでいる。花柄の絵画と高い本棚が特徴的。
住宅とヤシの木の前の通りに白いSUVが駐車されているロサンゼルス郊外の住宅街の昼間の写真。
短いジーンズと白いタンクトップを着た若い女性が、ハバナのカラフルなキューバの通りにある1950年代の赤い車にもたれかかっている。背後にはパステルカラーの長屋が並んでいる。
乾いた土の小道が前景に広がり、背景に山々がそびえ、左側には澄んだ青空の下に海が広がる、丘陵のイタリア風景に位置するローマの都市の風光明媚な空撮ビュー。

推奨パラメータ

samplers

Euler Normal, dpmpp 2m sgm uniform, dpmpp_2s_ancestral, euler, DPM++ SDE, 2M SDE Karras, DPM++ SDE Karras, DPM++ 2M

steps

4 - 40

cfg

2.5 - 7

resolution

1024x1024, 1536x1536

vae

ae.safetensors - unknown

推奨ハイレゾパラメータ

upscale

1.5 - null

ヒント

細部を向上させるためにより多くのステップを使用できますが、8ステップを超えると出力はほとんど変わりません。

よりきれいでクリーンな出力を望む場合、ガイダンススケール(CFG)を上げてみてください。

プロンプトでスタイルを指定するとモデルがより良い結果を生成しやすくなります。

ノードごとにアップスケール潜在を追加し、潜在を1.5倍にスケールして高解像度の画像を生成してみてください。

『4K』『8K』『傑作』『高解像度』『高品質』などの用語は、必要でない限り避けてください。これらは画像を過剰に調理されたように見せることがあります。

写真スタイルでは、自然な見た目を求める場合、『鮮やか』『強烈』『明るい』『高コントラスト』『ネオン』『ドラマティック』といった語の使用を避けてください。

トレーニングはpagedlion8bitオプティマイザーを使ったkohya_ss/sd-scriptsで行いました。

time_in、vector_in、modulationパラメータを固定することで『非蒸留』を防いでいます。

15以上の単一ブロックのトレーニングは避け、FLUXセクションでトレーニングブロックを設定してください。

学習率5e-6は高速ですが、数千ステップで停止しないとブロックの破損が始まり学習速度が遅くなります。

バージョンのハイライト

4090で5週間かけてファインチューニングしました。

クリエイタースポンサー

モデルは RunDiffusionRunware.ai でも利用可能です。

このモデルのトレーニングを可能にした計算リソースを提供してくれた RunDiffusion に大いに感謝します!

APIアクセスについては、Runware.ai と提携しています。

PixelWave FLUX.1-schnell 04 - Apache 2.0!

Safetensor Files: 💾BF16 💾FP8 💾bnb FP4

GGUF Files: 💾Q8_0 🤗Q6_K 💾Q4_K_M

リンク: 🤗VAE 🤗T5xxl 🤗CLIP L

モデルは次のサイトでも利用可能: RunDiffusionRunware.ai

PixelWave FLUX.1 schnell バージョン04は、FLUX.1-schnellの美的微調整版です。トレーニング画像は、鮮やかな色彩、質感、照明が特徴的な目を引く画像に偏るよう手作業で選択されました。

  • オリジナルのschnellモデルでトレーニングされているため、Apache 2.0ライセンスです!

  • 特別な実行要件はなく、FLUX LoRAsをサポートします。

  • Euler Normal、8ステップ。

さらに多くのステップを使用して細部を向上させることができますが、8ステップ以降は出力の変化はあまりありません。

RunDiffusionに感謝

このモデルのトレーニングを可能にした計算リソースを提供してくれたRunDiffusion(Juggernautの共同制作者)に大きく感謝します。schnellモデルの非蒸留(de-distillation)なしのトレーニング方法を模索するのに多くの実験が必要でしたが、RunDiffusionのクラウド計算資源利用が大いに助けとなりました。

このモデルのAPIアクセスが必要な方は、Runware.aiと提携しています。

現時点ではFLUX.1-dev 04バージョンをRunDiffusionとRunware限定で提供しています。今後バージョン05をリリースするときに、dev 04のオープンウェイトを公開する予定です。

彼らの支援に感謝しており、ぜひご覧ください

トレーニング

トレーニングはkohya_ss/sd-scriptsを使用して行いました。私のフォーク版のKohyaはこちらにあり、sd-scriptsサブモジュールへの変更も含まれているので両方クローンしてください。

ファインチューニングタブを使用。4090 24GB GPU上で動作可能なpagedlion8bitオプティマイザーで最良の結果を得ました。他のオプティマイザーは学習が困難でした。

time_in、vector_in、mod/modulationパラメータを固定しています。これにより『非蒸留』が停止します。

FLUXセクションでトレーニングするブロックを設定可能で、15以上の単一ブロックのトレーニングは避けています。

学習率は5e-6で高速に学習しますが、数千ステップ後に停止しないとブロックの腐敗が始まり学習が遅くなります。

腐敗したブロックは初期チェックポイントとのマージで交換し、学習を続けられます。

腐敗ブロックの兆候は、画像全体にかかる紙質感や背景ディテールの喪失です。

連絡先

ビジネスまたは商業目的の問い合わせはpixelwave@rundiffusion.comまでご連絡ください。Fluxファインチューニングのライセンス、カスタムトレーニングプロジェクト、商用AI開発までチームが対応します!

PixelWave Flux.1-dev 03 微調整完了!

Safetensor Files: 💾BF16 💾FP8 💾NF4

GGUF Files: 💾Q8_0 🤗Q6_K 💾Q4_K_M

リンク: 🤗VAE 🤗T5xxl 🤗CLIP L

「diffusers」ファイルは実際にはQ8_0およびQ4_K_MのGGUFバージョンです。GGUFファイルはhuggingfaceでも入手可能です。

バージョン03をベースFLUX.1-devから約5週間、4090で微調整しました。異なるアートスタイル、写真、アニメに対応可能です。LoRAsを助けるトリックを発見しました。

ショーケース画像にはdpmpp 2m sgm uniform 30ステップを使用しました。よりきれいな出力を望む場合はガイダンス強度を上げてみてください。スタイル指定も有効で、モデルが推測する必要が減ります。

さらに、ノードごとにアップスケール潜在を追加し、潜在を1.5倍にスケールして(例:1024x1024ではなく1536x1536の画像生成)解像度を高めることをお勧めします。

PixelWave Flux.1-schnell 03

Safetensor Files: 💾FP8 💾NF4

GGUF Files: huggingfaceへ

ショーケース画像にはdpmpp 2m sgm uniform 8ステップを使用しました。

4ステップから始められますが、多くのステップを使用すると解剖学の誤りが減少します。

PixelWave Flux.1-dev 02

Safetensor Files: 💾BF16 💾FP8

GGUF Files: 💾Q8_0 🤗Q6_K 💾Q4_K_M

バージョン02では黒や暗い画像の改善が大幅に行われ、手の描写問題も減少しより安定した出力が得られます。

dpmpp_2s_ancestral、beta、14ステップの使用を推奨します。またはEuler simple、20ステップも良いです。

Comfyui-GGUFノード

PixelWave 11 SDXL. 汎用のファインチューニングモデル。アートや写真スタイルに最適。

20ステップ、DPM++ SDE、CFG4〜6、または40ステップ、2M SDE Karrasを使用しています。

高速バージョン - 5ステップ以上、DPM++ SDE Karras、CFG2.5

PAG 推奨⚡ CFG3、スケール1.5推奨。 ワークフローリンク

🔗拡張ギャラリーへのリンク 🖼️

プロンプトガイドへのリンク⭐ 「quality」関連の用語(4K、8K、傑作、高解像度、高品質など)は必須でなければ使用不要です。より自然な見た目を望むなら、写真スタイルで「鮮やか、強烈、明るい、高コントラスト、ネオン、ドラマティック」などの語を避けることをお勧めします。これらは画像を「過剰に調理された」ように見せることがありますが、単にCLIPがプロンプトに従っているだけです🙂。鮮やかでネオン風の写真を望む場合はPixelWaveが対応します!

バージョン10の焦点はCLIPモデルのトレーニングで、信頼性の向上、多様なスタイルの生成、プロンプトのより良い追従性を実現しました。

テストを手伝ってくれた友人たちに感謝:masslevelblinksocalguitaristklinterwizard whitebeard

ガイド:LM StudioとMikey Nodesによるアップスケーリングプロンプト

ガイド:スキップステップ法で画像に詳細を追加

リファイナーモデルは不要です。

このモデルは他のモデルのミックスではありません。

Mikey Nodesも作成しており、多くの便利なノードが含まれています。comfy manager経由でインストール可能です。

前の画像
Artify´s Fantastic Flux Landscape Lora - artilands_v1.0
次の画像
Project0* - v4.0 Art_Realism_FP8

モデル詳細

モデルタイプ

Checkpoint

ベースモデル

Flux.1 D

モデルバージョン

FLUX.1-dev 03

モデルハッシュ

49b429b788

作成者

ディスカッション

コメントを残すには log in してください。

「PixelWave - FLUX.1-dev 03」による画像

暖炉が灯る居心地の良い薄暗い図書室で、黒いドレスを着た女性が暗赤色のベルベットソファに座って本を読んでいる。花柄の絵画と高い本棚が特徴的。
住宅とヤシの木の前の通りに白いSUVが駐車されているロサンゼルス郊外の住宅街の昼間の写真。
短いジーンズと白いタンクトップを着た若い女性が、ハバナのカラフルなキューバの通りにある1950年代の赤い車にもたれかかっている。背後にはパステルカラーの長屋が並んでいる。
乾いた土の小道が前景に広がり、背景に山々がそびえ、左側には澄んだ青空の下に海が広がる、丘陵のイタリア風景に位置するローマの都市の風光明媚な空撮ビュー。

アニメ画像

アニメ風のエジプト系女性が砂漠に膝をつく。日焼けした肌に白髪、赤い目、白いローブとエジプトの襟飾りを着け、背景に日光が差している。
夜に青い花畑に立つショートヘアのアニメ少女。空には青く輝く光と銀河があり、遠くに街の灯りが見える。
長い黒髪と鮮やかな緑色の瞳を持ち、黒い衣装と赤い花の刺青が施された太ももまでのストッキングを着用し、赤い背景に対して刀を持つスタイライズされたアニメ少女。
都市のスカイラインに迫る空中艦隊、ストリートで戦うロボットと蒸気駆動の外骨格スーツ、激しい爆発が中心を照らし、嵐の空の下に広がる劇的な蒸気パンク戦闘シーン。
金髪で黄色い目、キツネの耳と尾を持ち、毛皮の縁取りと伝統的な髪飾りがついたカラフルな着物を着た笑顔のキツネ少女が鳥居の前に立っている。
カフェの中で、ターコイズのソファに座り、トレイに乗せたドリンクを持つピンクのチャイナドレスを着た紫青色の髪のアニメ少女。
アニメ風の金髪の少女が白いサンドレスとひまわりの飾りがついた大きなサンハットを着て、夕暮れのひまわり畑で嬉しそうに腕を挙げて立っている。
星空の下、薄暗い都市の路地に立つ、ノースリーブの黒いタートルネックセーター、黒いパンツ、指なし手袋を身に着けた、鋭い青い目と短い白髪の自信に満ちた女性。
胸元の切り抜きがある黒と金のヘルダイバーアーマーを着て、サイハイブーツを履き、ヘルメットを手に持ち、青い瞳と淡い笑みを浮かべた金髪女性
赤い編み込み髪のアニメ少女が金色の縁取りのある紺色の制服を着て、足を広げて座り、赤い目で見つめ、赤いリボンとイヤリングを着けている。

基本モデル画像

暗く不吉な空の下、光るジャックオーランタンに照らされた不気味な墓地を歩くゾンビや骸骨を含むアンデッドキャラクターの写実的なシーン。

デジタルアート画像

高層ビルとデジタルビルボードが立ち並ぶ賑やかな未来都市広場の中央にある透明な立方体内に展示された透過性のホログラフィックスペースシップモデル。
豪華な寝室の上に青みがかった宇宙をテーマにしたキャラクターのホログラフィック投影を特徴とするフォトリアリスティックなデジタルイラスト。青い壁と都市の景観を背景にした未来的な装いの女性がベッドに座っている。
長い黒いポニーテールと前髪を持ち、肌にピタッとした白とエメラルドのボディスーツを着たSF女性キャラクター。コミックスタイルで背面から姿が強調されている。
暗い環境でバイオレットとシアンの火花と蒸気を放つ輝くスターバックスコーヒーマグ。
テクスチャのある強烈な赤い背景に、ギザギザの羽を持ち翼を広げた大きな暗い鳥のデジタル絵画。右側には明るく輝く光があります。
暗い背景に、顔と肩にそばかすがあり、緑の目と赤毛の少女が暗色のタンクトップを着たデジタル肖像画。
スタイリッシュな格子柄スーツを着たアンスロ黒猫が木製の机に座り、ブラウンのギンのグラスを持ち、明るい黄色の目と緻密なディテールがあるシュールなラウンジ設定。
白髪で青い目の若い白人男性のデジタルポートレート。MUSAICによるニューウェーブ音楽アルバムカバー「Counting Down The Days」は動的で詳細。

写真画像

ピンクの壁の近くで、グレーの髪と高いポニーテールの女性、祖父と白い犬とカンガルーがターコイズ色のプールに立っている
夜に暖かいオレンジ色の光で照らされた段差のあるコンクリート構造が特徴の、暗くムーディーな現代建築。
古代の石の遺跡と階段がある神秘的な夜の風景。遠くの山々の後ろに輝く満月が沈み、曲がりくねった川の谷、輝く星、そして映画のような照明で照らされた温かく魔法のような空が広がっています。
フォトリアリスティックな黒いリンカーンコンチネンタル、濃い色の窓ガラス、黄昏時の夕日が差すニューヨークの濡れた通りにて、光沢のある舗装と雨の雰囲気をフィルムグレインスタイルで表現。
ミニマリストスタイルの暗いドア枠の後ろからのぞくプラチナショートヘアの女性のファッション写真のポートレート。冷たい青のシネマティックライティングに照らされている。
淡いシネマティックな色彩で、霧と海の波が女性の横顔に溶け込む二重露光のクローズアップポートレート
鮮やかな紫色の花と緑の葉の茂みの後ろに部分的に隠れた、そばかすがある緑の目を持つ若い女性のクローズアップ、片方の目を花が覆っている。
白いチュニックとズボンを着てサングラスをかけたアフリカ系女性が、サイバーパンクとポストアポカリプスのデザイン要素を持つ巨大な黒い未来的宇宙船内の階段をドラマチックな照明のもとで降りているフォトリアリスティックな水彩画風イラスト。
フォトリアリスティックな3Dレンダリングで、大きく暗い円筒形のトンネル内に立つ人物が描かれており、未来的な技術要素とオレンジ色に光る光が散りばめられ、シネマティックかつボリュメトリックな照明効果で照らされている。
彫刻された金属製サイバーパンクヘルメットに配線とケーブルを備え、ブラックローブを纏ったディストピアンアンドロイドの正面ハイパーリアリスティック写真。

伝統的なアート画像

自信に満ちた女性のローマの女番兵が、精緻に装飾されたブロンズの戦闘鎧を着用し、日中の歴史的な街並みの中に立っている。
霧の中、険しい山の崖を流れ落ちる劇的な滝を描いた東洋の水墨画、薄くかすんだ書道入り
三毛猫が鮮やかな日本の水彩風の花々の中で穏やかに座り、大きな赤い太陽の下に優雅な墨絵効果が施されています。
輝く髪とクリアな肌の女の子のクローズアップ、目を閉じている。
1990年代アニメファッションで長い金髪を持つ学校の制服のアニメ少女、高品質な構図。
漢服を着た少女が中国の墨絵スタイルで巨大なホワイトタイガーを眺めている。
煙に囲まれた水上の剣士、中国のインクスタイルで体積光を使ったシーン。
漢服を着た女性の伝統的な中国要素を持つシネマティックなダブルエクスポージャー肖像画。