Colossus Project Flux - v12_int4_SVDQ_nunchaku
関連キーワード&タグ
推奨ネガティブプロンプト
blurry
推奨パラメータ
samplers
steps
cfg
resolution
ヒント
ネガティブプロンプトに「blurry」を使用して画像の鮮明さを向上させましょう。
FP4/int4バージョンについて:FP4はNvidia 50xx GPU専用、int4は40xx以下で動作(最低20xxシリーズGPUが必要)。
V2.0ではEulerサンプラーとSimpleスケジューラーの組み合わせが最適です。
安定した高品質な結果には20〜30ステップで約2.2のcfg設定を試してください。
「All in One」バージョンにはClip_L、T5xxl fp8、VAEが組み込まれていて使いやすいです。
SVDQ量子化はモデルサイズを削減し、品質を大きく損なわずに生成速度を向上させます。
バージョンのハイライト
注意!FP4とint4の2バージョンがあります。int4は40xx以下のカードで動作し、50xxカードでは動作しません!
V12の量子化はNunchakutechのMuyang Liさんのおかげです。https://huggingface.co/nunchaku-techと彼らの素晴らしいヌンチャクに感謝!
このバージョンはまさに驚異的で、これまでにない品質と速度の両立を実現しています。
両バージョンは以下から直接ダウンロード可能です:https://huggingface.co/nunchaku-tech/nunchaku-flux.1-dev-colossus
インストールガイドとワークフロー
簡単なインストールガイドとWIPのワークフローです。
https://civitai.com/articles/17313
ヌンチャク用の新ワークフローはまだ作成途中です。詳細記事は週末に追加予定です。
クリエイタースポンサー
FLUXモデルのクリエイターをサポートしたい方はこちらで寄付可能です:https://ko-fi.com/afroman4peace
FP4/int4バージョンをNunchakutechのMuyang Liさんが変換しました:https://huggingface.co/nunchaku-tech
CivitAIで詳細なワークフローガイドやインストールヘルプを確認できます:https://civitai.com/articles/17313、https://civitai.com/articles/17358
山の奥深くに眠る巨人がいます。彼は人類を助けることも破壊をもたらすこともできる存在です…
コロッサスが目覚める…
私のSDXLシリーズの後、今度はこのプロジェクトのFLUXシリーズの番です…今回は完全に最初からトレーニングしました。トレーニングには自分の画像を使い、schnell FluxモデルのDemonFlux/Colossus Project schnell+SDXL Colossus Project 12をリファイナーとして使用しました。
このSD Flux-Checkpointはほぼ全てを生成可能です。Colossusは非常にリアルな写真、アニメ、アートの制作に優れています。
もし気に入ったらフィードバックをお願いします。応援していただけるならこちらからサポートも可能です。Fluxモデルのトレーニング用のPC構築にはかなりの費用がかかっており、トレーニングやテストには多くの時間と電力が必要です。
https://ko-fi.com/afroman4peace
バージョン V12 "Hephaistos"
このチェックポイントを公開するのは嬉しい反面、少し悲しい気持ちでもあります… V12はこのシリーズの最後のチェックポイントとなります。主な理由は今後施行されるEUのAI関連規制、もう一つはFlux.1 DEV自体のライセンスのためです。皆様のサポートに感謝します!この一年間、このプロジェクトに多くの時間を注ぎました。今は別のプロジェクトに移る時です。
とはいえ…このシリーズは最高の形で終えます…
V12はV10B "BOB"をベースに、シリーズのベストパーツを全てこのチェックポイントに統合しました。(このマージは約1時間30分かかり、128GBメモリを使い切る新たなマージ手法の成果です)V10と比較して顔と肌のテクスチャを強化し、目はよりリアルで「生きている」ようになりました。
ぜひ自分で試してV12の感想を教えてください。「遅いインターネット接続」により、まずFP8_UNETをアップロードし、その後FP8「All in One」版、FP16_unetとFP16_BEHEMOTHを順次公開予定です。int4とfp4への変換も挑戦中です(応援してください)。
いつものようにV12の感想をお聞かせください。
バージョン V12 "Behemoth" (AIO)
この「All in One」モデルはV12シリーズの最高峰であり、もちろん最大サイズです :-)
BehemothはカスタムT5xxlとClip_lをモデル内部に組み込んでいます。品質を重視するならこのチェックポイントがおすすめです!
バージョン V12 FP4/int4
V12の量子化はNunchakutechのMuyang Liさんのおかげです。https://huggingface.co/nunchaku-techと彼らの素晴らしいヌンチャクに感謝!
このバージョンはまさに驚異的で、これまでにない品質と速度の両立を実現しています。
注意!
FP4とint4の2つのバージョンがあります。FP4はNvidiaの50xxグラフィックカード専用、int4は40xx以下で動作します。(最低でも20xxシリーズのグラフィックカードが必要です)
どちらもこちらから直接ダウンロード可能です:https://huggingface.co/nunchaku-tech/nunchaku-flux.1-dev-colossus
インストールガイドとワークフロー
簡単なインストールガイドと進行中のワークフローを紹介します。
https://civitai.com/articles/17313
ヌンチャク用の新しいワークフローはまだ作成中です。このため以下のフローはまだWIP(作業途中)です。詳細記事は週末に追加予定です。
バージョン V12 FP16_B_variant
深夜2時に誤ってアップロードした「間違った」チェックポイントですが、非常に実験的なもので公開は想定していませんでした。十分にテストされていませんがショーケース作成時は良好な結果を得られました。標準版より良いかもしれません。
主にアジア系の顔の傾向が強いです。これは未完成のサイドプロジェクトの要素を混ぜたかったためです。このチェックポイントのご感想をお聞かせください :-)
バージョン V12 AIO FP8
このバージョンはV12のAll in One版で、全てのクリップが内蔵されています。FP8_unetとカスタムclip_lで同じ出力を生成します。
バージョン V12 GGUF Q5_1
リクエストにより作成。画質は悪くありません。
バージョン V10B "BOB"
V10の代替版です。V10のFP8版改善のために作成しました。FP8版は一般的に精度が高く、色彩が良いです。最近時間がなく(リアルライフ優先)公開が遅れました。好みがあれば教えてください。FP16版もあります。フィードバック次第でint4版の公開も考えます。
ワークフロー:
V12とV10のワークフローはこちら:https://civitai.com/articles/17163
バージョン V10_int4_SVDQ "Nunchaku"
まずはFP16_Unetをint4_SVDQに変換してくれたtheunlikelyさんに感謝します:https://huggingface.co/theunlikely。彼のページに訪れてLikeを残してください。
このバージョンはFP8版とほぼ同等です。通常モードでも私のワークフロー内で2~3倍速いです。ワークフローの「高速モード」では3090tiで約19秒で2MP画像生成可能です。
SVDQ "Nunchaku"とは?
この新しい量子化方式はFluxモデル(例:FP16ネイティブモデル)を24GBから約6.7GBに縮小可能です。それだけでなく、品質をほとんど落とさずにこれまで以上に高速な生成を実現できます。32GB_Behemothとの画質差は小さいですが、こちらはより多くのVRAM/RAMが必要です。
詳細はこちら:https://github.com/mit-han-lab/ComfyUI-nunchaku?tab=readme-ov-file
インストール:ワークフロー/インストールガイドはこちら:https://civitai.com/articles/15610
バージョン V10 "Behemoth" (FP16_AIO)
このバージョンはまだ実験的です。主な焦点はよりリアルな結果の追求です。また「Fluxライン」の低減も達成しました。Colossus Project V5.0_Behemoth、V9.0、そして独自プロジェクト「Ouroborus Project」をベースにしています。
FP16版は非常に安定しています。FP8版も近日公開予定で、こちらは品質は良いものの安定性は劣ります。
ぜひ試して感想をお聞かせください。
制作を楽しんでください :-)
バージョン V9.0:
なぜV9.0なのかを説明します。
最近引っ越しをし、ネット回線トラブルでインターネット接続がほとんどありませんでした。その間PCを稼働させ続け、多くの(ほとんど壊れた)チェックポイントを作成しました。ただし非常に良いV8版もいくつかありますので、そちらも公開予定です。
変更点は?
V5.0の最良の結果をもとに新しい顔・肌テクスチャをトレーニングし、足・脚の解剖学的トレーニングも追加しました。V5.0版は時折頭や足が切れていましたが、その問題はある程度解決できたと思います。
さらに自作の風景画像も多く使用しました。引越し中に約2週間の計算時間をかけてトレーニング、電気代は1時間あたり約25セントかかっています。
このバージョンを気に入ってくだされば嬉しいです。応援もよろしくお願いします。良い画像や悪い画像も投稿いただくと改善に役立ちます :-)
バージョン 5.0:
V5.0は実際にはV4.2とV4.4(間もなく公開予定)をベースに、肌のディテールや解剖学全般の追加トレーニングを行い、手や乳首などの問題がほぼ解決されました。顔の細部も向上しています。Fluxラインの軽微な修正にも取り組みました。
基本的にV4.2よりリアルになり、細部表現も向上。V4.2と同様にハイブリッドのデスティルドモデルです。ほぼ同じ設定で使用可能です。
遊べる新しいワークフローはこちら:https://civitai.com/articles/11950/workflow-for-colossus-project-flux-50
V4.2やV2.1との比較でご意見をお願いします。
バージョン 4.4 "Research":
補完用に追加したバージョンで、V4.2よりややリアルでV5.0の基礎となっています。V5.0やV4.2のワークフローも使用可能です。
バージョン 4.2:
このバージョンはDemoncore FluxとColossus Project Fluxのさらなる発展版です。主な目的はより安定した結果、肌テクスチャの向上、手の改善、多様な顔の表現でした。ハイブリッドモデル(部分的にDemoncore Flux)でトレーニングし、乳首やNSFW表現も強化しました。V2.1よりV4.2の方が好きなら教えてください :-)
ショーケース画像はSDXL解像度か2MP(例:1216x1632)で作成。より高解像度にも対応可能で、最大2500x2500を試しましたが推奨は約2000x2000です。
設定は30ステップ、2〜2.5のcfgが推奨です。普段は2.2か2.3を使っています。ショーケースはDPM++ 2MとSimple schedulerを使用。
近日中に更にバージョンを追加しますが、クリスマス前はあまり時間がありません。
設定
専用のComfyワークフローも間もなく追加予定です。現状はショーケース画像のダウンロードと閲覧がおすすめです。
「All in One」バージョンはForgeでも問題なく動作します。
基本的にはV2.1と同様の設定で動作します(下記参照)。
ステップは20〜30、cfgは約2.2が推奨です。
バージョン 2.1_de-distilled_experimental (MERGE)
このバージョンは従来のFluxモデルとは全く異なり、実際に異なる動作をします!
私の2.0バージョンとデスティルドバージョンhttps://huggingface.co/nyanko7/flux-dev-de-distillの実験的なマージです。偶然の結果ですが驚異的な詳細表現を実現し、プロンプトへの追従性も非常に高いです。今後は直接デスティルドモデルでトレーニング予定で、テスト用のLoraもすでに作成済みです。非常に実験的なので不具合を見つけたら教えてください。良い画像や悪い画像の投稿は改善に役立ちます。2.0版も試して最適なチェックポイントを教えてください。
注意!
通常のFluxワークフローはこのバージョンでは使えません。必ず専用ワークフローをダウンロードしてください!
独自に対応策を見つけることも可能ですが、不良画像の責任は負いかねます。極めて実験的なモデルです。以下の欠点もご注意ください。
このチェックポイントの長所と短所:
極めて詳細な画像生成が可能ですが、その代償として通常のFluxチェックポイントより遅いです。利点はアップスケール不要になる場合が多いことと、Flux Guidanceの代わりにcfgスケールを使うため、標準ワークフローで動作しません。
ネガティブプロンプトの使用が可能で、望まない要素を排除できます。
時々アーティファクトが発生します(簡単な小さいアップスケールで解決可能、対策中)。特定のシードでしか起きません。更新:これはモデル自体の問題ではなくワークフローの問題で、修正中です。発生時は最初のアップスケールを1.2ではなく1.14に設定してください。


設定とワークフロー V2.1:
ワークフローはこちら:https://civitai.com/articles/8419
設定:通常のFluxと異なりFlux Guidance Scaleは不要。cfgスケールを使用。ワークフローでは通常3 cfgを推奨します。画像によってはより低いcfgも可能です。
最重要点はFlux Guidance Scaleを無効にすることです。
ワークフロー無しでは30ステップと2〜3 cfgでテスト済み。Forgeでも同様の設定を推奨します。実験してください。
ネガティブプロンプトには「blurry」を入れることを推奨します。
サンプラーとスケジューラー:
Euler, Heun, DPM++2m, deis, DDIMが良好に動作します。
スケジューラーは主に Simple を使用。
より良い設定が見つかったら教えてください :-)
Forge用にはAIOモデルを推奨。設定例:

バージョン 2.0_dev_experimental
これは実験的なバージョンです。より一貫性があり、高速なモデル作成を目指しました。追加で自身のLoraをいくつかトレーニングし、Tensorマージで統合しました。カスタムT5xxlを「Attention Seeker」で修正し、ByteDanceのHyper Flux Loraを取り込んで作業範囲を拡大しました。メインタイトル画像はこちら。
16ステップ V 2.0
30ステップ V 1.0
欠点:
まずサイズが前バージョンより大きいこと、Unetのみのバージョンをまだ作成していないことです。完成次第アップデートします。
設定とワークフロー V2.0:
このモデルはステップ数を減らせます。16ステップは旧モデルの30ステップに相当。
多くの場合もっと高品質なため20~30ステップ使用を推奨。
サンプラーはEulerを好み、スケジューラーはSimple。ガイダンスは1.5~3で調整可能(範囲外も試してください)。リアルな画像は1.8が合います。DPM++2MとHeunも良好。
ワークフロー 2.0:
V2.0とV1.0用に新しいワークフローを作成。Flux Prompt Generatorを導入し第2アップスケール段階も追加。https://civitai.com/articles/7946
Forge:
Forgeでもテスト済みで良好に動作。ただしComfy UIとForgeで画像に差異が出る可能性があります。
バージョン 1.0_dev_beta:
このモデルはシリーズ初のエントリーです。フィードバックや画像投稿をお願いします。プロジェクト改善に役立ちます。複数のバージョンがあり、画質重視ならFP16版がおすすめ。巨大で高性能なGPUと大量のRAMが必要です。FP8版は品質と性能のバランスが良好。GGUF版はQ8_0をダウンロード。GGUF Q4_0/4.1はリクエストによるもので小さいが画質がやや劣ります。
基本的に2タイプあり、「All in One」は1ファイルでClip_l、T5xxl fp8、VAEを内蔵。チェックポイントフォルダに置いてください。
もう一つはUNET-ONLY版で、全ファイルを個別に読み込む必要があります。
いずれの場合も正しく動作させるため私のClip_Lを必ずダウンロードしてください。
また適切なT5xxlクリップの選択も重要。FP8版はfp8_e4m3fn、FP16版はFP16クリップを使用。デフォルトの重みタイプを選択してください。(下はfp8版の例画像)
GGUF版はGGUFローダーが必要です!
V1.0に関する既知事項:
シリーズ初版なのでプロンプトやスタイルによっては苦戦することがあります。次バージョンでトレーニングを追加予定。モデルが不得意な点があれば教えてください。
設定とワークフロー:
約30ステップ、Eulerサンプラー、Simpleスケジューラーでテスト済み。ガイダンスは1.5~3で調整可能(範囲外も試してください)。
リアル画像には1.8がちょうど良いです。
各自設定を試してみてください。良い結果が出たら投稿お願いします。
ショーケース画像をトレーニングに使用済み。Comfy用ワークフローはこちら: https://civitai.com/articles/7946
"All in One"モデル:

UNETのみバージョン:
Clip_L(240MB)もダウンロードする必要があります。
GGUF: GGUF用ワークフローはこちら: https://civitai.com/articles/7946
重要事項:
この開発モデルは商用利用を目的としていません。代わりに「schnell」モデルを別の場所で公開予定です。個人利用や科学研究向けです。
ライセンス:
https://huggingface.co/black-forest-labs/FLUX.1-dev/blob/main/LICENSE.md
クレジット:
theunlikely https://huggingface.co/theunlikel(再度感謝)
バージョン 2.1/V4.2/5.0: nyanko7のFlux_dev_de-distill
https://huggingface.co/nyanko7/flux-dev-de-distill
V2.0以降: ByteDanceのHyper Lora https://huggingface.co/ByteDance/Hyper-SD
Black Forrestの素晴らしいFluxモデルに感謝 https://huggingface.co/black-forest-labs
モデル詳細
ディスカッション
コメントを残すには log in してください。











