Colossus Project Flux - v10_Behemoth_AIO_FP16
関連キーワード&タグ
推奨プロンプト
photography of a young woman as an (goth) with (razor cut haircut), a sports car, soft lighting, spray painted with a intricate comic style robot theme and "COLOSSUS X" cyberpunk theme, projection lighting, its night and its raining, biopunk, the road is reflecting shot on Pentax K-1 Mark II with Pentax FA 43mm f-1.9 Limited, Neutral color palette heterochromia (blue and brown) Mixed race, shot on Pentax K-1 Mark II with Pentax FA 43mm f-1.9 Limited, photo by Tami Bone
推奨ネガティブプロンプト
blurry
blurry, low res
推奨パラメータ
samplers
steps
cfg
resolution
vae
ヒント
画像品質向上のためにネガティブプロンプトに「blurry」を使用してください。
最高のリアリズムを得るには1.5〜3のcfgガイダンスが推奨され、リアル画像には1.8が良いバランスです。
推奨サンプラーはEuler、Heun、DPM++ 2M、deis、DDIMで、Simpleスケジューラーが良好に動作します。
一部チェックポイントではFlux guidance scaleをオフにしてcfg scaleを使用する必要があります。
Clip_L、T5xxl、VAEが内蔵されたオールインワンモデルを使用すると利便性が高まります。
インストールやワークフローは説明内のcivitai.comの公式ガイドを参照してください。
FP4およびint4の2つの量子化バージョンがあり、FP4はNvidia 50xx GPU向け、int4は40xx以下GPU向け(最低20xx GPU必須)です。
SVDQ Nunchaku量子化はモデルサイズを大幅に削減し、品質低下を最小限に抑えつつ生成速度を向上させます。
バージョンのハイライト
このバージョンはまだ実験的です。主によりリアルな結果を目指しました。また一部の「Flux Lines」の軽減に成功しています。Colossus Project V5.0_Behemoth、V9.0、そして私が「Ouroborus Project」と呼ぶ別プロジェクトがベースです。
FP16バージョンは非常に安定しています。近くFP8バージョンもリリースします。こちらも良いですが安定性は劣ります。
ぜひ実験してみてください。この版の感想を教えてください。
制作を楽しんでください:-)
クリエイタースポンサー
このモデルを気に入ってクリエイターを支援したい場合は、Ko-fiでの寄付をご検討ください。
FP4/int4バージョンの量子化はNunchakutechのMuyang Liによるものです。Nunchakutechをぜひご覧ください。
ワークフローやインストールガイドはcivitai.com/articles/17313およびcivitai.com/articles/17358で公開中です。
変換および量子化リポジトリはこちら: GitHub ComfyUI-nunchaku
山の奥深くに眠る巨人がいます。人類を助けるか破壊をもたらすか、どちらでも可能な存在です…
巨像が立ち上がる…
私のSDXLシリーズの後に、このプロジェクトのFLUXシリーズの時代が来ました…今回は一からこのモデルをトレーニングしました。トレーニングには自分の画像を使いました。自作のschnell FluxモデルDemonFlux/Colossus Project schnellとSDXL Colossus Project 12をリファイナーとして使用しています。
このSD Fluxチェックポイントはほぼすべてを生成可能です。Colossusは極めてリアルな写真、アニメ、アートを得意とします。
もし気に入ったら、ぜひフィードバックをください。支援したい場合はここでできます。Fluxモデルを実際にトレーニングできるPCを組むためにかなりの費用を使いました。またトレーニングやテストには多くの時間と電力が必要です。
https://ko-fi.com/afroman4peace
Version V12 「Hephaistos」
このチェックポイントを公開できて嬉しくもあり寂しくもあります。V12はこのシリーズの最終チェックポイントとなります。主な理由は今後のEU AI法規制です。もう一つの理由はFlux .1 DEVのライセンス問題です。皆さまの支援ありがとうございました!このプロジェクトには昨年多くの時間を投入しました。今後は別のプロジェクトに取り組みます。
それでも、このシリーズの締めくくりを最高の形にします…
V12はV10B「BOB」をベースにしており、このシリーズのベストなパーツをブロックマージで一つのチェックポイントにまとめました。(約1時間30分かかり、128GB RAM全てを使用しました)。またV10に比べ顔と肌のテクスチャを強化しました。目はよりリアルで生き生きしています。
ぜひ試してみて、V12へのフィードバックをください。遅いインターネット環境のため、最初にFP8_UNETをアップロード後、FP8の「オールインワン」版、次にFP16_unetとFP16_BEHEMOTHをアップロードします。int4とfp4変換も試みます(応援してください)。
いつも通りV12へのフィードバックお待ちしています…
Version V12 「Behemoth」(AIO)
この「オールインワン」モデルはV12シリーズ最高峰で、もちろんサイズも最大です:-)
BehemothにはカスタムT5xxlとClip_lがモデル内に組み込まれています。品質重視ならこのチェックポイントがおすすめです!
Version V12 FP4/int4
NunchakutechのMuyang LiによるV12量子化に感謝します。https://huggingface.co/nunchaku-tech と彼らの素晴らしいNunchakuに感謝!
このバージョンは本当に驚異的です。品質と速度の未知の組み合わせを提供します。
注意!
FP4とint4の2種類があります。FP4はNvidia 50xxグラフィックカード専用で、int4は40xx以下に対応(最低でも20xxシリーズGPUが必要)です。
両バージョンはここから直接ダウンロード可能です:https://huggingface.co/nunchaku-tech/nunchaku-flux.1-dev-colossus
インストールガイドとワークフロー
クイックインストールガイドと進行中のワークフローはこちら。
https://civitai.com/articles/17313
詳細なワークフローガイド
https://civitai.com/articles/17358
私はまだNunchaku向けの新しいワークフローを作成中です。そのため以下のワークフローは進行中(WIP)です。週末に詳細記事を追加します。
Version V12 FP16_B_variant
夜中の2時に小さなミスで「間違った」チェックポイントをリネームしてアップロードしてしまいました。これは非常に実験的で公開を想定していなかったものです。十分テストしていませんがショーケースを作った際に良好な結果を得ました。標準版より良いかもしれません。
アジア系の顔に寄りやすいです。これは私がまだ作業中のサイドプロジェクトを混ぜ込もうとしたためです。このチェックポイントの体験を教えてください:-)
Version V12 AIO FP8
このバージョンはV12のオールインワン版です。全てのclipが内部に焼き込まれています。カスタムclip_l付きのFP8_unetと同じ出力を出します。
Version V12 GGUF Q5_1
リクエストに応じて作成しました。品質は悪くありません。
Version V10B 「BOB」
これはV10の代替バージョンです。V10のFP8版の改良を目的に作成しました。一般にFP8版はより精密で色味が良いです。残念ながら最近時間があまりなく(現実優先)、リリースまで時間がかかりました。好みのバージョンを教えてください。FP16版「BOB」もあります。フィードバック次第ではint4バージョンの公開も検討します。
ワークフロー:
V12とV10のワークフローはこちら:https://civitai.com/articles/17163
Version V10_int4_SVDQ 「Nunchaku」
まず、FP16_Unetをint4_SVDQに変換してくれたtheunlikelyに感謝します。https://huggingface.co/theunlikely 彼のページにアクセスしていいねをお願いします。
このバージョンはほぼFP8版と同等です。私のワークフローの通常モードでも2〜3倍速く動作します。ワークフローの「高速モード」使用時には3090tiで2MP画像を約19秒でレンダリング可能です。
SVDQ 「Nunchaku」とは?
この新しい量子化方式によりFluxモデル(ここではネイティブFP16モデル)を24GBから約6.7GBに圧縮できます。しかもほとんど品質を落とさずに高速生成が可能です。32GB_Behemothと比べると若干違いが見られますが、このモデルでは動かすために多くのVRAM/RAMが必要です。
詳しくはこちらをご覧ください:https://github.com/mit-han-lab/ComfyUI-nunchaku?tab=readme-ov-file
インストール:ワークフロー/インストールガイドはこちらをご覧ください:https://civitai.com/articles/15610
Version V10 「Behemoth」 (FP16_AIO)
このバージョンはまだ実験的です。主によりリアルな結果を目指しました。また一部の「Flux Lines」の軽減に成功しています。Colossus Project V5.0_Behemoth、V9.0、そして私が「Ouroborus Project」と呼ぶ別プロジェクトがベースです。
FP16バージョンは非常に安定しています。近くFP8バージョンもリリースします。こちらも良いですが安定性は劣ります。
ぜひ実験してみてください。この版の感想を教えてください。
制作を楽しんでください:-)
Version V9.0:
なぜV9.0なのか、多く説明が必要です。
最近新しい部屋に引っ越しましたが、インターネットプロバイダーのミスでまともなネット接続がありませんでした。引っ越し作業中もPCを回し続け、多く(ほとんど破損した)チェックポイントができました。ただ良いV8バージョンもいくつか持っており、これも公開予定です。
何が変わったのか?
V5.0の最良結果を取り入れ新しい顔や肌のテクスチャをトレーニングし直しました。さらに足の解剖学トレーニングも追加しました。V5.0では時々頭や足が切れることがありましたが、ある程度修正できたと思います。
加えて自分の風景画像を多めに使いました…引っ越しの合間に約2週間かけてトレーニングした結果です。時間も費用もかかりました。(電気代は約1時間25セント)
とにかくこのバージョンを気に入っていただければ嬉しいです。支援したい場合は素敵な画像やKofiでのチップも歓迎します。
感想を教えてください:-)
Version 5.0:
V5.0は実質的にV4.2とV4.4(近日公開予定)をベースにしています。肌のディテールや全般的な解剖学、手と乳首の改善が主なトレーニング内容です。顔のディテールが大幅に向上し、一部の小さなflux linesの修正も試みました。
基本的にこのバージョンはV4.2よりリアルで細部にも優れています。V4.2同様、ハイブリッドのディスティル解除モデルであり、設定はほぼ同じです。
新しいワークフローもこちらにあります:https://civitai.com/articles/11950/workflow-for-colossus-project-flux-50
V4.2やV2.1と比較した感想を教えてください。
Version 4.4 「Research」:
完成を目指して追加したバージョンです。V4.2より少しリアルで、V5.0の基盤となっています。試してみてください。V5.0およびV4.2のワークフローも使用可能です。
Version 4.2:
このバージョンは基本的にDemoncore FluxとColossus Project Fluxのさらなる発展形です。より安定した成果、肌のテクスチャの向上、手の改善、顔の多様性を目標にしました。部分的にDemoncore Fluxを含むハイブリッドモデルとしてトレーニングしています。乳首やNSFWも少し強化しました。V2.1よりV4.2が好みか教えてください:-)
ショーケース画像にはSDXL解像度または2MP画像(1216x1632など)を用いています。このモデルは更に高解像度にも対応可能で、2500x2500までテスト済みですが約2000x2000が推奨です。
設定は約30ステップ、cfgは2〜2.5推奨。ワークフローでは主に2.2か2.3を使います。ショーケースはDPM++ 2MとSimple schedulerを使用。
また近々新バージョンを追加しますがクリスマス前は時間がありません。
設定
近くComfy用の新しい専用ワークフローを追加します。ショーケースの画像はいつでもダウンロードして試せます。
「オールインワン」版はForgeにも対応しています。
基本的にV2.1の設定と同様です(下記参照)
20〜30ステップ、cfgは約2.2が目安です。
Version 2.1_de-distilled_experimental (MERGE)
このバージョンは通常のFluxモデルとは全く異なります!
私のバージョン2.0とde-distilled版https://huggingface.co/nyanko7/flux-dev-de-distillの偶然のマージによる実験的モデルです。驚異的なディテールとプロンプト追従性を持ちます。次はde-distilledモデルを直接トレーニング予定です。テスト用Loraも作成済み。非常に実験的なので、下記にない不具合があれば教えてください。良い画像だけでなく悪い画像も共有いただけると改善に役立ちます。Version 2.0もお試しください。自分に合うタイプを探してみてください。
注意!
通常のFluxワークフローでは動作しません。専用ワークフローのダウンロードが必須です!
自力で環境を設定することも可能ですが、画像不良については責任を負いかねます。また高度に実験的なモデルであることをご理解ください…
このチェックポイントの長所と短所:
このチェックポイントは極細部の生成が可能ですが代償として通常のFluxより遅いです。メリットはアップスケール不要の場合が多いこととFlux Guidanceの代わりにcfgスケールを使用するため、標準ワークフローで動作しない点です。
ネガティブプロンプトの使用が可能!不要な要素を画像から除去できます。
時折アーティファクトが発生することがあります。簡単なアップスケールで解決可能(現在対応中)。一部のシードでのみ発生するのが特徴です。現在修正中で、最初のアップスケール値を1.2から1.14に変更すると改善する場合があります。


Version 2.1の設定とワークフロー:
ワークフローはこちら:https://civitai.com/articles/8419
設定:通常Fluxと異なりFlux Guidance Scale不要、cfgスケールを使用。ワークフローでは主に3cfg使用、一部画像で低cfgが必要な場合あり。
Flux Guidance Scaleは可能ならOFF推奨。
ワークフローなしでは30ステップ、2〜3cfgでテスト済み。Forgeでもこれらの設定を試してください。
ネガティブには「blurry」を入れるのがおすすめ。
サンプラーとスケジューラー:
Euler、Heun、DPM++2M、deis、DDIMが動作良好。
スケジューラーは「simple」が主に使用。
良い設定があれば教えてください:-)
ForgeにはAIOモデルがおすすめ。Forge用設定例:

Version 2.0_dev_experimental
実験的バージョン。高速かつ一貫性のあるモデルを目指しました。独自トレーニング済みLoraを複数マージ(テンソルマージ)しています。Attention SeekerでカスタムT5xxlも導入。さらにByteDanceのHyper Flux Loraをマージしスピードと品質を向上させました。作業領域がシフトしています。メインタイトル画像をご覧ください。
16ステップ V 2.0
30ステップ V 1.0
短所:
まず前のバージョンより若干大きくなりました。次にUnetのみバージョンを作成中。完成次第更新します。
Version 2.0の設定とワークフロー:
従来の30ステップに対し16ステップで動作します。
しかし多くの場合は20〜30ステップ使用でより高品質です。
サンプラーはEuler推奨、スケジューラーはSimple。Guidanceは1.5〜3の範囲で調整可能(もちろん範囲外も可)。リアル画像には1.8が良好。他も試せます。DPM++2MやHeunも良好に動作。
ワークフロー 2.0:
V2.0、V1.0向けに新ワークフローを作成。Fluxプロンプトジェネレーター搭載。さらに二段階アップスケーラーも動作。https://civitai.com/articles/7946
Forge:
Forgeでも問題なく動作確認済み。ただしComfy UIと画像に差が出ることがあります。
Version 1.0_dev_beta:
シリーズ初のモデルです。フィードバックや画像投稿をお待ちしています。モデル改善に役立てます。複数バージョンあり、品質面ではFP16版が最高です。しかしサイズが大きく高性能GPUと大量のRAMが必要です。FP8版は品質と性能のバランスが良好です。GGUF版はQ8_0ダウンロード推奨。Q4_0/4.1はリクエストによる小サイズですが品質低下あり。
基本的に「オールインワン」モデルはClip_l、T5xxl fp8、VAEを内蔵し、単一ファイルで動作します。(以下参照)チェックポイントフォルダに配置してください。
別のUNET-ONLYバージョンもあり、個別ファイル読み込みが必要です。
動作のためにClip_Lファイルのダウンロードが必須です。
また適切なT5xxl clipの選択も重要。FP8版はfp8_e4m3fn t5xxl clip、FP16はFP16 clip推奨。標準の重みタイプを選択してください。(下記はfp8版の例)
GGUF版はGGUFローダーが必要です!
V1.0に関する既知情報:
シリーズ最初のモデルのため一部プロンプトやスタイル(芸術系)に苦戦する可能性あり。次バージョンで改善予定。できないことがあれば教えてください。
設定とワークフロー:
約30ステップ、Eulerサンプラー、Simpleスケジューラーでテスト済み。Guidanceは1.5〜3(範囲外も可)。
リアル画像には1.8 Guidanceが良好。
設定を試し、良い結果が出たら共有してください。
ショーケース画像はトレーニングデータに組み込み済み。Comfy用ワークフローはこちらからダウンロード可能:https://civitai.com/articles/7946
「オールインワン」モデル:

UNET_only:
Clip_L(約240MB)もダウンロードが必要です。
GGUF:こちらにGGUF用のワークフローを追加しています:https://civitai.com/articles/7946
重要:
この開発モデルは商用利用を目的としていません。商用目的には別の場所で「schnell」モデルを公開予定。個人または科学的利用向けです。
ライセンス:
https://huggingface.co/black-forest-labs/FLUX.1-dev/blob/main/LICENSE.md
クレジット:
theunlikely https://huggingface.co/theunlikel (再度感謝)
Version 2.1/V4.2/5.0:nyanko7によるFlux_dev_de-distill
https://huggingface.co/nyanko7/flux-dev-de-distill
V2.0以降:ByteDanceのHyper Lora https://huggingface.co/ByteDance/Hyper-SD
Black Forrest の素晴らしいFluxモデルに感謝 https://huggingface.co/black-forest-labs
モデル詳細
ディスカッション
コメントを残すには log in してください。











