Colossus Project Flux - V12 "Hephaistos" FP8_UNET
関連キーワード&タグ
推奨ネガティブプロンプト
blurry
推奨パラメータ
samplers
steps
cfg
resolution
vae
ヒント
品質向上には20~30ステップ、CFG2.2前後の設定を使用してください。
サンプラーはEulerとSimpleスケジューラーが推奨。DPM++ 2MやHeunも良好です。
不要なアーティファクトを減らすにはネガティブプロンプトに「blurry」を追加しましょう。
実験的なv2.1モデルではFlux Guidance Scaleをオフにし、CFGスケールを使用してください。
FP4版はNvidia 50xxシリーズ専用、int4版は40xx以下でも動作します。
UNETのみのバージョンは必ずClip_Lファイルをダウンロードしてください。
推奨範囲内で様々なサンプラーとCFG設定を試してみましょう。
バージョンのハイライト
ワークフロー: https://civitai.com/articles/17163
V12のFP8_unet版:こちらのclip_lを使用してください:
https://civitai.com/models/833086?modelVersionId=1985466
またこのunetにはt5xxl_fp8_e4m3fnを使用してください。
バージョン V12 "Hephaistos"
このチェックポイント公開は嬉しくもあり悲しくもあります。V12はこのシリーズ最後のチェックポイントです。主な理由はEUのAI規制とFlux .1 DEVのライセンスです。皆様のサポートに感謝します!
ともかく、このシリーズを華々しく締めくくります…
V12はV10B "BOB"を基にし、シリーズの最良部分をこの1つのチェックポイントにブロックマージしました。(約1時間30分かかり、128GBのRAM全容量を使用した新たなマージ法の成果です)。V10と比べて顔と肌の質感を強化し、目はよりリアルで生き生きとしています。
ご自分で試し、V12へフィードバックください。遅い回線のためまずFP8_UNETをアップします。その後FP8のオールインワン版、FP16_unetとFP16_BEHEMOTHをアップし、さらにint4やfp4変換も試みます(成功を祈ってください)。
いつも通りV12へのフィードバックを期待しています。
クリエイタースポンサー
このモデルがお気に召したら、制作者をKo-fiで支援してください。
簡単なセットアップのためのインストール&ワークフローガイド:
- https://civitai.com/articles/17313
- https://civitai.com/articles/17358
- https://civitai.com/articles/17163
- https://civitai.com/articles/15610
追加のワークフローやショーケース画像はこちらで入手可能です:https://civitai.com/articles/7946。
山の奥深くに眠る巨人がいます。人類を助けることも破壊をもたらすこともできる存在です…
コロッサスが立ち上がる…
私のSDXLシリーズの後、今度はこのプロジェクトのFLUXシリーズの番です…今回はゼロからこのモデルをトレーニングしました。トレーニングには自分自身の画像を使用しました。schnell FluxモデルであるDemonFlux/Colossus Project schnellと、SDXL Colossus Project 12をリファイナーとして使い作成しました。
このSD Flux-Checkpointは、ほぼすべてを生成可能です。Colossusは非常にリアルな画像やアニメ、アートの生成が得意です。
気に入っていただけたら、ぜひフィードバックをください。また、サポートしていただける場合は、こちらから可能です。Fluxモデルを実際にトレーニングできるコンピュータを構築するために相当の費用を投じました。またトレーニングとテストには多くの時間と電力も必要です。
https://ko-fi.com/afroman4peace
バージョン V12 "Hephaistos"
このチェックポイントの公開は嬉しくもあり、悲しくもあります…V12はこのシリーズの最後のチェックポイントとなります。主な理由は今後施行されるEUのAI関連法と、Flux .1 DEVのライセンスによります。皆様の応援に感謝します!この一年間、このプロジェクトに多くの時間を費やしました。今は別のプロジェクトに移る時です。
ともかく、このシリーズを華やかに締めくくります…
V12はV10B "BOB"を基にしていますが、このシリーズの最良部分を単一のチェックポイントにブロックマージしました。(これは約1時間30分かかり、128GBのRAMをフル使用した新たなマージ方法の成果です)。V10と比較して顔や肌の質感も強化しました。目は以前よりずっとリアルで生き生きしています。
ぜひ自分で試し、V12へのフィードバックをお聞かせください。遅いインターネット接続のため、まずFP8_UNETをアップロードし、その後FP8の「オールインワン」バージョン、続いてFP16_unetとFP16_BEHEMOTHを公開します。int4やfp4への変換も試みています(成功を願ってください)。
いつも通りV12についてのフィードバックをお願いいたします…
バージョン V12 "Behemoth" (AIO)
この「オールインワン」モデルは私のV12シリーズの中で最高かつ最大のサイズです :-)
BehemothにはカスタムT5xxlとClip_lがモデル内部に組み込まれています。量より質を重視する方には最適のチェックポイントです!
バージョン V12 FP4/int4
V12の量子化を行ってくれたNunchakutechのMuyang Liに感謝します。https://huggingface.co/nunchaku-tech と彼らの素晴らしいnunchakuに感謝!
このバージョンは本当に衝撃的です。これまでにない品質と速度の融合を実現しています。
注意!
FP4とint4の2種類があります。FP4はNvidiaの50xxシリーズGPU専用です!int4は40xx以下でも動作します(最低でも20xxシリーズのグラフィックカードが必要です)。
両方のバージョンはここから直接ダウンロード可能です:https://huggingface.co/nunchaku-tech/nunchaku-flux.1-dev-colossus
インストールガイドとワークフロー
簡単なインストールガイドと暫定的なワークフローはこちらです。
https://civitai.com/articles/17313
詳細なワークフローガイドはこちら
https://civitai.com/articles/17358
私は現在Nunchaku用の新しいワークフローを作成中で、このワークフローはまだWIP(作業中)です。週末に詳細な記事を追加予定です。
バージョン V12 FP16_B_variant
深夜2時に誤って「間違った」チェックポイントを名前変更しアップロードしました。非常に実験的なチェックポイントで公開するつもりはなかったものです。あまりテストしていませんが、ショーケース作成時はかなり良好な性能を示しました。標準版より優れているかもしれません。
このバージョンはアジア系の顔に寄った傾向があります。まだ作業中のサイドプロジェクトに混ぜてみたかったからです。このチェックポイントの使用感を教えてください :-)
バージョン V12 AIO FP8
このバージョンはV12のオールインワン版です。全クリップが内部に組み込まれており、FP8_unetと私のカスタムclip_lと同じ出力を提供します。
バージョン V12 GGUF Q5_1
リクエストに応えたバージョンです。品質も悪くありません。
バージョン V10B "BOB"
V10の代替版です。V10のFP8版改良のために作成しました。一般的にFP8版はより精密で色も良いです。最近あまり時間がありません(現実優先です)。そのため公開まで時間がかかりました。このバージョンが好みであれば教えてください。FP16版もあります。フィードバック次第でint4版公開も検討します。
ワークフロー:
V12とV10用ワークフローはこちら:https://civitai.com/articles/17163
バージョン V10_int4_SVDQ "Nunchaku"
FP16_Unetをint4_SVDQに変換してくれたtheunlikelyに感謝します。https://huggingface.co/theunlikelyを訪れていいねをお願いします。
このバージョンはほぼFP8版と同等です。自分のワークフローの通常モードでも2倍から3倍速くなります。ワークフローの「高速モード」では3090tiで2MP画像を約19秒でレンダリング可能です。
SVDQ "Nunchaku"とは?
この新しい量子化手法ではFluxモデル(ここではFP16ネイティブモデル)を24GBから約6.7GBへ縮小可能です。それだけでなく、画質を大きく損なわず、これまでにない高速な生成が実現できます。32GBのBehemothと比べるとわずかな差はありますが、このモデルにはより多くのVRAM/RAMが必要です。
詳細はこちら:https://github.com/mit-han-lab/ComfyUI-nunchaku?tab=readme-ov-file
インストール:私のワークフロー/インストールガイドをご覧ください:https://civitai.com/articles/15610
バージョン V10 "Behemoth" (FP16_AIO)
このバージョンは実験的なもので、よりリアルな結果に焦点を当てています。いくつかの「Flux Lines」の軽減にも成功しました。このモデルはColossus Project V5.0_Behemoth, V9.0および「Ouroborus Project」と呼ぶ別のプロジェクトに基づいています。
FP16版は非常に安定しています。近々FP8版もリリース予定ですが、そちらはやや安定性が劣ります。
ぜひ試して感想を教えてください。
制作を楽しんでください :-)
バージョン V9.0:
まずなぜV9.0なのか説明します。
最近新しいアパートに引っ越しましたが、インターネット提供業者のミスでまともな接続がありませんでした。引っ越し中にPCを稼働させ続けた結果、多く(ほとんど壊れた)チェックポイントを作成しました。ただ非常に良いV8バージョンもあり、そちらは公開予定です。
何が変わったのか?
モデルに新しい顔や肌のテクスチャをトレーニングしました。これは基本的にはV5.0のベストな結果を採用したものです。また足・脚の解剖学的トレーニングも加えました。V5.0版では頭部や足が切れることがありましたが、改善したと思います。
さらに自身の風景画像も多く使ってトレーニングしました。はい、引っ越し中に全て行いました。総計約2週間の計算時間で、電気代は1時間約25セントかかっています。
このバージョンを気に入ってもらえれば嬉しいです。サポートしていただけるなら、素敵な画像を投稿、あるいはBuzzやKofiでチップをお願いします。
ご意見をお聞かせください :-)
バージョン 5.0:
V5.0は基本的にV4.2とV4.4(こちらも近日公開予定)をベースにしています。肌のディテールや解剖学的な詳細を追加トレーニングし、手や乳首などの問題を改善しました。顔のディテールも格段に向上しています。小さなFluxラインも修正を試みました。
全体的にこのバージョンはV4.2よりリアルで小さなディテールも優れています。V4.2同様、ハイブリッドディスティルモデルです。基本的にV4.2と同じ設定で使用可能です。
新しいワークフローもあります:https://civitai.com/articles/11950/workflow-for-colossus-project-flux-50
4.2やV2.1と比べてどう思うか教えてください。
バージョン 4.4 "Research":
完成度を高めるために追加したバージョンです。V4.2より若干リアルで、V5.0のベースにもなっています。試したければどうぞ。V5.0やV4.2のワークフローも使えます。
バージョン 4.2:
このバージョンはDemoncore FluxとColossus Project Fluxの更なる発展版です。より安定した出力、肌の質感向上、手の改善、顔の多様性増加を目指して、ハイブリッドモデルとして部分的にDemoncore Fluxを含んでいます。乳首とNSFWも少し強化しました。V2.1よりV4.2を好むか教えてください :-)
ショーケース画像にはSDXL解像度か2MP解像度(例:1216x1632)のネイティブ画像のみを使用しました。このモデルはさらなる高解像度にも対応可能です。最大2500x2500までテストしましたが、2000x2000程度を推奨します。
設定はステップ数約30、CFG2-2.5を推奨します。私は主に2.2か2.3を使っています。ショーケースはDPM++ 2M、シンプルスケジューラ使用です。
近いうちに更なるバージョンも追加予定ですが、クリスマスまでは時間がありません。
設定
専用の新しいComfyワークフローを近々追加予定です。暫定的にはショーケース画像のダウンロードとオープンが可能です。
「オールインワン」バージョンもForgeで正常に動作します。
基本的にV2.1と同じ設定で動作します(以下参照)。
設定は20〜30ステップ、CFG2.2程度を推奨。
バージョン 2.1_de-distilled_experimental (MERGE)
このバージョンは全く異なり、普通のFluxモデルとは異なる動作をします!
これは私のV2.0とデディスティル版https://huggingface.co/nyanko7/flux-dev-de-distillの実験的なマージです。偶然発生しましたが、結果は驚きです。細部が非常に緻密で、プロンプトに非常に忠実に従います。次はこのデディスティルモデルで直接トレーニングを行う予定です。既にいくつかのテストLoraも実施済みです。非常に実験的なため、問題があれば教えてください。良い画像も悪い画像も投稿して改善にご協力ください。V2.0も試してどのチェックポイントが合うか教えてください。
注意!
通常のFluxワークフローはこのバージョンで動作しません。専用ワークフローを必ずダウンロードしてください!
自分で工夫することも可能ですが、悪い画像の責任は負いません。非常に実験的なモデルであり、以下のデメリットもあります。
このチェックポイントのメリットとデメリット:
非常に細部を描写可能ですが、その代償として通常のFluxチェックポイントより遅いです。良い点は追加のアップスケールが不要なことが多い点です。Flux GuidanceではなくCFGスケールを使うため、標準ワークフローとは異なります。
ネガティブプロンプトが使用可能で、不要な要素を排除できます。
まれにアーティファクトが発生することがあります。これは簡単なアップスケールで解決可能です(現在修正中)。例として、特定のシードでまれに発生します。アップスケール倍率を1.2から1.14に下げると改善する場合があります。


設定とワークフロー V2.1:
ワークフローはこちら:https://civitai.com/articles/8419
設定:通常のFluxとは異なり、Flux Guidance Scaleをオフにし、CFGスケールを使用してください。私は主に3のCFGを使っていますが、画像によっては低くても良いです。
最重要事項はFlux Guidance Scaleのオフです。
ワークフロー無しでも30ステップ、CFG2-3で試しています。Forgeの設定としてもお勧めです。色々実験してみてください。
ネガティブプロンプトには「blurry」を追加することを推奨します。
サンプラーとスケジューラー:
以下のサンプラーが良く動作します:
Euler、Heun、DPM++2m、deis、DDIM
主にシンプルスケジューラーを使用しています。
良い設定が見つかれば教えてください :-)
ForgeにはAIOモデル使用を推奨します。例はこちら:

バージョン 2.0_dev_experimental
これは実験的なバージョンで、より一貫性があり高速なモデルを目指しています。いくつかの自作Loraを追加トレーニングし、特殊な方法(Tensor merge)でマージしました。カスタムT5xxlには「Attention Seeker」を組み込み、ByteDanceのHyper Flux Loraも組み込んで速度と品質を向上させました。これによって動作領域がシフトしています。メインのタイトル画像を示します。
16ステップ V 2.0
30ステップ V 1.0
デメリット:
まず、このバージョンは前作より少しサイズが大きいです。次に、Unetのみのバージョンの作成がまだです。完了後に更新します。
設定とワークフロー V2.0:
このモデルは少ないステップ数で動作可能です。16ステップは旧バージョンの30ステップに相当します。
しかし多くの場合20〜30ステップを使用した方が品質向上につながります。
サンプラーはEulerとSimpleスケジューラーを推奨します。ガイダンスは1.5〜3の間でテストしてみてください。リアルな画像では1.8が良好です。DPM++2MやHeunも良く動作します。
ワークフロー 2.0:
V2.0とV1.0のための新しいワークフローを作りました。新たにFlux Prompt Generatorを搭載し、第2段階のアップスケーラーも動作可能です。https://civitai.com/articles/7946
Forge:
このモデルはForgeでも非常にうまく動作しました。ただし、Comfy UIとForgeで画像に差異が出る可能性があります。
バージョン 1.0_dev_beta:
このモデルはシリーズの最初の作品です。フィードバックや画像投稿をお願いします。プロジェクトの改善に役立ちます。複数のバージョンがあります。品質で最良なのはFP16版ですが、サイズが非常に大きく、高性能なグラフィックカードと大量のRAMが必要です。FP8版は品質と性能のバランスが良いと考えています。GGUF版が欲しい場合はQ8_0をダウンロードしてください。GGUF Q4_0/4.1はリクエストで作成されました。サイズは小さいですが品質は少し落ちます。
基本的に2種類のモデルがあります。「オールインワン」モデルは1ファイルで十分で、Clip_l、T5xxl fp8、VAEが内蔵されています(以下参照)。チェックポイントフォルダに配置してください。
もう一つはUNETのみのバージョンで、こちらはファイルを個別にロードする必要があります。
どちらの場合も正しく動作させるためにClip_Lのダウンロードが必要です。
また、適切なT5xxlクリップを選ぶことが重要です。FP8版はfp8_e4m3fn t5xxlクリップ、FP16版はFP16クリップを使ってください。デフォルトの重みタイプを選択してください(以下はFP8版の例です)。
GGUF版にはGGUFローダーも必要です!
V1.0についての既知の点:
シリーズ最初のモデルのため、特定のプロンプトやアートスタイルに苦戦する場合があります。次のバージョンでさらにトレーニングを行います。モデルが苦手な点を教えてください。
設定とワークフロー:
約30ステップ、EulerとSimpleスケジューラーを使いテスト済みです。ガイダンスは1.5〜3で試してください。
1.8のガイダンスはリアル画像に適しています。
実験的に色々試してみてください。良い結果が出れば投稿お願いします。
ショーケース画像もトレーニングデータに含めています。Comfy用ワークフローはこちらからダウンロード可能です:https://civitai.com/articles/7946
「オールインワン」モデル:

UNETのみ:
Clip_L(240MBファイル)を必ずダウンロードしてください。
GGUF:ワークフローはこちらに追加しました:https://civitai.com/articles/7946
重要:
開発モデルは商用利用を目的としていません。そのため "schnell" モデルは別の場所で公開予定です。主に個人利用や科学的利用向けです。
ライセンス:
https://huggingface.co/black-forest-labs/FLUX.1-dev/blob/main/LICENSE.md
クレジット:
theunlikely https://huggingface.co/theunlikel(再度感謝)
バージョン 2.1/V4.2/5.0: nyanko7によるFlux_dev_de-distill
https://huggingface.co/nyanko7/flux-dev-de-distill
V2.0から:ByteDanceのHyper Lora https://huggingface.co/ByteDance/Hyper-SD
Black Forrestによる素晴らしいFluxモデル https://huggingface.co/black-forest-labs
モデル詳細
ディスカッション
コメントを残すには log in してください。











