夕暮れに木の枝とツタの下を歩くブラックパンサーのシルエット。暖かいオレンジ色の光が背景を照らしています。
翼を大きく広げたフォトリアリスティックな緑のカエルが、ムーディーな大気照明の下、広く緑豊かな葉の密集した野原の上を飛んでいる。
Leicaレンズで撮影されたシネマティックライティングとフィルムグレイン効果で輝くガラス質のテクスチャーを持つビニールレコードのクローズアップ。

推奨プロンプト

photography of a man wearing a steampunk monocle a swirly fench mustache and a tall top hat, 20-year-old goth woman, he is holding a pocket watch with the manufaturer "COLOSSUS written in black, long white braided hair black ribbon in hair, shot on Panasonic Lumix GH5 with Leica DG 25mm f-1.4, choker necklace, red eyes, slim fit figure, small perk breasts, gothic black leather and lace short lingerie dress, black fishnet thigh high stocking, black lace panties, she is emerging from swirling smoke tendrils, with soft blue ethereal lighting, a very haunting and dark image

推奨ネガティブプロンプト

blurry

blurry, low res

推奨パラメータ

samplers

Euler, Heun, DPM++ 2M, Deis, DDIM, Simple, dpmpp_2m_simple

steps

20 - 30

cfg

1.5 - 3

resolution

1216x1632, 2000x2000, 2500x2500, 1248x1600

vae

default VAE baked in - various versions including FP8 and FP16

ヒント

品質向上にはネガティブプロンプト『blurry』を使ってください。

V2.1ではFlux Guidanceスケールをオフにしてcfgを使用してください。

サンプラーとスケジューラーの推奨:EulerとSimpleスケジューラーが良好。他にHeun、DPM++ 2M、Deis、DDIMも優秀です。

V12『Behemoth』AIO版はカスタムT5xxlとClip_Lが組み込まれています。

異なる量子化バージョンがあり、FP4はNvidia 50xx GPU専用、int4は40xx以下用(最低20xx GPUが必要)です。

インストールと最適使用方法は提供されているワークフローガイドをご参照ください。

バージョンのハイライト

V10「Ouroboros」

クリエイタースポンサー

FLUXシリーズモデルを気に入ったら、クリエイターをKo-fiで支援できます。

量子化バージョンやモデルダウンロードはHuggingfaceで入手可能です。

詳細なインストールとワークフローガイドはCivitaiでご覧いただけます。

山の深くに眠る巨人がいて、人類を助けるか破壊をもたらすかの力を持っています…

コロッサスが立ち上がる…

SDXLシリーズの後、次はこのプロジェクトのFLUXシリーズです。今回はゼロから訓練しました。自分の画像を使用しました。自分のschnell FluxモデルDemonFlux/Colossus Project schnellとSDXL Colossus Project 12をリファイナーとして作成しました。

このSD Flux-Checkpointはほぼすべてを生成可能です。Colossusは非常にリアルな写真、アニメ、アートに優れています。

気に入ったらフィードバックをお願いします。サポートしたい方はこちらからも可能です。Fluxモデルを訓練可能なPCを構築するためにかなりの投資をしました。訓練やテストには多くの時間と電気も必要です。

https://ko-fi.com/afroman4peace

バージョンV12「Hephaistos」

このチェックポイントを公開することは嬉しい反面、悲しくもあります。V12はこのシリーズの最後のチェックポイントとなります。主な理由は今後のEUのAI法規制とFlux .1 DEVのライセンスに関係しています。皆さまのサポートに感謝します!この1年間多くの時間をこのプロジェクトに費やしました。今は別のプロジェクトへ進む時です。

ともかく、シリーズを良い形で締めくくります…

V12はV10B「BOB」に基づきながら、このシリーズの最高のパーツを統合して作られました。(新たなマージメソッドで1時間半かけて合成し、128GBのRAMをフルに使いました)。顔や肌のテクスチャもV10より向上。目はよりリアルで生き生きしています。

ぜひ試してフィードバックをください。「遅い」インターネット接続のため、まずFP8_UNETをアップロードし、その後FP8「all in one」版、FP16_unet、FP16_BEHEMOTHを順に公開します。int4とfp4への変換も試みます(成功を祈ってください)。

いつものようにV12についてのフィードバックをお待ちしています。

バージョンV12「Behemoth」(AIO)

この「all in one」モデルはV12シリーズの最高峰で、もちろんサイズも最大です :-)

BehemothはカスタムのT5xxlとClip_lがモデル内部に組み込まれています。品質重視の方に最適なチェックポイントです!

バージョンV12 FP4/int4

NunchakutechのMuyang Li氏に感謝します。V12の量子化を行いました。https://huggingface.co/nunchaku-tech と彼らの素晴らしいnunchakuに感謝します!

このバージョンは品質と速度の両立で驚異的です。

注意!

FP4とint4の2つのバージョンがあります。FP4はNvidia 50xxシリーズGPU専用、int4は40xx以下でも動作します(最低20xxシリーズのGPUが必要です)。

両方のバージョンは以下から直接ダウンロード可能です:https://huggingface.co/nunchaku-tech/nunchaku-flux.1-dev-colossus

インストールガイドとワークフロー

簡単なインストールガイドと進行中のワークフローを紹介します。

https://civitai.com/articles/17313

ワークフローの詳細ガイド

https://civitai.com/articles/17358

Nunchaku用の新しいワークフローはまだ作成中なので、以下のワークフローはWIP(作業途中)です。週末に詳細な記事を追加予定です。

バージョンV12 FP16_B_variant

深夜2時の小さなミスで「間違った」チェックポイントをアップロードしてしまいました。非常に実験的で公開目的ではありません。十分にテストされていませんが、ショーケース作成時は良好なパフォーマンスでした。標準版より良いかもしれません。

アジア系の顔に寄った傾向があります。副プロジェクトとの混合をテストしたためです。このチェックポイントの体験を教えてください :-)

バージョンV12 AIO FP8

このバージョンはV12のすべてを一つにまとめた版です。全てのclipsが内部に組み込まれており、カスタムclip_l付きFP8_unetと同じ出力を提供します。

バージョンV12 GGUF Q5_1

リクエストで作成されたバージョンです。品質は悪くありません。

バージョンV10B「BOB」

V10の代替版で、V10のFP8版を改善するために作成しました。FP8版は一般的により正確で色も良いです。最近はあまり時間がなく(リアルライフ優先)、公開が遅れました。こちらの方が好みなら教えてください。FP16版「BOB」もあります。フィードバックに応じてint4版も検討します。

ワークフロー:

V12とV10のワークフローはこちら:https://civitai.com/articles/17163

バージョンV10_int4_SVDQ「Nunchaku」

最初にtheunlikely https://huggingface.co/theunlikelyへ感謝します。FP16_Unetをint4_SVDQに変換してくれました。ページを訪れていいねをお願いします。

このバージョンはほぼFP8版と同等です。普通のモードでもワークフロー内で2〜3倍速く動作します。「高速モード」では3090tiで約19秒で2MP画像をレンダリング可能です。

SVDQ「Nunchaku」とは?

この新しい量子化方式はFluxモデル(ここではネイティブFP16モデル)を24GBから約6.7GBに縮小可能にします。それだけではなく、ほとんど品質を落とさずこれまでより高速に生成が可能です。32GB_Behemothとの違いは小さいですが、あちらはより多くのVRAM/RAMが必要です。

詳細は以下を参照:https://github.com/mit-han-lab/ComfyUI-nunchaku?tab=readme-ov-file

インストール:ワークフロー/インストールガイドはこちらへ:https://civitai.com/articles/15610

バージョンV10「Behemoth」(FP16_AIO)

これはまだ実験的なバージョンです。主な焦点はよりリアルな結果の獲得でした。また「Flux Lines」を減少させることに成功しました。このモデルはColossus Project V5.0_Behemoth、V9.0、そして「Ouroborus Project」と呼ぶ別のプロジェクトに基づいています。

FP16版は非常に安定しています。FP8版もまもなく公開予定で、こちらも良好ですが安定性は劣ります。

実験して感想を教えてください。

楽しく作成してください :-)

バージョンV9.0:

なぜV9.0なのかを説明します。

最近新しいアパートに引っ越しましたが、インターネット回線の問題で実質的に接続がありませんでした。その間、PCを稼働させていたため多数のチェックポイント(ほとんど不完全なもの)を生成しました。かなり良いV8版もありますので公開検討中です。

変更点:

V5.0の最高の結果を取り込みつつ、新しい顔や肌のテクスチャ、足と脚の解剖学トレーニングを行いました。V5.0版では頭や足が切れてしまうことがありましたが、これを改善できたと思います。

さらに自分の風景画像で追加訓練しました。引っ越しの最中にも訓練しており、総計約2週間の計算時間をかけています。電気代は時間あたり約25セントかかっています。

気に入っていただければ幸いです。応援していただけるなら素敵な画像の投稿やBuzz、Ko-fiでのチップも歓迎します。

感想を教えてください :-)

バージョン5.0:

V5.0は実質的にV4.2とV4.4(まもなく公開予定)をベースにしています。肌のディテールや解剖学の追加訓練を行い、主に手や乳首の問題を修正しました。顔のディテールは大幅に向上し、一部の小さなFluxラインも修正しました。

全体的にこのバージョンはV4.2よりリアルで、細部も良くなっています。V4.2同様、ハイブリッドのデディスティルモデルで、同じ設定で使用可能です。

新しいワークフローも導入しています:https://civitai.com/articles/11950/workflow-for-colossus-project-flux-50

V4.2やV2.1と比較して感想をお聞かせください。

バージョン4.4「Research」:

完成のために追加したバージョンで、V4.2よりややリアルで、V5.0のベースにもなっています。使ってみてください。V5.0やV4.2のワークフローも使えます。

バージョン4.2:

このバージョンはDemoncore FluxとColossus Project Fluxのさらなる発展形です。より安定した結果、良い肌テクスチャ、良い手、多様な顔を目標にしました。部分的にDemoncore Fluxのハイブリッドモデルとして訓練し、乳首やNSFWも少し強化しました。V4.2がV2.1より好みなら教えてください :-)

公開用画像はSDXL解像度または2MP解像度(例1216x1632)のネイティブ画像を使用しました。このモデルはより高解像度にも対応可能で、2500x2500までテスト済みですが約2000x2000推奨です。

設定は約30ステップ、2〜2.5のCFGを推奨します。自分は主に2.2か2.3を使用し、ショーケース画像はDPM++ 2MとSimpleスケジューラーを利用しました。

クリスマス前で時間があまりないため、バージョンは追って追加予定です。

設定

近々より新しい専用のComfyワークフローを追加予定です。現状は公開ショーケース画像を自由に使用してください。

「All in One」バージョンはForgeでも良好に動作します。

基本的にはバージョン2.1と同じ設定で動作します(以下参照)。

20〜30ステップ、CFG約2.2を推奨します。

バージョン2.1_de-distilled_experimental (MERGE)

このバージョンはまったく異なり、通常のFluxモデルとは動作が違います!

実験的なマージで、自分の2.0バージョンとデディスティル版https://huggingface.co/nyanko7/flux-dev-de-distillの組み合わせです。偶然の産物ですが、詳細は驚異的で、プロンプトに非常によく沿います。今後はデディスティルモデル単独での訓練も試みる予定です。このモデルは非常に実験的なので、問題があれば報告ください。良い画像や悪い画像の投稿も改善に役立ちます。2.0バージョンも試して、どちらが合うか教えてください。

注意!

通常のFluxワークフローはこのバージョンでは動作しません。専用ワークフローのダウンロードが必要です!

自作の対処も可能ですが、荒れた画像は責任を負いかねます。また非常に実験的なモデルであり、以下の欠点もご理解ください。

このチェックポイントの長所と短所:

  • 非常に詳細な画像を生成可能ですが、その分通常のFluxチェックポイントより遅いです。一方で追加のアップスケールが不要な場合が多いです。Flux Guidanceではなくcfgスケールを使用するため、標準ワークフローでは動作しません。

  • ネガティブプロンプトが使用可能です!不要な要素を画像から除去できます。

  • 時折アーティファクトが発生することがあります。単純なアップスケールで解決可能かもしれません(現在対応中)。例を示しますが、特定のシードでのみ発生します。更新:これはモデル自身の問題ではなくワークフローの問題で、修正中です。発生した場合は最初のアップスケールを1.2ではなく1.14に設定してみてください。

設定とワークフロー V2.1:

こちらにワークフローがあります:https://civitai.com/articles/8419

設定:通常のFluxとは異なりFlux Guidanceスケールは不要で、代わりにcfgを使います。自分は主に3のcfgを使っていますが画像によっては低めも必要です。

Flux Guidanceスケールはオフが重要です。

ワークフローを使わずとも30ステップ、2-3のcfgで動作を確認済みです。Forgeの設定にもなるかもしれません。試してみてください。

ネガティブに「blurry」という単語を入れることを推奨します。

サンプラーとスケジューラー:

以下の動作するサンプラーを選択可能です:

Euler、Heun、DPM++2M、deis、DDIMが良好に動作します。

スケジューラーには「simple」をよく使っています。

より良い設定があれば教えてください.. :-)

ForgeにはAIOモデルを推奨します。例を示します。

バージョン2.0_dev_experimental

これは実験的なバージョンです。より一貫性と高速化を目指しました。いくつかの追加自作Loraを訓練し、特殊な方法(Tensor merge)でマージしました。Attention Seekerで改変したカスタムT5xxlもあります。ByteDanceのHyper Flux loraも統合しました。これにより作業領域が移動しています。メインタイトル画像を示します。

16ステップ V 2.0

30ステップ V 1.0

欠点:

まず、このバージョンは前回より少し大きいです。次にUnetのみ版も作成予定です。完成したら更新します。

設定とワークフロー V2.0:

モデルはより少ないステップで動作します。16ステップは旧モデルの30ステップに相当します。

それでも品質向上のため20〜30ステップ推奨です。

サンプラー:EulerとSimpleスケジューラーを好みます。ガイダンスは1.5-3の範囲で調整可能(範囲外も試してください)。1.8のガイダンスはリアル画像で良好です。他のサンプラーも良好に動作します。DPM++2MとHeunもおすすめです。

ワークフロー 2.0:

V2.0とV1.0用の新しいワークフローを作成しました。Flux Prompt Generatorを導入し、第2アップスケールステージも動作しています。https://civitai.com/articles/7946

Forge:

Forgeでもこのモデルをテストし、良好に動作しました。ただしComfy UIとForgeでは画像結果に差異がある場合があります。

バージョン1.0_dev_beta:

このモデルはシリーズ初のエントリーです。フィードバックや画像投稿でプロジェクトの改善にご協力ください。複数のバージョンがありますが、品質面で最良はFP16版です。巨大なサイズで強力なGPUと多くのRAMを必要とします。FP8版は品質と性能のバランス良好な解決策と考えています。GGUF版はQ8_0をダウンロードしてください。GGUF Q4_0/4.1はリクエスト版でサイズは小さいですが若干品質が劣ります。

基本的にモデルには単一ファイルの「All in one」版があり、Clip_l、T5xxl fp8、VAEが組み込まれています。(下記参照)チェックポイントフォルダに配置してください。

別にUNETのみ版もあり、その場合は全ファイルを別々に読み込む必要があります。

いずれの場合もclip_Lをダウンロードし、正常に動作させる必要があります。

FP8版はfp8_e4m3fn t5xxl clipを使用してください。FP16版はFP16 clipを使用し、デフォルトのweightタイプを選択します。(下画像はfp8版の例)

GGUF版にはGGUFローダーが必要です!

現在のV1.0に関する既知の事項:

シリーズ初版なので一部のプロンプトやスタイル(アートなど)に苦戦するかもしれません。次バージョンで更なる訓練を行う予定です。苦手な点を教えてください。

設定とワークフロー:

約30ステップ、Euler、Simpleスケジューラーでテストしています。ガイダンスは1.5-3で調整可能(範囲外も試してください)。

1.8のガイダンスはリアルな画像で良好です。

設定を自由に試し、良い結果が得られたら共有してください。

ショーケース画像を訓練データとして追加しています。Comfy用のワークフローを含みます。ダウンロードはこちら:https://civitai.com/articles/7946

「All in one」モデル:

UNETのみ版:

Clip_L(約240MB)もダウンロードする必要があります。

GGUF:GGUF用ワークフローはこちらに追加しました:https://civitai.com/articles/7946

重要:

開発版モデルは商用利用を目的としていません。そのため「schnell」モデルは別の場所で公開予定です。個人または科学用途向けです。

ライセンス:

https://huggingface.co/black-forest-labs/FLUX.1-dev/blob/main/LICENSE.md

クレジット:

theunlikely https://huggingface.co/theunlikel (再度感謝します)

バージョン2.1/V4.2/5.0: nyanko7によるFlux_dev_de-distill

https://huggingface.co/nyanko7/flux-dev-de-distill

V2.0より:ByteDanceのHyper Lora https://huggingface.co/ByteDance/Hyper-SD

Black Forrestの素晴らしいFluxモデルに感謝 https://huggingface.co/black-forest-labs

前の画像
Pet Love - pet love
次の画像
No More Sameface - フェイスランダマイザー - SDXL

モデル詳細

モデルタイプ

Checkpoint

ベースモデル

Flux.1 D

モデルバージョン

v10_AIO_FP8

モデルハッシュ

749f6f9226

作成者

ディスカッション

コメントを残すには log in してください。