콜로서스 프로젝트 플럭스 - v10_int4_SVDQ
관련 키워드 및 태그
추천 네거티브 프롬프트
blurry
추천 매개변수
samplers
steps
cfg
resolution
vae
팁
출력 품질 향상을 위해 'blurry'라는 단어가 포함된 부정 프롬프트를 사용하세요.
FP4 버전은 Nvidia 50xx 시리즈 그래픽 카드 전용이며, int4 버전은 40xx 이하도 지원합니다 (최소 20xx 시리즈 권장).
"올인원" 모델에는 Clip_l, T5xxl, VAE가 내장되어 있어 사용이 간편합니다.
Euler, Heun, DPM++2M, deis, DDIM과 같은 다양한 샘플러를 시도해 보세요; 'Simple' 스케줄러를 권장합니다.
가이던스 스케일(cfg)은 1.5에서 3 사이, 기본 2.2~2.3 범위에서 실험해 보세요.
FP8 버전은 품질과 성능의 균형이 잘 잡혀 있습니다.
특수 'de-distilled' 버전에서는 Flux Guidance 스케일을 비활성화하고 대신 cfg를 사용하세요.
아티팩트가 발생하면 작은 업스케일(예: 1.2 대신 1.14배)을 시도해 문제를 완화하세요.
워크플로우와 상세 가이드는 Civitai 기사 링크에서 확인할 수 있습니다.
버전 하이라이트
버전 V10_int4_SVDQ "Nunchaku"
설치: 내 워크플로우/설치 가이드를 참조하세요: https://civitai.com/articles/15610
FP16_Unet를 int4_SVDQ로 변환해 주신 theunlikely https://huggingface.co/theunlikely에게 감사드립니다. 방문하여 좋아요를 눌러 주세요.
이 버전은 대체로 FP8 버전과 동일하며, 내 워크플로우 내 일반 모드에서도 이 모델은 일반 모델보다 약 2~3배 빠릅니다. 워크플로우 "빠른 모드"를 사용하면 3090ti에서 약 19초 만에 2MP 이미지를 렌더링할 수 있습니다.
SVDQ "Nunchaku"란?
이 새로운 양자화 방법은 Flux 모델(FP16 네이티브 모델 기준)을 24GB에서 약 6.7GB로 축소할 수 있습니다. 또한 이전보다 빠르게 생성할 수 있으면서 품질 손실은 적습니다. 32GB_Behemoth와 비교할 때 약간의 차이는 있지만, Behemoth를 구동하려면 훨씬 더 많은 VRAM/RAM이 필요합니다.
자세한 내용은 다음을 참고하세요: https://github.com/mit-han-lab/ComfyUI-nunchaku?tab=readme-ov-file
크리에이터 스폰서
제작자를 Ko-Fi에서 지원하세요: https://ko-fi.com/afroman4peace
Nunchakutech의 무양 리가 제작한 양자화 모델 다운로드: https://huggingface.co/nunchaku-tech/nunchaku-flux.1-dev-colossus
Civitai의 워크플로우 가이드:
https://civitai.com/articles/17313
https://civitai.com/articles/17358
https://civitai.com/articles/17163
https://civitai.com/articles/15610
https://civitai.com/articles/11950/workflow-for-colossus-project-flux-50
https://civitai.com/articles/8419
https://civitai.com/articles/7946
Nunchaku SVDQ 양자화 GitHub: https://github.com/mit-han-lab/ComfyUI-nunchaku?tab=readme-ov-file
산 깊은 곳에는 잠자는 거인이 살고 있으며, 인류를 도울 수도 있고 파괴를 일으킬 수도 있습니다...
콜로서스가 일어납니다...
내 SDXL 시리즈 이후로 이번에는 이 프로젝트의 FLUX 시리즈를 시작합니다... 이번에는 처음부터 새롭게 훈련했습니다. 훈련에 내 자신의 이미지를 사용했으며, schnell Flux 모델 DemonFlux/Colossus Project schnell와 SDXL Colossus Project 12를 리파이너로 활용했습니다.
이 SD Flux 체크포인트는 거의 모든 것을 생성할 수 있습니다. 콜로서스는 매우 현실적인 사진, 애니메이션, 예술을 만드는 데 매우 탁월합니다.
마음에 드신다면 피드백을 부탁드립니다. 또한 저를 지원하고 싶으시면 여기를 통해 도와주실 수 있습니다. 실제로 Flux 모델을 훈련할 수 있는 컴퓨터를 구매하는 데 상당한 비용을 들였으며, 훈련과 테스트 역시 많은 시간과 전력을 소모합니다.
https://ko-fi.com/afroman4peace
버전 V12 "Hephaistos"
이 체크포인트 공개가 기쁘면서도 슬픕니다.. V12가 이 시리즈의 마지막 체크포인트가 될 것입니다.. 주요 원인은 다가오는 EU AI 법안과 Flux .1 DEV 자체의 라이선스 때문입니다. 모두의 지원에 감사드립니다! 지난 1년간 이 프로젝트에 많은 시간을 투자했습니다. 이제는 다른 프로젝트로 넘어갈 시간입니다.
어쨌든 이 시리즈를 훌륭한 마무리와 함께 끝내겠습니다...
V12는 V10B "BOB"를 기반으로 하며, 이 시리즈의 최상의 요소들을 블록 병합하여 하나의 체크포인트에 담았습니다. (약 1시간 30분 소요된 새 병합 방법의 결과이며, 128GB RAM 전체를 사용했습니다.) 얼굴과 피부 질감도 V10보다 향상되었고, 눈은 훨씬 더 사실적이며 "생동감"이 있습니다.
직접 테스트해보고 V12에 대한 피드백을 주세요. 느린 인터넷 연결 때문에 우선 FP8_UNET을 업로드한 후 FP8 "올인원" 버전, FP16_unet 및 FP16_BEHEMOTH를 차례로 올릴 예정입니다. int4 및 fp4 버전 변환도 시도할 계획입니다 (응원해주세요).
언제나 그렇듯 V12에 대한 피드백을 부탁드립니다..
버전 V12 "Behemoth" (올인원)
이 "올인원" 모델은 내 V12 시리즈 중 최고이자 크기도 가장 큰 모델입니다 :-)
Behemoth는 모델 내에 커스텀 T5xxl과 Clip_l이 내장되어 있습니다. 품질을 중시한다면 이 체크포인트가 적합합니다!
버전 V12 FP4/int4
V12의 양자화를 담당한 Nunchakutech의 무양 리에게 감사드립니다. https://huggingface.co/nunchaku-tech 및 훌륭한 nunchaku!
이 버전은 진정으로 놀랍습니다. 품질과 속도를 결합하여 전례 없는 성능을 보여줍니다.
주의!
FP4와 int4 두 가지 버전이 있습니다. FP4는 Nvidia 50xx 그래픽 카드 전용이며, int4는 40xx 이하에서도 작동합니다. (최소 20xx 시리즈 그래픽 카드를 권장합니다)
두 버전 모두 여기에 직접 다운로드할 수 있습니다: https://huggingface.co/nunchaku-tech/nunchaku-flux.1-dev-colossus
설치 가이드 및 워크플로우
간단한 설치 가이드와 진행 중인 워크플로우를 소개합니다.
https://civitai.com/articles/17313
워크플로우 상세 가이드
https://civitai.com/articles/17358
현재 Nunchaku용 새 워크플로우를 작업 중이며, 아래 워크플로우는 아직 진행 중입니다. 주말에 자세한 기사를 추가할 예정입니다.
버전 V12 FP16_B_variant
늦은 밤 (새벽 2시)에 실수로 "잘못된" 체크포인트를 이름 변경해 업로드했습니다. 매우 실험적인 버전이며 공개할 의도가 없었습니다. 많이 테스트하지는 않았지만 쇼케이스 생성 시 좋은 성능을 보여줬습니다. 표준 버전보다 나을 수도 있습니다.
아시아 얼굴에 좀 더 치중하는 경향이 있습니다. 아직 진행 중인 사이드 프로젝트를 섞어 보려는 테스트용입니다. 이 체크포인트 사용 경험을 알려주세요 :-)
버전 V12 올인원 FP8
V12의 올인원 버전으로, 모든 클립이 내장되어 있습니다. FP8_unet과 내 커스텀 clip_l과 동일한 출력을 제공합니다.
버전 V12 GGUF Q5_1
요청으로 제작된 버전이며 품질은 나쁘지 않습니다..
버전 V10B "BOB"
V10의 대안 버전입니다. V10의 FP8 버전을 개선하려고 만들었습니다. 일반적으로 FP8 버전이 더 정밀하고 색감이 좋습니다. 최근 시간이 부족해 (현실 생활 우선) 이 작업에 오래 걸렸습니다. 이 버전을 선호하시면 알려 주세요. "BOB"의 FP16 버전도 있습니다. 피드백에 따라 int4 버전 출시도 고려하겠습니다.
워크플로우:
V12 및 V10 워크플로우: https://civitai.com/articles/17163
버전 V10_int4_SVDQ "Nunchaku"
FP16_Unet를 int4_SVDQ로 변환해 주신 theunlikely https://huggingface.co/theunlikely에게 감사 인사를 드립니다. 방문하여 좋아요를 눌러 주세요.
이 버전은 대체로 FP8 버전과 동일합니다. 내 워크플로우 내 일반 모드에서도 이 모델은 일반 모델보다 약 2~3배 빠릅니다. 워크플로우의 "빠른 모드"로는 3090ti에서 약 19초 만에 2MP 이미지를 렌더링할 수 있습니다.
SVDQ "Nunchaku"란?
이 새로운 양자화 방법은 Flux 모델(FP16 네이티브 모델 기준)을 24GB에서 약 6.7GB로 축소할 수 있게 해 줍니다. 뿐만 아니라 이전보다 더 빠르게 생성할 수 있으면서 품질 손실도 적습니다. 32GB_Behemoth와 비교하면 약간의 차이는 있지만, Behemoth를 구동하려면 훨씬 더 많은 VRAM/RAM이 필요합니다.
자세한 내용은 다음을 참조하세요: https://github.com/mit-han-lab/ComfyUI-nunchaku?tab=readme-ov-file
설치: 내 워크플로우/설치 가이드를 참조하세요: https://civitai.com/articles/15610
버전 V10 "Behemoth" (FP16_AIO)
이 버전은 아직 실험 단계입니다. 주요 초점은 보다 현실적인 결과를 얻는 것이었고, 일부 "Flux 라인"을 줄이는 데에도 성공했습니다. 이 모델은 Colossus Project V5.0_Behemoth, V9.0 및 "Ouroborus Project"라는 다른 프로젝트를 기반으로 합니다.
FP16 버전은 매우 안정적입니다. 곧 FP8 버전도 출시할 예정이며, 그 버전도 좋지만 안정성은 조금 떨어집니다.
실험해 보시고 의견을 알려 주세요.
만드는데 즐거움이 가득하기를 바랍니다 :-)
버전 V9.0:
설명이 필요합니다.. 우선 왜 V9.0인지부터...
최근 새 아파트로 이사하던 중 인터넷 공급자 문제로 인터넷 연결이 되지 않았습니다.. 이사하는 동안 컴퓨터를 계속 켜둔 결과 많은 (대부분 불완전한) 체크포인트를 생성했습니다. 그러나 일부 매우 좋은 V8 버전도 있으니 곧 공개할 수 있을 것 같습니다..
변경 내용?
V5.0의 최고 결과를 기반으로 얼굴과 피부 질감을 새로 훈련했고, 해부학적으로 더 나은 발과 다리 훈련도 추가했습니다. V5.0 버전은 때때로 머리와 발이 잘렸는데 이를 어느 정도 수정했습니다.
또한 자신의 풍경 이미지를 더 많이 사용해 훈련했습니다.. 그리고 네, 이 모든 작업을 이사하면서 했습니다... 총 훈련 기간은 약 2주간 컴퓨팅 시간이었으며, 많은 비용이 들었습니다 (매 시간 약 25센트 전기료).
이 버전을 마음에 들어 하시길 바라며, 지원하고 싶으시면 멋진 이미지 게시나 Buzz 또는 Ko-Fi로 팁을 주시면 감사하겠습니다.
의견을 알려 주세요 :-)
버전 5.0:
V5.0은 사실 V4.2와 V4.4 (조만간 공개 예정)를 기반으로 합니다. 피부 디테일과 해부학 관련 추가 훈련이 포함되어 주로 손과 유두 같은 부분을 개선했습니다. 얼굴 디테일도 크게 향상되었고, 일부 작은 Flux 라인도 수정하려고 했습니다.
일반적으로 이 버전은 V4.2보다 더 현실적이고 세부 사항이 뛰어납니다.. V4.2와 마찬가지로 하이브리드 de-distilled 모델입니다. V4.2와 비슷한 설정으로 사용 가능합니다.
재미로 아래 새로운 워크플로우를 시도해 보세요: https://civitai.com/articles/11950/workflow-for-colossus-project-flux-50
V4.2 또는 V2.1과 비교해 이 버전에 대해 알려 주세요..
버전 4.4 "Research":
완성을 위해 이 버전을 추가했습니다.. V4.2보다 약간 더 현실적이며 V5.0의 기반이 됩니다. 사용해 보고 싶으면 사용 가능하며 V5.0 및 V4.2 워크플로우도 지원됩니다..
버전 4.2:
기본적으로 Demoncore Flux와 Colossus Project Flux의 추가 발전 버전입니다. 목표는 더 안정적인 결과와 개선된 피부 질감, 더 나은 손 묘사, 다양한 얼굴 표현입니다. 일부는 Demoncore Flux의 하이브리드 모델로 훈련했습니다. 유두와 NSFW 부분도 일부 개선했습니다. V2.1보다 V4.2를 선호하시면 알려 주세요 :-)
쇼케이스 이미지는 SDXL 해상도 또는 2MP 해상도(예: 1216x1632) 네이티브 이미지로만 제작했습니다. 이 모델은 더 높은 해상도도 처리할 수 있습니다. 최대 2500x2500까지 테스트했고, 약 2000x2000 정도를 권장합니다.
설정은 약 30 스텝과 2~2.5 cfg를 권장하며, 주로 2.2 또는 2.3을 사용합니다. 쇼케이스는 DPM++ 2M과 Simple 스케줄러를 사용했습니다.
곧 더 많은 버전을 추가할 계획이나 크리스마스 전에 시간이 많지 않습니다..
설정
곧 더 전용된 Comfy 워크플로우를 추가할 예정입니다. 우선 쇼케이스 이미지를 다운로드하고 열어 보실 수 있습니다..
"올인원" 버전도 Forge와 잘 작동합니다..
기본적으로 V2.1과 같은 설정으로 작동합니다 (아래 참조)
20-30 스텝에 약 2.2 cfg를 설정하세요..
버전 2.1_de-distilled_experimental (병합)
이 버전은 완전히 다르며 일반 Flux 모델과 작동 방식이 다릅니다!
내 버전 2.0과 de-distilled 버전 https://huggingface.co/nyanko7/flux-dev-de-distill을 우연히 병합한 실험적 버전입니다. 결과는 매우 뛰어나고 프롬프트를 매우 잘 따릅니다... 다음 단계는 직접 de-distilled 모델로 훈련하는 것입니다. 이미 일부 실험적인 Lora를 했습니다. 매우 실험적인 모델이니 오류를 발견하면 알려 주세요. 좋은 이미지뿐 아니라 나쁜 이미지도 공유해 주세요. 개선에 도움이 됩니다 :-) 버전 2.0도 시도해 보고 자신에게 맞는 체크포인트 유형을 알려 주세요.
주의!
일반 Flux 워크플로우는 이 버전에서 작동하지 않습니다. 반드시 내 워크플로우를 다운로드하세요!
직접 해결책을 찾을 수도 있지만 나쁜 이미지 문제는 제작자에게 책임이 없습니다. 매우 실험적인 모델임을 유의하세요... 아래 단점도 확인바랍니다.
이 체크포인트의 장단점:
아주 상세한 이미지를 생성할 수 있으나 그만큼 속도는 느립니다. 장점은 추가 업스케일이 필요 없는 경우가 많으며, Flux Guidance 대신 cfg 스케일을 사용하기 때문에 표준 워크플로우와는 호환되지 않습니다.
부정 프롬프트(negative prompt)를 사용할 수 있습니다! 원하지 않는 요소를 제거하는 데 유용합니다.
때때로 아티팩트가 나타날 수 있습니다. 간단한 업스케일(예: 1.2 대신 1.14 배)로 해결할 수 있습니다 (해당 문제는 모델 자체보다는 워크플로우 문제로 수정 중입니다).


설정 및 워크플로우 V2.1:
워크플로우는 여기에서 확인할 수 있습니다: https://civitai.com/articles/8419
설정: 일반 Flux와 다르게 Flux Guidance 스케일이 필요 없으며, 대신 cfg를 사용합니다. 워크플로우에서 주로 3 cfg를 사용하며, 일부 이미지에서는 더 낮은 cfg가 필요할 수 있습니다.
가장 중요한 점은 Flux Guidance 스케일을 꺼야 한다는 것입니다..
워크플로우 없이도 30 스텝, 2-3cfg로 테스트했습니다. Forge 용 설정일 수도 있으니 실험해 보세요.
부정 프롬프트에 "blurry"를 넣는 것을 추천합니다.
샘플러 및 스케줄러:
사용 가능한 샘플러는 Euler, Heun, DPM++ 2M, deis, DDIM 등이 있으며 모두 잘 작동합니다.
대부분 "simple" 스케줄러를 사용합니다.
더 좋은 설정을 알 게 되면 알려 주세요.. :-)
Forge 용 예시 설정도 있습니다.

버전 2.0_dev_experimental
이것 역시 실험적 버전입니다.. 목표는 더 일관되고 빠른 모델을 만드는 것이었으며, 자체 훈련한 로라를 추가하고 텐서 병합 방식을 적용했습니다. "Attention Seeker"로 수정한 커스텀 T5xxl도 포함되어 있습니다. 성능 및 품질 향상을 위해 ByteDance의 Hyper Flux 로라를 병합했습니다. 작업 영역이 변화했는데, 대표 이미지로 보여드리겠습니다..
16 스텝 V 2.0
30 스텝 V 1.0
단점:
우선 이 버전은 이전 버전보다 약간 용량이 크며, UNET 전용 버전은 아직 만들지 않았습니다. 완성되면 업데이트하겠습니다..
설정 및 워크플로우 V2.0:
이제 적은 스텝으로 모델을 실행할 수 있습니다.. 16 스텝은 기존 모델 30 스텝과 동등합니다.
대부분의 경우 더 높은 품질을 위해 20-30 스텝을 권장합니다.
샘플러: Euler와 Simple 스케줄러를 선호합니다. 가이던스는 1.5-3 범위에서 조정 가능합니다 (물론 범위 외 실험도 환영). 사실적인 이미지에는 1.8 가이던스도 잘 작동합니다. DPM++2M과 Heun도 좋은 선택입니다.
워크플로우 2.0:
V2.0과 V1.0을 위해 새 워크플로우를 만들었으며, Flux Prompt Generator와 두 번째 업스케일러 단계가 포함되어 있습니다. https://civitai.com/articles/7946
Forge:
이 모델은 Forge에서도 잘 작동하며, Comfy UI와 Forge 간에 이미지 차이가 있을 수 있습니다.
버전 1.0_dev_beta:
이 모델은 시리즈의 첫 진입점입니다. 피드백과 이미지 게시를 부탁드립니다. 프로젝트 개선에 큰 도움이 됩니다. 품질 면에서 가장 좋은 모델은 FP16 버전이지만, 용량이 크고 고성능 그래픽 카드와 많은 RAM이 필요합니다. FP8 버전은 품질과 성능의 좋은 균형을 제공합니다. GGUF 버전을 원하면 Q8_0를 다운로드하세요. GGUF Q4_0/4.1 버전은 요청으로 제공되며 용량은 작으나 약간 품질이 떨어집니다.
내 모델은 기본적으로 두 종류로 나뉩니다: 하나는 "올인원" 모델로, 한 파일만 다운로드하면 되며 Clip_l, T5xxl fp8, VAE가 내장되어 있습니다. (아래 참조) 체크포인트 폴더에 넣으세요.
다른 하나는 UNET 전용으로, 모든 파일을 별도로 불러와야 합니다.
어떤 경우든 내 Clip_L을 다운로드해야 제대로 작동합니다..
또한 FP8 버전에는 fp8_e4m3fn t5xxl 클립을, FP16 버전에는 FP16 클립을 사용하세요. 기본 가중치 유형을 선택했는지 확인하세요. (아래 이미지 참조)
GGUF 버전은 GGUF 로더가 필요합니다!
현재까지 알려진 V1.0 관련 내용:
시리즈 첫 모델이라 일부 프롬프트나 아트 스타일에서 어려움이 있을 수 있습니다. 다음 버전에서 더 훈련할 예정입니다. 모델이 잘 안 되는 부분을 알려 주세요..
설정 및 워크플로우:
약 30 스텝, Euler와 Simple 스케줄러를 사용해 테스트했습니다. 가이던스는 1.5-3 범위에서 조절 가능(범위 밖도 자유롭게 실험 가능)
1.8 가이던스는 사실적인 이미지에 좋습니다.
설정을 자유롭게 실험해 보시고, 좋은 결과가 나면 게시해 주세요.
쇼케이스 이미지를 훈련 데이터로 추가했습니다. Comfy용 워크플로우도 포함되어 있습니다. 다운로드용 워크플로우: https://civitai.com/articles/7946
"올인원" 모델:

UNET 전용:
클립_L도 다운로드해야 합니다. 240MB 파일입니다.
GGUF: GGUF 워크플로우를 여기에 추가했습니다: https://civitai.com/articles/7946
중요:
Dev 모델은 상업적 용도가 아니며, "schnell" 모델은 다른 곳에 공개할 예정입니다. 개인적 혹은 과학적 사용에 더 적합합니다.
라이선스:
https://huggingface.co/black-forest-labs/FLUX.1-dev/blob/main/LICENSE.md
크레딧:
theunlikely https://huggingface.co/theunlikel (다시 한번 감사드립니다)
버전 2.1/V4.2/5.0: nyanko7의 Flux_dev_de-distill
https://huggingface.co/nyanko7/flux-dev-de-distill
v2.0부터: ByteDance의 Hyper Lora https://huggingface.co/ByteDance/Hyper-SD
Black Forrest의 훌륭한 Flux 모델 https://huggingface.co/black-forest-labs
모델 세부사항
토론
댓글을 남기려면 log in하세요.












