Colossus Project Flux - V12 "Hephaistos" FP8_UNET
관련 키워드 및 태그
추천 네거티브 프롬프트
blurry
추천 매개변수
samplers
steps
cfg
resolution
vae
팁
품질 좋은 결과를 위해 20-30 스텝과 2.2 CFG를 사용하세요.
샘플러는 Euler와 Simple 스케줄러를 선호하며, DPM++ 2M과 Heun도 잘 작동합니다.
원치 않는 아티팩트를 줄이기 위해 부정 프롬프트에 'blurry'를 추가하세요.
실험적 v2.1 모델에서는 Flux 가이던스 스케일을 끄고 대신 CFG 스케일을 사용하세요.
FP4 버전은 Nvidia 50xx 시리즈 전용이며, int4 버전은 40xx 및 이하 GPU에서 작동합니다.
UNET 전용 버전이 제대로 작동하려면 필요한 Clip_L 파일을 다운로드하세요.
권장 범위 내에서 다양한 샘플러와 CFG 설정을 시도하여 결과를 다양화하세요.
버전 하이라이트
워크플로우: https://civitai.com/articles/17163
V12의 FP8_unet 버전: 이 clip_l을 사용하세요:
https://civitai.com/models/833086?modelVersionId=1985466
이 unet과 함께 t5xxl_fp8_e4m3fn도 사용하세요.
버전 V12 "Hephaistos"
이 체크포인트를 공개하는 것은 기쁘면서도 슬픕니다.. V12가 이 시리즈의 마지막 체크포인트가 될 것입니다.. 주요 이유는 다가오는 EU-AI 법률입니다... 또 다른 이유는 Flux .1 DEV 소유 라이선스 때문입니다. 모든 지원에 감사드립니다!
어쨌든.. 이 시리즈를 멋진 결말로 마무리하겠습니다...
V12는 V10B "BOB"를 기반으로 하지만 기본적으로 이 시리즈 최고의 부분들을 블록 병합해 하나의 체크포인트로 만들었습니다. (약 1시간 30분 동안 수행된 새로운 병합 기법으로 내 전체 128GB RAM을 사용했습니다). V10과 비교해 얼굴 및 피부 질감도 향상되었으며, 눈은 훨씬 더 현실적이고 "생동감" 있게 바뀌었습니다.
직접 테스트하고 V12에 대한 피드백을 주세요. 느린 인터넷 연결 덕분에 FP8_UNET을 먼저 올릴 예정이고, 이후 FP8 "올인원" 버전, FP16_unet, FP16_BEHEMOTH 순으로 올리겠습니다. int4 및 fp4 변환도 시도할 예정입니다 (성공을 빕니다).
항상 V12에 대한 피드백을 부탁드립니다..
크리에이터 스폰서
이 모델이 마음에 드시나요? 창작자를 Ko-fi에서 후원해 주세요.
더 쉬운 설치를 위한 설치 및 워크플로우 가이드를 확인하세요:
- https://civitai.com/articles/17313
- https://civitai.com/articles/17358
- https://civitai.com/articles/17163
- https://civitai.com/articles/15610
추가 워크플로우와 쇼케이스 이미지는 여기에서 확인할 수 있습니다.
산 속 깊은 곳에는 인류를 돕거나 파괴를 일으킬 수 있는 잠자는 거인이 있습니다...
콜로서스가 깨어납니다...
내 SDXL 시리즈 이후로 이번에는 이 프로젝트의 FLUX 시리즈입니다... 이번에는 처음부터 훈련했습니다. 훈련에는 내 자체 이미지를 사용했습니다. 내 빠른 Flux 모델 DemonFlux/Colossus Project schnell과 내 SDXL Colossus Project 12를 리파이너로 사용하여 제작했습니다.
이 SD Flux-체크포인트는 거의 모든 것을 생성할 수 있습니다.. Colossus는 매우 사실적인 그림, 애니메 및 예술적 이미지를 매우 잘 만듭니다.
마음에 드시면 자유롭게 피드백을 주세요. 또한 지원하고 싶다면 여기서 할 수 있습니다. Flux 모델을 실제로 훈련할 수 있는 컴퓨터를 구축하는 데 상당한 비용이 들었습니다. 훈련과 테스트도 많은 시간과 전력이 소요됩니다..
https://ko-fi.com/afroman4peace
버전 V12 "Hephaistos"
이 체크포인트를 공개하는 것은 기쁘면서도 슬픕니다.. V12가 이 시리즈의 마지막 체크포인트가 될 것입니다.. 주요 이유는 다가오는 EU-AI 법률입니다... 또 다른 이유는 Flux .1 DEV 자체의 라이센스 때문입니다. 모든 지원에 감사드립니다! 지난 1년 동안 이 프로젝트에 많은 시간을 투입했습니다. 이제는 다른 프로젝트로 넘어갈 때입니다.
어쨌든.. 이 시리즈를 좋은 마무리로 끝내겠습니다...
V12는 V10B "BOB"를 기반으로 하지만 본질적으로 이 시리즈에서 최고의 부분들을 하나의 체크포인트로 블록 병합했습니다. (약 1시간 30분 동안 수행된 새로운 병합 방법의 결과로 내 전체 128GB RAM이 사용되었습니다). V10과 비교하여 얼굴 및 피부 질감도 향상시켰습니다. 눈은 훨씬 더 현실적이고 더 "생생"해졌습니다.
직접 테스트해보고 V12에 대한 피드백을 주세요. 느린 인터넷 연결 덕분에 먼저 FP8_UNET을 업로드할 예정입니다. 그 다음에 FP8 "올인원" 버전, 이후에는 FP16_unet 및 FP16_BEHEMOTH를 올릴 것입니다. 또한 int4와 fp4로 변환하는 것도 시도할 것입니다 (그 점에 행운을 빕니다).
항상 V12에 대한 피드백을 주세요..
버전 V12 "Behemoth" (AIO)
이 "올인원" 모델은 내 V12 시리즈 중 최고이며, 물론 크기도 가장 큽니다 :-)
Behemoth는 모델 내부에 맞춤 T5xxl 및 Clip_l가 구워져 있습니다. 품질을 양보다 선호한다면 이 체크포인트가 적합합니다!
버전 V12 FP4/int4
V12 양자화는 Nunchakutech의 Muyang Li 덕분입니다. https://huggingface.co/nunchaku-tech 그리고 그들의 놀라운 눙차쿠!
이 버전은 진정으로 압도적입니다. 전에 없던 품질과 속도의 조합입니다.
주의!
두 가지 버전이 있습니다: FP4와 int4. FP4는 Nvidia 50xx 그래픽 카드 전용이며, int4는 40xx 및 이하 모델에서 작동합니다. (최소 20xx 시리즈 그래픽 카드 필요)
두 버전을 모두 직접 다운로드할 수 있습니다: https://huggingface.co/nunchaku-tech/nunchaku-flux.1-dev-colossus
설치 가이드 및 워크플로우
간단한 설치 가이드와 진행 중인 워크플로우를 제공합니다.
https://civitai.com/articles/17313
상세한 워크플로우 가이드
https://civitai.com/articles/17358
새로운 Nunchaku 워크플로우 작업 중이라 다음 워크플로우는 매우 진행 중인 상태(WIP)입니다. 주말에 상세한 글을 추가할 예정입니다.
버전 V12 FP16_B_variant
밤늦게(새벽 2시) 작은 실수로 잘못된 체크포인트를 이름 바꿔 업로드했습니다. 매우 실험적인 체크포인트로 공개할 의도가 없었으며, 테스트는 부족하지만 쇼케이스 제작 시 매우 좋은 성능을 보였습니다. 표준 버전보다 나을 수도 있습니다.
아시아인 얼굴에 더 치우친 경향이 있습니다. 이는 여전히 작업 중인 사이드 프로젝트를 섞어보기 위한 테스트 때문입니다. 이 체크포인트 사용경험을 알려주세요 :-)
버전 V12 AIO FP8
이 버전은 V12의 올인원 버전입니다. 모든 클립이 내장되어 있고, FP8_unet 버전과 내 맞춤 clip_l와 동일한 출력 결과를 제공합니다.
버전 V12 GGUF Q5_1
요청으로 제작된 버전입니다. 품질은 나쁘지 않습니다..
버전 V10B "BOB"
V10의 대체 버전으로 FP8 버전 개선을 위해 제작했습니다. 일반적으로 FP8 버전이 더 정밀하고 색상이 좋습니다. 최근 시간이 부족해 작업이 지체되었습니다.. (현실 생활이 우선). 이 버전을 선호한다면 알려주세요. "BOB"의 FP16 버전도 가지고 있으며, 피드백에 따라 int4 버전 공개도 고려 중입니다.
워크플로우:
V12 및 V10용 워크플로우: https://civitai.com/articles/17163
버전 V10_int4_SVDQ "Nunchaku"
먼저 FP16_Unet을 int4_SVDQ로 변환해 준 theunlikely(https://huggingface.co/theunlikely)에게 감사드립니다. 그의 페이지 방문하여 좋아요를 눌러주세요.
이 버전은 FP8 버전과 거의 동일합니다. 내 워크플로우 내 기본 모드에서 이 모델은 일반 모델보다 약 2~3배 빠릅니다.. 워크플로우의 "빠른 모드"에서는 내 3090ti로 2MP 이미지를 약 19초 만에 렌더링할 수 있습니다.
SVDQ "Nunchaku"란?
이 새로운 양자화 방식은 Flux 모델(이번에는 네이티브 FP16 모델)을 24GB에서 약 6.7GB로 축소할 수 있습니다. 하지만 그것만이 아닙니다: 품질 손실 없이 그 어느 때보다 빠르게 생성할 수 있습니다. 물론 내 32GB_Behemoth와는 약간 차이가 있지만, 후자는 더 많은 VRAM/RAM이 필요합니다.
더 많은 정보는 여기 방문: https://github.com/mit-han-lab/ComfyUI-nunchaku?tab=readme-ov-file
설치: 내 워크플로우/설치 가이드를 방문하세요: https://civitai.com/articles/15610
버전 V10 "Behemoth" (FP16_AIO)
이 버전은 아직 실험적입니다. 주요 목표는 더욱 사실적인 결과를 얻는 것이었고, "Flux Lines" 일부도 줄이는데 성공했습니다. 이 모델은 Colossus Project V5.0_Behemoth, V9.0 및 "Ouroborus Project"라는 다른 프로젝트를 기반으로 합니다.
FP16 버전은 매우 안정적입니다. 곧 FP8 버전도 공개할 예정입니다. 그 버전도 매우 좋지만 그렇게 안정적이지는 않습니다..
직접 실험해 보시고 이 버전에 대한 의견을 알려주세요.
생성하는 데 즐거움을 느끼시길 바랍니다 :-)
버전 V9.0:
많은 설명이 필요합니다.. 왜 하필 V9.0일까요?
최근 새 아파트로 이사 갔는데, 인터넷 공급자의 문제로 제대로 된 인터넷 연결이 없었습니다.. 이사 동안 컴퓨터를 켜둔 결과 많은(대부분은 깨진) 체크포인트를 만들었습니다. 좋은 V8 버전도 몇 가지 있는데, 곧 공개할 수도 있습니다..
무엇이 바뀌었나요?
V5.0의 최고 결과물을 기본으로 새로운 얼굴과 피부 질감을 훈련했습니다. 또한 더 나은 해부학을 위해 발/다리 훈련도 추가했습니다. V5.0 버전은 때때로 머리와 발이 잘렸는데, 이 문제를 일부 해결한 것으로 생각합니다..
더불어 내 풍경 이미지를 더 많이 사용해 훈련했습니다.. 그리고 네, 이 모든 작업은 이사할 때 진행했습니다... 전체 훈련 시간은 약 2주로 전기비용이 꽤 들었습니다 (시간당 약 25센트).
어쨌든 이 버전이 마음에 들길 바랍니다.. 지원하고 싶다면 멋진 이미지나 Kofi 또는 Buzz를 통한 팁을 부탁드립니다..
느낌이 어떠한지 알려주세요 :-)
버전 5.0:
V5.0은 실제로 V4.2와 V4.4(곧 공개 예정)를 기반으로 합니다. 피부 디테일과 해부학 전반에 대한 추가 훈련이 이루어져 손과 젖꼭지 같은 부분이 주로 개선되었습니다. 얼굴 디테일도 훨씬 좋아졌습니다. 일부 작은 Flux 라인들도 고치려고 시도했습니다..
일반적으로 이 버전은 V4.2보다 더 사실적이고 작은 디테일이 더 좋습니다.. V4.2 버전과 마찬가지로 하이브리드 비증류(de-distilled) 모델입니다. 기본 설정은 V4.2와 동일하게 사용할 수 있습니다.
사용할 새로운 워크플로우도 있습니다: https://civitai.com/articles/11950/workflow-for-colossus-project-flux-50
V4.2 또는 V2.1과 비교한 의견도 알려주세요..
버전 4.4 "Research":
완성을 위해 이 버전을 추가했습니다.. V4.2보다 약간 더 사실적이며 V5.0의 기반입니다. 원하면 시도해볼 수 있습니다. V5.0 및 V4.2 워크플로우도 사용할 수 있습니다..
버전 4.2:
이 버전은 기본적으로 Demoncore Flux와 Colossus Project Flux의 추가 개발 버전입니다. 목표는 더 안정적인 결과와 더 나은 피부 질감, 더 좋은 손과 다양한 얼굴을 얻는 것이었습니다. 하이브리드 모델로 훈련했으며 일부는 Demoncore Flux입니다. 젖꼭지와 NSFW 부분도 조금 개선했습니다. V2.1보다 V4.2를 선호하면 알려주세요 :-)
쇼케이스 이미지는 SDXL 해상도 또는 2MP 해상도의 네이티브 이미지(예: 1216x1632)만 사용했습니다. 이 모델은 더 높은 해상도도 처리할 수 있습니다.. 엔진 테스트 결과 최대 2500x2500까지 가능했으나 2000x2000 정도가 추천됩니다.
설정은 대략 30 스텝, 2-2.5 CFG를 권장합니다. 워크플로우에서는 대개 2.2 또는 2.3을 사용합니다. 쇼케이스에는 DPM++ 2M과 Simple 스케줄러를 사용했습니다.
곧 더 많은 버전을 추가할 예정이지만 크리스마스 전까지는 시간이 별로 없습니다..
설정
곧 전용 Comfy 워크플로우를 추가할 예정입니다. 현재는 쇼케이스 이미지를 다운로드하여 열어 볼 수 있습니다..
"All in One" 버전은 Forge와도 잘 작동합니다..
기본적으로 V2.1과 동일한 설정으로 작동합니다 (아래 참조)
20-30 스텝에 2.2 전후 CFG를 주시면 됩니다..
버전 2.1_de-distilled_experimental (MERGE)
이 버전은 완전히 다르며 일반 Flux 모델과는 다르게 동작합니다!
내 버전 2.0과 de-distilled 버전 https://huggingface.co/nyanko7/flux-dev-de-distill 간의 실험적 병합입니다. 우연히 일어난 일이지만 결과는 압도적입니다. 매우 세밀한 디테일을 얻을 수 있으며, 프롬프트도 극도로 잘 따릅니다... 다음 단계는 이 de-distilled 모델을 직접 훈련하는 것입니다. 이미 일부 테스트 로라를 만들었습니다. 매우 실험적이니 발견된 오류가 있으면 알려주세요. 좋은 이미지 뿐 아니라 안 좋은 것도 공유해 주시면 개선에 도움이 됩니다 :-). 버전 2.0도 시도해 보시고 어떤 체크포인트 유형이 가장 적합한지 알려주세요.
!주의!
이 버전은 일반 Flux 워크플로우와 호환되지 않습니다. 워크플로우를 꼭 다운로드하세요!
스스로 방법을 찾을 수 있겠지만 부실한 이미지에 대해 제 탓으로 돌리지 마세요. 매우 실험적인 모델임을 기억하세요.. 아래 단점도 참고해 주세요.
이 체크포인트의 장점과 단점:
이 모델은 매우 세밀한 디테일을 생성할 수 있지만 속도가 느립니다. 기존 Flux 체크포인트에 비해 느립니다. 다만 업스케일링이 추가로 필요한 경우가 줄어든다는 장점이 있습니다. Flux Guidance 대신 CFG 스케일을 사용해 작동하므로 일반 워크플로우에서는 동작하지 않습니다.
부정 프롬프트를 사용할 수 있어 원하지 않는 부분을 이미지에서 제거하는 데 도움됩니다.
가끔 아티팩트가 나타날 수 있는데, 간단한 업스케일링으로 해결 가능합니다 (현재 개선 작업 중). 모든 씨드에서 발생하는 것은 아닙니다. 참고 이미지가 있습니다. 이 문제는 모델 자체 문제보다는 워크플로우 문제입니다. 해결책을 작업 중이며, 발생 시 첫 업스케일을 1.14로 설정하는 것도 시도해 보세요.


설정 및 워크플로우 V2.1:
워크플로우는 여기서 확인할 수 있습니다: https://civitai.com/articles/8419
설정: 일반 Flux와 다르게 Flux Guidance 스케일을 끄고 대신 CFG 스케일을 사용합니다. 나는 워크플로우에서 주로 3CFG를 사용합니다. 일부 이미지는 더 낮은 CFG 스케일이 필요할 수 있습니다.
가장 중요한 것은 Flux Guidance 스케일을 끄는 것입니다..
워크플로우 없이 30스텝, 2-3CFG로 테스트했습니다. 이 설정은 Forge에도 적합합니다. 여기서 실험해 보세요.
부정 프롬프트에 "blurry" 단어를 사용하는 것을 권장합니다.
샘플러와 스케줄러:
다음과 같은 샘플러를 사용할 수 있습니다:
Euler, Heun, DPM++2M, DEIS, DDIM 등이 잘 작동합니다.
나는 주로 "Simple" 스케줄러를 사용합니다.
더 나은 설정을 발견하면 알려주세요.. :-)
Forge에서는 AIO 모델을 권장합니다.. Forge용 예시 설정도 있습니다.

버전 2.0_dev_experimental
이건 실험적인 버전입니다.. 목표는 더 일관되고 빠른 모델을 만드는 것이었습니다. 추가로 고유 로라를 훈련 및 병합하는 특별한 방법(텐서 병합)을 사용했습니다. "Attention Seeker"로 수정한 맞춤 T5xxl이 포함되어 있습니다. 속도와 품질 향상을 위해 ByteDance의 Hyper Flux 로라를 병합했습니다. 이는 작업 영역을 이동시키는 효과가 있습니다. 대표 타이틀 이미지를 보여드립니다..
16 스텝 V 2.0
30 스텝 V 1.0
단점:
우선 이 버전은 이전 버전보다 크기가 약간 큽니다.. 또한 Unet 전용 버전이 아직 없습니다. 완료되면 업데이트하겠습니다..
설정 및 워크플로우 V2.0:
이제 적은 스텝으로도 모델을 실행할 수 있습니다.. 16스텝은 이전 모델의 30스텝에 해당합니다.
대부분의 경우 품질 향상을 위해 20~30 스텝 사용을 권장합니다.
샘플러: Euler를 선호하며 Simple 스케줄러와 함께 사용합니다. 가이던스는 1.5~3 사이에서 설정 가능합니다 (물론 범위 외 실험 자유). 1.8 가이던스는 사실적인 이미지에 여전히 잘 작동합니다. DPM++2M, Heun도 훌륭합니다.
워크플로우 2.0:
V2.0 및 V1.0용 새 워크플로우를 만들었습니다. 새로운 Flux 프롬프트 생성기와 두 번째 업스케일러 단계가 포함되어 있습니다. https://civitai.com/articles/7946
Forge:
이 모델을 Forge에서도 테스트했으며 매우 잘 작동했습니다.. 다만 Comfy UI와 Forge 간에 이미지가 다를 수 있습니다.
버전 1.0_dev_beta:
이 모델은 시리즈의 첫 번째 버전입니다. 피드백과 이미지 게시를 부탁드립니다. 프로젝트 개선에 도움이 됩니다. 여러 버전이 있으며 가장 품질이 좋은 모델은 FP16 버전입니다. 하지만 FP16 버전은 크기가 매우 크고 강력한 그래픽 카드와 많은 RAM이 필요합니다. FP8 버전은 품질과 성능 간 좋은 절충안으로 봅니다. GGUF 버전은 Q8_0을 다운로드하세요. Q4_0/4.1 버전은 요청으로 제작되었으며 크기는 작지만 약간의 품질 손실이 있습니다.
모델 유형은 크게 두 가지로 나뉘며, "All in One" 모델은 하나의 파일만 다운로드하면 됩니다. Clip_l, T5xxl fp8 및 VAE가 포함되어 있습니다. 체크포인트 폴더에 넣으세요.
다른 버전은 UNET 전용으로 모든 파일을 별도로 로드해야 합니다.
UNET 전용 버전을 위해 반드시 내 Clip_L 을 다운로드해야 합니다..
적절한 T5xxl 클립 선택도 중요합니다. FP8 버전은 fp8_e4m3fn t5xxl 클립을, FP16은 FP16 클립을 사용하세요. 기본 가중치 타입을 선택해야 합니다. (아래는 FP8 버전의 예시 이미지)
GGUF 버전은 GGUF 로더가 필요합니다!
현재 V1.0 관련 알려진 사항:
시리즈의 첫 모델로 일부 프롬프트나 아트 스타일에서는 성능이 부족할 수 있습니다. 다음 버전에서 더 많은 훈련이 이루어질 예정입니다. 모델이 못 하는 부분을 알려주세요..
설정 및 워크플로우:
대략 30 스텝, Euler 샘플러와 Simple 스케줄러로 테스트했습니다. 가이던스는 1.5-3 사이이며, 자유롭게 범위 밖도 실험하세요.
1.8 가이던스는 사실적인 이미지에 잘 작동합니다.
설정을 자유롭게 실험해 보시고 좋은 결과가 나오면 공유 부탁드립니다.
즐겨 찾기 이미지도 훈련 데이터로 추가했습니다. Comfy 워크플로우를 포함합니다. 다운로드용 워크플로우는 다음 링크입니다: https://civitai.com/articles/7946
"올인원" 모델:

UNET 전용:
Clip_L 파일(240MB)도 다운로드해야 합니다.
GGUF: 이곳에 GGUF 워크플로우를 추가했습니다: https://civitai.com/articles/7946
중요:
개발 모델은 상업적 용도가 아닙니다. 상업용은 "schnell" 모델을 별도로 배포할 예정이며, 개인적 또는 과학적 용도에 더 적합합니다.
라이선스:
https://huggingface.co/black-forest-labs/FLUX.1-dev/blob/main/LICENSE.md
크레딧:
theunlikely https://huggingface.co/theunlikel (다시 한번 감사드립니다)
버전 2.1/V4.2/5.0: nyanko7의 Flux_dev_de-distill
https://huggingface.co/nyanko7/flux-dev-de-distill
V2.0부터: ByteDance의 Hyper Lora https://huggingface.co/ByteDance/Hyper-SD
Black Forrest의 놀라운 Flux 모델에 감사 https://huggingface.co/black-forest-labs
모델 세부사항
토론
댓글을 남기려면 log in하세요.












