낡은 우주복을 입은 우주비행사가 입이 벌어진 듯한 개구부와 대형 엔진이 있는 거대한 상어 모양 스타쉽 앞 흰 사막에 서 있다.

추천 매개변수

samplers

Euler Normal, dpmpp 2m sgm uniform, dpmpp_2s_ancestral, Euler, DPM++ SDE, 2M SDE Karras

steps

4 - 40

cfg

2.5 - 7

resolution

1536x1536, 1024x1024

vae

ae.safetensors

추천 고해상도 매개변수

upscale

1.5 - null

더 세밀한 디테일 향상을 위해 8단계 이상 사용하되, 8단계 이후 출력은 크게 변하지 않습니다.

스타일 프롬프트를 추가하면 모델이 더 깔끔하고 정돈된 출력을 생성하는 데 도움이 됩니다.

더 깔끔한 이미지를 위해 가이드 스케일을 높여 보세요.

자연스러운 사진을 원한다면 4K, 8K, 걸작, 고해상도 같은 '품질' 용어 사용을 피하세요.

업스케일링 시 노드별 latent 업스케일 및 latent 스케일을 1.5로 조정하여 고해상도 이미지를 생성해 보세요.

24GB GPU에서 훈련할 때는 pagedlion8bit 옵티마이저를 사용하고 time_in, vector_in, modulation 매개변수를 고정하여 de-distillation을 방지하세요.

LR 5e-6일 때는 몇 천 단계 후 훈련을 중단하여 블록 손상을 방지하고, 이전 체크포인트와 병합하여 손상된 블록을 수정 후 훈련을 계속하세요.

버전 하이라이트

schnell 모델의 세밀 조정본이며, dev 모델은 사용하지 않았습니다. Apache 2.0 라이선스!

kohya로 맞춤 시그마 스케줄을 사용하고 time과 modulation 매개변수를 고정하여 시간 증류 저하를 방지하며 훈련했습니다.

➤ 총 훈련 단계 : 1,360,641

➤ 실제 훈련 시간: 1192.61 시간 (49.7일)

크리에이터 스폰서

모델 또한 다음에서 사용할 수 있습니다: RunDiffusionRunware.ai

이 모델 훈련을 위한 컴퓨팅 지원을 해준 RunDiffusion에 깊은 감사를 드립니다!

API 접근이 필요하다면 Runware.ai를 확인하세요.

PixelWave FLUX.1-schnell 04 - Apache 2.0!

Safetensor 파일: 💾BF16 💾FP8 💾bnb FP4

GGUF 파일: 💾Q8_0 🤗Q6_K 💾Q4_K_M

다음 링크들: 🤗VAE 🤗T5xxl 🤗CLIP L

모델은 또한 다음에서 사용할 수 있습니다: RunDiffusionRunware.ai

PixelWave FLUX.1 schnell 버전 04는 FLUX.1-schnell의 미학적 세밀 조정 모델입니다. 훈련 이미지들은 눈길을 끄는 이미지, 아름다운 색상, 질감 및 조명을 보장하기 위해 엄선되었습니다.

  • 원래 schnell 모델로 훈련되어 Apache 2.0 라이선스입니다!

  • 특별한 실행 요구사항이 없습니다. FLUX LoRA를 지원합니다.

  • Euler Normal, 8 단계.

더 세밀한 디테일 향상을 위해 더 많은 단계를 사용할 수 있지만 8단계 이후에는 출력이 크게 변하지 않습니다.

RunDiffusion에 감사드립니다

RunDiffusion(Juggernaut의 공동 제작자)에게 이 모델 훈련을 가능하게 한 컴퓨팅 지원에 대해 크게 감사드립니다! schnell을 de-distilling 없이 훈련하는 방법을 찾기 위해 많은 실험이 필요했고, RunDiffusion의 클라우드 컴퓨팅 활용이 이 과정을 훨씬 쉽게 만들었습니다.

이 모델에 대한 API 접근이 필요한 분들은 Runware.ai와 협력 중입니다.

현재 FLUX.1-dev 04 버전은 임시로 RunDiffusion 및 Runware 전용입니다. 앞으로 버전 05를 출시할 때 dev 04의 오픈 가중치를 공개할 계획입니다.

이 모델 출시를 지원해주셔서 감사합니다, 꼭 확인해 보세요!

훈련

훈련은 kohya_ss/sd-scripts를 사용했습니다. 내 fork된 Kohya 에서 sd-scripts 서브모듈에 대한 변경사항도 확인할 수 있으니 둘 다 복제하세요.

세밀 조정 탭을 사용하세요. 4090 GPU 24GB에서 실행할 수 있는 pagedlion8bit 옵티마이저가 가장 좋은 결과를 냈고, 다른 옵티마이저들은 학습에 어려움을 겪었습니다.

time_in, vector_in, mod/modulation 매개변수를 고정하여 'de-distillation'을 방지했습니다.

15 이상의 단일 블록 훈련은 피했습니다. 훈련할 블록은 FLUX 섹션에서 설정할 수 있습니다.

LR 5e-6에서는 빠르게 훈련되지만 몇 천 단계 후에 중단해야 하며, 그렇지 않으면 블록이 손상되고 학습속도가 느려집니다.

손상된 블록은 이전 체크포인트와 병합하여 교체한 다음 훈련을 계속할 수 있습니다.

손상된 블록의 징후: 대부분 이미지에 종이 질감, 배경 디테일 손실.

연락처

비즈니스 또는 상업 문의는 pixelwave@rundiffusion.com으로 연락해주세요. flux 세밀 조정 라이선싱, 고객 맞춤 훈련 프로젝트, 상업용 AI 개발 등 팀이 모두 처리합니다!

PixelWave Flux.1-dev 03 세밀 조정 완료!

Safetensor 파일: 💾BF16 💾FP8 💾NF4

GGUF 파일: 💾Q8_0 🤗Q6_K 💾Q4_K_M

다음 링크들: 🤗VAE 🤗T5xxl 🤗CLIP L

'diffusers' 파일은 실제로 Q8_0 및 Q4_K_M GGUF 버전입니다. GGUF 파일은 huggingface에서도 이용 가능합니다.

버전 03을 FLUX.1-dev 기본에서 5주 이상 4090에서 세밀 조정했습니다. 다양한 예술 스타일, 사진 및 애니메이션이 가능합니다. LoRA 관련 팁을 발견했습니다.

쇼케이스 이미지에는 dpmpp 2m sgm uniform 30단계를 사용했습니다. 깔끔한 출력을 원한다면 가이던스를 높여보세요. 스타일을 명시하면 모델이 추측하지 않아 도움이 됩니다.

또한 업스케일링을 위해 노드별 latent 업스케일과 latent 스케일을 1.5로 조정하여 1024x1024 대신 1536x1536 이미지를 생성하는 것을 추천합니다.

PixelWave Flux.1-schnell 03

Safetensor 파일: 💾FP8 💾NF4

GGUF 파일: huggingface로 이동

쇼케이스 이미지에 dpmpp 2m sgm uniform 8단계를 사용했습니다.

4단계부터 시작할 수 있지만, 더 많은 단계에서 해부학 오류가 줄어듭니다.

PixelWave Flux.1-dev 02

Safetensor 파일: 💾BF16 💾FP8

GGUF 파일: 💾Q8_0 🤗Q6_K 💾Q4_K_M

버전 02는 검정색 및 어두운 이미지가 크게 개선되었고 손 문제도 적어 더 안정적인 출력이 가능합니다.

dpmpp_2s_ancestral, beta, 14단계 또는 euler, simple, 20단계 사용을 추천합니다.

Comfyui-GGUF 노드

PixelWave 11 SDXL. 일반 목적의 세밀 조정 모델. 예술 및 사진 스타일에 훌륭함.

20단계, DPM++ SDE, CFG 4~6 또는 40단계, 2M SDE Karras를 사용합니다.

가속 버전 - 5+ 단계, DPM++ SDE Karras, 2.5 CFG

PAG 추천⚡CFG 3에서 1.5 스케일 권장. 워크플로 링크

🔗확장 갤러리 링크 🖼️

프롬프트 가이드 링크⭐ 4K, 8K, 걸작, 고해상도, 고품질 같은 '품질' 용어는 사용할 필요 없습니다. 자연스러운 사진 스타일을 원한다면 '생생한, 강렬한, 밝은, 고대비, 네온, 드라마틱' 같은 단어 사용을 권장하지 않습니다. 이 경우 이미지가 '과하게 조리된' 듯 보일 수 있지만, 이는 CLIP이 프롬프트를 따르기 때문입니다. 🙂 생생하고 네온 사진이 필요하면 PixelWave가 제공합니다!

버전 10의 초점은 CLIP 모델 훈련으로 신뢰성을 개선하고 다양한 스타일 생성이 가능하며 프롬프트 추종력을 높였습니다.

테스트에 도움을 준 친구들께 감사드립니다: masslevel, blink, socalguitarist, klinter, wizard whitebeard.

가이드: LM Studio와 Mikey Nodes로 프롬프트 업스케일링

가이드: 스킵 스텝 방법으로 이미지에 더 많은 디테일 추가

리파이너 모델은 필요 없습니다.

이 모델은 다른 모델들의 혼합이 아닙니다.

많은 유용한 노드를 포함한 Mikey Nodes도 제작했으며, comfy manager를 통해 설치할 수 있습니다.

이전
Smol Dragons [LoRA 1.5+SDXL] - SDXL
다음
ICBINP - "I Can't Believe It's Not Photography" - LCM

모델 세부사항

모델 유형

Checkpoint

기본 모델

Flux.1 S

모델 버전

FLUX.1-schnell 04

모델 해시

565b846820

제작자

토론

댓글을 남기려면 log in하세요.

PixelWave - FLUX.1-schnell 04 제작 이미지

낡은 우주복을 입은 우주비행사가 입이 벌어진 듯한 개구부와 대형 엔진이 있는 거대한 상어 모양 스타쉽 앞 흰 사막에 서 있다.

애니메 이미지

하얀 케이플렛에 금장식과 빨간 귀걸이를 착용하고 숲 속에 서 있는, 긴 은색 트윈테일과 청록색 눈, 섬세한 얼굴 생김새를 가진 작은 엘프 소녀의 클로즈업 초상화.
섬세한 반투명 날개를 가진 팅커벨을 닮은 요정이 생생한 꽃 위에서 평화롭게 잠들어 있으며, 정교한 초록 의상을 입고 있습니다.
밤 배경에 매달린 등불과 함께 검은색 민소매 중국 드레스에 고양이 귀와 꼬리를 착용한 Final Fantasy XIV의 Y'shtola Rhul.
무성한 협곡 절벽에 세워진 미래지향적 공상 과학 수도원과 도시, 아래 강과 함께 비행 기계와 가느다란 다리를 건너는 외로운 여성.
연한 파스텔 톤과 고대비 애니메 스타일로 열대 우림의 가지에 앉아 있는 다채로운 마코앵무.
아름다운 눈과 앞머리를 가진 소녀가 풀밭에 앉아 있고 햇빛과 잎 그림자가 그녀와 땅 위에 얽혀 있습니다.
밤의 달빛 아래 빛나는 밝은 눈과 긴 곱슬머리, 세밀한 갑옷과 빛나는 보석 귀걸이를 착용한 레트로 미래 소녀의 초상화.
햇빛에 비치고 가을 잎이 그녀의 황갈색 피부에 복잡한 그림자를 드리우는 파란 긴 머리와 아름다운 눈을 가진 애니메 스타일 소녀의 초상화
사막에 무릎을 꿇은 애니메 스타일의 이집트 여성, 흰 피부, 흰 머리, 붉은 눈, 흰색 로브와 이집트식 목걸이 착용, 배경에 햇살.
짧은 머리를 한 애니메 소녀가 밤의 파란 꽃밭에 서 있으며, 하늘에는 빛나는 파란 빛과 은하수가 있고, 멀리 도시의 불빛이 보인다.

기본 모델 이미지

어둡고 불길한 하늘 아래 빛나는 잭오랜턴 조명으로 밝힌 음산한 무덤을 걷는 좀비와 해골을 포함한 언데드 캐릭터들의 사진 같은 장면.

디지털 아트 이미지

주황빛 가을잎으로 둘러싸인 나뭇가지에 앉아 있는 밝은 파란 눈을 가진 귀여운 짙은 회색 고양이의 디지털 아트. 고양이 머리 위에는 빛나는 후광이 있고 펜던트가 달린 목걸이를 착용하고 있습니다.
네온으로 빛나는 디스토피아 도시 풍경 속 거대한 폭발 가운데 빛나는 첨단 엑소수트를 입은 강렬한 여성이 에너지 발사를 하고 있음.
겨울 눈 덮인 마을 배경을 등지고 흰 토끼를 안고 있는 갈색 머리 작은 소녀의 클로즈업 디지털 페인팅, 고전 미술 스타일로 표현됨.
거대한 버섯 구름과 불타는 폐허가 있는 원자 폭발로 황폐해진 디스토피아 마을을 관통하는 길이 길게 금이 간 모습 뒤에서 본 풍경.
디지털 아트 스타일로 어두운 배경에 분홍색 갈기가 흐르고, 빛나는 분홍 뿔과 색이 있는 공막의 붉은 눈을 가진 흰색 유니콘.
플랫 컬러, 고대비, 최소한의 선 작업으로 표현된 빛나는 노란 눈을 가진 검은 고양이의 클로즈업 디지털 아트.
화려한 태피스트리 배경 앞에서 생생한 직물과 정교한 보석을 착용한 곱슬곱슬한 금발 머리의 패셔너블한 여성의 포토리얼리스틱 초상화
어두운 환경에서 옆모습으로 보이는 빛나는 첨단 SF 보디수트를 입고 푸른 빛의 패널과 갑옷이 특징인 긴 흰 머리의 미래형 사이보그 소녀
불타는 하늘 아래 불타는 장면을 둘러싼 가운 입은 인물들과 함께 빛나는 주황색 불꽃과 신성한 빛에 휩싸인 고딕 대성당.

photography 이미지

마룬색 브이넥 티셔츠와 플로럴 마이크로스커트를 입고 자연광 아래 야외에 앉아 미소 짓는 주근깨 있는 금발 여성
분홍 벽 근처 청록색 수영장에 흰 개와 캥거루와 함께 서 있는 회색 머리 할아버지와 높은 포니테일 회색 머리 여성
밤에 따뜻한 오렌지 빛으로 조명된 계단식 콘크리트 구조를 특징으로 하는 어둡고 분위기 있는 현대 건축물
계단이 있는 고대 석조 유적과, 멀리 산 너머에 지는 빛나는 보름달, 구불구불한 강 계곡, 반짝이는 별들, 그리고 영화 같은 조명으로 밝힌 따뜻하고 마법적인 하늘이 펼쳐진 신비로운 밤 풍경.
황금 시간대 석양에 젖은 뉴욕시 거리에서 어두운 틴팅 창문을 가진 포토리얼리틱한 검은 Lincoln Continental, 반짝이는 포장도로와 비 오는 분위기, 필름 그레인 스타일로 표현.
미니멀리스트 스타일의 시원한 블루 시네마틱 조명 아래 어두운 문틀 뒤에서 살짝 고개를 내민 플래티넘 단발 여성의 패션 사진 초상화.
부드럽고 영화 같은 색감으로 표현된 여성의 프로필과 안개, 바다 파도가 어우러진 클로즈업 이중 노출 초상화
생생한 보라색 꽃과 초록 잎 덤불 뒤에 부분적으로 숨겨진 주근깨가 있는 초록 눈의 젊은 여성 클로즈업, 한 송이 꽃이 한쪽 눈을 가리고 있음
화이트 튜닉과 바지를 입고 선글라스를 쓴 아프리카 여성이 드라마틱한 조명 아래 거대한 검은색 미래형 우주선 내부의 계단을 내려가는 포토리얼리스틱 수채화 스타일 일러스트레이션으로, 사이버펑크와 포스트 아포칼립스 디자인 요소가 포함되어 있습니다.
시네마틱 및 볼류메트릭 조명 효과로 빛나는 오렌지색 조명이 있는 미래 기술 요소와 함께 크고 어두운 원통형 터널 안에 서 있는 인물의 포토리얼리스틱 3D 렌더.

전통 예술 이미지

자신감 있는 여성 로마 여경이 복잡하게 세공된 청동 전투 갑옷을 입고 낮 시간대의 역사적인 도시 거리에서 서 있는 모습.
안개 낀 분위기와 희미한 서예가 어우러진 험준한 산 절벽을 따라 웅장한 폭포가 흐르는 동양 수묵화 그림
우아한 먹물 효과가 있는 크고 붉은 태양 아래 생생한 일본 수채화 스타일 꽃들 사이에 평온하게 앉아 있는 삼색 고양이.
눈을 감은, 반짝이는 머리카락과 맑은 피부를 가진 소녀의 클로즈업.
파란 리본을 매고 전통 일본 교복을 입은 긴 금발 머리의 애니메 소녀
안개 낀 산 배경에 전통 의상을 입은 소녀와 백호. stable diffusion을 사용해 생성된 AI 이미지.
격렬한 장면, 폭풍우 치는 하늘 아래 물 위에 홀로 서 있는 사무라이가, 멀리 전통 일본식 파고다를 마주 보고 있으며, 소용돌이치는 구름과 안개가 감도는 모습, Stable Diffusion을 사용해 생성됨.
전통 중국 복장을 입고 머리카락이 흐르는 아름다운 여성을 Stable Diffusion을 사용하여 AI가 생성한 이미지로, 세밀한 고대 의상과 탑과 잎사귀가 있는 평온한 동양 배경이 포함되어 있습니다.