모델/Flux.1 D - 오싹한 것들 - v1.0

Flux.1 D - 오싹한 것들 - v1.0

김지훈 (Kim Ji-hoon)

9/28/2025

1:10:28 AM

| Discussion|

팁

Flux는 스타일, 깔끔한 이미지 및 색상 대비에 좋습니다.

특히 여러 LoRA와 높은 CFG를 사용할 때 상당한 RAM과 긴 생성 시간이 필요할 수 있습니다.

비용 상승이나 느린 성능을 피하기 위해 현장 생성기 사용 시 주의하세요.

일부 실사 이미지에서 만화 같거나 가짜 같은 느낌을 줄 수 있습니다.

High-Res Fix를 적용한 SDXL을 사용하면 더 빠른 배치 생성을 시도해 보세요.

아마도 Flux의 당분간 마지막 모델일 가능성이 높으며, 흥미로운 무언가가 나타나지 않는 한 계속 그럴 것입니다. 이유는 여러 가지가 있지만, 주된 이유는 가장 재미있었던 SDXL과 Pony 모델의 무작위성이 그리워서입니다. 음악을 들으며 가사를 해석하며 놀 수 있었는데, Flux로는 그게 잘 되지 않습니다. 또한, 그림 생성에 필요한 자원과 시간이 너무 많아 현재로서는 부담스럽습니다. 몇 개의 LoRA를 추가하고 높은 CFG를 적용하면 RAM 사용량과 생성 시간이 급증합니다. 한 장의 이미지를 만드는 데 걸리는 시간 동안 SDXL에서 High-Res Fix로 10장을 배치로 만들 수 있습니다. 가끔 사용은 하겠지만 주된 초점은 아닙니다.

호기심과 끈질긴 도전이 Flux를 시작하게 한 주된 동력이었습니다. Flux에는 많은 이점이 있지만 더 자세히 살펴본 결과, 내가 원하는 방식이나 기대하는 바에 부합하지 않는 한 싸움에서 이길 수 없다는 것을 깨달았습니다. 유연하지 않고 LoRA와 랜덤 시드를 사용해도 특정 이미지와 스타일에 기본 설정이 고정되어 있으며, 컨셉이 겹치는 현상(일부 경우에는 나쁘지 않음), 일부 플러그인은 작동하지 않거나(미지원 혹은 Forge의 Gradio 버전 문제), 카메라 앵글에 대한 지식 부족, 실사 이미지임에도 만화 같은 가짜 느낌을 주는 경우가 있으며, 노이즈, 그레인, 헤이즈 등이 제한적입니다.

하지만 탁월한 점은 스타일, 깔끔한 이미지, 나쁜 학습 이미지를 유용한 것으로 바꾸는 능력, 대부분 좋은 해부학, 색상과 대비, 일관성, 텍스트 인코더 등이 매우 뛰어납니다.

이 모델은 기본 Flux 모델이 아니라 이 모델로 훈련되었습니다. https://civitai.com/models/843551/fluxdev-dedistilled?modelVersionId=943787. 다른 점이 있나요? 모르겠습니다. 동일한 LoRA를 두 버전으로 나란히 비교해 훈련해 볼 생각도 했지만, 결국 신경 쓰지 않았습니다. 다만, 이 점을 감안해 현장 생성기에서 이 LoRA를 사용하려는 사람들에게는 작동하지 않을 수도 있는 것에 비용을 낭비하지 말라고 권장합니다.

현재 이와 비슷한 LoRA가 꽤 있는데(특히 할로윈 관련), 더 나은 성능을 보이는 것도 있습니다. 사진들이 모두 비슷해 보이지만 다양한 스타일과 테마의 이미지를 사용했으며, 일부는 공포와 관련이 없습니다. 현재 할로윈 테마를 주로 사용하며 몇 가지 이론과 직감을 시험해본 것입니다.

행운을 빕니다

추신: 이전 갤러리의 일부 이미지는 기본적으로 같은 LoRA를 사용했으며, Kohya 설정과 스텝 수만 다릅니다.