모델/LEOSAM의 FilmGirl Ultra 필름 스타일 - VELVIA 3.0 LoRA

LEOSAM의 FilmGirl Ultra 필름 스타일 - VELVIA 3.0 LoRA

김지훈 (Kim Ji-hoon)

7/14/2025

2:01:26 PM

| Discussion|

팁

ACGN 스타일 출력이 약하므로 digital art, anime, cartoon 태그 사용을 피하세요.

SPIN-Diffusion 미세조정 시 총 50,000회 이상의 학습 반복을 권장합니다.

"film grain analog photography" 같은 프롬프트로 필름 스타일을 활성화하세요.

자신의 모델 개선에 도움이 되었다면 모델 설명에 FilmGirl Ultra를 언급하세요.

Apache-2.0 라이선스를 준수하고 생성 이미지 사용 시 출처를 명시하세요.

버전 하이라이트

업데이트 내용:

Velvia 3.0의 주요 LoRA 모델 훈련 이미지 수가 406장에 도달했으며 해상도는 1024x1024로 더욱 향상되었습니다.
이번 버전의 주요 모델 훈련에는 과적합 방지를 위해 "Scale weight norms" 기능을 사용했습니다. 다른 대안 버전에서는 "Prodigy" 옵티마이저도 테스트했는데, 이 옵티마이저는 총 훈련 단계의 절반만으로 AdamW8bit에 준하는 적합도를 제공하지만, 제 매개변수 설정 문제로 훈련 결과 얼굴 미적감이 떨어져 최종적으로 채택하지 않았습니다.
고해상도 주요 모델을 기반으로 Velvia 2.0 모델을 소량 혼합했고, 인물 피부 톤 개선을 위해 계층적 조정을 실시했습니다.

크리에이터 스폰서

🌍QQ群 "토순·AIGC몽공 북공장"(그룹 번호: 780132897) 및 "토순·AIGC몽공 남공장"(그룹 번호: 835297318)에 가입하세요. 입장 답변: 토순.

Telegram 그룹 채팅 “토순의 SDXL 브로드웨이”: https://t.me/+KkflmfLTAdwzMzI1

🌍QQ群 "토순·AIGC몽공 북공장"에 오신 것을 환영합니다. 그룹 번호: 780132897 ; "토순·AIGC몽공 남공장" 그룹 번호: 835297318 (입장 답변: 토순). Telegram 그룹 채팅 “토순의 SDXL 브로드웨이” 링크:https://t.me/+KkflmfLTAdwzMzI1

🚨FilmGirl Ultra 권장 파라미터：

Clip skip: 1

CFG scale: 9

직접 출력 이미지 해상도: 약 50만 픽셀 (640x768)

2024.2.29 "FilmGirl Ultra" 소개, SD1.5 AI 얼굴과 작별을 고하다

지난해 2월 24일, 처음으로 FilmGirl LoRA 버전을 완성했습니다. 이 LoRA는 제 첫 고다운로드 모델이자 AI 꿈의 시작을 알리는 모델입니다. SDXL 출시 이후 저는 HelloWorld 및 AIArt XL 모델 개선에 많은 노력을 기울여 왔습니다. FilmGirl 시리즈는 8개월간 업데이트가 없었습니다.

실제로 FilmGirl, 후속작 Polaroid LoRA 및 Helloworld XL 모두 저는 포토리얼리즘의 극치를 추구해왔습니다. 1년이 지난 지금, 1주년을 기념하며 SD1.5 포토리얼리즘을 한 단계 끌어올릴 수 있는 모델을 공개하기로 했습니다. 더 이상 LoRA 모델로는 부족하여 새로운 FilmGirl Ultra는 SD1.5 베이스 모델입니다.

SD1.5 포토리얼리즘 모델의 동질화와 AI 얼굴 문제에서 완전히 벗어나기 위해, FilmGirl Ultra는 basilmix, chilloutmix 또는 그 후손을 훈련 베이스 모델로 선택하지 않고 UCLA의 최신 SPIN-Diffusion을 선택했습니다. SPIN-Diffusion은 pickapic_v2 데이터셋 우승 이미지로 자체 대결 미세 조정된 SD1.5 베이스 모델로, 원본 SD1.5 및 SD1.5 DPO 베이스 모델보다 뛰어나며, 프롬프트 정렬 성능은 Chilloutmix 같은 대량 미세 조정 및 병합 베이스 모델보다 훨씬 우수합니다.

FilmGirl Ultra의 훈련 세트는 HelloWorld XL에서 가져왔습니다. 실제로 HelloWorld XL 최초 버전의 훈련 세트도 마지막 버전 FilmGirl LoRA에서 온 것입니다. 1년 동안 이 훈련 세트를 세심하게 모으고 선별해 총 약 10,000장에 달합니다. FilmGirl Ultra 훈련에는 GPT4V 자연어 설명, GPT4V 태그형 설명, Blip+Clip 설명 등 다양한 라벨링 방식을 사용했습니다. "1girl", "best quality", "masterpiece" 같은 널리 쓰이는 프롬프트와 호환되도록 일부 이미지에 적절히 이 세 단어도 추가했습니다(하지만 "little girl/child girl" 프롬프트로도 정확히 어린 소녀 효과를 유발할 수 있습니다). 라벨을 다중으로 사용한 이유는 훈련 효과 발현 확률을 최대화하기 위해서입니다. FilmGirl 전통에 따라 필름 스타일에는 특별히 중점을 두었으며, "film grain analog photography" 프롬프트로 해당 스타일 활성화가 가능합니다.

이 모델은 총 7단계 훈련으로, 각 단계마다 다른 배치 크기, 옵티마이저, 학습률 및 훈련 세트 비율을 사용해 현재 효과를 달성했습니다. SPIN-Diffusion 미세조정에 관심 있는 분께는 총 반복 횟수를 50,000회 이상 권장합니다. 저는 실제로 배치 크기 40~64로 약 100,000회 훈련했습니다.

FilmGirl Ultra의 포토리얼리즘 효과는 제 기대를 넘어 이제 SDXL 이미지 품질에 근접합니다. 아래는 Civitai에서 현재 다운로드 수 최상인 Realistic Vision v6 및 제가 오랫동안 최고 포토리얼리즘 SD1.5 베이스 모델이라 생각하는 epiCPhotoGasm과의 비교입니다. 두 훌륭한 베이스 모델과 창작자에 경의를 표합니다.

클로즈업 커플 초상, 아프리카 출신 젊은 여성과 남성, 깨끗한 얼굴, 카메라 응시, 패션 사진, 단순한 배경
부정 프롬프트: 워터마크, 애니메이션, 만화, 입 벌린 상태

클로즈업 커플 초상, 아프리카 출신 어린 소녀와 소년, 깨끗한 얼굴, 카메라 응시, 패션 사진, 단순한 배경
부정 프롬프트: 워터마크, 애니메이션, 만화, 입 벌린 상태

GPT4V 캡션과 SPIN-Diffusion 베이스 모델 덕분에 프롬프트 정렬 성능이 우수합니다. 아래는 몇 가지 개념에 대한 XY 플롯 테스트입니다.

인종 테스트

체형 테스트

피부색 테스트

나이 테스트

동물 테스트

그러나 FilmGirl Ultra가 모든 면에서 우위를 차지하는 것은 아닙니다. 새 출발점에서 제작되어 최근 1년간 커뮤니티 1.5 베이스 모델의 지속적인 최적화와 다듬음을 포기했기 때문입니다. 여러 테스트와 비교를 통해 이 베이스 모델은 커뮤니티의 성숙한 리얼리스틱 모델보다 팔다리 오류율이 더 높습니다. 또한 훈련 세트에 애니메이션 관련 콘텐츠 부족으로 프롬프트에 ACGN 관련 태그가 포함되면 출력이 좋지 않습니다. "digital art", "anime", "cartoon" 등의 단어 사용을 권장하지 않습니다. 이 두 가지 문제가 FilmGirl Ultra의 현재 주요 단점입니다.

FilmGirl Ultra는 제 AI 여정 첫 해의 연말 정리이며, 저를 지지해주신 AI 동호인들께 드리는 선물입니다. 오픈 소스 커뮤니티는 많은 친구, 추억, 즐거움, 지식을 안겨주었고, 저도 커뮤니티에 작은 기여를 하고자 합니다. 여러분의 모델 훈련이나 병합 시 FilmGirl Ultra를 기반으로 하는 것을 환영합니다. 이 모델이 자신의 모델 개선에 도움이 된다면 모델 설명에 표기해주십시오. FilmGirl Ultra와 SPIN-Diffusion이 더 널리 알려지고 사용되길 바랍니다.

FilmGirl Ultra는 앞으로도 지속해서 업데이트될 것이며, 즐거운 사용 되시길 바랍니다!

AI와 함께 계속 발전하며 내년 이맘때 다시 만나길 희망합니다!

저작권 고지：

FilmGirl Ultra 시리즈 모델(이하 "본 모델")은 제가 UCLA SPIN-Diffusion 기반으로 개발한 SD1.5 대형 모델입니다.

소유자는 개인 또는 기관이 본 모델로 생성된 이미지를 비상업적 교육 또는 정보 전달 목적으로 무료로 사용할 수 있도록 허가하며, 다음 사항을 준수해야 합니다:

- 관련 법규 준수 및 본 모델 또는 제3자의 법적 권리 침해 금지.

- 이미지 사용 시 출처를 "LEOSAM의 FilmGirl Ultra 대형 모델에서 생성됨"으로 명시.

상업적 사용의 경우 소유자와 상업적 라이선스 계약을 체결해야 하며, 관련 문의는 Civitai 플랫폼의 소유자 프로필을 통해 연락 바랍니다.

소유자는 개인 사용자를 위해 FilmGirl Ultra 모델 업데이트를 무료로 지속 제공하여 커뮤니티 오픈 소스 기여자 지원 및 감사의 뜻을 표합니다. 상업적 사용자 유료 협력은 본 모델 개발과 지속 개선의 중요한 원동력입니다. 모든 사용자 분들의 이해와 지원에 감사드립니다.

무단 사용은 관련 법률 위반 및 법적 책임을 초래할 수 있음을 유의하시기 바랍니다. 본 고지의 최종 해석권은 소유자에게 있으며 관련 법률의 적용을 받습니다.