구름 낀 하늘 아래 고요한 북극 해양에서 눈 덮인 해빙 가장자리에 서 있는 북극곰.
중앙 플로리다에서 미키 마우스 티셔츠와 반바지를 입고 야자수에 기대어 서 있는 여성 관광객의 선명한 사진, 맑은 날씨 속 교외 주택가.
높은 홍수로 둘러싸인 플로리다 교외의 노란색 2층 주택, 야자수가 물 표면에 반사되어 있습니다.
긴 흰 수염에 꽃무늬 뾰족 모자와 초록색 로브를 입은 마법사 복장의 남자가 소파, 풍선, 바닥의 맥주병들로 가득한 거실 파티에서 나무 지팡이를 들고 있는 모습.

추천 프롬프트

Full body shot photo of,Medium shot photo of,Selfie photo of,Close-up photo of,photo,photograph,Amateur photography of <Subject Description>, <Scene Description>, <Image Quality Tags>, on flickr in 2007, 2005 blog, 2007 blog,Shot on iPhone photo of,This Image features

추천 매개변수

samplers

DEIS with DDIM, Heun with BETA, [Forge] Flux Realistic (Slow) with Beta / DDIM, DEIS, [Forge] Flux Realistic (Slow)

steps

20 - 40

cfg

1 - 4

resolution

896x1152, 1344x1728, 1248x1824, 1440x1800, 1152x896, 1024x1024, 1824x1248, 1344x1728, 1248x1824

other models

amateurphoto-version5-gm (d9ccc813e4d8), flux1-dev-Q8_0 (52cfce60d7)

추천 고해상도 매개변수

upscaler

4x_NMKD-Superscale-SP_178000_G, 4x ultrasharp

upscale

1.5 - null

steps

10

프롬프트에 따라 Lora 가중치를 실험해야 합니다; 권장 가중치는 버전에 따라 0.3-0.5에서 0.6-1까지 다양합니다.

사진 관련 상세 프롬프트가 모델을 더 잘 유도합니다; photo, photograph 같은 용어나 카메라 종류, 날짜 등을 포함하세요.

손, 텍스트, 배경 인물, 피부 질감 문제 발생 시 Lora 가중치를 줄여보세요.

가능하다면 1344x1728과 같은 더 높은 해상도에서 직접 생성할 수도 있습니다.

데이터셋 캡션은 GPT4o를 사용해 작성되었으며 상세한 캡션이 가장 좋은 결과를 제공합니다.

버전 하이라이트

v4에서 소폭 업그레이드됨

안녕하세요 여러분, Lora를 사용하기 전에 꼭 읽어주세요

  • 증류된 CFG 스케일: 3.5

  • 샘플링 방법 및 스케줄 유형: DEIS with DDIM

  • 스텝 수: 20

  • 해상도: 896x1152

    • Hires fix 모델: 4x_NMKD-Superscale-SP_178000_G

    • 스텝: 10

    • 디노이즈: 0.3

    • 업스케일 비율: 1.5

  • Lora 가중치: 0.8. 프롬프트에 따라 실험해보셔야 합니다

  • 증류된 CFG 스케일: 2.5에서 4 사이

  • 샘플링 방법 및 스케줄 유형: Heun with BETA 또는 DEIS with DDIM 또는 [Forge] Flux Realistic (느림) with Beta / DDIM

  • 스텝 수: 20 이상 (보통 20, 30, 35, 40을 사용합니다 - 이미지가 몇 스텝에서 수렴하는지 확인하세요 - 직접 실험해보시기 바랍니다)

  • 해상도: 896x1152 (이 해상도에서 정상 동작하는 것을 확인했습니다. 높은 해상도에서 생성하기를 원치 않는 분들을 위해서입니다) - 그러나 hires fix를 사용해야 합니다. 아래는 제 예제 이미지에 사용한 설정입니다.

    • Hires fix: 4x 초고해상도, 0.4 디노이즈, 10 스텝 (저는 업스케일링에 전문가는 아니지만, 다른 업스케일링 방법도 사용할 수 있습니다)

    • 가능하다면 1344x1728 해상도에서 직접 생성할 수도 있습니다

  • 체크포인트: flux1-dev-Q8_0.gguf (Q8 버전을 사용합니다. FP8, Q4 또는 다른 양자화 버전은 테스트하지 않았습니다)

  • Lora 가중치: 0.3-0.5. 프롬프트에 따라 실험해보셔야 합니다

  • 긍정 프롬프트: 트리거 단어는 필요 없습니다. 하지만 Flux를 조정하기 위해 사진 촬영 관련 용어(예: photo, photograph 등)를 사용해야 합니다. 아래 예시로 시작할 수 있습니다. 이것은 제가 학습 데이터셋에 태그를 단 방식입니다.

    • 전신 사진

    • 중간 거리 사진

    • 셀카

    • 근접 사진

    • 또는 원하는 어떤 것이든 (스텝 및 가중치는 프롬프트에 따라 조절). 상세한 프롬프트가 여전히 가장 좋습니다.

  • 문제점: 이런 문제가 생기면 가중치를 줄여보세요

    • 텍스트

    • 배경의 인물

    • 피부 질감 - 완벽하지 않습니다. 저도 만족하지 않으며 개선 방법을 찾고 있습니다

이 버전을 가능하게 해준 Buzz에게 팁을 준 모든 분들께 감사드립니다. 특별 언급:

  • plectrudecatastrophe

  • Paper_Cranes

  • congo2008

  • 증류된 CFG 스케일: 2.5에서 4 사이

  • 샘플링 방법 및 스케줄 유형: Heun with BETA 또는 DEIS with DDIM 또는 [Forge] Flux Realistic (느림) with Beta / DDIM

  • 스텝 수: 20 이상 (보통 20, 30, 35, 40을 사용합니다 - 이미지가 몇 스텝에서 수렴하는지 확인하세요 - 직접 실험해보시기 바랍니다)

  • 해상도: 1344x1728 또는 1248x1824 또는 1440x1800. 896x1152도 가능하지만 hires fix를 사용해야 합니다

  • 체크포인트: flux1-dev-Q8_0.gguf (Q8 버전을 사용합니다. FP8, Q4 또는 다른 양자화 버전은 테스트하지 않았습니다)

  • Lora 가중치: 0.3-0.5가 최적 범위입니다

  • 긍정 프롬프트: 이 두 버전은 트리거 단어가 필요 없습니다. photo of, photograph of, Shot on iPhone photo of, This Image features 등 원하는 것을 사용할 수 있습니다 (다른 사용자들이 올린 예시들을 참고하십시오 - 다양한 프롬프트 방식을 사용해도 좋은 결과를 얻습니다). 다만 많은 테스트를 거친 결과, 이 페이지 오른쪽에 추가한 트리거 단어가 매우 좋은 결과를 냈습니다. 원하면 사용하셔도 되고, 아니면 원하는 것을 사용하시면 됩니다. 참고로 데이터셋은 GPT4O로 캡션이 작성되어 있어 상세한 프롬프트가 가장 좋은 결과를 줍니다.

이 버전을 가능하게 해준 Buzz에게 팁을 준 모든 분들께 감사드립니다. 특별 언급:

  • kudzueye

  • 증류된 CFG 스케일: 2.5에서 4 사이

  • 샘플링 방법 및 스케줄 유형: Heun with BETA 또는 DEIS with DDIM 또는 [Forge] Flux Realistic (느림) with Beta / DDIM

  • 스텝 수: 20 이상 (보통 20, 30, 35, 40을 사용합니다 - 이미지가 몇 스텝에서 수렴하는지 확인하세요 - 직접 실험해보시기 바랍니다)

  • 해상도: 896x1152 또는 1152x896 또는 1024x1024 (이보다 높은 해상도에서도 생성할 수 있습니다. Flux와 이 Lora가 처리 가능합니다)

  • 체크포인트: flux1-dev-Q8_0.gguf (Q8 버전을 사용합니다. FP8, Q4 또는 다른 양자화 버전은 테스트하지 않았습니다)

  • Lora 가중치: 0.6-1

  • 긍정 프롬프트: 만약 다른 프롬프트가 잘 작동한다면 그것을 사용하세요. 저는 단지 제가 Lora를 테스트하는 방법을 강조하는 것입니다. 이곳과 Reddit 등에서 다양한 프롬프트 방식을 사용하는 여러 이미지를 보았습니다.

    • 항상 "아마추어 사진 of"로 시작하고 "on flickr in 2007, 2005 blog, 2007 blog"로 끝나도록 하세요

      • 최상의 결과를 위한 프롬프트 형식: 아마추어 사진 of <주제 설명>, <장면 설명>, <이미지 품질 태그>, on flickr in 2007, 2005 blog, 2007 blog

데이터셋은 어떻게 캡션 되었나요?:

  • 훈련 데이터셋 캡션은 GPT4o를 사용해 작성했습니다. 상세한 캡션이 이 Lora와 가장 잘 맞습니다

이 Lora가 마음에 드시고 Buzz에게 후원할 수 있다면 매우 감사하겠습니다

마음에 들지 않고 건설적인 피드백이 있다면 문제점을 설명하는 댓글을 남겨 주세요. 다음 버전에서 개선하도록 노력하겠습니다

건설적인 피드백이 없고 단순히 불평만 하고 싶다면 다른 곳에서 하시기 바랍니다

이전
ZavyChromaXL - b1
다음
디즈니 애니메이션 [Illustrious & Pony] - [illustrious]

모델 세부사항

모델 유형

LORA

기본 모델

Flux.1 D

모델 버전

v5-beta

모델 해시

8840a76daf

학습된 단어

Hack Forums scrapped posted to WhatsApp r/me_irl r/pics Shot on iPhone Bad Quality Sharp photo of

토론

댓글을 남기려면 log in하세요.