modele/Amatorska fotografia [Flux Dev] - v2.0

Amatorska fotografia [Flux Dev] - v2.0

Zofia Nowak

7/19/2025

2:04:27 PM

| Discussion|

Powiązane słowa kluczowe i tagi

Kobieta w białym bikini i okularach przeciwsłonecznych odpoczywająca na jachcie z panoramą Miami w tle pod słonecznym niebem

Kobieta w błyszczącej czerwonej sukience z czarnymi okularami przeciwsłonecznymi i puszystymi włosami, stojąca obok czerwonego Lamborghini pod neonowymi światłami w Miami nocą.

Kobieta w białym garniturze i okularach przeciwsłonecznych stoi przed palmami Miami i biurowymi drapaczami chmur pod jasnym niebieskim niebem, widziana z niskiego kąta.

Policjant w stylu lat 80. noszący okulary przeciwsłoneczne i czarne wąsy, opierający się o biały radiowóz w Miami, trzymający różowy pączek z polewą, z palmami i biurowcem w tle.

Zalecane podpowiedzi

Full body shot photo of,Medium shot photo of,Selfie photo of,Close-up photo of,photo,photograph,Amateur photography of <Subject Description>, <Scene Description>, <Image Quality Tags>, on flickr in 2007, 2005 blog, 2007 blog,Shot on iPhone photo of,This Image features

2005 blog

Zalecane parametry

samplers

DEIS with DDIM, Heun with BETA, [Forge] Flux Realistic (Slow) with Beta / DDIM, Heun

steps

20 - 40

cfg

1 - 4

resolution

896x1152, 1344x1728, 1248x1824, 1440x1800, 1152x896, 1024x1024, 896x1152

other models

amateurphotov2-000049 (771781fd6719), flux1-dev-Q8_0 (52cfce60d7)

Zalecane parametry wysokiej rozdzielczości

upscaler

4x_NMKD-Superscale-SP_178000_G, 4x ultrasharp

upscale

1.5 - null

steps

Wskazówki

Musisz eksperymentować z wagą Lora w zależności od swoich promptów; zalecane wagi różnią się od 0.3-0.5 do 0.6-1 w zależności od wersji.

Szczegółowe prompt-y związane z fotografią lepiej kierują modelem; używaj słów takich jak photo, photograph lub dodawaj typy aparatów czy daty.

Jeśli pojawią się problemy z dłońmi, tekstem, ludźmi w tle lub teksturą skóry, spróbuj zmniejszyć wagę Lora.

Możesz też generować bezpośrednio w wyższych rozdzielczościach, takich jak 1344x1728, jeśli pozwala na to Twój sprzęt.

Opisy zestawu danych zostały stworzone za pomocą GPT4o; szczegółowe opisy dają najlepsze rezultaty.

Najważniejsze informacje o wersji

Prompt GPT4o:

Planuję wytrenować LoRA dla modelu Stable Diffusion text-to-image, który w swojej architekturze używa transformera T5XXL. Prompt-y powinny być w języku naturalnym i mieć określony format. Będę przesyłać obrazy i potrzebuję, abyś pomógł mi stworzyć szczegółowe prompt-y na ich podstawie. Prompt-y powinny zaczynać się od "Amatorska fotografia" i kończyć na "on flickr w 2007, blog z 2005, blog z 2007." Zawsze podawaj prompt w jednym akapicie.

Format powinien być:

Opis obiektu: Zacznij od szczegółowego opisu wszystkich osób na obrazie. Bardzo ważne jest uwzględnienie ich rasy i pochodzenia etnicznego, cech fizycznych (takich jak wzrost, budowa ciała, odcień skóry i kolor włosów), cech twarzy, stroju oraz wszelkich wyrazów twarzy lub póz. Bądź tak precyzyjny, jak to możliwe. Upewnij się, że zawsze uwzględniasz budowę ciała (np. plus size, szczupły, drobny) i nie pomijasz tego.

Opis sceny: Dokładnie przekaż, co dokładnie osoby robią na zdjęciu. Opisz otoczenie, elementy tła, wszelkie obiekty, z którymi wchodzą w interakcję, oraz ogólne środowisko (miejskie, wiejskie, wewnątrz, na zewnątrz itd.).

Tagi jakości obrazu: Dodaj opisowe tagi podkreślające jakość obrazu. Używaj określeń takich jak lekki rozmycie ruchu, zagracone tło, ciepłe tony, jasne naturalne światło, wysoki kontrast, żywe kolory itd. Tagi te powinny odzwierciedlać nastrój i atmosferę obrazu.

Ostateczny wynik powinien łączyć wszystkie te elementy w spójny i szczegółowy prompt, który dokładnie odzwierciedla obraz.

Witajcie wszyscy, proszę przeczytajcie to przed użyciem Lora

Zalecane ustawienia (v6):

Skala Distilled CFG: 3.5
Metoda próbkowania i typ harmonogramu: DEIS z DDIM
Kroki: 20
Rozdzielczość: 896x1152
- Model hires fix: 4x_NMKD-Superscale-SP_178000_G
- Kroki: 10
- Usuwanie szumów: 0.3
- Powiększenie: 1.5
Waga Lora: 0.8. Należy eksperymentować w zależności od swoich promptów

Zalecane ustawienia (v5-final):

Skala Distilled CFG: od 2.5 do 4
Metoda próbkowania i typ harmonogramu: Heun z BETA lub DEIS z DDIM lub [Forge] Flux Realistic (wolne) z Beta / DDIM
Kroki: >=20 (Czasem używam 20, 30, 35 lub 40 - powinieneś sprawdzić, przy ilu krokach obraz się stabilizuje - więc eksperymentuj samodzielnie)
Rozdzielczość: 896x1152 (upewniłem się, że działa przy tej rozdzielczości, ponieważ niektórzy nie lubili, kiedy mówiłem generuj w wysokich rozdzielczościach) - ale musisz użyć hires fix. Poniżej ustawienia, których używałem w przykładowych obrazach
- Hires fix: 4x ultrasharp, usuwanie szumów 0.4, 10 kroków (nie jestem najlepszy w powiększaniu. Jeśli masz inne metody powiększania, możesz ich użyć)
- Możesz też generować bezpośrednio w rozdzielczości 1344x1728, jeśli możesz
Checkpoint: flux1-dev-Q8_0.gguf (używam tego Q8. Nie testuję tego Lora z FP8, Q4 ani innymi kwantyzacjami)
Waga Lora: 0.3-0.5. Należy eksperymentować w zależności od promptów
Pozytywny prompt: Nie potrzeba słowa wyzwalającego. Musisz jednak używać terminów fotograficznych, aby pokierować Flux (takich jak photo, photograph itp.). Możesz zacząć od poniższego. Tak oznaczyłem zestaw treningowy
- Zdjęcie całej sylwetki
- Zdjęcie w średnim ujęciu
- Selfie
- Zbliżenie
- Albo cokolwiek chcesz (dostosuj kroki, wagę w zależności od promptu). Szczegółowe prompt-y nadal działają najlepiej

Problemy: Jeśli się pojawią, proszę zmniejsz wagę
- Dłonie
- Tekst
- Ludzie w tle
- Tekstura skóry - nie jest perfekcyjna. Nie podoba mi się to również. Staram się znaleźć sposoby, aby to poprawić

Chciałbym podziękować wszystkim, którzy wsparli Buzz i umożliwili powstanie tej wersji. Szczególne podziękowania dla:

plectrudecatastrophe
Paper_Cranes
congo2008

Zalecane ustawienia (v4-soap-testing i v5-beta):

Skala Distilled CFG: od 2.5 do 4
Metoda próbkowania i typ harmonogramu: Heun z BETA lub DEIS z DDIM lub [Forge] Flux Realistic (wolne) z Beta / DDIM
Kroki: >=20 (Czasem używam 20, 30, 35 lub 40 - powinieneś sprawdzić, przy ilu krokach obraz się stabilizuje - więc eksperymentuj samodzielnie)
Rozdzielczość: 1344x1728 lub 1248x1824 lub 1440x1800. 896x1152 też działa, ale musisz użyć hires fix
Checkpoint: flux1-dev-Q8_0.gguf (używam tego Q8. Nie testuję tego Lora z FP8, Q4 ani innymi kwantyzacjami)
Waga Lora: 0.3-0.5 to optymalny zakres
Pozytywny prompt: Te 2 wersje nie potrzebują słowa wyzwalającego. Możesz używać „photo of”, „photograph of”, „Shot on iPhone photo of”, „This Image features” lub czegokolwiek chcesz (spójrz na przykłady innych, którzy używają różnych promptów i nadal osiągają dobre wyniki), ale po wielu testach uzyskałem bardzo dobre wyniki z dodatkowym słowem wyzwalającym, które dodałem po prawej stronie tej strony. Możesz z tego skorzystać lub nie. Pamiętaj, że zestaw danych jest opisany za pomocą GPT4O, więc szczegółowe zapytania zawsze dają najlepsze rezultaty

Chciałbym podziękować wszystkim, którzy wsparli Buzz i umożliwili powstanie tej wersji. Szczególne podziękowania dla:

kudzueye

Zalecane ustawienia (v3 i v2):

Skala Distilled CFG: od 2.5 do 4
Metoda próbkowania i typ harmonogramu: Heun z BETA lub DEIS z DDIM lub [Forge] Flux Realistic (wolne) z Beta / DDIM
Kroki: >=20 (Czasem używam 20, 30, 35 lub 40 - powinieneś sprawdzić, przy ilu krokach obraz się stabilizuje - więc eksperymentuj samodzielnie)
Rozdzielczość: 896x1152 lub 1152x896 lub 1024x1024 (Możesz generować też w wyższych rozdzielczościach. Flux i ten lora to obsługują)
Checkpoint: flux1-dev-Q8_0.gguf (używam tego Q8. Nie testuję tego Lora z FP8, Q4 ani innymi kwantyzacjami)
Waga Lora: 0.6-1
Pozytywny prompt: Jeśli inne prompt-y działają u Ciebie z tym Lora, po prostu je użyj. Podkreślam, jak testuję Lora. Widziałem wiele obrazów tutaj i na Reddicie, gdzie ludzie używają różnych promptów
- Zawsze zaczynaj od "Amatorska fotografia" i kończ na "on flickr w 2007, blog z 2005, blog z 2007"
  - Prompt powinien mieć format: Amatorska fotografia <Opis obiektu>, <Opis sceny>, <Tagi jakości obrazu>, on flickr w 2007, blog z 2005, blog z 2007

Jak opisano zestaw danych?:

Opisywałem zestaw treningowy za pomocą GPT4o. Szczegółowe opisy działają najlepiej z tym Lora

Jeśli podoba Ci się ten lora i możesz wesprzeć Buzz, będzie to bardzo docenione

Jeśli Ci się nie podoba i masz konstruktywne uwagi, zostaw komentarz wyjaśniający problemy, a postaram się je naprawić w następnej wersji

Jeśli nie masz konstruktywnej krytyki i chcesz tylko narzekać na ten Lora, skieruj swoje komentarze gdzie indziej

Współtwórca

Zofia Nowak

Cześć! Nazywam się Zofia Nowak. Łączę pasję do fotografii z technologią, by prezentować najbardziej inspirujące obrazy tworzone przez sztuczną inteligencję.

Poprzedni

chromeBot portret robotów/cyborgów - v0.1

Następny

Szczegółowe portrety wędrowca | FLUX - v1.0

Użyj tego modelu