Amatorska fotografia [Flux Dev] - v2.0
Powiązane słowa kluczowe i tagi
Zalecane podpowiedzi
Full body shot photo of,Medium shot photo of,Selfie photo of,Close-up photo of,photo,photograph,Amateur photography of <Subject Description>, <Scene Description>, <Image Quality Tags>, on flickr in 2007, 2005 blog, 2007 blog,Shot on iPhone photo of,This Image features
2005 blog
Zalecane parametry
samplers
steps
cfg
resolution
other models
Zalecane parametry wysokiej rozdzielczości
upscaler
upscale
steps
Wskazówki
Musisz eksperymentować z wagą Lora w zależności od swoich promptów; zalecane wagi różnią się od 0.3-0.5 do 0.6-1 w zależności od wersji.
Szczegółowe prompt-y związane z fotografią lepiej kierują modelem; używaj słów takich jak photo, photograph lub dodawaj typy aparatów czy daty.
Jeśli pojawią się problemy z dłońmi, tekstem, ludźmi w tle lub teksturą skóry, spróbuj zmniejszyć wagę Lora.
Możesz też generować bezpośrednio w wyższych rozdzielczościach, takich jak 1344x1728, jeśli pozwala na to Twój sprzęt.
Opisy zestawu danych zostały stworzone za pomocą GPT4o; szczegółowe opisy dają najlepsze rezultaty.
Najważniejsze informacje o wersji
Prompt GPT4o:
Planuję wytrenować LoRA dla modelu Stable Diffusion text-to-image, który w swojej architekturze używa transformera T5XXL. Prompt-y powinny być w języku naturalnym i mieć określony format. Będę przesyłać obrazy i potrzebuję, abyś pomógł mi stworzyć szczegółowe prompt-y na ich podstawie. Prompt-y powinny zaczynać się od "Amatorska fotografia" i kończyć na "on flickr w 2007, blog z 2005, blog z 2007." Zawsze podawaj prompt w jednym akapicie.Format powinien być:Opis obiektu: Zacznij od szczegółowego opisu wszystkich osób na obrazie. Bardzo ważne jest uwzględnienie ich rasy i pochodzenia etnicznego, cech fizycznych (takich jak wzrost, budowa ciała, odcień skóry i kolor włosów), cech twarzy, stroju oraz wszelkich wyrazów twarzy lub póz. Bądź tak precyzyjny, jak to możliwe. Upewnij się, że zawsze uwzględniasz budowę ciała (np. plus size, szczupły, drobny) i nie pomijasz tego.Opis sceny: Dokładnie przekaż, co dokładnie osoby robią na zdjęciu. Opisz otoczenie, elementy tła, wszelkie obiekty, z którymi wchodzą w interakcję, oraz ogólne środowisko (miejskie, wiejskie, wewnątrz, na zewnątrz itd.).Tagi jakości obrazu: Dodaj opisowe tagi podkreślające jakość obrazu. Używaj określeń takich jak lekki rozmycie ruchu, zagracone tło, ciepłe tony, jasne naturalne światło, wysoki kontrast, żywe kolory itd. Tagi te powinny odzwierciedlać nastrój i atmosferę obrazu.Ostateczny wynik powinien łączyć wszystkie te elementy w spójny i szczegółowy prompt, który dokładnie odzwierciedla obraz.Witajcie wszyscy, proszę przeczytajcie to przed użyciem Lora
Zalecane ustawienia (v6):
Skala Distilled CFG: 3.5
Metoda próbkowania i typ harmonogramu: DEIS z DDIM
Kroki: 20
Rozdzielczość: 896x1152
Model hires fix: 4x_NMKD-Superscale-SP_178000_G
Kroki: 10
Usuwanie szumów: 0.3
Powiększenie: 1.5
Waga Lora: 0.8. Należy eksperymentować w zależności od swoich promptów
Zalecane ustawienia (v5-final):
Skala Distilled CFG: od 2.5 do 4
Metoda próbkowania i typ harmonogramu: Heun z BETA lub DEIS z DDIM lub [Forge] Flux Realistic (wolne) z Beta / DDIM
Kroki: >=20 (Czasem używam 20, 30, 35 lub 40 - powinieneś sprawdzić, przy ilu krokach obraz się stabilizuje - więc eksperymentuj samodzielnie)
Rozdzielczość: 896x1152 (upewniłem się, że działa przy tej rozdzielczości, ponieważ niektórzy nie lubili, kiedy mówiłem generuj w wysokich rozdzielczościach) - ale musisz użyć hires fix. Poniżej ustawienia, których używałem w przykładowych obrazach
Hires fix: 4x ultrasharp, usuwanie szumów 0.4, 10 kroków (nie jestem najlepszy w powiększaniu. Jeśli masz inne metody powiększania, możesz ich użyć)
Możesz też generować bezpośrednio w rozdzielczości 1344x1728, jeśli możesz
Checkpoint: flux1-dev-Q8_0.gguf (używam tego Q8. Nie testuję tego Lora z FP8, Q4 ani innymi kwantyzacjami)
Waga Lora: 0.3-0.5. Należy eksperymentować w zależności od promptów
Pozytywny prompt: Nie potrzeba słowa wyzwalającego. Musisz jednak używać terminów fotograficznych, aby pokierować Flux (takich jak photo, photograph itp.). Możesz zacząć od poniższego. Tak oznaczyłem zestaw treningowy
Zdjęcie całej sylwetki
Zdjęcie w średnim ujęciu
Selfie
Zbliżenie
Albo cokolwiek chcesz (dostosuj kroki, wagę w zależności od promptu). Szczegółowe prompt-y nadal działają najlepiej
Problemy: Jeśli się pojawią, proszę zmniejsz wagę
Dłonie
Tekst
Ludzie w tle
Tekstura skóry - nie jest perfekcyjna. Nie podoba mi się to również. Staram się znaleźć sposoby, aby to poprawić
Chciałbym podziękować wszystkim, którzy wsparli Buzz i umożliwili powstanie tej wersji. Szczególne podziękowania dla:
plectrudecatastrophe
Paper_Cranes
congo2008
Zalecane ustawienia (v4-soap-testing i v5-beta):
Skala Distilled CFG: od 2.5 do 4
Metoda próbkowania i typ harmonogramu: Heun z BETA lub DEIS z DDIM lub [Forge] Flux Realistic (wolne) z Beta / DDIM
Kroki: >=20 (Czasem używam 20, 30, 35 lub 40 - powinieneś sprawdzić, przy ilu krokach obraz się stabilizuje - więc eksperymentuj samodzielnie)
Rozdzielczość: 1344x1728 lub 1248x1824 lub 1440x1800. 896x1152 też działa, ale musisz użyć hires fix
Checkpoint: flux1-dev-Q8_0.gguf (używam tego Q8. Nie testuję tego Lora z FP8, Q4 ani innymi kwantyzacjami)
Waga Lora: 0.3-0.5 to optymalny zakres
Pozytywny prompt: Te 2 wersje nie potrzebują słowa wyzwalającego. Możesz używać „photo of”, „photograph of”, „Shot on iPhone photo of”, „This Image features” lub czegokolwiek chcesz (spójrz na przykłady innych, którzy używają różnych promptów i nadal osiągają dobre wyniki), ale po wielu testach uzyskałem bardzo dobre wyniki z dodatkowym słowem wyzwalającym, które dodałem po prawej stronie tej strony. Możesz z tego skorzystać lub nie. Pamiętaj, że zestaw danych jest opisany za pomocą GPT4O, więc szczegółowe zapytania zawsze dają najlepsze rezultaty
Chciałbym podziękować wszystkim, którzy wsparli Buzz i umożliwili powstanie tej wersji. Szczególne podziękowania dla:
kudzueye
Zalecane ustawienia (v3 i v2):
Skala Distilled CFG: od 2.5 do 4
Metoda próbkowania i typ harmonogramu: Heun z BETA lub DEIS z DDIM lub [Forge] Flux Realistic (wolne) z Beta / DDIM
Kroki: >=20 (Czasem używam 20, 30, 35 lub 40 - powinieneś sprawdzić, przy ilu krokach obraz się stabilizuje - więc eksperymentuj samodzielnie)
Rozdzielczość: 896x1152 lub 1152x896 lub 1024x1024 (Możesz generować też w wyższych rozdzielczościach. Flux i ten lora to obsługują)
Checkpoint: flux1-dev-Q8_0.gguf (używam tego Q8. Nie testuję tego Lora z FP8, Q4 ani innymi kwantyzacjami)
Waga Lora: 0.6-1
Pozytywny prompt: Jeśli inne prompt-y działają u Ciebie z tym Lora, po prostu je użyj. Podkreślam, jak testuję Lora. Widziałem wiele obrazów tutaj i na Reddicie, gdzie ludzie używają różnych promptów
Zawsze zaczynaj od "Amatorska fotografia" i kończ na "on flickr w 2007, blog z 2005, blog z 2007"
Prompt powinien mieć format: Amatorska fotografia <Opis obiektu>, <Opis sceny>, <Tagi jakości obrazu>, on flickr w 2007, blog z 2005, blog z 2007
Jak opisano zestaw danych?:
Opisywałem zestaw treningowy za pomocą GPT4o. Szczegółowe opisy działają najlepiej z tym Lora
Jeśli podoba Ci się ten lora i możesz wesprzeć Buzz, będzie to bardzo docenione
Jeśli Ci się nie podoba i masz konstruktywne uwagi, zostaw komentarz wyjaśniający problemy, a postaram się je naprawić w następnej wersji
Jeśli nie masz konstruktywnej krytyki i chcesz tylko narzekać na ten Lora, skieruj swoje komentarze gdzie indziej
Szczegóły modelu
Typ modelu
Model bazowy
Wersja modelu
Hash modelu
Wytrenowane słowa
Twórca
Dyskusja
Proszę się log in, aby dodać komentarz.






