Kobieta w białym bikini i okularach przeciwsłonecznych odpoczywająca na jachcie z panoramą Miami w tle pod słonecznym niebem
Kobieta w błyszczącej czerwonej sukience z czarnymi okularami przeciwsłonecznymi i puszystymi włosami, stojąca obok czerwonego Lamborghini pod neonowymi światłami w Miami nocą.
Kobieta w białym garniturze i okularach przeciwsłonecznych stoi przed palmami Miami i biurowymi drapaczami chmur pod jasnym niebieskim niebem, widziana z niskiego kąta.
Policjant w stylu lat 80. noszący okulary przeciwsłoneczne i czarne wąsy, opierający się o biały radiowóz w Miami, trzymający różowy pączek z polewą, z palmami i biurowcem w tle.

Zalecane podpowiedzi

Full body shot photo of,Medium shot photo of,Selfie photo of,Close-up photo of,photo,photograph,Amateur photography of <Subject Description>, <Scene Description>, <Image Quality Tags>, on flickr in 2007, 2005 blog, 2007 blog,Shot on iPhone photo of,This Image features

2005 blog

Zalecane parametry

samplers

DEIS with DDIM, Heun with BETA, [Forge] Flux Realistic (Slow) with Beta / DDIM, Heun

steps

20 - 40

cfg

1 - 4

resolution

896x1152, 1344x1728, 1248x1824, 1440x1800, 1152x896, 1024x1024, 896x1152

other models

amateurphotov2-000049 (771781fd6719), flux1-dev-Q8_0 (52cfce60d7)

Zalecane parametry wysokiej rozdzielczości

upscaler

4x_NMKD-Superscale-SP_178000_G, 4x ultrasharp

upscale

1.5 - null

steps

10

Wskazówki

Musisz eksperymentować z wagą Lora w zależności od swoich promptów; zalecane wagi różnią się od 0.3-0.5 do 0.6-1 w zależności od wersji.

Szczegółowe prompt-y związane z fotografią lepiej kierują modelem; używaj słów takich jak photo, photograph lub dodawaj typy aparatów czy daty.

Jeśli pojawią się problemy z dłońmi, tekstem, ludźmi w tle lub teksturą skóry, spróbuj zmniejszyć wagę Lora.

Możesz też generować bezpośrednio w wyższych rozdzielczościach, takich jak 1344x1728, jeśli pozwala na to Twój sprzęt.

Opisy zestawu danych zostały stworzone za pomocą GPT4o; szczegółowe opisy dają najlepsze rezultaty.

Najważniejsze informacje o wersji

Prompt GPT4o:

Planuję wytrenować LoRA dla modelu Stable Diffusion text-to-image, który w swojej architekturze używa transformera T5XXL. Prompt-y powinny być w języku naturalnym i mieć określony format. Będę przesyłać obrazy i potrzebuję, abyś pomógł mi stworzyć szczegółowe prompt-y na ich podstawie. Prompt-y powinny zaczynać się od "Amatorska fotografia" i kończyć na "on flickr w 2007, blog z 2005, blog z 2007." Zawsze podawaj prompt w jednym akapicie.
Format powinien być:
Opis obiektu: Zacznij od szczegółowego opisu wszystkich osób na obrazie. Bardzo ważne jest uwzględnienie ich rasy i pochodzenia etnicznego, cech fizycznych (takich jak wzrost, budowa ciała, odcień skóry i kolor włosów), cech twarzy, stroju oraz wszelkich wyrazów twarzy lub póz. Bądź tak precyzyjny, jak to możliwe. Upewnij się, że zawsze uwzględniasz budowę ciała (np. plus size, szczupły, drobny) i nie pomijasz tego.
Opis sceny: Dokładnie przekaż, co dokładnie osoby robią na zdjęciu. Opisz otoczenie, elementy tła, wszelkie obiekty, z którymi wchodzą w interakcję, oraz ogólne środowisko (miejskie, wiejskie, wewnątrz, na zewnątrz itd.).
Tagi jakości obrazu: Dodaj opisowe tagi podkreślające jakość obrazu. Używaj określeń takich jak lekki rozmycie ruchu, zagracone tło, ciepłe tony, jasne naturalne światło, wysoki kontrast, żywe kolory itd. Tagi te powinny odzwierciedlać nastrój i atmosferę obrazu.
Ostateczny wynik powinien łączyć wszystkie te elementy w spójny i szczegółowy prompt, który dokładnie odzwierciedla obraz.

Witajcie wszyscy, proszę przeczytajcie to przed użyciem Lora

  • Skala Distilled CFG: 3.5

  • Metoda próbkowania i typ harmonogramu: DEIS z DDIM

  • Kroki: 20

  • Rozdzielczość: 896x1152

    • Model hires fix: 4x_NMKD-Superscale-SP_178000_G

    • Kroki: 10

    • Usuwanie szumów: 0.3

    • Powiększenie: 1.5

  • Waga Lora: 0.8. Należy eksperymentować w zależności od swoich promptów

  • Skala Distilled CFG: od 2.5 do 4

  • Metoda próbkowania i typ harmonogramu: Heun z BETA lub DEIS z DDIM lub [Forge] Flux Realistic (wolne) z Beta / DDIM

  • Kroki: >=20 (Czasem używam 20, 30, 35 lub 40 - powinieneś sprawdzić, przy ilu krokach obraz się stabilizuje - więc eksperymentuj samodzielnie)

  • Rozdzielczość: 896x1152 (upewniłem się, że działa przy tej rozdzielczości, ponieważ niektórzy nie lubili, kiedy mówiłem generuj w wysokich rozdzielczościach) - ale musisz użyć hires fix. Poniżej ustawienia, których używałem w przykładowych obrazach

    • Hires fix: 4x ultrasharp, usuwanie szumów 0.4, 10 kroków (nie jestem najlepszy w powiększaniu. Jeśli masz inne metody powiększania, możesz ich użyć)

    • Możesz też generować bezpośrednio w rozdzielczości 1344x1728, jeśli możesz

  • Checkpoint: flux1-dev-Q8_0.gguf (używam tego Q8. Nie testuję tego Lora z FP8, Q4 ani innymi kwantyzacjami)

  • Waga Lora: 0.3-0.5. Należy eksperymentować w zależności od promptów

  • Pozytywny prompt: Nie potrzeba słowa wyzwalającego. Musisz jednak używać terminów fotograficznych, aby pokierować Flux (takich jak photo, photograph itp.). Możesz zacząć od poniższego. Tak oznaczyłem zestaw treningowy

    • Zdjęcie całej sylwetki

    • Zdjęcie w średnim ujęciu

    • Selfie

    • Zbliżenie

    • Albo cokolwiek chcesz (dostosuj kroki, wagę w zależności od promptu). Szczegółowe prompt-y nadal działają najlepiej

  • Problemy: Jeśli się pojawią, proszę zmniejsz wagę

    • Dłonie

    • Tekst

    • Ludzie w tle

    • Tekstura skóry - nie jest perfekcyjna. Nie podoba mi się to również. Staram się znaleźć sposoby, aby to poprawić

Chciałbym podziękować wszystkim, którzy wsparli Buzz i umożliwili powstanie tej wersji. Szczególne podziękowania dla:

  • plectrudecatastrophe

  • Paper_Cranes

  • congo2008

  • Skala Distilled CFG: od 2.5 do 4

  • Metoda próbkowania i typ harmonogramu: Heun z BETA lub DEIS z DDIM lub [Forge] Flux Realistic (wolne) z Beta / DDIM

  • Kroki: >=20 (Czasem używam 20, 30, 35 lub 40 - powinieneś sprawdzić, przy ilu krokach obraz się stabilizuje - więc eksperymentuj samodzielnie)

  • Rozdzielczość: 1344x1728 lub 1248x1824 lub 1440x1800. 896x1152 też działa, ale musisz użyć hires fix

  • Checkpoint: flux1-dev-Q8_0.gguf (używam tego Q8. Nie testuję tego Lora z FP8, Q4 ani innymi kwantyzacjami)

  • Waga Lora: 0.3-0.5 to optymalny zakres

  • Pozytywny prompt: Te 2 wersje nie potrzebują słowa wyzwalającego. Możesz używać „photo of”, „photograph of”, „Shot on iPhone photo of”, „This Image features” lub czegokolwiek chcesz (spójrz na przykłady innych, którzy używają różnych promptów i nadal osiągają dobre wyniki), ale po wielu testach uzyskałem bardzo dobre wyniki z dodatkowym słowem wyzwalającym, które dodałem po prawej stronie tej strony. Możesz z tego skorzystać lub nie. Pamiętaj, że zestaw danych jest opisany za pomocą GPT4O, więc szczegółowe zapytania zawsze dają najlepsze rezultaty

Chciałbym podziękować wszystkim, którzy wsparli Buzz i umożliwili powstanie tej wersji. Szczególne podziękowania dla:

  • kudzueye

  • Skala Distilled CFG: od 2.5 do 4

  • Metoda próbkowania i typ harmonogramu: Heun z BETA lub DEIS z DDIM lub [Forge] Flux Realistic (wolne) z Beta / DDIM

  • Kroki: >=20 (Czasem używam 20, 30, 35 lub 40 - powinieneś sprawdzić, przy ilu krokach obraz się stabilizuje - więc eksperymentuj samodzielnie)

  • Rozdzielczość: 896x1152 lub 1152x896 lub 1024x1024 (Możesz generować też w wyższych rozdzielczościach. Flux i ten lora to obsługują)

  • Checkpoint: flux1-dev-Q8_0.gguf (używam tego Q8. Nie testuję tego Lora z FP8, Q4 ani innymi kwantyzacjami)

  • Waga Lora: 0.6-1

  • Pozytywny prompt: Jeśli inne prompt-y działają u Ciebie z tym Lora, po prostu je użyj. Podkreślam, jak testuję Lora. Widziałem wiele obrazów tutaj i na Reddicie, gdzie ludzie używają różnych promptów

    • Zawsze zaczynaj od "Amatorska fotografia" i kończ na "on flickr w 2007, blog z 2005, blog z 2007"

      • Prompt powinien mieć format: Amatorska fotografia <Opis obiektu>, <Opis sceny>, <Tagi jakości obrazu>, on flickr w 2007, blog z 2005, blog z 2007

Jak opisano zestaw danych?:

  • Opisywałem zestaw treningowy za pomocą GPT4o. Szczegółowe opisy działają najlepiej z tym Lora

Jeśli podoba Ci się ten lora i możesz wesprzeć Buzz, będzie to bardzo docenione

Jeśli Ci się nie podoba i masz konstruktywne uwagi, zostaw komentarz wyjaśniający problemy, a postaram się je naprawić w następnej wersji

Jeśli nie masz konstruktywnej krytyki i chcesz tylko narzekać na ten Lora, skieruj swoje komentarze gdzie indziej

Poprzedni
chromeBot portret robotów/cyborgów - v0.1
Następny
Szczegółowe portrety wędrowca | FLUX - v1.0

Szczegóły modelu

Typ modelu

LORA

Model bazowy

Flux.1 D

Wersja modelu

v2.0

Hash modelu

61cff4eebd

Wytrenowane słowa

Amateur photography
on flickr in 2007
2005 blog
2007 blog

Dyskusja

Proszę się log in, aby dodać komentarz.