SDS_FILM / fotografia analogowa - v2.1.2
Zalecane podpowiedzi
8K,masterpiece,best quality:1.2,ultrahigh-res,Film photography + any film type,computational photography + any quality rating,ulzzang,naver fanpop,fffffound,streaming on twitch,character album cover,<lora:DetailedEyes_xl_V2:1>,<lora:neg4all_bdsqlsz_xl_V7:1>,<lora:ClearHand-V2:1>
Zalecane negatywne podpowiedzi
anime,cartoon,3D rendering,high saturation,facial blemishes,lowres,bad anatomy,bad hands,text,error,missing fingers,extra digit,fewer digits,cropped,worst quality,low quality,normal quality,jpeg artifacts,signature,watermark,username,CyberRealistic_Negative-neg,SkinPerfection_NegV15,illustration,3d,2d,painting,cartoons,sketch,mole,skin blemishes,overexposed background,poor lighting,overexposed areas,uneven lighting,Low resolution,potential compression artifact,greasy skin
(worst quality, low quality, illustration, 3d, 2d, painting, cartoons, sketch)
Zalecane parametry
samplers
steps
cfg
clip skip
resolution
Zalecane parametry wysokiej rozdzielczości
upscaler
upscale
steps
denoising strength
Wskazówki
Dodanie ocen jakości fotografii obliczeniowej i niższych do negatywów w początkowych ustawieniach maksymalnie poprawia jakość obrazu.
Model V5_SD1.5 słabiej radzi sobie z oczami, zaleca się użycie modeli XL do osobnego przemalowania oczu celem poprawy efektu.
Przy fotografii analogowej wprowadź 'Film photography + dowolny typ filmu', aby uzyskać efekt filmu domyślnie.
Przy fotografii obliczeniowej wprowadź 'computational photography + dowolna ocena jakości', aby uzyskać efekt jakości telefonu komórkowego.
Przy włączonym ADetailer zaleca się używać samplerów Euler i Euler a, aby uniknąć problemów z szumem.
Zaleca się używać nowych modeli tagowania VIT-L-14/openai oraz bilp2-flan-t5-xl do inferencji słów kluczowych dla lepszych efektów.
Kluczowe pozytywne słowa to ulzzang, naver fanpop, ffffffound, streaming on twitch, character album cover.
Dodanie m.in. mole i skin blemishes do negatywów łagodzi problemy z defektami skóry w tej wersji modelu.
Do naprawy HD zaleca się stosować 8x_NMKD-Superscale_150000_G, powiększenie x1.5, 12 iteracji, siła 0.35.
Unikaj jednoczesnego użycia refiner i ADetailer, by zapobiec dodawaniu szumu.
Sponsorzy twórcy
V5_SD1.5:
Model koncentruje się głównie na trenowaniufotografii analogowej,fotografii obliczeniowej,cyfrowych plikach raw w trzech głównych kategoriach, z głębokim dostrojeniem do azjatyckich portretów. Obecnie zbiór treningowy głównie obejmuje młodych mężczyzn i kobiety z Azji oraz niewielką ilość krajobrazów. Do tagowania użyto GPT4V, częściowo z udziałem Cogvqa i WD1.4, gdzie tagi 1girl i 1boy zostały zmienione na woman oraz man, aby zapobiec błędom wieku.
Uwaga: ta wersja to wersja SD1.5, scalona z innych modeli. Model nie jest trenowany z celem pełnej równowagi, więc mogą występować wyraźne różnice w funkcjonalności i estetyce.
Cyfrowy surowy plik: Raw format
Fotografia analogowa: Film photography
Przykładowe typy filmów: Fuji C100 shooting, Fuji C200 shooting, Kodak 400 shooting, Kodak gold 200 shooting, Nolan 5219 shooting
Fotografia obliczeniowa: computational photography
Ocena jakości obrazu: jakość zdjęć z telefonu komórkowego, z telefonu stacjonarnego, z pagera
Podstawowe ustawienia (można modyfikować wg potrzeb, włączając ocenę jakości obliczeniowej i niżej do negatywów, aby uzyskać maksymalną poprawę jakości obrazu, odwrotnie analogicznie):
Pozytywne słowa kluczowe: 8K, masterpiece, best quality:1.2, ultrahigh-res,
Negatywne słowa kluczowe: anime, cartoon, 3D rendering, high saturation, facial blemishes, lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username,CyberRealistic_Negative-neg,(SkinPerfection_NegV15),
Pozostałe ustawienia można zobaczyć w przykładowych obrazkach.
Problemy: przetwarzanie oczu w modelu 1.5 jest nadal trudne; do dalszej poprawy zaleca się użyć modeli XL do osobnego, szczegółowego przemalowania oczu.
Model oparty na treningu LEOSAM FilmGirl Ultra, wszystkie prawa i oświadczenia są zgodne z modelem nadrzędnym.
V4:
Model koncentruje się głównie na trenowaniu fotografii analogowej i fotografii obliczeniowej, z głębokim dostrojeniem do azjatyckich portretów. Oprócz optymalizacji podstawowych danych, dodano niektóre popularne typy filmów. Jakość obrazu jest oceniana, a różnorodne niskiej jakości zdjęcia są używane do wyodrębnienia negatywnych cech, co wzmacnia kontrolę jakości obrazu.
Model opiera się na dużym modelu LEOSAM's HelloWorld5.0 (w skrócie HW5.0) jako bazowym. Wszystkie zasady użytkowania również wynikają z oświadczenia HW5.0. Jeśli modyfikujesz ten model, koniecznie zamieść informacje o tym modelu oraz HW5.0 w opisie.
Link do modelu HW5.0: https://civitai.com/models/43977/leosams-helloworld-sdxl-base-model
Jeśli podoba Ci się mój model, zapraszam nakawę lub na platformę Aifadian by mnie wesprzeć. Zachęcam też do dzielenia się efektami, ocen i komentarzy – to dla mnie bardzo ważne!
Przegląd słów kluczowych używanych w treningu:
Rekomendowana rozdzielczość to 896*1152, pozostałe parametry można znaleźć w opisach V4RC1 lub HW5.0.
Poniżej kluczowe pojęcia i wyrażenia do treningu.
Film: Film photography
Przykłady typów filmów: Fuji C100 shooting, Fuji C200 shooting, Kodak 400 shooting, Kodak gold 200 shooting, Nolan 5219 shooting
Fotografia obliczeniowa: computational photography
Ocena jakości: jakość obrazu telefonu, jakości telefonu stacjonarnego, jakości pagera
(jakość maleje kolejno: telefon komórkowy, telefon stacjonarny, pager)
Przeszkolone negatywne słowa kluczowe: overexposed background, poor lighting, overexposed areas, uneven lighting, Low resolution, potential compression artifact (testowano i nie wpływa to nadmiernie na obraz)
Zalecenia:
Przy użyciu filmu, wprowadź Film photography + dowolny typ filmu (lub bez nazwy filmu)
Używaj negatywnych słów z treningu oraz worst quality, low quality, illustration, 3d, 2d, painting, cartoons, sketch,
Opcjonalnie dodaj computational photography, Mobile phone image quality, Landline image quality, Pager image quality
Włożenie kategorii fotografii obliczeniowej w negatywy może powodować nadmierne wyostrzanie, a ponieważ główny zbiór to nadal film, przy braku specjalnych słów kluczowych model domyślnie generuje efekt filmu.
Przy użyciu fotografii obliczeniowej (czyli jakości telefonu komórkowego), wprowadź computational photography + dowolna ocena jakości
Można pominąć negatywne słowa z treningu, bo one cechują fotografię obliczeniową.
Porównanie jakości dla różnych kategorii fotografii:

Porównanie różnych typów filmów:

Porównanie różnych negatywnych wstawek:

Uwaga: wszystkie efekty fotograficzne to symulacje AI i nie odzwierciedlają prawdziwych efektów filmów czy zdjęć telefonicznych. To także osobista estetyka autora, nie utożsamiaj efektów modelu z konkretnym sprzętem rzeczywistym.
Note: all photography effects can not represent the real world film, mobile phone shooting effects, here are AI simulation results, with personal aesthetic, do not correspond to the model effect to the real specific equipment.
V4_RC1:
V4 był trenowany lokalnie setki godzin, dane oznaczano GPT4V i częściowo WD1.4 + cog.
Model napotkał częściowe przeuczenie, przeprowadzono pierwszą rundę MBW, która to złagodziła.
W porównaniu do wcześniejszej wersji V4, struktura dłoni jest lepsza, reagowanie na podpowiedzi bardziej czułe, a korekta kolorów bardziej intensywna. (Z powodu ograniczonej ilości danych, efekty nie są w pełni kompleksowe.)
V4_RC1:
V4 był trenowany lokalnie setki godzin, dane oznaczano GPT4V i częściowo WD1.4 + cog.
Model napotkał częściowe przeuczenie, przeprowadzono pierwszą rundę MBW, która to złagodziła.
W porównaniu do wcześniejszej wersji V4, struktura dłoni jest lepsza, reagowanie na podpowiedzi bardziej czułe, a korekta kolorów bardziej intensywna. (Z powodu ograniczonej ilości danych, efekty nie są w pełni kompleksowe.)
Instrukcje użytkowania:
Zazwyczaj używam DPM++2M K lub restart, sample 30-40 (restart 20), cilp terminacja 1, CFG: 5-7
W ADetailer rozmycie krawędzi 20, zakres malowania 0.4.
Można użyć refiner0.8 dla lepszych szczegółów wysokiej częstotliwości.
Do naprawy HD stosuję 8x_NMKD-Superscale_150000_G, powiększenie 1.5, 12 iteracji, zakres 0.35.
Negatywne słowa: (worst quality, low quality, illustration, 3d, 2d, painting, cartoons, sketch), mole, skin blemishes (ta wersja może mieć defekty skóry; dodanie dwóch ostatnich znacznie je łagodzi)
Instructions for use:
Zazwyczaj używam DPM++2M K lub restart, sample 30-40 (restart 20), cilp terminates 1pm CFG restart20 5-7.
W ADetailer rozmycie krawędzi 20, zakres malowania 0.4.
Możesz użyć refiner0.8 dla lepszych detali wysokiej częstotliwości.
Naprawa HD korzysta z 8x_NMKD-Superscale_150000_G, powiększenie 1.5, 12 iteracji, zakres 0.35.
Negatywne prompt: (worst quality, low quality, illustration, 3D, 2d, painting, cartoons, sketch), mole, skin blemishes (ta wersja może mieć defekty skóry, dodanie dwóch ostatnich skutecznie łagodzi)
Model może wciąż mieć problemy; teraz stosuje się oznaczanie GPT4V + nowe procesy retreningu.


Wersja V3 stabilnaOpis:
Trening z użyciem języka naturalnego w FP32, bez stałych słów wyzwalających, nie znaleziono problemów ze samplerami. W przypadku niestabilności rasowej można użyć słowa "azjata" aby wzmocnić wyzwalanie. Zalecono włączenie naprawy twarzy przy wysokiej rozdzielczości (przy pełnoekranowych portretach nie zaleca się naprawy twarzy).
2.1.2:
Obecnie większość samplerów nie generuje nadmiarowego szumu w większości scen, więc refiner nie jest konieczny, a After Detailer działa poprawnie. Pozostałe ustawienia nie zmieniły się.
DPM++ 2M Karras, Euler, Restart działają najlepiej.
Most sampling methods now no longer generate excessive noise in most scenarios, so refiners are no longer necessary, and After Detailer can also be used normally.
DPM++2M Karras, Euler, and Restart performed relatively better. The remaining parts are still the same as below.
2.1.0:
1: Przeprowadziłem wiele testów, obecnie najbardziej rekomenduję sampler euler i euler a, optymalna liczba kroków to 50, można włączyć refiner, przełączanie przy 0.9.
Inne sampler’y mogą powodować znaczący szum w niektórych scenach, można użyć refiner do redukcji, co jest skuteczne. Jednak po włączeniu ADetailer pojawia się znów szum, co jest prawie nieużywalne. Jeśli musisz użyć innego samplera, nie włączaj wtyczki do poprawy twarzy, tylko HD repair - to największy obecnie problem.
2: CILP: 2 (uczono na 1, testując 2 brak różnicy)
3: ADetailer zalecany tylko przy samplerach Euler i Euler a.
4: Rozdzielczość: 896*1152 (albo inne rekomendowane oficjalnie)
Instrukcja słów kluczowych:
1: Użyto nowych modeli znakowania: model cilp: VIT-L-14/openai, model captain: bilp2-flan-t5-xl. Jeśli nie wiesz jak opisać obraz, spróbuj użyć tych modeli do inferencji promptów, uzyskasz najlepsze efekty.
2: Co do słów wywoławczych: testowałem i mają one pewien wpływ na obraz, choć niewielki, ale zaleca się ich użycie.
3: Kluczowe tagi: ulzzang, naver fanpop, ffffffound, streaming on twitch, character album cover, pojawiają się najczęściej poza słowami wywoławczymi. Można je wprowadzić jednocześnie na start, daje to bardzo dobre rezultaty.
4: Pozytywne podpowiedzi: zwykle używam tych dwóch: <lora:DetailedEyes_xl_V2:1>, <lora:neg4all_bdsqlsz_xl_V7:1>, pochodzą od @bdsqlsz i są praktycznie wolne od zakłóceń. Naprawy dłoni <lora:ClearHand-V2:1> od @frostyforest dobrze radzą sobie z prostymi układami dłoni, choć w złożonych sytuacjach wciąż jest wyzwanie.
5: Negatywne słowa: (worst quality, low quality, illustration, 3d, 2d, painting, cartoons, sketch), greasy skin,
Na koniec moja grupa QQ 749047075 hasło: SDS, zapraszam do dyskusji i wymiany. Nowe modele testuję jako pierwszy.
Sekcja przypomnień:
1: Użyliśmy nowego modelu znakowania, model cilp: VIT-L-14/openai, oraz model captain: bilp2-flan-t5-xl. Gdy nie wiesz jak opisać obraz, spróbuj użyć tych modeli do odgadnięcia słów kluczowych; to da najlepszy efekt.
2: Co do słów wywoławczych: test wykazał, że mają pewien, choć niewielki wpływ, ale zaleca się je używać.
3: Kluczowe tagi: ulzzang, naver fanpop, ffffffound, streaming on twitch, character album cover to najczęściej występujące frazy poza słowami wywoławczymi. Dodaj je wszystkie od razu, aby uzyskać dobre rezultaty.
4: Pozytywne wskazówki jakości: zwykle stosuję te dwa: <lora:DetailedEyes_xl_V2:1>, <lora:neg4all_bdsqlsz_xl_V7:1>, oba pochodzą od @bdsqlsz i są niemal bez zanieczyszczeń. Naprawa dłoni <lora:ClearHand-V2:1> od @frostyforest dobrze radzi sobie z prostymi ułożeniami dłoni, choć w skomplikowanych sytuacjach to wciąż wyzwanie.
5: Negatywne prompt: (best quality, low quality, illustration, 3d, 2d, painting, cartons, sketch), great skin,
Na koniec moja grupa QQ 749047075, hasło: SDS. Zachęcam do dołączenia i wymiany doświadczeń, nowe modele testuję jako pierwszy.
Sampler/liczba kroków / Sampler/Steps:
Słowa wywoławcze / trigger word

Szczegóły modelu
Dyskusja
Proszę się log in, aby dodać komentarz.







