modele/ThinkDiffusionXL - v1.0

ThinkDiffusionXL - v1.0

Zofia Nowak

5/26/2025

10:53:01 AM

| Discussion|

Powiązane słowa kluczowe i tagi

model bazowy,checkpoint,sdxl 1.0

Portret starszego mężczyzny z głębokimi zmarszczkami i białą brodą, noszącego beżowy kapelusz i żółtą koszulę, uchwycony w silnym letnim świetle na tle rozmytego zielonego parku.

Wysoce szczegółowy obraz wygenerowany przez AI za pomocą stable diffusion przedstawiający demoniczną postać z cechami szkieletu i misterną, kolczastą zbroją. Mroczna, upiorna atmosfera.

Ponury żniwiarz w mrocznym lesie z mglistą, upiorną atmosferą, stworzony przy użyciu stable diffusion.

Dramatyczny obraz wygenerowany przez AI przy użyciu Stable Diffusion przedstawiający ponurego Żniwiarza z szkieletową twarzą, ubrany w postrzępione szaty, stojącego na skale z rozpostartymi ramionami podczas uderzenia błyskawicy. W tle widnieje ciemne, burzowe niebo i surowy krajobraz.

Widok profilu kobiety z misternym tatuażem na szyi i ramieniu oraz eleganckim kokiem, obraz generowany przez AI za pomocą stable diffusion.

Eteryczny smok z przejrzystymi skrzydłami w zrujnowanym pałacu, w tle pochmurne niebo, obraz wygenerowany AI przy użyciu Stable Diffusion.

Zalecane parametry

samplers

DPM++ 2M Karras

steps

cfg

4 - 8

Wskazówki

Rozważ użycie TDXL do projektów wymagających dużej szczegółowości i jakości, ponieważ wyróżnia się w tych aspektach.

Model oferuje elastyczność w generowaniu obrazów bez wbudowanego biasu, odpowiedni do każdego stylu lub tematu.

Sponsorzy twórcy

Możesz go znaleźć wstępnie załadowanego na ThinkDiffusion.

Przeczytaj więcej o modelu, kliknij tutaj

Prosimy o pozostawienie opinii, jeśli jesteś z niego zadowolony, to zachęci nas do tworzenia kolejnych i dalszego ulepszania.

ThinkDiffusionXL (TDXL)

ThinkDiffusionXL jest efektem naszego celu stworzenia uniwersalnego modelu zdolnego do zadziwiającego fotorealizmu, który jednocześnie jest wszechstronny i może generować wysokiej jakości obrazy w różnych stylach i tematach bez potrzeby bycia ekspertem w promptowaniu.

Można go znaleźć wstępnie załadowanego na ThinkDiffusion.

Przeczytaj więcej o modelu, kliknij tutaj

Prosimy o pozostawienie opinii, jeśli jesteś z niego zadowolony, to zachęci nas do tworzenia kolejnych i dalszego ulepszania.

Prace

Źródło danych: TDXL został wytrenowany na ponad 10 000 różnorodnych obrazów obejmujących fotorealizm, cyfrową sztukę, anime i inne. Najmniejsza rozdzielczość w naszym zbiorze to 1365x2048, ale wiele obrazów ma rozdzielczość nawet do 4622x6753. Łącznie nasz zestaw danych zajmuje 42 GB.
Trening: Poświęciliśmy dużo czasu – 1,8 miliona kroków. Dla porównania, Juggernaut ma 600k kroków, a RealVisXL 348k kroków.
Ręcznie opisane obrazy: Każdy obraz został dokładnie opisany ręcznie, co zwiększa zdolność modelu do generowania precyzyjnych i wysokiej jakości rezultatów z minimalnych promptów.
Możliwości NSFW: Model zawiera ponad 1000 starannie wyselekcjonowanych obrazów NSFW.

Nasze przemyślenia

Szczegóły i jakość: Większość modeli XL w kategorii Realistic cierpi na słabe detale, zwłaszcza w tle, a także w podstawowych cechach takich jak oczy, zęby i skóra. Uważamy, że TDXL przewyższa je w tych aspektach dzięki dużemu i wysokiej jakości zbiorowi danych. Dla porównania, Juggernaut ma około połowę materiału obrazowego, a RealVisXL tylko 1700 obrazów. Ostatecznie TDXL posiada po prostu dużo większą "wiedzę".
Mniej uprzedzeń (Less-Bias): Zadbasz o użycie równej liczby obrazów dla każdego stylu, płci itp. Inne modele testowane przez ostatnie miesiące miały pewnego rodzaju bias, czasem wobec portretów, płci, określonych etniczności itp. Na przykład Juggernaut wykazuje bias w obszarze zbliżeń, a w modelu dominujące jest oświetlenie kinowe. RealVisXL również ma tendencję do portretów. Z kolei TDXL daje to, czego chcesz: pejzaże, ujęcia półpostaciowe, całe postacie, zbliżenia, portrety, widok z boku, z tyłu, sceny akcji, kino... cokolwiek chcesz, bez narzucania się przez bias.
Wszechstronna baza: Dzięki dużemu, zbalansowanemu i wysokiej jakości zestawowi danych, TDXL jest wszechstronny jako baza pod przyszłe trenowania. Możesz tworzyć nowe dopasowania (finetune) w różnych kierunkach, dodawać LoRA w celu uzupełnienia brakujących koncepcji lub przeprowadzać dalsze treningi z bardziej zbalansowanymi danymi wysokiej jakości.

Współtwórca

Zofia Nowak

Cześć! Nazywam się Zofia Nowak. Łączę pasję do fotografii z technologią, by prezentować najbardziej inspirujące obrazy tworzone przez sztuczną inteligencję.

Poprzedni

ThisIsReal - v5.0

Następny

MooMooFusion - v4.0 Female

Użyj tego modelu