modele/ThinkDiffusionXL - v1.0

ThinkDiffusionXL - v1.0

|
5/26/2025
|
10:53:01 AM
| Discussion|
0

Powiązane słowa kluczowe i tagi

Portret starszego mężczyzny z głębokimi zmarszczkami i białą brodą, noszącego beżowy kapelusz i żółtą koszulę, uchwycony w silnym letnim świetle na tle rozmytego zielonego parku.
Wysoce szczegółowy obraz wygenerowany przez AI za pomocą stable diffusion przedstawiający demoniczną postać z cechami szkieletu i misterną, kolczastą zbroją. Mroczna, upiorna atmosfera.
Ponury żniwiarz w mrocznym lesie z mglistą, upiorną atmosferą, stworzony przy użyciu stable diffusion.
Dramatyczny obraz wygenerowany przez AI przy użyciu Stable Diffusion przedstawiający ponurego Żniwiarza z szkieletową twarzą, ubrany w postrzępione szaty, stojącego na skale z rozpostartymi ramionami podczas uderzenia błyskawicy. W tle widnieje ciemne, burzowe niebo i surowy krajobraz.
Widok profilu kobiety z misternym tatuażem na szyi i ramieniu oraz eleganckim kokiem, obraz generowany przez AI za pomocą stable diffusion.
Eteryczny smok z przejrzystymi skrzydłami w zrujnowanym pałacu, w tle pochmurne niebo, obraz wygenerowany AI przy użyciu Stable Diffusion.

Zalecane parametry

samplers

DPM++ 2M Karras

steps

30

cfg

4 - 8

Wskazówki

Rozważ użycie TDXL do projektów wymagających dużej szczegółowości i jakości, ponieważ wyróżnia się w tych aspektach.

Model oferuje elastyczność w generowaniu obrazów bez wbudowanego biasu, odpowiedni do każdego stylu lub tematu.

Sponsorzy twórcy

Możesz go znaleźć wstępnie załadowanego na ThinkDiffusion.

Przeczytaj więcej o modelu, kliknij tutaj

Prosimy o pozostawienie opinii, jeśli jesteś z niego zadowolony, to zachęci nas do tworzenia kolejnych i dalszego ulepszania.

ThinkDiffusionXL (TDXL)

ThinkDiffusionXL jest efektem naszego celu stworzenia uniwersalnego modelu zdolnego do zadziwiającego fotorealizmu, który jednocześnie jest wszechstronny i może generować wysokiej jakości obrazy w różnych stylach i tematach bez potrzeby bycia ekspertem w promptowaniu.

Można go znaleźć wstępnie załadowanego na ThinkDiffusion.

Przeczytaj więcej o modelu, kliknij tutaj

Prosimy o pozostawienie opinii, jeśli jesteś z niego zadowolony, to zachęci nas do tworzenia kolejnych i dalszego ulepszania.

Prace

  • Źródło danych: TDXL został wytrenowany na ponad 10 000 różnorodnych obrazów obejmujących fotorealizm, cyfrową sztukę, anime i inne. Najmniejsza rozdzielczość w naszym zbiorze to 1365x2048, ale wiele obrazów ma rozdzielczość nawet do 4622x6753. Łącznie nasz zestaw danych zajmuje 42 GB.

  • Trening: Poświęciliśmy dużo czasu – 1,8 miliona kroków. Dla porównania, Juggernaut ma 600k kroków, a RealVisXL 348k kroków.

  • Ręcznie opisane obrazy: Każdy obraz został dokładnie opisany ręcznie, co zwiększa zdolność modelu do generowania precyzyjnych i wysokiej jakości rezultatów z minimalnych promptów.

  • Możliwości NSFW: Model zawiera ponad 1000 starannie wyselekcjonowanych obrazów NSFW.

Nasze przemyślenia

  • Szczegóły i jakość: Większość modeli XL w kategorii Realistic cierpi na słabe detale, zwłaszcza w tle, a także w podstawowych cechach takich jak oczy, zęby i skóra. Uważamy, że TDXL przewyższa je w tych aspektach dzięki dużemu i wysokiej jakości zbiorowi danych. Dla porównania, Juggernaut ma około połowę materiału obrazowego, a RealVisXL tylko 1700 obrazów. Ostatecznie TDXL posiada po prostu dużo większą "wiedzę".

  • Mniej uprzedzeń (Less-Bias): Zadbasz o użycie równej liczby obrazów dla każdego stylu, płci itp. Inne modele testowane przez ostatnie miesiące miały pewnego rodzaju bias, czasem wobec portretów, płci, określonych etniczności itp. Na przykład Juggernaut wykazuje bias w obszarze zbliżeń, a w modelu dominujące jest oświetlenie kinowe. RealVisXL również ma tendencję do portretów. Z kolei TDXL daje to, czego chcesz: pejzaże, ujęcia półpostaciowe, całe postacie, zbliżenia, portrety, widok z boku, z tyłu, sceny akcji, kino... cokolwiek chcesz, bez narzucania się przez bias.

  • Wszechstronna baza: Dzięki dużemu, zbalansowanemu i wysokiej jakości zestawowi danych, TDXL jest wszechstronny jako baza pod przyszłe trenowania. Możesz tworzyć nowe dopasowania (finetune) w różnych kierunkach, dodawać LoRA w celu uzupełnienia brakujących koncepcji lub przeprowadzać dalsze treningi z bardziej zbalansowanymi danymi wysokiej jakości.

Poprzedni
ThisIsReal - v5.0
Następny
MooMooFusion - v4.0 Female

Szczegóły modelu

Typ modelu

Checkpoint

Model bazowy

SDXL 1.0

Wersja modelu

v1.0

Hash modelu

a21c9949ef

Dyskusja

Proszę się log in, aby dodać komentarz.

Obrazy autorstwa ThinkDiffusionXL - v1.0

Obrazy z model bazowy