ThinkDiffusionXL - v1.0
Powiązane słowa kluczowe i tagi
Zalecane parametry
samplers
steps
cfg
Wskazówki
Rozważ użycie TDXL do projektów wymagających dużej szczegółowości i jakości, ponieważ wyróżnia się w tych aspektach.
Model oferuje elastyczność w generowaniu obrazów bez wbudowanego biasu, odpowiedni do każdego stylu lub tematu.
Sponsorzy twórcy
Możesz go znaleźć wstępnie załadowanego na ThinkDiffusion.
Przeczytaj więcej o modelu, kliknij tutaj
Prosimy o pozostawienie opinii, jeśli jesteś z niego zadowolony, to zachęci nas do tworzenia kolejnych i dalszego ulepszania.
ThinkDiffusionXL (TDXL)
ThinkDiffusionXL jest efektem naszego celu stworzenia uniwersalnego modelu zdolnego do zadziwiającego fotorealizmu, który jednocześnie jest wszechstronny i może generować wysokiej jakości obrazy w różnych stylach i tematach bez potrzeby bycia ekspertem w promptowaniu.
Można go znaleźć wstępnie załadowanego na ThinkDiffusion.
Przeczytaj więcej o modelu, kliknij tutaj
Prosimy o pozostawienie opinii, jeśli jesteś z niego zadowolony, to zachęci nas do tworzenia kolejnych i dalszego ulepszania.
Prace
Źródło danych: TDXL został wytrenowany na ponad 10 000 różnorodnych obrazów obejmujących fotorealizm, cyfrową sztukę, anime i inne. Najmniejsza rozdzielczość w naszym zbiorze to 1365x2048, ale wiele obrazów ma rozdzielczość nawet do 4622x6753. Łącznie nasz zestaw danych zajmuje 42 GB.
Trening: Poświęciliśmy dużo czasu – 1,8 miliona kroków. Dla porównania, Juggernaut ma 600k kroków, a RealVisXL 348k kroków.
Ręcznie opisane obrazy: Każdy obraz został dokładnie opisany ręcznie, co zwiększa zdolność modelu do generowania precyzyjnych i wysokiej jakości rezultatów z minimalnych promptów.
Możliwości NSFW: Model zawiera ponad 1000 starannie wyselekcjonowanych obrazów NSFW.
Nasze przemyślenia
Szczegóły i jakość: Większość modeli XL w kategorii Realistic cierpi na słabe detale, zwłaszcza w tle, a także w podstawowych cechach takich jak oczy, zęby i skóra. Uważamy, że TDXL przewyższa je w tych aspektach dzięki dużemu i wysokiej jakości zbiorowi danych. Dla porównania, Juggernaut ma około połowę materiału obrazowego, a RealVisXL tylko 1700 obrazów. Ostatecznie TDXL posiada po prostu dużo większą "wiedzę".
Mniej uprzedzeń (Less-Bias): Zadbasz o użycie równej liczby obrazów dla każdego stylu, płci itp. Inne modele testowane przez ostatnie miesiące miały pewnego rodzaju bias, czasem wobec portretów, płci, określonych etniczności itp. Na przykład Juggernaut wykazuje bias w obszarze zbliżeń, a w modelu dominujące jest oświetlenie kinowe. RealVisXL również ma tendencję do portretów. Z kolei TDXL daje to, czego chcesz: pejzaże, ujęcia półpostaciowe, całe postacie, zbliżenia, portrety, widok z boku, z tyłu, sceny akcji, kino... cokolwiek chcesz, bez narzucania się przez bias.
Wszechstronna baza: Dzięki dużemu, zbalansowanemu i wysokiej jakości zestawowi danych, TDXL jest wszechstronny jako baza pod przyszłe trenowania. Możesz tworzyć nowe dopasowania (finetune) w różnych kierunkach, dodawać LoRA w celu uzupełnienia brakujących koncepcji lub przeprowadzać dalsze treningi z bardziej zbalansowanymi danymi wysokiej jakości.
Szczegóły modelu
Dyskusja
Proszę się log in, aby dodać komentarz.






