Profil boczny abstrakcyjnej pięknej kobiety z delikatnym makijażem i tradycyjnymi ozdobami do włosów, na tle nocnego miasta z górami i dużym księżycem.
Abstrakcyjna ilustracja kobiety o uderzających rudych włosach i piegach, ubranej w ciemne ubrania, na tle szczegółowego nocnego nieba z gwiazdami i niebiańskimi wzorami.

Zalecane parametry

steps

4 - null

Sponsorzy twórcy

Zapoznaj się z naszym Przewodnikiem szybkiego startu Stable Diffusion 3.5 z najnowszymi informacjami!

Zapoznaj się z naszym Przewodnikiem szybkiego startu Stable Diffusion 3.5 z najnowszymi informacjami!

Stable Diffusion 3.5 Large Turbo to model tekst-na-obraz Multimodal Diffusion Transformer (MMDiT) z Adversarial Diffusion Distillation (ADD), który charakteryzuje się ulepszoną jakością obrazu, typografią, zrozumieniem złożonych promptów oraz efektywnością zasobową, skupiając się na mniejszej liczbie kroków inferencji.

Uwaga: Ten model jest udostępniany na podstawie Stability Community License. Odwiedź Stability AI, aby dowiedzieć się więcej lub skontaktować się z nami w celu uzyskania informacji o licencjach komercyjnych.

Opis modelu

  • Opracowany przez: Stability AI

  • Typ modelu: model generujący obrazy z tekstu MMDiT

  • Opis modelu: Model generuje obrazy na podstawie tekstowych promptów. Jest to ADD-destylowany Multimodal Diffusion Transformer używający trzech stałych, wstępnie wytrenowanych enkoderów tekstu oraz normalizacji QK.

Licencja

  • Licencja społecznościowa: Darmowa do celów badawczych, niekomercyjnych oraz komercyjnych dla organizacji lub osób z rocznym przychodem poniżej 1 miliona dolarów. Szczegóły dostępne są w Community License Agreement. Czytaj więcej na https://stability.ai/license.

  • Dla osób i organizacji z rocznym przychodem powyżej 1 miliona dolarów: Prosimy o kontakt w celu uzyskania licencji Enterprise.

Źródła modelu

Do lokalnego lub samodzielnego użytku zalecamy ComfyUI jako interfejs nodyfikujący dla inferencji, lub diffusers albo GitHub do wykorzystania programistycznego.

Szczegóły implementacji

  • Normalizacja QK: Wdraża technikę normalizacji QK w celu poprawy stabilności treningu.

  • Adversarial Diffusion Distillation (ADD) (patrz raport techniczny), która pozwala na próbkowanie z 4 krokami przy wysokiej jakości obrazu.

  • Enkodery tekstu:

  • Dane treningowe i strategia:

    Model był trenowany na szerokim zakresie danych, w tym danych syntetycznych oraz filtrowanych danych dostępnych publicznie.

Więcej technicznych szczegółów oryginalnej architektury MMDiT znajduje się w artykułe naukowym.

Poprzedni
Pikuson | Style Shiiro - v1.0
Następny
Dragonhead - v1.0

Szczegóły modelu

Typ modelu

Checkpoint

Model bazowy

SD 3.5 Large Turbo

Wersja modelu

Large Turbo

Hash modelu

fb64610bf8

Twórca

Dyskusja

Proszę się log in, aby dodać komentarz.

Obrazy autorstwa Stable Diffusion 3.5 Large Turbo - Large Turbo

Profil boczny abstrakcyjnej pięknej kobiety z delikatnym makijażem i tradycyjnymi ozdobami do włosów, na tle nocnego miasta z górami i dużym księżycem.
Abstrakcyjna ilustracja kobiety o uderzających rudych włosach i piegach, ubranej w ciemne ubrania, na tle szczegółowego nocnego nieba z gwiazdami i niebiańskimi wzorami.

Obrazy z model bazowy

Fotorealistyczna scena postaci nieumarłych, w tym zombie i szkieletów, spacerujących przez upiorny cmentarz oświetlony świecącymi lampionami jack-o'-lantern pod ciemnym, złowrogim niebem.

Obrazy z stability ai

Dziewczyna w stylu anime o blond włosach, ubrana w białą sukienkę na ramiączkach i duży kapelusz z dekoracją z słonecznika, szczęśliwie stojąca na polu słoneczników o zachodzie słońca z uniesionymi ramionami.
Postać Ffixgarnet z długimi czarnymi włosami i brązowymi oczami, nosząca pomarańczowy kombinezon z krzyżowymi sznurówkami oraz białe bufiaste rękawy i czerwone rękawice, wspinająca się po drewnianej drabinie linowej na tle niebieskiego nieba, rumieniąca się i patrząca za siebie
Postać anime z różowymi włosami i ognistymi skrzydłami kucająca w dynamicznej pozie na tle fioletowego i mrocznego fantasy ze ostrymi, postrzępionymi skałami.
Zbliżenie wielu czarnych, teksturowanych kul unoszących się na ciemnym kosmicznym tle z kolorowymi, marzycielskimi światłami bokeh.
Zbliżenie na cyborga z matowym czarnym hełmem bez twarzy, długimi czarnymi włosami i skomplikowaną czerwono-czarną zbroją delikatnie świecącą na czerwono w mrocznym otoczeniu.
Wojownicza pokojówka z zielonymi dwoma kucykami trzymająca włócznię z ostrzem piły tarczowej w słabo oświetlonej fabryce robotów z mechanicznymi częściami i kablami, plamy krwi na podłodze.