Seitenprofil einer abstrakten schönen Frau mit zartem Make-up und traditionellen Haarornamenten, vor einer nächtlichen Stadtlandschaft mit Bergen und großem Mond.
Abstrakte Illustration einer Frau mit auffälligen roten Haaren und Sommersprossen, die dunkle Kleidung trägt, vor einem detaillierten Nachthimmel mit Sternen und himmlischen Mustern.

Empfohlene Parameter

steps

4 - null

Ersteller-Sponsoren

Bitte sehen Sie sich unseren Schnellstart-Leitfaden für Stable Diffusion 3.5 für alle neuesten Informationen an!

Bitte sehen Sie sich unseren Schnellstart-Leitfaden für Stable Diffusion 3.5 für alle neuesten Informationen an!

Stable Diffusion 3.5 Large Turbo ist ein Multimodal Diffusion Transformer (MMDiT) Text-zu-Bild-Modell mit Adversarial Diffusion Distillation (ADD), das verbesserte Leistung bei Bildqualität, Typografie, komplexem Prompt-Verständnis und Ressourceneffizienz bietet, mit Schwerpunkt auf weniger Inferenzschritten.

Bitte beachten Sie: Dieses Modell wird unter der Stability Community License veröffentlicht. Besuchen Sie Stability AI, um mehr zu erfahren oder kontaktieren Sie uns für Details zu kommerziellen Lizenzen.

Modellbeschreibung

  • Entwickelt von: Stability AI

  • Modelltyp: MMDiT Text-zu-Bild Generativmodell

  • Modellbeschreibung: Dieses Modell generiert Bilder basierend auf Textprompts. Es ist ein ADD-verdichteter Multimodal Diffusion Transformer, der drei feste, vortrainierte Text-Encoder verwendet sowie QK-Normalisierung.

Lizenz

  • Community Lizenz: Kostenlos für Forschung, nicht-kommerzielle sowie kommerzielle Nutzung für Organisationen oder Einzelpersonen mit weniger als 1 Mio. $ Jahresumsatz. Details finden sich in der Community License Agreement. Weitere Informationen unter https://stability.ai/license.

  • Für Einzelpersonen und Organisationen mit Jahresumsatz über 1 Mio. $: Bitte kontaktieren Sie uns, um eine Enterprise-Lizenz zu erhalten.

Modellquellen

Für lokale oder selbstgehostete Nutzung empfehlen wir ComfyUI für eine node-basierte UI-Inferenz, oder diffusers bzw. GitHub für programmatische Nutzung.

Implementierungsdetails

  • QK-Normalisierung: Implementiert die QK-Normalisierungstechnik zur Verbesserung der Trainingsstabilität.

  • Adversarial Diffusion Distillation (ADD) (siehe den technischen Bericht), welches Sampling mit 4 Schritten bei hoher Bildqualität ermöglicht.

  • Textencoder:

  • Trainingsdaten und Strategie:

    Dieses Modell wurde mit einer großen Vielfalt an Daten trainiert, einschließlich synthetischer Daten und gefilterter öffentlich verfügbarer Daten.

Für weitere technische Details der ursprünglichen MMDiT-Architektur verweisen wir auf das Research Paper.

Zurück
Pikuson | Shiiro's Styles - v1.0
Weiter
Dragonhead - v1.0

Modell-Details

Modelltyp

Checkpoint

Basismodell

SD 3.5 Large Turbo

Modellversion

Large Turbo

Modell-Hash

fb64610bf8

Ersteller

Diskussion

Bitte log in um einen Kommentar zu hinterlassen.

Bilder von Stable Diffusion 3.5 Large Turbo - Large Turbo

Seitenprofil einer abstrakten schönen Frau mit zartem Make-up und traditionellen Haarornamenten, vor einer nächtlichen Stadtlandschaft mit Bergen und großem Mond.
Abstrakte Illustration einer Frau mit auffälligen roten Haaren und Sommersprossen, die dunkle Kleidung trägt, vor einem detaillierten Nachthimmel mit Sternen und himmlischen Mustern.

Bilder mit Basismodell

Fotorealistische Szene untoter Charaktere, darunter Zombies und Skelette, die durch einen unheimlichen Friedhof gehen, beleuchtet von leuchtenden Jack-O'-Lanterns unter einem dunklen, bedrohlichen Himmel.

Bilder mit stability ai

Anime-Stil blondes Mädchen trägt ein weißes Sommerkleid und einen großen Sonnenhut mit Sonnenblumendekoration, steht glücklich in einem Sonnenblumenfeld bei Sonnenuntergang mit erhobenen Armen.
Ffixgarnet-Charakter mit langem schwarzen Haar und braunen Augen, trägt einen orangen, gekreuzt geschnürten Bodysuit mit weißen, bauschigen Ärmeln und roten Handschuhen, klettert eine hölzerne Seilleiter vor blauem Himmel, errötet und schaut zurück
Anime-Charakter mit pinkem Haar und feurigen Flügeln, der in einer dynamischen Pose hockt vor einem lila und dunklen Fantasie-Hintergrund mit scharfen, zerklüfteten Felsen.
Nahansicht mehrerer schwarzer, strukturierter Kugeln, die vor einem dunklen kosmischen Hintergrund mit bunten, traumhaften Bokeh-Lichtern schweben.
Eine Nahaufnahme eines Cyborgs mit mattschwarzem, gesichtslosen Helm, langem schwarzen Haar und aufwendig gestalteter rot-schwarzer Rüstung, die in einer dunklen Stimmung schwach rot leuchtet.
Krieger-Magd mit grünen Zwillingszöpfen, die eine Stangenwaffe mit Kreissäge in einer schwach beleuchteten Roboterfabrik mit mechanischen Teilen und Kabeln schwingt, Blutspritzer auf dem Boden.