ThinkDiffusionXL - v1.0
Verwandte Schlüsselwörter & Tags
Empfohlene Parameter
samplers
steps
cfg
Tipps
Erwägen Sie den Einsatz von TDXL für Projekte, die hohe Details und Qualität erfordern, da es in diesen Bereichen herausragt.
Das Modell bietet Flexibilität bei der Bildgenerierung ohne inhärente Verzerrungen und eignet sich für jeden Stil oder jedes Motiv.
Ersteller-Sponsoren
Es ist vorinstalliert verfügbar auf ThinkDiffusion.
Hier klicken für mehr Infos zum Modell
Bitte hinterlassen Sie eine Bewertung, wenn Sie zufrieden sind. Das motiviert uns, mehr zu schaffen und das Modell weiter zu verbessern.
ThinkDiffusionXL (TDXL)
ThinkDiffusionXL ist das Ergebnis unseres Ziels, ein Modell zu entwickeln, das erstaunlichen Fotorealismus bietet und zugleich vielseitig genug ist, um hochwertige Bilder in einer Vielzahl von Stilen und Themen zu erzeugen, ohne dass man ein Prompting-Genie sein muss.
Es ist vorinstalliert verfügbar auf ThinkDiffusion.
Hier klicken für mehr Infos zum Modell
Bitte hinterlassen Sie eine Bewertung, wenn Sie zufrieden sind. Das motiviert uns, mehr zu schaffen und das Modell weiter zu verbessern.
Die Arbeit
Datenquelle: TDXL wurde mit über 10.000 vielfältigen Bildern trainiert, die Fotorealismus, digitale Kunst, Anime und mehr abdecken. Die kleinste Auflösung in unserem Datensatz beträgt 1365x2048, viele Bilder haben Auflösungen bis zu 4622x6753. Insgesamt nimmt unser Datensatz 42GB ein.
Training: Mit 1,8 Millionen Schritten haben wir umfangreiche Arbeit geleistet. Zum Vergleich: Juggernaut hat 600k Schritte, RealVisXL 348k Schritte.
Handbeschriftete Bilder: Jedes Bild wurde sorgfältig von Hand beschriftet, um die Fähigkeit des Modells zu verbessern, genaue und hochwertige Ergebnisse aus minimalen Prompts zu generieren.
NSFW-Fähigkeiten: Das Modell enthält über 1.000 geschmackvoll kuratierte NSFW-Bilder.
Unsere Einschätzungen
Detail und Qualität: Die meisten XL-Modelle der Kategorie Realistisch leiden unter mangelndem Detail, besonders im Hintergrund und bei einfachen Merkmalen wie Augen, Zähnen und Haut. Wir sind der Meinung, dass TDXL in diesen Bereichen dank seines großen, hochwertigen Datensatzes herausragt. Zum Vergleich: Juggernaut hat etwa die Hälfte des Bildmaterials, und RealVisXL nur 1.700 Bilder. Letztlich besitzt TDXL einfach viel mehr „Wissen“.
Weniger Verzerrung: Wir haben darauf geachtet, für jeden Stil, jedes Geschlecht etc. eine gleiche Anzahl Bilder zu verwenden. Andere Modelle, die wir in den letzten Monaten getestet haben, wiesen gewisse Verzerrungen auf, beispielsweise Vorlieben für Porträtaufnahmen, Geschlechter- oder Ethnizitäts-Bias. So hat Juggernaut einen Bias im Nahbereich, und Cinematic Light dominiert dieses Modell stark. RealVisXL zeigt ebenfalls eine Präferenz für Porträtaufnahmen. TDXL hingegen liefert, was Sie wünschen: Landschaft, Mittelaufnahme, Ganzkörper, Nahaufnahme, Porträt, Seitenansicht, Rückansicht, Action-Shots, Cinematic... was immer Sie wollen, ohne aufgrund einer Verzerrung in eine bestimmte Richtung gedrängt zu werden.
Vielseitige Basis: Aufgrund seines großen ausgewogenen Qualitätsdatensatzes ist TDXL vielseitig einsetzbar als Basismodell für zukünftige Trainings. Sie können neue Finetunes in ganz unterschiedliche Richtungen erstellen, LoRAs hinzufügen, um fehlende Konzepte zu ergänzen, oder weitere Trainings mit ausgewogenerem Qualitätsdatensatz durchführen.
Modell-Details
Diskussion
Bitte log in um einen Kommentar zu hinterlassen.






