Cyborg-Göttin, die bei Sonnenuntergang auf der OberflÀche eines kleinen Planeten geht und eine neon-transparente Plastiktasche mit einer kosmischen, blauen WolkenatmosphÀre im Hintergrund trÀgt
Gekapuzente Beduinenprinzessin mit blondem Haar hÀlt eine leuchtende, durchscheinende Pokeball-Kugel in einer sonnenbeschienenen Wiese bei Sonnenuntergang, umgeben von goldenem Licht und atmosphÀrischem Dunst.
Eine vermummte, gesichtslose Ritterin in detaillierter mittelalterlicher RĂŒstung steht in einer nebligen grauen Wiese und hĂ€lt eine leuchtende rot-weiße Kugel, im Hintergrund ein alter Steingrundbrunnen und felsige HĂŒgel.
Nahaufnahme eines fotorealistischen PortrÀts einer lÀchelnden Frau mit Haaren, die ihre Augen bedecken, mit filmischer Beleuchtung, weichen Schatten und atmosphÀrischem Dunst.
PortrĂ€t einer jungen Frau, die in einem See steht und ein hellblaues Rollkragenkleid mit Schlitzdetail trĂ€gt, weiches natĂŒrliches Licht und unscharfer Hintergrund mit Wasser und BĂ€umen.

Empfohlene Prompts

studio light,sharp focus,high-end fashion photoshoot,product introduction photo,popular Korean makeup,aegyo sal,Sharp High-Quality Photo,medium format photo,Mamiya photography,analog film,Medium Portrait with Soft Light,real-life image,refined editorial photograph,raw photo,real photo,Scanned Photo,film still,film grain texture,analog photography aesthetic

Empfohlene Negative Prompts

bad hand,bad anatomy,worst quality,ai generated images,low quality,average quality,jpeg artifacts,blurry,poorly drawn,ugly

(worst quality, low resolution, bad hands), distorted, twisted, watermark

Empfohlene Parameter

samplers

DPM++ 2M Karras, Euler a, Restart

steps

6 - 40

cfg

1 - 10

resolution

1024x1024, 832x1248, 896x1152, 1248x832, 1360x768, 1152x896, 832x1260, 900x1200

Empfohlene Hires (Hochauflösungs-) Parameter

upscaler

ESRGAN 4x, 8x_NMKD-Faces_160000_G, ESRGAN_4x

upscale

1.5

steps

8 - 21

denoising strength

0.2 - 0.3

Tipps

FĂŒgen Sie beim Verwenden von HelloWorld 1.0 das Triggerwort 'leogirl' hinzu, um stabile Trainingseffekte auszulösen.

Nutzen Sie das 'adetailer'-Plugin, um Probleme bei entfernten PortrÀts, besonders bei Ganzkörperaufnahmen, zu korrigieren.

FĂŒr bessere Gesichtsdetaillierung bei Ganzkörperbildern fĂŒhren Sie eine 1,5-fache Hochauflösungsreparatur mit etwa 0,3 StĂ€rke durch.

Verwenden Sie natĂŒrliche Spracheingaben, um die AusgabequalitĂ€t bei SDXL-Modellen zu verbessern.

Vermeiden Sie unerwĂŒnschte warme Farbtöne durch Prompts wie 'studio light' und 'sharp focus'.

Ganzkörperbilder können breitere Szenen und weniger scharfe Gesichtsdetails bei 1024 Auflösung aufweisen; nutzen Sie Kompositions-Prompts oder adetailer zur Verbesserung.

Das Modell umfasst vielfÀltige Konzepte wie Surrealismus, Boudoir, Masken, Origami, Mechas, Tiere und Filmtexturen.

Versions-Highlights

HelloWorld 5.0 ist das umfangreichste Update in der Geschichte der HelloWorld-Serie, getaggt mit GPT-4v, und wurde in Bereichen wie Science-Fiction, Tiere, Architektur und Illustration stark feinjustiert.

Vergleichende Tests zeigen Verbesserungen in dieser Version:

1. Variablere und dynamischere Figurenposen und Bildkompositionen, die visuell ansprechende Bilder schaffen;

2. Das Film-Datenset wurde intensiv trainiert. WÀhrend der Filmtextur-Effekt von Version 2.0 bis 4.0 schwach war, vermissten viele Fans den leogirl-Stil von Version 1.0. Dieses Update stÀrkt explizit die Filmtextur ohne Verlust anderer fotografischer QualitÀten. Filmtextur kann durch Phrasen wie film grain texture und analog photography aesthetic ausgelöst werden;

3. Verbesserte Ausdruckskraft in Themen wie Science-Fiction, Thriller und Tiere, mit einem stĂ€rker designten GefĂŒhl bei Mechas und anderen Motiven. Tiere wie Pallas-Katze, Schneeleopard, Roter Panda, Großer Panda, Tiger und Hauskatzen sowie -hunde wirken lebensechter;

4. Dank GPT-Tagging sind Prompt-Treue und Konzeptgenauigkeit weiter verbessert.

Nachteile dieser Version:

1. Als umfassendes Feinjustierungs-Update kann die Fehlerquote bei Gliedmaßen leicht steigen – ein ĂŒbliches PhĂ€nomen beim Verlassen bekannter Optimierungsbereiche. FrĂŒhere Versionen hatten intensive Gliedmaßentests fĂŒr Verbesserungen, in der neuen Version war weniger Zeit fĂŒr solche Verbesserungen. Trotzdem ist die Genauigkeit der Gliedmaßen mindestens höher als in Version 1.0, und zukĂŒnftige Updates werden weitere Verbesserungen bringen.

2. Aufgrund der verstÀrkten Filmtextur kann es trotz prÀzisem GPT-Tagging zu einem unvermeidbaren warmen Farbton in Bildern kommen. Mit Prompts wie studio light oder sharp focus lassen sich aber hochauflösende Studiofotos erzeugen. Durch geschickte Prompt-Nutzung sind Hauttöne und optische Wirkung oft besser als in vorherigen Versionen.

3. Diese Version enthÀlt mehr Ganzkörper-Charakterbilder zur VerstÀrkung des Ganzkörper-Effekts, wodurch das Modell unter UmstÀnden breitere Szenen erzeugt, wenn keine spezifische Charakterkomposition vorgegeben wird. Gesichtsdetails in 1024er Auflösung sind bei Ganzkörperaufnahmen eventuell weniger scharf als bei Halb- oder Nahaufnahmen. Dieses Problem lÀsst sich mit adetailer und 1.5x Hires bei 0.3 IntensitÀt oder durch Kompositions-Prompts zur Vermeidung von Ganzkörperbildern verbessern.

4. Da einige hochwertige IllustrationsdatensĂ€tze hinzugefĂŒgt wurden, kann es sein, dass sich animierte Stile durch Prompts erkennen und animierte Bilder erzeugt werden. Wer das vermeiden will, sollte Prompt-Anpassungen vornehmen.

Dies sind die wichtigsten Neuerungen dieser Version. Das Training großer SDXL-Modelle ist anspruchsvoll, und bei Trainingssets mit annĂ€hernd zehntausend Bildern liegen die Kosten fĂŒr Tagging und Training pro Modell ĂŒber 300 USD. Ich lade alle ein, das Modell zu nutzen, und freue mich ĂŒber jegliches Feedback! Wenn euch das Modell gefĂ€llt, wĂ€re ich sehr dankbar, wenn ihr es weiterempfehlt.

Ersteller-Sponsoren

đŸ–„ïžProbieren Sie das Open-Source-Tool GPT4V-Image-Captioner mit Ein-Klick-Installation und Funktionen wie Bildvor-Kompression und Tagging.

Verwenden Sie die WebUI-Plugin-Version fĂŒr einfache Integration.

đŸ–„ïžWillkommen zum Ausprobieren des Open-Source-Tools GPT4V-Image-Captioner, entwickelt von meinem Freund und mir. Es bietet eine Ein-Klick-Installation und ist mit mehreren Features ausgestattet, darunter Bildvor-Kompression, Bild-Tagging und Tag-Statistiken. KĂŒrzlich haben wir auch die WebUI-Plugin-Version dieses Werkzeugs veröffentlicht, die fĂŒr alle zur Nutzung offensteht!

🌍Willkommen zum Beitritt der QQ-Gruppen „慔ç‹Č·AIGCæąŠć·„ćŒ—ćŽ‚â€œ mit der Nummer: 780132897 und „慔ç‹Č·AIGCæąŠć·„ć—ćŽ‚â€œ mit der Nummer: 835297318 (Zugangscode: 慔ç‹Č). Telegram-Chat „慔ç‹Č的SDXL癟老汇“ mit Link: https://t.me/+KkflmfLTAdwzMzI1

📖HelloWorld 7.0 Update - 13. Juni 2024

Update-Zusammenfassung in einem Satz: HelloWorld 7.0 ist eine iterativ optimierte Version mit der besten Körper-Performance der gesamten Serie und weiter verbesserter Konzeptabdeckung sowie Detailvielfalt.

Update-Details:

  1. Durch HinzufĂŒgen von negativen Trainingsbildern, VerstĂ€rkung des Posen-Trainings und Optimierung des Clip-Modells wurde die Genauigkeit von Gliedmaßen und HĂ€nden im Vergleich zu frĂŒheren Versionen verbessert. Empfohlenes negatives Prompt sind: „bad hand, bad anatomy, worst quality, ai generated images, low quality, average quality“.

  2. Die feinjustierte LoRA wurde vom offiziellen SPO-Modell extrahiert und in HelloWorld 7.0 integriert. SPO baut auf der DPO-Methode auf und das SPO Basismodell bietet im Vergleich zum DPO XL- und SDXL-Basismodell bessere Leistungen. SPO LoRA verbessert Bilddetails, Kontrast und verschönert Bilder. Dank an das technische Team von SPO.

  3. Der Konzeptumfang des Trainingssets wurde weiter ausgebaut, wobei das Trainingsset optimiert und gestrafft wurde (große Trainingssets sind sehr teuer, und H800 ist schwer zu mieten – lokale Trainingszeiten sind begrenzt). Das Trainingsset umfasst aktuell 20.821 Bilder mit folgender Auflösungsverteilung. Es wird empfohlen, mehrere Auflösungen mit höherer Bildanzahl fĂŒr die Ausgabe zu verwenden:

    (832, 1248) - Anzahl: 7128
    (896, 1152) - Anzahl: 6250
    (1248, 832) - Anzahl: 2402
    (1024, 1024) - Anzahl: 1639
    (1360, 768) - Anzahl: 928
    (1152, 896) - Anzahl: 870
    (768, 1360) - Anzahl: 432
    (960, 1088) - Anzahl: 506
    (992, 1056) - Anzahl: 162
    (1088, 960) - Anzahl: 140
    (704, 1472) - Anzahl: 120
    (1056, 992) - Anzahl: 122
    (1472, 704) - Anzahl: 115
    (1632, 640) - Anzahl: 75
    (640, 1632) - Anzahl: 12
  4. FĂŒr alle DatensĂ€tze wurde GPT4O fĂŒr ein erneutes Labeling verwendet. Diesmal wurde eine strukturierte Labeling-Methode angewandt, bestehend aus: „Ein-Satz-Zusammenfassung + mehrere Bildelement-Tags + inspiriert von XXX + Ă€sthetische QualitĂ€tsbeschreibung“, wobei die Ă€sthetische QualitĂ€tsbeschreibung fĂŒnf Stufen umfasst: schlechteste QualitĂ€t, niedrige QualitĂ€t, durchschnittliche QualitĂ€t, beste QualitĂ€t und Meisterwerk. Ein typisches Beispiel:

    konzeptionelle Kunst mit einer menschlichen Hand, die in rote und beige BÀnder gewickelt ist, isoliert vor einfachem, hellem Hintergrund, realistischer Stil, minimalistisches Farbschema, glatte Texturen, verlÀngert und surreal, inspiriert von den surrealistischen Werken Salvador Dalís, Meisterwerk

Die „HĂ€ufig getaggten Wörter“ und „HĂ€ufige Kunststil-Listen“ zum "inspiriert von XXX" fĂŒr HelloWorld 7.0 werden ausschließlich an Nutzer mit kommerzieller Lizenz vergeben. Partner, die eine HelloWorld XL-Model-Autorisierung erworben haben, wenden sich bitte bei Auslassungen an mich, um es kostenlos zu erhalten.

Spieler können sich an der Liste der hĂ€ufigen Tagging-Wörter von HelloWorld 6.0 orientieren. Außerdem habe ich 150+ hochwertige Beispielbilder von HelloWorld 7.0 in der Galerie zur VerfĂŒgung gestellt, die als Referenz fĂŒr eure Ausgaben dienen können. Modelle zu erstellen ist nicht einfach, ich danke den Spielern fĂŒr ihr VerstĂ€ndnis und ihre Toleranz!

📖HelloWorld 6.0 Update - 20. April 2024

LEOSAM HelloWorld 6.0 Top 250 hÀufige Tagging-Wörter

Vielen Dank fĂŒr eure Geduld. Ich war in letzter Zeit auf Jobsuche, was einige Verzögerungen bei den HelloWorld-Updates verursachte. Die wichtigsten Neuerungen in Version 6.0 sind:

  • HelloWorld 6.0 ist eine iterative Verbesserung auf Basis von Version 5.0. Nach meinen Tests unterscheidet sich der Realismus-Effekt nicht signifikant von Version 5.0. Der Hauptvorteil von Version 6.0 liegt in der grĂ¶ĂŸeren Abdeckung von Konzepten im Trainingsset. Laut Feedback wurden diverse Themen verbessert, darunter Surrealismus, Boudoir, Gruppenfotos, Masken, Origami, 3D-Renderings, Autos, Drachen und Schwangerschaftsfotografie. Einige Beispiele sind in den Illustrationen zu sehen.

  • HelloWorld 6.0 enthĂ€lt bewusst einige minderwertige Bilder im Training, um die Reaktion des Modells auf negative Prompts zu verbessern. Es wird empfohlen, folgende Begriffe in negativen Prompts zu verwenden: „low quality, jpeg artifacts, blurry, poorly drawn, ugly, worst quality“.

  • Das Haupttraining von HelloWorld 6.0 verwendet GPT4v-Tagging. FĂŒr Bilder, die GPT4v nicht taggen kann, wird cogVQA unter Anleitung von blip2-opt-6.7b fĂŒr die tag-Verteilung eingesetzt. Der Tagging-Stil dieser multimodalen Modelle unterscheidet sich stark von herkömmlichen WD1.4-Taggern. Um Konzepte im Trainingsset genauer anzusprechen, habe ich die Top 250 hĂ€ufigen Tagging-Wörter des HelloWorld 6.0 Trainingssets gesammelt. Ihr könnt diese Liste in diesem Dokument ansehen.

Obwohl SD3 bald erscheint, werde ich weiterhin HelloWorld XL 7.0 aktualisieren und hoffe auf grĂ¶ĂŸere Verbesserungen in Version 7.0!

📖2024.2.22 Vorstellung von "HW5.0_Euler_a_Lightning"

Dieses Modell ist eine beschleunigte Version des HelloWorld SDXL Basismodells und integriert Technologien von SDXL-Lightning. Ausgestattet mit dem Euler a Sampler und CFG 1 kann es Bilder in 6-8 Schritten erzeugen, was dreimal schneller als die ursprĂŒngliche SDXL-Version ist. Außerdem sind diese Bildergebnisse besser als die von LCM oder Turbo-Versionen.

Empfohlene Parameter zur Bildgenerierung mit diesem Modell:

Sampler: Euler a (Wichtig! Das Modell ist speziell fĂŒr Euler a angepasst, andere Sampler können schlechtere Ergebnisse liefern)

CFG-Skala: 1

Sampling-Schritte: 8 Schritte (6-8 Schritte sind akzeptabel)

Hires-Algorithmus: ESRGAN 4x / 8x_NMKD-Faces_160000_G

Hires-Aufskalierungsfaktor: 1.5x

Hires-Schritte: 8 Schritte

Hires RauschunterdrĂŒckungsstĂ€rke: 0.3

📖2024.2.11 Vorstellung von "HelloWorld 5.0 GPT4V"

HelloWorld 5.0 ist das umfangreichste Update in der Geschichte der HelloWorld-Serie, getaggt mit GPT-4v, und wurde in Bereichen wie Science-Fiction, Tiere, Architektur und Illustration stark feinjustiert.

Vergleichende Tests zeigen Verbesserungen in dieser Version:

1. Variablere und dynamischere Figurenposen und Bildkompositionen, die visuell ansprechende Bilder schaffen;

2. Das Film-Datenset wurde intensiv trainiert. WÀhrend der Filmtextur-Effekt von Version 2.0 bis 4.0 schwach war, vermissten viele Fans den leogirl-Stil von Version 1.0. Dieses Update stÀrkt explizit die Filmtextur ohne Verlust anderer fotografischer QualitÀten. Filmtextur kann durch Phrasen wie film grain texture und analog photography aesthetic ausgelöst werden;

3. Verbesserte Ausdruckskraft in Themen wie Science-Fiction, Thriller und Tiere, mit einem stĂ€rker designten GefĂŒhl bei Mechas und anderen Motiven. Tiere wie Pallas-Katze, Schneeleopard, Roter Panda, Großer Panda, Tiger und Hauskatzen sowie -hunde wirken lebensechter;

4. Dank GPT-Tagging sind Prompt-Treue und Konzeptgenauigkeit weiter verbessert.

Nachteile dieser Version:

1. Als umfassendes Feinjustierungs-Update kann die Fehlerquote bei Gliedmaßen leicht steigen – ein ĂŒbliches PhĂ€nomen beim Verlassen bekannter Optimierungsbereiche. FrĂŒhere Versionen hatten intensive Gliedmaßentests fĂŒr Verbesserungen, in der neuen Version war weniger Zeit fĂŒr solche Verbesserungen. Trotzdem ist die Genauigkeit der Gliedmaßen mindestens höher als in Version 1.0, und zukĂŒnftige Updates werden weitere Verbesserungen bringen.

2. Aufgrund der verstÀrkten Filmtextur kann es trotz prÀzisem GPT-Tagging zu einem unvermeidbaren warmen Farbton in Bildern kommen. Mit Prompts wie studio light oder sharp focus lassen sich aber hochauflösende Studiofotos erzeugen. Durch geschickte Prompt-Nutzung sind Hauttöne und optische Wirkung oft besser als in vorherigen Versionen.

3. Diese Version enthÀlt mehr Ganzkörper-Charakterbilder zur VerstÀrkung des Ganzkörper-Effekts, wodurch das Modell unter UmstÀnden breitere Szenen erzeugt, wenn keine spezifische Charakterkomposition vorgegeben wird. Gesichtsdetails in 1024er Auflösung sind bei Ganzkörperaufnahmen eventuell weniger scharf als bei Halb- oder Nahaufnahmen. Dieses Problem lÀsst sich mit adetailer und 1.5x Hires bei 0.3 IntensitÀt oder durch Kompositions-Prompts zur Vermeidung von Ganzkörperbildern verbessern.

4. Da einige hochwertige IllustrationsdatensĂ€tze hinzugefĂŒgt wurden, kann es sein, dass sich animierte Stile durch Prompts erkennen und animierte Bilder erzeugt werden. Wer das vermeiden will, sollte Prompt-Anpassungen vornehmen.

Dies sind die wichtigsten Neuerungen dieser Version. Das Training großer SDXL-Modelle ist anspruchsvoll, und bei Trainingssets mit annĂ€hernd zehntausend Bildern liegen die Kosten fĂŒr Tagging und Training pro Modell ĂŒber 300 USD. Ich lade alle ein, das Modell zu nutzen, und freue mich ĂŒber jegliches Feedback! Wenn euch das Modell gefĂ€llt, wĂ€re ich sehr dankbar, wenn ihr es weiterempfehlt.

📖2024.1.31 Vorstellung von "HelloWorld 4.0"

HelloWorld 4.0 ist eine progressive Übergangsversion vom Tagging mit blip+clip zum Tagging mit GPT4V. Ich habe zunĂ€chst ein reines GPT4V-Tagging-Modell trainiert und dann mit einem großen Anteil der HelloWorld 3.2 Version sowie 0,05 Anteil von Juggernaut XL (fĂŒr Hauttöne) zusammengefĂŒhrt. Die neue Version zeigt verbesserte Prompt-Treue und Konzeptabdeckung im Vergleich zu 3.2.

Das neue GPT4V-Tagging-Trainingsset hat sich von 4000 Bildern der helloworld3-Serie auf 8000 Bilder verdoppelt und umfasst nicht nur PortrĂ€ts, sondern auch Tiere, Architektur, Natur, Essen, Illustrationen usw. Die reine GPT4V-Version zeigte jedoch ein Überanpassungsproblem, das vorlĂ€ufig auf die Verdopplung der Bildzahl zurĂŒckgefĂŒhrt wird. Ein nĂ€chster Schritt der iterativen Optimierung ist, möglichst viele Nicht-PortrĂ€t-Konzepte einzubinden und gleichzeitig PortrĂ€t-Training ausreichend zu gewĂ€hrleisten. Aktuell wurde eine Mischung aus neuen und alten Versionen genutzt, um eine nahtlose VersionsĂŒbergabe sicherzustellen. Die Vorteile des erweiterten Konzeptumfangs und des GPT4V-Taggings werden erst in den nachfolgenden Generationen 5 und 6 deutlicher.

📖2024.1.5 Vorstellung von "HelloWorld 3.2"

Version 3.2 ist eine mit DPO Technologie optimierte Iteration. Im Vergleich zu Version 3.0 wurden Hauttöne und Gliedmaßen-Genauigkeit verbessert, aber die Unterschiede sind nicht groß, weshalb diese Version 3.2 und nicht 4.0 heißt.

📖2023.12.15 Vorstellung von "HelloWorld 3.0"

  1. Das Trainingsset wurde erweitert, um die FĂ€higkeit des Modells zum Ausdruck verschiedener Kunststile, darunter Science-Fiction und Kunst, zu steigern.

  2. Eine selbst entwickelte QualitĂ€tssteigerung-LoCon (erstellt mit Slider-Technologie) wurde integriert, um die BildqualitĂ€t zu verbessern und Verzerrungen bei Fingern und Gliedmaßen zu verringern.

📖2023.11.17 Vorstellung von "HelloWorld 2.0"

Vielen Dank fĂŒr eure Geduld. Nach diversen Herausforderungen ist die HelloWorld 2.0 Version endlich bereit und entspricht meinem Zufriedenheitsgrad. Die Hauptunterschiede zu 1.0 sind:

  1. HelloWorld 2.0 benötigt keine Triggerwörter mehr, und die Ergebnisse sind vergleichbar mit Version 1.0 mit Trigger. Das Triggerwort 'leogirl' in 1.0 war stark mit Ostasiaten assoziiert. Nach Wegfall der Triggerwörter generieren Begriffe wie '1girl' noch oft ostasiatische PortrĂ€ts, wenn die Ethnie nicht spezifiziert wird. Nun kann die Ethnie durch Keywords wie NationalitĂ€t, Hautfarbe usw. gezielt angegeben werden. Beispiel-Trigger fĂŒr Begriffe wie 'Chinese', 'Russian', 'Iranian', 'Jamaican', 'Kenyan', 'dark-skinned', 'pale-skinned' sind weiter unten aufgefĂŒhrt.

    Man kann auch verschiedene Charakterstile erzielen, indem man Namen von Personen verschiedener LÀnder und Geschlechter im Prompt verwendet, z.B. Han Meimei (China), Sophie Martin (Frankreich), Priya Patel (Indien), Fatima Al-Hassan (Arabien), Wanjiru Mwangi (Kenia). Diese Beispiele sind nur VorschlÀge; es gibt viele weitere Möglichkeiten, die zum Experimentieren und Teilen einladen.

  2. HelloWorld 2.0 balanciert QualitÀt und Farbgebung und bietet mehr Stiloptionen. Die 1.0-Version mit 'leogirl' erzeugte oft Bilder mit starker Filmtextur. HelloWorld 2.0 ist nicht mehr an Filmtextur gebunden und kann mit qualitÀtsbezogenen Prompts angepasst werden. Einige getestete und funktionierende Prompts sind:

    hochwertiges Fashion-Fotoshooting, Produktfoto, beliebtes koreanisches Make-up, aegyo sal, scharfes HochqualitÀtsfoto, Studio-Beleuchtung, Mittelformatsfoto, Mamiya-Fotografie, Analogfilm, mittleres PortrÀt mit weichem Licht, realitÀtsnahes Bild, editiertes Foto, rohes Foto, echtes Foto, gescanntes Foto, Filmstille

    Die Farbschemata dieser Prompts sind wie folgt:

  3. Das Trainingsset von HelloWorld 2.0 enthĂ€lt deutlich mehr Ganzkörperfotos, um die Wirkung von SDXL bei Ganzkörper- und FernportrĂ€ts zu verbessern. Trotz Verbesserungen gegenĂŒber Version 1.0 ist die Nutzung von 'adetailer' bei der Erzeugung von Ganzkörperfotos sehr zu empfehlen. FĂŒr Nutzer mit reichlich Videospeicher (24 GB) wird zudem eine 1,5-fache Hochauflösungs-Reparatur empfohlen, die Gesichtsdetaillierung deutlich verbessert.

📖2023.8.29 Vorstellung des "HelloWorld" SDXL Basismodells

Spezielle Erinnerung: Beim Verwenden des HelloWorld 1.0 Modells bitte das Triggerwort "leogirl" hinzufĂŒgen.

Im Unterschied zum SD1.5 Basismodell "MoonFilm" ist "HelloWorld" eine vollkommen neue realistische SDXL Basis-Modellserie. Um mehr Nutzern den Zugang zu HelloWorld zu ermöglichen, habe ich den originalen MoonFilm-Modell-Link beibehalten. HelloWorld kann als geistige Fortsetzung von MoonFilm auf der SDXL-Plattform verstanden werden, zielt aber darauf ab, weit mehr als nur realistischen und filmartigen PortrĂ€tqualitĂ€t zu erreichen. Dank der weitaus besseren Informations- und TextverarbeitungsfĂ€higkeit von SDXL im Vergleich zu SD1.5 ist HelloWorld ein Basismodell, das alle Dinge realistisch darstellen soll – oder anders gesagt, ich hoffe, mit HelloWorld eine virtuelle Fotografie-Welt aufzubauen.

Das realistische Basismodell fĂŒr SD1.5 ist bereits sehr ausgereift und wird kaum noch signifikante Verbesserungen erfahren. Ohne Durchbruchstechnologien fĂŒr die SD1.5-Plattform werden die Moonfilm- & MoonMix-Reihen voraussichtlich eingestellt. Meine Hauptenergie investiere ich in die Entwicklung der großen HelloWorld SDXL Modelle. Version 1.0 ist nun verfĂŒgbar, Version 2.0 ist in Entwicklung und wird voraussichtlich Anfang September veröffentlicht.

Als neues SDXL Modell unterscheidet sich HelloWorld in drei Punkten von traditionellen SD1.5 Modellen:

  1. Im Unterschied zu SD1.5 Basismodellen, die meist keine Triggerwörter nutzen, muss beim Verwenden von HelloWorld 1.0 das Triggerwort "leogirl" beachtet werden. Dies sorgt fĂŒr stabilere TrainingssĂ€tzeffekte im SDXL Modell.

  2. HelloWorld unterstĂŒtzt direkten Output in 1024*1024 Pixeln, ohne Hochskalierung. Die QualitĂ€t der NahportrĂ€ts entspricht der von SD1.5, doch bei FernportrĂ€ts gibt es noch MĂ€ngel im Output. Daher wird die Nutzung des ADetailer Plugins empfohlen, das effektiv Probleme bei entfernten Gesichtern korrigiert.

  3. SDXL ermöglicht nun einfacherere Ergebnisse mit einfachen natĂŒrlichen Spracheingaben. Es empfiehlt sich, mehr natĂŒrliche Spracheingaben zu testen, um bessere Resultate bei realistischen AI-Fotos zu erreichen.

Nach mehreren TestlÀufen sind folgende Parameter-Einstellungen empfohlen:

  • Schritte ≄ 25

  • Sampler: DPM++ 2M Karras

  • CFG-Skala: 10

  • GrĂ¶ĂŸe ≄ 1024x1024

  • ADetailer: aktiviert

Jeder ist eingeladen, HelloWorld auszuprobieren und Feedback zu geben. Eure wertvollen Meinungen sind sehr wichtig fĂŒr die nĂ€chste Modellverbesserung!

Die HelloWorld-Serie von Modellen (im Folgenden "das Modell") wurde von mir (im Folgenden "dem Besitzer") mit UnterstĂŒtzung der LiblibAI-Plattform erstellt. Eine Veröffentlichung des Modells auf Plattformen außer LiblibAI und Civitai ist ohne Erlaubnis des Besitzers nicht gestattet.

Der Besitzer gestattet die kostenlose Nutzung von durch das Modell generierten Bildern fĂŒr nicht-kommerzielle Bildungs- oder Informationszwecke unter der Bedingung, dass:

- Nutzer geltende Gesetze einhalten und keine Rechte des Modells oder Dritter verletzen.

- Als Urheber der Bilder die Bezeichnung "erstellt mit LEOSAM's HelloWorld Basismodell" klar angegeben wird.

FĂŒr jegliche kommerzielle Nutzung ist eine kommerzielle Lizenzvereinbarung mit dem Besitzer erforderlich. Anfragen zu kommerzieller Lizenzierung und Modell-Personalisierung sind ĂŒber die auf der Homepage des Besitzers verfĂŒgbaren Kontaktmöglichkeiten zu richten.

Die Entwicklung und kostenfreie Verteilung des SDXL Modells ist eine bedeutende Leistung. Der Besitzer verpflichtet sich, kostenlose Updates des HelloWorld Modells fĂŒr individuelle Enthusiasten bereitzustellen als Anerkennung fĂŒr die Community-BeitrĂ€ge zur Open-Source-Entwicklung. Kooperationen fĂŒr kommerzielle Projekte sind wesentlich fĂŒr die Weiterentwicklung und Verbesserung des Modells. Der Besitzer dankt allen Nutzern fĂŒr VerstĂ€ndnis und UnterstĂŒtzung.

Unbefugte Nutzung kann gegen geltendes Recht verstoßen und rechtliche Konsequenzen nach sich ziehen. Der Besitzer behĂ€lt sich das ausschließliche Interpretationsrecht dieser ErklĂ€rung vor, die nach geltendem Recht geregelt wird.

ZurĂŒck
Midjourney V6.1 trifft FLUX đŸ–Œïž [+ILLUSTRIOUS / SDXL] - ILLUSTRIOUS v0.5
Weiter
XL Pokemon Ball - Von HailoKnight - v1.0

Modell-Details

Modelltyp

Checkpoint

Basismodell

SDXL 1.0

Modellversion

HelloWorld XL 5.0 GPT4V

Modell-Hash

d8fd60692a

Ersteller

Diskussion

Bitte log in um einen Kommentar zu hinterlassen.