LEOSAMs HelloWorld XL - HelloWorld XL 60
Verwandte Schlüsselwörter & Tags
Hervorgehobene Bilder
Empfohlene Prompts
conceptual art featuring a human hand wrapped in red and beige ribbons, isolated against a plain, light background, realistic style, minimalist color scheme, smooth textures, elongated and surreal aesthetic
film grain texture
analog photography aesthetic
Empfohlene Negative Prompts
bad hand,bad anatomy,worst quality,ai generated images,low quality,average quality,jpeg artifacts,blurry,poorly drawn,ugly
low quality,jpeg artifacts,blurry,poorly drawn,ugly,worst quality
Empfohlene Parameter
samplers
steps
cfg
resolution
other models
Empfohlene Hires (Hochauflösungs-) Parameter
upscaler
upscale
steps
denoising strength
Tipps
Verwenden Sie ADetailer zur Korrektur entfernter Gesichter.
Verwenden Sie einfache natürliche Sprache bei Prompts für bessere KI-realistische Fotos.
Hochwertige Porträts können mit ADetailer und 1,5x Hires-Fix bei einer Stärke von 0,3 verbessert werden.
Versions-Highlights
HelloWorld 6.0 Update - April 20, 2024
Thank you for your patience. I have been job hunting recently, which caused some delays in the HelloWorld updates. Here are the main updates in version 6.0:
HelloWorld 6.0 is an iterative improvement based on version 5.0. Based on my own testing, the realism effect is not significantly different from version 5.0. The main advantage of version 6.0 lies in its broader coverage of concepts in the training set. According to feedback, enhancements have been made in various themes including surrealism, boudoir, group photos, masks, origami, 3D renders, cars, dragons, and maternity photography. Some examples are provided in the illustrations.
HelloWorld 6.0 intentionally includes some low-quality images in the training to enhance the model's response to negative prompts. It is recommended to use the following terms in negative prompts: "low quality, jpeg artifacts, blurry, poorly drawn, ugly, worst quality".
The main body of the HelloWorld 6.0 training set employs GPT4v tagging. For images that GPT4v cannot tag, cogVQA guided by blip2-opt-6.7b is used for tagging. The tagging language style of these multimodal models differs significantly from the traditional WD1.4 tagger. To facilitate more accurate triggering of different concepts in the training set, I have compiled the top 250 high-frequency tagging words from the HelloWorld 6.0 training set. You can view these high-frequency words in this document.
Finally, although SD3 is about to be released, I will still update to HelloWorld XL 7.0, hoping to achieve greater enhancements in version 7.0!
Ersteller-Sponsoren
🖥️Willkommen zum Ausprobieren des Open-Source-Tools GPT4V-Image-Captioner, entwickelt von meinem Freund und mir. Es bietet eine Ein-Klick-Installation und ist integriert mit mehreren Funktionen, darunter Bildvor-Komprimierung, Bild-Tagging und Tag-Statistiken. Kürzlich haben wir auch eine WebUI-Plugin-Version dieses Tools veröffentlicht, die jeder gerne nutzen darf!
🌍Willkommen im QQ-Gruppe '兔狲·AIGC梦工北厂', Gruppen-ID: 780132897 ; '兔狲·AIGC梦工南厂', Gruppen-ID: 835297318 (Beitrittsantwort: 兔狲). Telegram-Chat “兔狲的SDXL百老汇”, Link:https://t.me/+KkflmfLTAdwzMzI1
🖥️Willkommen zum Ausprobieren des Open-Source-Tools GPT4V-Image-Captioner, entwickelt von meinem Freund und mir. Es bietet eine Ein-Klick-Installation und ist integriert mit mehreren Funktionen, darunter Bildvor-Komprimierung, Bild-Tagging und Tag-Statistiken. Kürzlich haben wir auch eine WebUI-Plugin-Version dieses Tools veröffentlicht, die jeder gerne nutzen darf!
🌍Willkommen im QQ-Gruppe „兔狲·AIGC梦工北厂“, Gruppen-ID: 780132897; „兔狲·AIGC梦工南厂“, Gruppen-ID: 835297318 (Beitrittsantwort: 兔狲). Telegram-Chat „兔狲的SDXL百老汇“, Link: https://t.me/+KkflmfLTAdwzMzI1
📖HelloWorld 7.0 Update – 13. Juni 2024
Kurzfassung des Updates: HelloWorld 7.0 ist eine iterativ optimierte Version mit der besten Körperperformance der gesamten Serie sowie weiter verbessertem Konzeptumfang und Detailreichtum.
Details zum Update:
Durch Hinzufügen negativer Trainingsbilder, Verstärkung des Posentrainings und Optimierung des Clip-Modells wurde die Genauigkeit von Gliedmaßen und Händen im Vergleich zu früheren Versionen verbessert. Empfohlene negative Prompt-Wörter sind: „bad hand, bad anatomy, worst quality, ai generated images, low quality, average quality“.
Das fein abgestimmte LoRA wurde aus dem offiziellen SPO-Modell extrahiert und in HelloWorld 7.0 integriert. SPO ist eine Weiterentwicklung der DPO-Methode. Das SPO-Basismodell liefert bessere Leistung als das DPO XL-Basismodell und das ursprüngliche SDXL-Basismodell. Das SPO-LoRA verbessert Bilddetails & Kontrast und verschönert Bilder. Danke an das technische Team hinter SPO.
Der Konzeptumfang des Trainingssets wurde weiterhin erweitert, aber das Trainingsset wurde optimiert und gestrafft (ein großes Trainingsset fein zu justieren ist sehr kostenintensiv, und das H800 ist derzeit schwer mietbar, daher keine Möglichkeit für lokales Training innerhalb kurzer Zeit). Das aktuelle Gesamtdaten-Set umfasst 20.821 Bilder. Die Auflösungsverteilung des Trainingssets ist wie folgt, empfohlen wird die Verwendung mehrerer Auflösungen mit hoher Bildanzahl für den Output:
(832, 1248) - Anzahl: 7128 (896, 1152) - Anzahl: 6250 (1248, 832) - Anzahl: 2402 (1024, 1024) - Anzahl: 1639 (1360, 768) - Anzahl: 928 (1152, 896) - Anzahl: 870 (768, 1360) - Anzahl: 432 (960, 1088) - Anzahl: 506 (992, 1056) - Anzahl: 162 (1088, 960) - Anzahl: 140 (704, 1472) - Anzahl: 120 (1056, 992) - Anzahl: 122 (1472, 704) - Anzahl: 115 (1632, 640) - Anzahl: 75 (640, 1632) - Anzahl: 12
Alle Datensätze wurden mit GPT4O neu etikettiert. Diesmal wurde eine strukturierte Labeling-Methode verwendet, mit folgender Struktur: „Ein-Satz-Zusammenfassung + mehrere Bildelement-Tags + inspiriert von XXX + Wörter zur Beschreibung der ästhetischen Qualität“, wobei die ästhetische Qualität in fünf Stufen unterteilt ist: worst quality, low quality, average quality, best quality, masterpiece. Ein typisches Etikettierungsbeispiel lautet:
konzeptuelle Kunst mit einer menschlichen Hand, die in rote und beige Bänder eingewickelt ist, isoliert vor einem einfachen, hellen Hintergrund, realistischer Stil, minimalistisches Farbschema, glatte Texturen, verlängert und surrealästhetisch, inspiriert von Salvador Dalís surrealistischen Werken, Meisterwerk
Die „High-Frequency Tagging Word List“ und die „High-Frequency Art Style List“, die beim Inspired by XXX für die HelloWorld 7.0 Version verwendet werden, stehen nur kommerziellen Lizenznutzern zur Verfügung. Partner, die in der Vergangenheit eine Helloworld XL Serien-Modellautorisierung erworben haben, wenden sich bitte bei Auslassungen an mich, um diese kostenfrei zu erhalten.
Spieler können sich an der High-Frequency Tagging Word List von HelloWorld 6.0 orientieren. Außerdem habe ich über 150 hochwertige HelloWorld 7.0 Beispielbilder in der Galerie bereitgestellt, die als Referenz für die Ausgaben dienen können. Modellbau ist nicht einfach, danke Euch für Verständnis und Nachsicht!
📖HelloWorld 6.0 Update – 20. April 2024
LEOSAM HelloWorld 6.0 Top 250 High-Frequency Tagging Word List
Danke für eure Geduld. Ich war in letzter Zeit auf Jobsuche, was zu Verzögerungen bei den HelloWorld-Updates führte. Hier sind die Hauptupdates der Version 6.0:
HelloWorld 6.0 ist eine iterative Verbesserung basierend auf Version 5.0. Nach meinen Tests unterscheidet sich der Realismus-Effekt nicht wesentlich von Version 5.0. Der Hauptvorteil von Version 6.0 liegt in der breiteren Abdeckung von Konzepten im Trainingsset. Gemäß Rückmeldungen wurden verschiedene Themenbereiche wie Surrealismus, Boudoir, Gruppenfotos, Masken, Origami, 3D-Renderings, Autos, Drachen und Schwangerschaftsfotografie verbessert. Einige Beispiele befinden sich in den Illustrationen.
HelloWorld 6.0 beinhaltet absichtlich einige minderwertige Bilder im Training, um die Reaktion des Modells auf negative Prompts zu verbessern. Empfohlene Begriffe für negative Prompts sind: „low quality, jpeg artifacts, blurry, poorly drawn, ugly, worst quality“.
Der Hauptteil des HelloWorld 6.0 Trainingssets nutzt GPT4v-Tagging. Für Bilder, die GPT4v nicht taggen kann, wird cogVQA geführt von blip2-opt-6.7b verwendet. Der Tagging-Stil dieser multimodalen Modelle unterscheidet sich stark vom traditionellen WD1.4-Tagger. Um eine genauere Erfassung verschiedener Konzepte im Trainingsset zu ermöglichen, habe ich die Top 250 der häufigsten Tagging-Wörter des HelloWorld 6.0 Trainingssets zusammengestellt. Diese Hochfrequenz-Wörter können in diesem Dokument eingesehen werden.
Zum Schluss, obwohl SD3 kurz vor der Veröffentlichung steht, werde ich dennoch auf HelloWorld XL 7.0 updaten, in der Hoffnung, weitere Verbesserungen in Version 7.0 zu erreichen!
Modell-Details
Modelltyp
Basismodell
Modellversion
Modell-Hash
Ersteller
Diskussion
Bitte log in um einen Kommentar zu hinterlassen.