Chroma - v.35
Verwandte Schlüsselwörter & Tags
Empfohlene Prompts
Extreme close-up photograph of a single tiger eye, direct frontal view. The iris is very detailed and the pupil resembling a dark void. The word "Chroma V.35 now with less steps" is across the lower portion of the image in large white stylized letters, with brush strokes resembling those made with Japanese calligraphy. Each strand of the thick fur is highly detailed and distinguishable. Natural lighting to capture authentic eye shine and depth.
Empfohlene Negative Prompts
low quality, ugly, unfinished, out of focus
Empfohlene Parameter
samplers
steps
cfg
resolution
Ersteller-Sponsoren

Hallo zusammen,
Vor einiger Zeit habe ich über Chroma, mein in Arbeit befindliches Open-Source-Grundmodell, berichtet. Ich habe großartiges Feedback erhalten und freue mich, ankündigen zu können, dass das Basismodelltraining endlich abgeschlossen ist und die gesamte Modellfamilie jetzt für euch bereitsteht!
Eine kurze Erinnerung an das Versprechen: Dies sind echte Basismodelle.
Ich habe keine ästhetische Feinabstimmung oder Nachtrainingstechniken wie DPO verwendet. Sie sind roh, leistungsstark und als perfekter, neutraler Ausgangspunkt für euer Feintuning konzipiert. Wir haben die schwere Arbeit übernommen, damit ihr es nicht tun müsst.
Und wenn ich schwere Arbeit sage, meine ich etwa 105.000 H100 Stunden Rechenzeit. Diese gesamte GPU-Zeit wurde investiert, um diese Modelle mit einer riesigen Datenverteilung zu trainieren, was das Feintuning auf ihnen zum Kinderspiel machen sollte.
Wie versprochen, sind alle Modelle vollständig unter Apache 2.0 lizenziert – keine Einschränkungen.
Kurzfassung:
Release-Branch:
Chroma1-Base: Dies ist das Kernmodell mit 512x512 Auflösung. Es ist eine solide, vielseitige Grundlage für praktisch jedes kreative Projekt. Wenn ihr plant, es länger zu feintunen und am Ende der Trainings-Epochen nur hochauflösend trainieren wollt, um schnellere Konvergenz zu erreichen, ist dies das Modell für euch.
Chroma1-HD: Dies ist das hochauflösende Feintuning des Chroma1-Base mit 1024x1024 Auflösung. Wenn ihr schnell feintunen oder LoRA für hochauflösende Bilder verwenden wollt, ist dies der Startpunkt.
Research Branch:
Chroma1-Flash: Eine feingetunte Version des Chroma1-Base, entwickelt, um den besten Weg für schnellere Flow-Matching-Modelle zu finden. Dies ist technisch ein experimentelles Ergebnis, um zu ermitteln, wie man ein schnelles Modell trainiert, ohne GAN-basierte Trainingsverfahren zu nutzen. Die Delta-Gewichte können auf jede Chroma-Version angewendet werden, um die Geschwindigkeit zu erhöhen (achtet nur darauf, die Stärke entsprechend anzupassen).
Chroma1-Radiance [WIP]: Eine radikal abgestimmte Version des Chroma1-Base, bei der das Modell jetzt ein Pixelraum-Modell ist, das technisch gesehen nicht unter VAE-Komprimierungsartefakten leiden sollte.
Quantisierungsoptionen
Alternative Option: FP8-skaliert Quant (Format, das von ComfyUI verwendet wird, mit möglicher Erhöhung der Inferenzgeschwindigkeit)
Alternative Option: GGUF quantisiert (Du musst den ComfyUI-GGUF Custom Node installieren)
Besonderer Dank
Ein riesiges Dankeschön an die Unterstützer, die dieses Projekt ermöglichen.
Anonymen Spender, dessen unglaubliche Großzügigkeit das Pretraining und die Datensammlung finanziert hat. Eure Unterstützung war transformativ für die Open-Source-KI.
Fictional.ai für ihre fantastische Unterstützung und dafür, die Grenzen der Open-Source-KI voranzutreiben.
Unterstütze dieses Projekt!
https://ko-fi.com/lodestonerock/
BTC Adresse: bc1qahn97gm03csxeqs7f4avdwecahdj4mcp9dytnj
ETH Adresse: 0x679C0C419E949d8f3515a255cE675A1c4D92A3d7
Mein Discord: discord.gg/SQVcWVbqKx
Modell-Details
Diskussion
Bitte log in um einen Kommentar zu hinterlassen.


