Photographie en gros plan noir et blanc d'une colonne vertébrale mécanique chromée centrée sur les engrenages avec faible profondeur de champ et arrière-plan flou.
Photographie en gros plan d'un sol forestier couvert de feuilles d'automne avec une grande feuille d'érable jaune au centre, montrant des gouttes d'eau, entourée de petites feuilles brunes et rouges avec des aiguilles de pin et des brindilles en arrière-plan.
Silhouette sous-marine d'un plongeur en combinaison noire et palmes, flottant verticalement avec la lumière du soleil filtrant à travers l'eau au-dessus.
Gros plan d'un masque oni féroce à peau blanche fissurée, cornes noires pointues, et sourire menaçant entouré de longs cheveux blancs ondulants et de pétales de fleurs de cerisier roses douces.
Une silhouette mystérieuse se tenant dans une forêt ensoleillée, couverte d'un tissu brun foncé en lambeaux recouvert de mousse orné de petites fleurs blanches, entourée de fleurs jaunes brillantes dans une lumière douce et chaude.
Image en noir et blanc d'une femme assise sous la pluie avec des cheveux mouillés, en contre-jour par une lumière vive qui crée des ombres dramatiques et des reflets sur son visage et ses vêtements texturés.
Une figure humanoïde mécanique avec un crâne cybernétique rouillé présentant des engrenages exposés, se tenant dans un environnement industriel post-apocalyptique désolé avec des cheminées et un air pollué.

Paramètres recommandés

samplers

DPM++ 2M_sgm_uniform

steps

20

cfg

3.5

clip skip

1

vae

ae_flux.safetensors

other models

Chroma_Flux1_S_Base\Chroma1-HD.safetensors (d446d9695d)

Conseils

Gardez la puissance du LoRA basse (autour de 0,7) pour les images liées aux humains ou aux animaux afin d’éviter les problèmes d’anatomie.

Fusionner de plus petits lots LoRA en un seul checkpoint permet un entraînement plus rapide et un jugement plus facile de la convergence.

Chroma seul est capable, mais combiné avec ce modèle, il équilibre les erreurs courantes lors de l’entraînement.

Points forts de la version

Approche différente et plus d’images.

V2.0

Une approche légèrement différente. Fusion de plus petits lots LoRA dans le checkpoint puis extraction d'un LoRA à partir de celui-ci. Bien plus facile à gérer, car avec autant d’images et de thèmes différents, la convergence prend trop de temps. Avec moins d’images, c’est plus rapide et plus simple de déterminer quand l’entraînement est suffisant.

Très satisfait du résultat. Cela adoucit les images qui, dans certains cas, semblent encore trop artificielles ou où l’on dirait qu’un personnage a été photoshopé.

Je recommande de garder la puissance basse (autour de 0,7 environ) pour tout ce qui concerne les humains ou les animaux, car cela peut perturber l’anatomie, et Chroma est suffisamment performant pour gérer le reste.


Même si Chroma est capable de produire ce type de résultats tout seul, il a fallu équilibrer les erreurs que j'entraîne habituellement et pour combiner les LoRA entre eux. Ce n’est pas terminé, mais je continuerai probablement à l’entraîner intermédiairement jusqu’à convergence, ce qui selon mes calculs prendra environ 5 millions d’années, à peu près.

Fonctionne un peu avec les modèles Flux normaux mais avec une influence réduite, du moins dans Comfy, sans garantie pour votre configuration et version personnelle.

Entraîné sur la version HD rev 0.1

Et toujours pas de catégorie pour Chroma...

Précédent
Abstraction Numérique par ChronoKnight - [FLUX] - v1.0
Suivant
Qwen-Image - Qwen_Image_fp8_e4m3fn

Détails du modèle

Type de modèle

LORA

Modèle de base

Chroma

Version du modèle

v2.0

Hash du modèle

27a0117d8c

Discussion

Veuillez vous log in pour laisser un commentaire.