Retrato de princesa indiana adornada com lehenga tradicional verde-esmeralda e dourada com bordados intrincados e joias ornamentadas, posando junto a uma janela iluminada pelo sol em um interior de palácio ricamente decorado.

Prompts Negativos Recomendados

easynegative,badhandv4,(bad quality:1.3),(worst quality:1.3),watermark,(blurry),5-funny-looking-fingers,nude,nudity,naked,NSFW,nipples

Parâmetros Recomendados

samplers

Euler a, DPM++ SDE Karras, DPM++ 2M Karras, Advanced Euler by licyk, DPM++ 2M SDE Karras

steps

45 - 50

cfg

7 - 10

clip skip

2

resolution

512x904, 512x904

vae

vae-ft-mse-840000-ema-pruned - 1.0

Parâmetros Recomendados para Alta Resolução

upscaler

R-ESRGAN 4x+, 4k-UltraSharp, 4x-UltraSharp

upscale

2

steps

20

denoising strength

0.35 - 0.45

Dicas

Ajuste cuidadosamente as intensidades das LoRas entre 0.4 e 1 para evitar dominar o checkpoint.

A prioridade do prompt é influenciada pela ordem das palavras; colocar descritores-chave primeiro melhora os resultados.

Parênteses nos prompts podem aumentar a prioridade dos termos contidos.

Mudanças sutis no prompt, incluindo pontuação, podem afetar significativamente a saída da imagem.

Para conseguir um visual cartoon, inclua termos como Anime, Cartoon, painted ou comic perto do início do prompt.

Para evitar nudez ou conteúdo NSFW, certifique-se de incluir no prompt negativo termos como nude, nudity, naked, NSFW, nipples.

Considere usar ADetailer para melhorar faces distantes, mas tenha cuidado com fundos borrados.

Se usar o WebUI Automatic1111, ativar xformers pode melhorar o desempenho; se indisponível, ajuste os argumentos da linha de comando conforme necessário.

Destaques da Versão

Quis ver se podia levar o checkpoint um pouco mais longe. Além disso, vou ter outro filho em breve... então não terei muito tempo em dezembro. Espero que gostem!! Esta versão tem um pouco mais de "3D" com uma inclinação para o realismo, mas ainda mantendo um pouco daquele aspecto cartoon. :) Acho que esta versão também se sai melhor em detalhes do fundo e ambiente. Ah, e FELIZ DIA DE AÇÃO DE GRAÇAS! (Quando for lançada)

Patrocinadores do Criador

Confira meu modelo exclusivo do Mage.Space: RealCartoon - Mage

Você também pode rodar este modelo em sinkin.ai e mage.space:

  1. www.Mage.space realmente ajuda:

    1. V11
    2. V14
    3. V15
    4. V17
  2. https://www.shakker.ai/userpage/76e974968502489794d7d7938e6dda54/publish

  3. https://sinkin.ai/m/gLv9zeq

Quer enviar algum apoio? (envie pelo Ko-fi)

Confira meu modelo exclusivo do Mage.Space: RealCartoon - Mage

Você também pode rodar este modelo em sinkin.ai e mage.space:

  1. www.Mage.space realmente ajuda:

    1. V11 - https://www.mage.space/play/d6ec9d76c61c51e88c8d7ebedfed4870

    2. V14 - https://www.mage.space/play/0d8c0275c138d22f316d6fe75ee17040

    3. V15 - https://www.mage.space/play/e4b5b5108f3d42d501c6a25b95fdb784

    4. V17 - https://www.mage.space/play/3179aa44ab27ae1b37345ebdd6f8b8de

  2. https://www.shakker.ai/userpage/76e974968502489794d7d7938e6dda54/publish

  3. https://sinkin.ai/m/gLv9zeq

Quer enviar algum apoio? (envie pelo Ko-fi)

Role para baixo para algumas recomendações de prompts

Se quiser adicionar idade a um sujeito, testei o Age Slider e ele funcionou bem: Age Slider

Também recomendo easynegative, badhandv4 no prompt negativo

A História:

RealCartoon3D foi meu primeiro modelo enviado. Eu ainda estava aprendendo essa área, mas queria criar um checkpoint para fazer o que eu desejava quando solicitado com um estilo que eu gostava. Alguns objetivos para o checkpoint (atualizados com o tempo):

  • 1. Variedade em humanos (ex: Africano, Europeu, Asiático, etc). Eu não queria que ele produzisse só a mesma aparência que via em todo lugar.

  • 2. Produzir um visual cartoon com um toque realista

  • 3. Funcionar bem com LoRAs. (porque é aqui que a customização realmente acontece)

A missão era/é tentar levar este checkpoint a um ponto onde ele funcione bem na primeira ou segunda tentativa com prompts (meu computador é só um laptop para jogos que esquenta muito quando faço coisas assim lol... já matei a bateria uma vez).

Aprendi muito no processo e até iniciei outros checkpoints (RealCartoon-Anime, Realistic, Pixar e 2.5D) para oferecer variações mais focadas. Este checkpoint é a base para todos eles e recebe atualizações deles de tempos em tempos. Este, no entanto, sempre será meu principal... mesmo que aquele PIXAR tenha um visual muito bom :P

Espero que todos aproveitem! Por favor, avaliem e compartilhem suas imagens. Muito obrigado pelo apoio com os downloads e feedback (MUITO OBRIGADO A TODOS). Nunca pensei que teria tanta atenção.

O Processo de Criação:


Os checkpoints iniciais para mescla foram alguns dos melhores durante maio de 2023 (Os checkpoints não tinham restrições para mesclas). Também incorporei o VAE (vae-ft-mse-840000-ema-pruned). Testei o ClearVAE (que gera bons resultados, mas às vezes causava falhas que talvez fossem do meu computador). Não quis que esse problema atingisse quem baixasse o modelo, então não usei o ClearVAE. Infelizmente, não tive recursos para treinar do zero; mas descobri que muita gente treinava a partir desses checkpoints principais. Com o tempo, eu procurava checkpoints com aparência, fundos legais ou resultados interessantes que ajudassem o visual geral (sempre evitando aqueles com restrições de mescla, para não prejudicar trabalhos de ninguém ou infringir licenças). Um problema constante eram as mãos, que saíam erradas (como em muitos checkpoints do SD 1.5); mas conforme fazia mais mesclas, as mãos melhoravam. Depois procurava LoRas para influenciar o visual e o estilo. Essas LoRas não dominavam o checkpoint, mas ajudavam a moldá-lo, pois eu queria que o usuário tivesse controle, que é o propósito das LoRas.

Esse checkpoint evoluiu rápido nas versões à medida que o molde foi definido. Finalmente, começou a alcançar o que eu queria nas versões 3.0, 3.1 e, claro, a 4 (com atualizações mais lentas). Ainda gosto das versões antigas; elas influenciaram os outros checkpoints RealCartoon e foram cruciais para o visual do principal.

Configurações do Prompt:

(Essas configurações são para A1111 ):

A imagem abaixo mostra as configurações principais que recomendo. Normalmente não uso VAE porque

(vae-ft-mse-840000-ema-pruned) já está incorporado.

Abaixo estão as configurações normais que uso para gerar a maioria das minhas imagens.

Alguma variação acontece conforme o resultado desejado (ex: paisagem). Também gosto de fazer retrato 512 por 904. Geralmente executo em lotes só quando verifico checkpoints ou procuro a imagem perfeita. Normalmente definido para 1.

O método de amostragem que uso principalmente é Euler a, mas DPM++ SDE Karra e DPM++ 2M Karras também funcionam bem.

Uma versão mais nova do sampler Euler (Advanced Euler por licyk) - https://github.com/licyk/advanced_euler_sampler_extension

  • Esta tem melhor desempenho em mãos

  • Geralmente gera imagens mais rápido

Upscaler é geralmente R-ESRGAN 4x+ ou 4k-UltraSharp para a maior parte das minhas imagens.

As configurações de upscale variam conforme seu computador.

Eu recomendaria usar ADetailer se o sujeito estiver distante, pois SD1.5 pode falhar em faces de pessoas distantes. Tenha cuidado se tiver sujeitos borrados no fundo; isso pode começar a "melhorá-los" e alterar o visual geral.

Se estiver tendo problemas para rodar o A1111, pode alterar as configurações do "webui-user.bat" para ajudar (clicando com o botão direito e abrindo no bloco de notas):

  • set COMMANDLINE_ARGS= --xformers

Se não tiver xformers ou não conseguir instalar, use:

  • set COMMANDLINE_ARGS= --disable-model-loading-ram-optimization --opt-sdp-no-mem-attention

Para instalar xformers: como instalar xformers

Recomendações de Prompt:

Quanto aos prompts, isso depende de você. Aqui vão algumas dicas:

  1. Tenha cuidado com a intensidade que adiciona às LoRas, pois isso pode afetar o visual geral do checkpoint. Mais forte nem sempre é melhor. Normalmente uso intensidades de 0.4 a 1, dependendo da LoRa.

  2. O que aparece primeiro no seu prompt tem prioridade maior.

  3. Parênteses aumentam a prioridade do conteúdo, mas colocar tudo dentro deles quase equivale a escrever sem eles.

  4. Mudanças sutis no prompt (incluindo pontuação) podem alterar a imagem.

  5. O seed ajuda a produzir imagens similares com softwares e configurações semelhantes. Não garante imagens idênticas, pois até diferenças de software (ex: ComfyUI) ou hardware podem influenciar.

  6. Se quiser um visual mais cartoon (pelo menos com este checkpoint), use perto do início do prompt termos como Anime, Cartoon, painted ou comic. Não garante o estilo dependendo da versão, mas tende para isso. Isso também funciona para visuais realistas (Realistic, real, etc).

  7. Se quiser evitar nudez ou conteúdo NSFW, certifique-se de incluir no prompt negativo termos como nude, nudity, naked, NSFW, nipples. Claro que, se estiverem no prompt positivo, normalmente o modelo vai replicar.

  8. O seguinte é o que normalmente uso no prompt negativo (você pode clicar em easynegative ou badhandv4 para obter os arquivos):

    easynegative,(badhandv4),(bad quality:1.3),(worst quality:1.3),watermark,(blurry),5-funny-looking-fingers

    NOTA: Badhandv4 é um embedding. Portanto, deve ir na pasta embedding do A1111

Por Que Tantas Versões:

Porque quis compartilhar todos os resultados que considerei alcançar um resultado desejado. Isso me divertiu e viu que muitos gostaram. O que me motivou a continuar tentando. Mais uma vez, obrigado.

__________________________________________________________________________________________________

Licença e Uso

Este modelo é de acesso aberto e disponível para todos, com uma licença CreativeML OpenRAIL-M que especifica direitos e uso.

  • 1. Você não pode usar o modelo para produzir ou compartilhar deliberadamente saídas ou conteúdos ilegais ou prejudiciais.

  • 2. Os autores não reivindicam direitos sobre as imagens geradas por você, que é livre para usá-las e responsável pelo uso, que não deve violar as disposições da licença.

  • 3. Você pode redistribuir os pesos. Se fizer isso, deve incluir as mesmas restrições de uso da licença e compartilhar uma cópia do CreativeML OpenRAIL-M modificado para todos seus usuários (leia a licença completa atentamente).

    Leia a licença completa aqui Stable Diffusion

Restrições de Uso:

Você concorda em não usar o Modelo ou Derivados:

- De qualquer forma que viole leis ou regulamentos nacionais, federais, estaduais, locais ou internacionais aplicáveis

- Para explorar, prejudicar ou tentar explorar ou prejudicar menores de qualquer forma

- Para gerar ou disseminar informações ou conteúdos comprovadamente falsos com o propósito de prejudicar outros

- Para gerar ou disseminar informações pessoais que possam prejudicar um indivíduo

- Para difamar, desmerecer ou assediar outros

- Para decisões totalmente automatizadas que impactem direitos legais de indivíduos ou criem obrigações vinculantes

- Para qualquer uso que discrimine ou prejudique indivíduos ou grupos com base em comportamento social online/offline ou características pessoais conhecidas ou previstas

- Para explorar vulnerabilidades de grupos específicos por idade, características sociais, físicas ou mentais, distorcendo comportamentos de forma a causar danos físicos ou psicológicos

- Para usos que discriminem com base em características legalmente protegidas

- Para fornecer aconselhamento médico ou interpretação de resultados médicos

- Para gerar ou disseminar informações para administração da justiça, aplicação da lei, imigração ou asilo, como prever fraude ou crime (ex: perfilamento por texto, relações causais em documentos, uso arbitrário e indiscriminado).

Termos de Uso:

- Você é o único responsável por qualquer responsabilidade legal decorrente do uso antiético deste modelo(s)

- Se usar estes modelos para mesclagem, informe quais passos tomou e indique claramente onde houve modificações.

Nota:

Se encontrar conflitos ou correções a fazer, por favor me avise.

Anterior
RealCartoon-Anime - V7
Próximo
301041 Style - Illustrious - 301041 Style -V1

Detalhes do Modelo

Tipo de modelo

Checkpoint

Modelo base

SD 1.5

Versão do modelo

V11

Hash do modelo

ce30feb9a1

Discussão

Por favor, faça log in para deixar um comentário.

Imagens por RealCartoon3D - V11

Retrato de princesa indiana adornada com lehenga tradicional verde-esmeralda e dourada com bordados intrincados e joias ornamentadas, posando junto a uma janela iluminada pelo sol em um interior de palácio ricamente decorado.

Imagens com anime

Ilustração digital em estilo anime mostrando uma grande estrutura pontiaguda de pirâmide de pedra triangular em terra árida com pedras espalhadas sob um céu estrelado e um planeta com anéis laranja.
Guerreira feminina detalhada em estilo anime, com traje de couro preto, em uma pose dinâmica com efeitos coloridos em azul e laranja rodopiando ao fundo.
Personagem anime Frieren com orelhas pontudas e olhos verdes, cabelo cinza em twintails, vestindo uma camisola branca transparente, sentada em uma cama em um quarto suavemente iluminado.
Um retrato detalhado de um ciborgue com cabelo branco longo, olhos azuis e armadura robótica intrincada, em uma paisagem urbana futurista cyberpunk à noite.
Retrato em close de uma pequena garota elfa com longos rabos de cavalo prateados, olhos azul-esverdeados e traços faciais delicados, vestindo uma capa branca com acabamento dourado e brincos vermelhos, em pé numa floresta.
Uma delicada fada parecida com Sininho com asas translúcidas intricadas, dormindo pacificamente em flores vibrantes, vestida com um traje verde detalhado.
Y'shtola Rhul de Final Fantasy XIV usando um vestido chinês preto sem mangas com orelhas de gato e cauda, contra um fundo noturno com lanternas penduradas.
Um monastério e cidade sci-fi futuristas construídos em penhascos íngremes de uma garganta verdejante com um rio abaixo, apresentando uma máquina voadora e uma mulher solitária caminhando por uma ponte fina.
Uma arara vibrante empoleirada em um galho na floresta tropical com tons suaves de pastéis e estilo anime de alto contraste.
Uma garota com olhos belos e franja sentada na grama, luz do sol e sombras das folhas se entrelaçam sobre ela e no chão.

Imagens com arte digital

Arte digital abstrata que retrata uma figura fragmentada dançando sob uma grande lua brilhante, composta por fragmentos em estilo glitch com contrastes marcantes e atmosfera nebulosa.
Close-up em preto e branco de uma mulher com cabelos molhados pela chuva, parcialmente se desintegrando em partículas coloridas do arco-íris que se dispersam para a esquerda.
Retrato de uma mulher negra de pele escura estilizada como deusa, usando joias de ouro e um traje dourado com cabelo curto e escuro.
Cidade futurista com altas torres cilíndricas de vidro situada em uma paisagem montanhosa nevada sob um céu dramático ao pôr do sol.
Arte digital de um gato cinza escuro fofo com olhos azuis brilhantes sentado em um galho de árvore rodeado por folhas de outono laranja. O gato tem um halo brilhante acima da cabeça e usa uma coleira com um pingente.
Uma mulher feroz em um exotraje tecnológico brilhante dispara rajadas de energia no meio de uma enorme explosão em uma paisagem urbana distópica iluminada por neon.
Pintura digital em close-up de uma menina de cabelo castanho segurando um coelho branco contra um cenário de vila nevada no inverno, renderizada em estilo de arte clássico.
Vista por trás de um longo caminho rachado que atravessa uma cidade distópica devastada por uma explosão atômica com uma enorme nuvem em forma de cogumelo e ruínas em chamas.
Um unicórnio branco com um chifre rosa brilhante e uma crina rosa fluida, olhos vermelhos com esclera colorida, em um fundo escuro no estilo de arte digital.

Imagens com feminino

Um robô feminino com corpo branco, braços de metal e olhos azuis brilhantes sentado cansado sobre escombros em uma paisagem urbana destruída sob céus nublados e escuros.
Fêmea egípcia em estilo anime ajoelhada no deserto, com pele bronzeada, cabelos brancos, olhos vermelhos, vestindo uma túnica branca e colar egípcio, raio de sol ao fundo.
Retrato digital de uma garota ruiva com olhos verdes e sardas no rosto e ombros, vestindo uma regata escura contra um fundo escuro.
Vista lateral de uma Muse feminina asiática em uma pose sensual de dança adornada com vários colares e pulseiras tribais, renderizada em estilo de esboço em tinta preta ultra realista com preenchimento em aquarela em um fundo cinza neutro.
Retrato de uma mulher sorridente com longos cabelos ruivos, olhos azuis, pele clara, vestindo um manto azul com joias douradas, ao ar livre.
Uma mulher pícaro de cabelos ruivos com roupa preta assimétrica escura ajoelhada acariciando um filhote de lobo branco com olhos azuis brilhantes contra uma cena noturna rochosa escura com plantas vermelhas brilhantes.
Fêmea antropomórfica de leopardo das neves em armadura preta com detalhes amarelos, saudando e piscando contra fundo escuro.
Uma tiefling feminina de fantasia sombria com grandes chifres de carneiro curvando ao redor da cabeça, cabelo trançado vermelho sangue, pele azul pálida, olhos amarelos penetrantes, vestindo um vestido verde elegante adornado com elementos de bronze intrincados.
Retrato em close de uma fêmea soldado lobo branco anthro com olhos vermelhos marcantes, presas visíveis e boca levemente aberta mostrando a língua, usando capacete de soldado em luz natural.
Uma mulher com rosto triste e cabelo longo escuro vestindo top de biquíni branco e shorts segurando uma placa de madeira que diz 'Libere os melões' em um fundo de selva exuberante.

Imagens com mecha

Imagem fotorrealista de uma personagem feminina futurista usando máscara de gás e equipamento de combate, em pé com confiança diante de uma grande aranha robótica preta e vermelha contra uma parede de concreto.
Racing Miku com longas caudas gêmeas iridescentes RGB vestindo um plugue reflexivo, transparente e iridescente, flutuando próximo a uma estação espacial com a Terra ao fundo.
Uma garota cibernética com braços mecânicos intrincados realizando magia com círculos mágicos vermelho-alaranjados brilhantes em uma paisagem urbana futurista sombria.
Um robô feminino cyberpunk agachado sobre escombros sob um céu noturno tempestuoso iluminado por relâmpagos intensos com olhos brilhantes e uma paisagem urbana futurista.
Modelo 3D do robô Gigante de Ferro em pé ao ar livre à noite, encarando um menino com moletom amarelo, com céu estrelado e cenário de montanhas ao fundo.
Um robô humanoide detalhado com armadura amarela vestindo um grande chapéu de cowboy marrom e um cachecol rosa, contra um céu com nuvens rosas e brancas. O robô tem olhos circulares brilhantes rosa e cabos visíveis.
Um monstro mecha sci-fi gigantesco com múltiplos olhos e longos chifres, em pé entre prédios desabando sob um céu nublado com iluminação volumétrica.
Guerreiro futurista em traje corporal blindado preto esverdeado equipado com arma de energia e cinturão de cartuchos, posando com uma arma de maça com espinhos em um cenário sci-fi surreal.