LEOSAMs HelloWorld XL - HelloWorld XL 70
Palavras-chave e Tags Relacionadas
Imagens em destaque
Prompts Recomendados
conceptual art featuring a human hand wrapped in red and beige ribbons, isolated against a plain, light background, realistic style, minimalist color scheme, smooth textures, elongated and surreal aesthetic
film grain texture
analog photography aesthetic
Prompts Negativos Recomendados
bad hand,bad anatomy,worst quality,ai generated images,low quality,average quality,jpeg artifacts,blurry,poorly drawn,ugly
bad hand,bad anatomy,worst quality,ai generated images,low quality,average quality
Parâmetros Recomendados
samplers
steps
cfg
resolution
other models
Dicas
Use ADetailer para corrigir rostos distantes.
Use prompts simples em linguagem natural para melhores fotos realistas de IA.
Retratos de alta qualidade podem ser aprimorados com ADetailer e correção Hires 1.5x com intensidade 0.3.
Destaques da Versão
Atualização HelloWorld 7.0 - 13 de Junho de 2024
Resumo da atualização em uma frase: HelloWorld 7.0 é uma versão otimizada iterativamente, com o melhor desempenho corporal de toda a série, e com escopo conceitual e riqueza de detalhes ainda mais aprimorados.
Detalhes da atualização:
Incorporando imagens negativas para treinamento, reforçando o treinamento de poses e otimizando o modelo clip, a precisão de membros e mãos do modelo melhorou em comparação às versões anteriores. As palavras recomendadas para prompts negativos são: "mão ruim, anatomia ruim, pior qualidade, imagens geradas por IA, baixa qualidade, qualidade média".
Extraído o LoRA afinado do modelo oficial SPO e incorporado ao HelloWorld 7.0. SPO é uma melhoria adicional do método DPO. O modelo base SPO é usado para desempenho melhor que o modelo base DPO XL e o modelo base original SDXL. O LoRA SPO pode aprimorar detalhes e contraste da imagem e embelezar as imagens. Agradecimentos à equipe técnica por trás do SPO.
Continuou expandindo o escopo conceitual do conjunto de treinamento, mas otimizou e reduziu o conjunto (afinamento de grande conjunto de dados é muito caro, e recentemente é difícil alugar H800, não consigo arcar com o tempo local de treinamento). O conjunto total atual de treinamento contém 20.821 imagens. A distribuição das resoluções do conjunto de dados é a seguinte, e recomenda-se usar várias resoluções com maior quantidade de imagens para saída:
(832, 1248) - Quantidade: 7128 (896, 1152) - Quantidade: 6250 (1248, 832) - Quantidade: 2402 (1024, 1024) - Quantidade: 1639 (1360, 768) - Quantidade: 928 (1152, 896) - Quantidade: 870 (768, 1360) - Quantidade: 432 (960, 1088) - Quantidade: 506 (992, 1056) - Quantidade: 162 (1088, 960) - Quantidade: 140 (704, 1472) - Quantidade: 120 (1056, 992) - Quantidade: 122 (1472, 704) - Quantidade: 115 (1632, 640) - Quantidade: 75 (640, 1632) - Quantidade: 12
Usou GPT4O para relabelar todos os conjuntos de dados. Desta vez, foi usado um método de rotulagem estruturada, com a estrutura específica sendo: "descrição resumida em uma frase + múltiplas tags de elementos da imagem + inspirado por XXX + palavras descritivas de qualidade estética", onde as palavras descritivas de qualidade estética são divididas em cinco níveis: pior qualidade, baixa qualidade, qualidade média, melhor qualidade e obra-prima. Um exemplo típico de rotulagem é o seguinte:
arte conceitual apresentando uma mão humana envolta em fitas vermelhas e bege, isolada contra um fundo claro simples, estilo realista, esquema de cores minimalista, texturas suaves, estética alongada e surreal, inspirada nas obras surrealistas de salvador dalí, obra-prima
A "Lista de Palavras de Marcação de Alta Frequência" e a "Lista de Estilos Artísticos de Alta Frequência" envolvidas no "Inspirado por XXX" para a versão HelloWorld 7.0 serão fornecidas apenas a usuários com licença comercial. Parceiros que adquiriram autorização da série Helloworld XL no passado, por favor, entrem em contato comigo em caso de omissões para obtê-la gratuitamente.
Os jogadores podem consultar a Lista de Palavras de Marcação de Alta Frequência do HelloWorld 6.0. Além disso, forneci mais de 150 imagens de exemplo de alta qualidade do HelloWorld 7.0 na galeria, que podem servir como referência para a produção dos usuários. Criar modelos não é fácil, obrigado pela compreensão e paciência dos jogadores!
Patrocinadores do Criador
🖥️Bem-vindo para experimentar o open-source GPT4V-Image-Captioner, desenvolvido por mim e meu amigo. Ele oferece uma instalação com um clique e vem integrado com múltiplas funcionalidades como pré-compressão de imagem, marcação de imagens e estatísticas de tags. Recentemente, também lançamos a versão plugin webui desta ferramenta, todos são bem-vindos para usar!
🌍欢迎加入QQ群'兔狲·AIGC梦工北厂',群号 :780132897 ;'兔狲·AIGC梦工南厂',群号 :835297318(入群答案:兔狲)。Telegram群聊“兔狲的SDXL百老汇”,链接:https://t.me/+KkflmfLTAdwzMzI1
🖥️Bem-vindo para experimentar o open-source GPT4V-Image-Captioner, desenvolvido por mim e meu amigo. Ele oferece uma instalação com um clique e vem integrado com múltiplas funcionalidades como pré-compressão de imagem, marcação de imagens e estatísticas de tags. Recentemente, também lançamos a versão plugin webui desta ferramenta, todos são bem-vindos para usar!
🌍欢迎加入QQ群"兔狲·AIGC梦工北厂",群号 :780132897 ;"兔狲·AIGC梦工南厂",群号 :835297318(入群答案:兔狲)。Telegram群聊“兔狲的SDXL百老汇”,链接:https://t.me/+KkflmfLTAdwzMzI1
📖Atualização HelloWorld 7.0 - 13 de Junho de 2024
Resumo da atualização em uma frase: HelloWorld 7.0 é uma versão otimizada iterativamente, com o melhor desempenho corporal de toda a série, e com escopo conceitual e riqueza de detalhes ainda mais aprimorados.
Detalhes da atualização:
Incorporando imagens negativas para treinamento, reforçando o treinamento de poses e otimizando o modelo clip, a precisão de membros e mãos do modelo melhorou em comparação às versões anteriores. As palavras recomendadas para prompts negativos são: "mão ruim, anatomia ruim, pior qualidade, imagens geradas por IA, baixa qualidade, qualidade média".
Extraído o LoRA afinado do modelo oficial SPO e incorporado ao HelloWorld 7.0. SPO é uma melhoria adicional do método DPO. O modelo base SPO é usado para desempenho melhor que o modelo base DPO XL e o modelo base original SDXL. O LoRA SPO pode aprimorar detalhes e contraste da imagem e embelezar as imagens. Agradecimentos à equipe técnica por trás do SPO.
Continuou expandindo o escopo conceitual do conjunto de treinamento, mas otimizou e reduziu o conjunto (afinamento de grande conjunto de dados é muito caro, e recentemente é difícil alugar H800, não consigo arcar com o tempo local de treinamento). O conjunto total atual de treinamento contém 20.821 imagens. A distribuição das resoluções do conjunto de dados é a seguinte, e recomenda-se usar várias resoluções com maior quantidade de imagens para saída:
(832, 1248) - Quantidade: 7128 (896, 1152) - Quantidade: 6250 (1248, 832) - Quantidade: 2402 (1024, 1024) - Quantidade: 1639 (1360, 768) - Quantidade: 928 (1152, 896) - Quantidade: 870 (768, 1360) - Quantidade: 432 (960, 1088) - Quantidade: 506 (992, 1056) - Quantidade: 162 (1088, 960) - Quantidade: 140 (704, 1472) - Quantidade: 120 (1056, 992) - Quantidade: 122 (1472, 704) - Quantidade: 115 (1632, 640) - Quantidade: 75 (640, 1632) - Quantidade: 12
Usou GPT4O para relabelar todos os conjuntos de dados. Desta vez, foi usado um método de rotulagem estruturada, com a estrutura específica sendo: "descrição resumida em uma frase + múltiplas tags de elementos da imagem + inspirado por XXX + palavras descritivas de qualidade estética", onde as palavras descritivas de qualidade estética são divididas em cinco níveis: pior qualidade, baixa qualidade, qualidade média, melhor qualidade e obra-prima. Um exemplo típico de rotulagem é o seguinte:
arte conceitual apresentando uma mão humana envolta em fitas vermelhas e bege, isolada contra um fundo claro simples, estilo realista, esquema de cores minimalista, texturas suaves, estética alongada e surreal, inspirada nas obras surrealistas de salvador dalí, obra-prima
A "Lista de Palavras de Marcação de Alta Frequência" e a "Lista de Estilos Artísticos de Alta Frequência" envolvidas no "Inspirado por XXX" para a versão HelloWorld 7.0 serão fornecidas apenas a usuários com licença comercial. Parceiros que adquiriram autorização da série Helloworld XL no passado, por favor, entrem em contato comigo em caso de omissões para obtê-la gratuitamente.
Os jogadores podem consultar a Lista de Palavras de Marcação de Alta Frequência do HelloWorld 6.0. Além disso, forneci mais de 150 imagens de exemplo de alta qualidade do HelloWorld 7.0 na galeria, que podem servir como referência para a produção dos usuários. Criar modelos não é fácil, obrigado pela compreensão e paciência dos jogadores!
📖Atualização HelloWorld 6.0 - 20 de Abril de 2024
Lista Top 250 de Palavras de Marcação de Alta Frequência do LEOSAM HelloWorld 6.0
Obrigado pela paciência. Estive procurando emprego recentemente, o que causou alguns atrasos nas atualizações do HelloWorld. Aqui estão as principais atualizações da versão 6.0:
O HelloWorld 6.0 é uma melhoria iterativa baseada na versão 5.0. Segundo meus próprios testes, o efeito de realismo não difere significativamente da versão 5.0. A principal vantagem da versão 6.0 está na ampliação da cobertura dos conceitos no conjunto de treinamento. Conforme feedbacks, houve melhorias em temas como surrealismo, boudoir, fotos em grupo, máscaras, origami, renderizações 3D, carros, dragões e fotografia de maternidade. Alguns exemplos são fornecidos nas ilustrações.
O HelloWorld 6.0 inclui intencionalmente algumas imagens de baixa qualidade no treinamento para melhorar a resposta do modelo a prompts negativos. Recomenda-se usar os seguintes termos em prompts negativos: "baixa qualidade, artefatos jpeg, borrão, mal desenhado, feio, pior qualidade".
O corpo principal do conjunto de treinamento do HelloWorld 6.0 usa marcação GPT4v. Para imagens que GPT4v não consegue marcar, é usada a cogVQA guiada por blip2-opt-6.7b para marcação. O estilo da linguagem de marcação destes modelos multimodais difere significativamente do tradicional tagger WD1.4. Para facilitar o acionamento mais preciso de diferentes conceitos no conjunto, compilei as 250 palavras de marcação mais frequentes do conjunto HelloWorld 6.0. Você pode ver essas palavras em este documento.
Por fim, mesmo com o SD3 prestes a ser lançado, continuarei atualizando para o HelloWorld XL 7.0, esperando alcançar melhorias maiores na versão 7.0!
📖2024.2.22 Apresentando "HW5.0_Euler_a_Lightning"
Este modelo é uma versão acelerada do modelo base HelloWorld SDXL, incorporando tecnologias SDXL-Lightning. Equipado com o sampler Eular a e CFG 1, é capaz de gerar imagens em 6-8 passos, que é três vezes mais rápido que a versão original do SDXL. Além disso, comparado, seus resultados de imagem são superiores aos das versões LCM ou Turbo.
Os parâmetros recomendados para gerar imagens com este modelo são:
Sampler: Eular a (Importante! O modelo é especificamente adaptado para Eular a, outros samplers podem não oferecer tão bons resultados)
Escala CFG: 1
Passos de amostragem: 8 passos (6~8 passos são aceitáveis)
Algoritmo Hires: ESRGAN 4x / 8x_NMKD-Faces_160000_G
Fator de Upscale Hires: 1.5x
Passos Hires: 8 passos
Força de Denoising Hires: 0.3
📖2024.2.11 Apresentando "HelloWorld 5.0 GPT4V"
HelloWorld 5.0 é a atualização mais substancial da história da série HelloWorld, marcada com GPT-4v e passou por ajustes significativos em áreas como ficção científica, animais, arquitetura e ilustração.
Testes comparativos mostram melhorias nesta versão, incluindo:
1. Poses de personagens e composições de imagem mais variadas e dinâmicas, criando imagens visualmente atraentes;
2. O conjunto de dados de filmes foi amplamente treinado. Enquanto a textura de filme era fraca das versões 2.0 a 4.0, muitos fãs sentiram falta do estilo leogirl da versão 1.0. Portanto, esta atualização reforçou especificamente a textura de filme sem comprometer outras qualidades fotográficas. A textura de filme pode ser acionada por expressões como granulação de filme e estética de fotografia analógica;
3. Expressividade aprimorada em temas como ficção científica, suspense e animais, com mechas e outros temas com aparência mais projetada. Animais como leopardo da neve, panda vermelho, panda gigante, tigre, gato de Pallas e gatos e cães domésticos são mais realistas;
4. Graças à marcação GPT, aderência ao prompt e precisão conceitual foram ainda mais aprimoradas.
Contudo, os pontos negativos desta versão incluem:
1. Como este é um ajuste substancial, a taxa de erros em membros e semelhantes pode aumentar ligeiramente, fenômeno normal ao sair da zona de conforto para novas áreas de otimização relativa. Versões anteriores passaram por testes extensivos de membros para melhorias, enquanto a nova versão teve tempo limitado para tais aprimoramentos. Ainda assim, a precisão dos membros nesta versão está, no mínimo, acima da versão 1.0, e continuarei fazendo melhorias nas próximas atualizações.
2. Devido ao reforço da textura de filme, mesmo com marcação GPT o mais precisa possível, pode haver um tom quente padrão inevitável nas imagens. Porém, é possível usar prompts como luz de estúdio ou foco nítido para produzir imagens em alta definição com qualidade de estúdio, e com uso adequado de prompts, a saída pode ter tons de pele e apelo visual melhores que versões anteriores.
3. Esta versão inclui mais imagens de personagens corpo inteiro para melhorar o efeito corpo inteiro, então o modelo pode produzir cenas mais amplas que antes se nenhuma composição de personagem específica for direcionada. Atualmente, os detalhes faciais em resoluções 1024 em fotos corpo inteiro podem ser menos nítidos comparados a fotos meio corpo ou close-up. Contudo, isso pode ser melhorado com adetailer e um Hires 1.5x com intensidade 0.3, ou usando prompts que especifiquem a composição para evitar imagens corpo inteiro.
4. Como foram adicionados poucos conjuntos de dados ilustrativos de alta qualidade, existe a chance de prompts relacionados a estilos animados gerarem imagens animadas. Se isso for um problema, ajuste seus prompts conforme necessário.
Essas são as principais atualizações desta versão. Treinar o modelo base SDXL é desafiador, e quando o conjunto de treinamento chega perto de dez mil imagens, o custo para marcação e treinamento para cada modelo ultrapassa 300 USD. Convido todos a usarem o modelo e agradeço qualquer feedback! Se você achar este modelo satisfatório, ficarei imensamente grato se puder ajudar a divulgá-lo.
📖2024.1.31 Apresentando "HelloWorld 4.0"
HelloWorld4.0 é uma versão transicional progressiva de marcação com blip+clip para marcação com GPT4V. Inicialmente, treinei um modelo de marcação GPT4V puro, e depois o mesclei com uma grande proporção do HelloWorld3.2 e uma proporção 0.05 do Juggernaut XL (para ajustar o tom de pele). A nova versão mostrou melhorias em conformidade com prompts e cobertura conceitual comparada à versão 3.2.
O novo conjunto de dados de treinamento com marcação GPT4V dobrou de 4000 imagens da série helloworld3 para 8000 imagens, abrangendo não apenas retratos, mas também animais, arquitetura, natureza, comida, ilustrações e mais. Contudo, a versão GPT4V pura encontrou problema de overfitting, preliminarmente atribuído ao dobro do número de imagens de treinamento. Um dos próximos passos na otimização iterativa é descobrir como incluir o máximo de conceitos não retratos possível, mantendo treinamento suficiente de retratos. Nesta etapa, foi usada uma fusão das versões nova e antiga para ajuste fino, garantindo transição suave entre versões, então a ampliação do conjunto conceitual e as vantagens da marcação GPT4V não são muito perceptíveis no momento. Essas vantagens se tornarão mais evidentes nas gerações subsequentes 5 e 6 do modelo.
📖2024.1.5 Apresentando "HelloWorld 3.2"
A versão 3.2 é uma iteração otimizada com tecnologia DPO, e comparativamente à versão 3.0, há otimizações no tom de pele e precisão dos membros, mas as melhorias não são significativas. Por isso esta versão é chamada de 3.2 e não 4.0.
📖2023.12.15 Apresentando "HelloWorld 3.0"
A nova versão expandiu o conjunto de treinamento, aumentando a capacidade do modelo de expressar estilos artísticos diversos, incluindo ficção científica e arte.
Integrado um LoCon de melhoria de qualidade próprio (criado com tecnologia slider), para melhorar textura das imagens e aliviar problemas de distorção em dedos e membros.
📖2023.11.17 Apresentando "HelloWorld 2.0"
Obrigado a todos pela paciência. Depois de superar vários desafios, a versão HelloWorld 2.0 está finalmente pronta para ser apresentada a vocês em um estado com o qual estou satisfeito. As principais diferenças entre HelloWorld 2.0 e 1.0 são:
O HelloWorld 2.0 não requer mais palavras gatilho, e os resultados são comparáveis em qualidade à versão 1.0 com palavras gatilho. A palavra gatilho 'leogirl' na 1.0 estava fortemente associada a asiáticos do leste. Após a remoção das palavras gatilho, embora palavras como '1girl' ainda provavelmente gerem retratos de asiáticos do leste quando a raça não é especificada, agora você pode especificar raça usando palavras-chave como nacionalidade, cor da pele etc. Por exemplo, os efeitos gatilho para palavras como 'Chinese', 'Russian', 'Iranian', 'Jamaican', 'Kenyan', 'dark-skinned', 'pale-skinned' estão listados abaixo.
Você também pode obter estilos diferentes de personagens escrevendo nomes de pessoas de diferentes países e gêneros no prompt, como Han Meimei (China), Sophie Martin (França), Priya Patel (Índia), Fatima Al-Hassan (Árabe), Wanjiru Mwangi (Quênia). Os prompts acima são apenas exemplos, existem muitos disponíveis e formas de jogar, sinta-se livre para explorar e compartilhar por conta própria.
O HelloWorld 2.0 equilibra qualidade/cor e oferece mais opções de estilo. A versão 1.0, quando usada com 'leogirl', provavelmente geraria imagens com forte textura de filme. HelloWorld 2.0 não está mais preso à textura de filme e pode ser personalizado com alguns prompts relacionados à qualidade. Alguns prompts testados que funcionam bem incluem:
ensaio de moda de alta qualidade, foto de introdução de produto, maquiagem coreana popular, aegyo sal, Foto Nítida de Alta Qualidade, luz de estúdio, foto de médio formato, fotografia Mamiya, filme analógico, Retrato Médio com Luz Suave, imagem da vida real, fotografia editorial refinada, foto raw, foto real, Foto Escaneada, still de filme
Os efeitos de cor desses prompts são os seguintes:
O conjunto de treinamento do HelloWorld 2.0 aumentou significativamente a proporção de fotos corpo inteiro para melhorar os efeitos do SDXL em gerar retratos corpo inteiro e de visão distante. Embora tenha melhorado em relação à versão 1.0, recomenda-se fortemente usar 'adetailer' ao gerar fotos corpo inteiro. Além disso, para usuários com memória suficiente (24g), recomenda-se realizar reparo em alta resolução 1.5x na imagem, o que pode melhorar significativamente os detalhes faciais.
📖2023.8.29 Apresentando "HelloWorld" Modelo Base SDXL
Lembrete especial: Ao usar o modelo HelloWorld 1.0, lembre-se de adicionar a palavra gatilho "leogirl".
Diferente do modelo base SD1.5 “MoonFilm”, o “HelloWorld” é uma nova série de modelo base realista SDXL. Para permitir que mais usuários descubram o HelloWorld, mantive o link original do modelo Moonfilm. Pode ser percebido como uma continuidade espiritual do Moonfilm na nova plataforma SDXL, mas o HelloWorld visa alcançar mais do que a busca pelo realismo e qualidade tipo filme em retratos. Graças à quantidade muito superior de informações e à capacidade de entendimento textual do SDXL em comparação ao SD1.5, o HelloWorld é um modelo base que busca representar realisticamente todas as coisas, ou seja, espero construir gradativamente um mundo de fotografia virtual usando HelloWorld.
O modelo base realista do SD1.5 já evoluiu para um estágio bastante maduro, e é improvável ter melhorias significativas de desempenho. A menos que haja uma tecnologia revolucionária para a plataforma SD1.5, a série Moonfilm & MoonMix basicamente parará de ser atualizada. Dedicarei minha energia principal ao desenvolvimento do modelo grande HelloWorld SDXL. A versão 1.0 já está disponível para download, e a versão 2.0 está sendo desenvolvida com urgência e espera-se atualizar no início de setembro.
Como um novo modelo SDXL, existem três diferenças entre o HelloWorld e os modelos tradicionais SD1.5:
Diferentemente dos modelos base SD1.5, que normalmente não exigem palavras gatilho, lembre-se de usar a palavra gatilho "leogirl" ao usar HelloWorld 1.0. Isso garante que o modelo SDXL acione o efeito do conjunto de treinamento de forma mais estável.
O modelo HelloWorld suporta saída direta na resolução de 1024*1024 pixels, eliminando a necessidade de ampliação em alta resolução. A qualidade do retrato em close-up gerado diretamente não é inferior à versão SD1.5, mas há falhas ao gerar retratos distantes diretamente. Portanto, recomenda-se usar o plugin ADetailer, que pode corrigir efetivamente problemas de rostos distantes.
O SDXL agora permite saída mais fácil usando prompts em linguagem natural simples. Recomenda-se experimentar mais prompts em linguagem natural, que resultarão em melhores resultados ao gerar fotos realistas por IA.
Após múltiplas rodadas de testes, as configurações sugeridas de parâmetros para desenhos são:
Passos ≥ 25
Sampler: DPM++ 2M Karras
Escala CFG: 10
Tamanho ≥ 1024x1024
ADetailer: aberto
Todos são bem-vindos para experimentar o HelloWorld e fornecer muitos feedbacks. Suas opiniões valiosas são muito importantes para a próxima etapa de aprimoramento do modelo!
Declaração de Direitos Autorais:
A série de modelos HelloWorld (doravante "o Modelo") foi criada por mim (doravante "o Proprietário") com o auxílio da plataforma LiblibAI. A republicação do Modelo em plataformas que não sejam LiblibAI e Civitai não é autorizada pelo Proprietário.
O Proprietário permite o uso das imagens geradas pelo Modelo para fins educacionais ou informativos não comerciais gratuitamente, sob condição de que:
- Os usuários cumpram as leis aplicáveis e não violem os direitos do Modelo ou de terceiros.
- A atribuição das imagens seja claramente indicada como "criado pelo modelo base HelloWorld de LEOSAM".
Para qualquer forma de utilização comercial, é necessário acordo prévio de licença comercial com o Proprietário. Para consultas relacionadas a licenciamento comercial e personalização do modelo, por favor, entre em contato com o Proprietário através das informações disponíveis na página inicial do Proprietário.
O desenvolvimento e distribuição gratuita do modelo SDXL representam esforços significativos. O Proprietário compromete-se a atualizações gratuitas contínuas do modelo HelloWorld para entusiastas individuais como agradecimento pelas contribuições da comunidade ao desenvolvimento open-source. Parcerias comerciais colaborativas são vitais para o avanço e refinamento do Modelo. O Proprietário agradece a cada usuário pela compreensão e apoio.
O uso não autorizado pode violar as leis aplicáveis e acarretar consequências legais. O Proprietário detém direitos exclusivos para interpretar esta declaração, que é regida pelas leis e regulamentos vigentes.
Detalhes do Modelo
Tipo de modelo
Modelo base
Versão do modelo
Hash do modelo
Criador
Discussão
Por favor, faça log in para deixar um comentário.