LEOSAMs HelloWorld XL - HelloWorld XL 60
관련 키워드 및 태그
추천 프롬프트
conceptual art featuring a human hand wrapped in red and beige ribbons, isolated against a plain, light background, realistic style, minimalist color scheme, smooth textures, elongated and surreal aesthetic
film grain texture
analog photography aesthetic
추천 네거티브 프롬프트
bad hand,bad anatomy,worst quality,ai generated images,low quality,average quality,jpeg artifacts,blurry,poorly drawn,ugly
low quality,jpeg artifacts,blurry,poorly drawn,ugly,worst quality
추천 매개변수
samplers
steps
cfg
resolution
other models
추천 고해상도 매개변수
upscaler
upscale
steps
denoising strength
팁
ADetailer를 사용하여 멀리 있는 얼굴을 보정하세요.
더 나은 AI 현실 사진 출력을 위해 간단한 자연어 프롬프트를 사용하세요.
고품질 인물 사진은 ADetailer와 0.3 강도의 1.5배 Hires 수정으로 향상될 수 있습니다.
버전 하이라이트
HelloWorld 6.0 Update - April 20, 2024
Thank you for your patience. I have been job hunting recently, which caused some delays in the HelloWorld updates. Here are the main updates in version 6.0:
HelloWorld 6.0 is an iterative improvement based on version 5.0. Based on my own testing, the realism effect is not significantly different from version 5.0. The main advantage of version 6.0 lies in its broader coverage of concepts in the training set. According to feedback, enhancements have been made in various themes including surrealism, boudoir, group photos, masks, origami, 3D renders, cars, dragons, and maternity photography. Some examples are provided in the illustrations.
HelloWorld 6.0 intentionally includes some low-quality images in the training to enhance the model's response to negative prompts. It is recommended to use the following terms in negative prompts: "low quality, jpeg artifacts, blurry, poorly drawn, ugly, worst quality".
The main body of the HelloWorld 6.0 training set employs GPT4v tagging. For images that GPT4v cannot tag, cogVQA guided by blip2-opt-6.7b is used for tagging. The tagging language style of these multimodal models differs significantly from the traditional WD1.4 tagger. To facilitate more accurate triggering of different concepts in the training set, I have compiled the top 250 high-frequency tagging words from the HelloWorld 6.0 training set. You can view these high-frequency words in this document.
Finally, although SD3 is about to be released, I will still update to HelloWorld XL 7.0, hoping to achieve greater enhancements in version 7.0!
크리에이터 스폰서
🖥️친구와 제가 개발한 오픈소스 GPT4V-Image-Captioner를 사용해보세요. 원클릭 설치 가능하며, 이미지 사전 압축, 이미지 태깅, 태그 통계 등 다양한 기능이 통합되어 있습니다. 최근에는 webui 플러그인 버전도 출시했으니 모두 환영합니다!
🌍QQ群 '토순·AIGC몽공북공장'에 참여하세요, 그룹 번호: 780132897; '토순·AIGC몽공남공장' 그룹 번호: 835297318 (가입 답변: 토순). Telegram 그룹채팅 '토순의 SDXL 브로드웨이', 링크:https://t.me/+KkflmfLTAdwzMzI1
🖥️친구와 제가 개발한 오픈소스 GPT4V-Image-Captioner를 사용해보세요. 원클릭 설치가 가능하며, 이미지 사전 압축, 이미지 태깅, 태그 통계 등 다양한 기능이 통합되어 있습니다. 최근에는 이 도구의 webui 플러그인 버전도 출시하였으니 모두 환영합니다!
🌍QQ群 '토순·AIGC몽공북공장'에 참여하세요, 그룹 번호: 780132897; '토순·AIGC몽공남공장' 그룹 번호: 835297318 (가입 답변: 토순). Telegram 그룹채팅 '토순의 SDXL 브로드웨이', 링크: https://t.me/+KkflmfLTAdwzMzI1
📖HelloWorld 7.0 업데이트 - 2024년 6월 13일
한 문장 업데이트 요약: HelloWorld 7.0은 반복 최적화된 버전으로, 시리즈 전체에서 최고의 신체 성능과 더욱 강화된 개념 범위 및 세부 묘사를 자랑합니다.
업데이트 상세 내용:
부정적인 학습 이미지 추가, 포즈 훈련 강화, clip 모델 최적화를 통해 이전 버전 대비 모델의 팔다리 및 손의 정확도가 향상되었습니다. 추천 부정 프롬프트 단어는: "bad hand, bad anatomy, worst quality, ai generated images, low quality, average quality"입니다.
공식 SPO 모델에서 미세 조정된 LoRA를 추출하여 HelloWorld 7.0에 통합했습니다. SPO는 DPO 기법의 추가 개선 버전으로, SPO 기본 모델이 DPO XL과 원본 SDXL 기본 모델보다 우수한 성능을 제공합니다. SPO LoRA는 이미지 디테일과 대비를 강화하고 이미지를 미화합니다. SPO 기술팀에 감사드립니다.
학습셋의 개념 범위를 계속 확장했지만, 큰 학습셋 미세 조정이 비용이 많이 들어 최적화 및 간소화를 진행했습니다 (최근 H800 대여가 어려워 로컬 학습 시간이 부담). 현재 총 학습셋은 20,821장 이미지로 구성되어 있으며, 학습셋 해상도 분포는 다음과 같고, 출력 시 이미지 수가 많은 여러 해상도를 사용하는 것을 권장합니다:
(832, 1248) - 수량: 7128 (896, 1152) - 수량: 6250 (1248, 832) - 수량: 2402 (1024, 1024) - 수량: 1639 (1360, 768) - 수량: 928 (1152, 896) - 수량: 870 (768, 1360) - 수량: 432 (960, 1088) - 수량: 506 (992, 1056) - 수량: 162 (1088, 960) - 수량: 140 (704, 1472) - 수량: 120 (1056, 992) - 수량: 122 (1472, 704) - 수량: 115 (1632, 640) - 수량: 75 (640, 1632) - 수량: 12
GPT4O를 사용해 모든 데이터셋을 재라벨링했습니다. 이번에는 구조화된 라벨링 방식을 채택했으며, 구체적 구조는 "한 문장 요약 설명 + 여러 이미지 요소 태그 + XXX 영감 + 미적 품질 설명어"로, 미적 품질 설명어는 최악, 낮음, 평균, 최고, 걸작 5단계로 구분됩니다. 예시 라벨링은 다음과 같습니다:
붉은색과 베이지색 리본으로 감싸진 인간 손을 주제로 한 개념 미술, 단색 밝은 배경에 고립, 사실적인 스타일, 미니멀리즘 색채, 부드러운 질감, 길고 초현실적인 미감, 살바도르 달리의 초현실주의 작품에서 영감, 걸작
HelloWorld 7.0 버전의 Inspired by XXX에 관련된 "고빈도 태깅 단어 목록" 및 "고빈도 예술 스타일 목록"은 상업적 라이선스 사용자에게만 제공됩니다. 과거에 Helloworld XL 시리즈 모델 권한을 구매한 파트너는 누락 사항이 있으면 무료로 받을 수 있도록 저에게 연락 바랍니다.
사용자는 HelloWorld 6.0 고빈도 태깅 단어 목록을 참조할 수 있습니다. 또한, 갤러리에는 150장 이상의 고품질 HelloWorld 7.0 예시 이미지도 제공되어 출력 참고용으로 활용할 수 있습니다. 모델 제작은 쉽지 않으니 사용자 여러분의 이해와 관용에 감사드립니다!
📖HelloWorld 6.0 업데이트 - 2024년 4월 20일
LEOSAM HelloWorld 6.0 상위 250 고빈도 태깅 단어 목록
기다려주셔서 감사합니다. 최근 구직 활동으로 인해 HelloWorld 업데이트에 지연이 있었습니다. 버전 6.0의 주요 업데이트 내용은 다음과 같습니다:
HelloWorld 6.0은 버전 5.0을 기반으로 한 반복 개선판입니다. 자체 테스트 결과, 현실감 효과는 5.0과 큰 차이가 없습니다. 버전 6.0의 주요 장점은 학습셋 내 개념 범위가 넓어진 점입니다. 피드백에 따르면 초현실주의, 부드와르, 그룹 사진, 마스크, 종이접기, 3D 렌더링, 자동차, 용, 임신 사진 등 다양한 주제에 대해 향상이 이루어졌습니다. 일부 예시는 첨부된 그림에서 확인할 수 있습니다.
HelloWorld 6.0은 모델의 부정 프롬프트 반응성을 높이기 위해 일부 저품질 이미지를 학습에 의도적으로 포함했습니다. 부정 프롬프트로는 "low quality, jpeg artifacts, blurry, poorly drawn, ugly, worst quality" 사용이 권장됩니다.
HelloWorld 6.0 학습셋 본문은 GPT4v 태깅을 사용하며, GPT4v로 태깅 불가한 이미지는 blip2-opt-6.7b가 이끄는 cogVQA가 태깅을 담당합니다. 이 다중모달 모델들의 태깅 언어 스타일이 기존 WD1.4 태거와 크게 다릅니다. 학습셋 내 여러 개념을 더 정확히 트리거하기 위해 HelloWorld 6.0 학습셋 상위 250 고빈도 태깅 단어를 모았습니다. 해당 고빈도 단어 목록은 이 문서에서 확인할 수 있습니다.
마지막으로, SD3 출시가 임박했지만 저는 계속해서 HelloWorld XL 7.0으로 업데이트할 예정이며, 7.0 버전에서 더 큰 향상을 이루고자 합니다!