LEOSAMのHelloWorld XL - HelloWorld XL 1.0
推奨プロンプト
studio light,sharp focus,high-end fashion photoshoot,product introduction photo,popular Korean makeup,aegyo sal,Sharp High-Quality Photo,medium format photo,Mamiya photography,analog film,Medium Portrait with Soft Light,real-life image,refined editorial photograph,raw photo,real photo,Scanned Photo,film still,film grain texture,analog photography aesthetic
leogirl
推奨ネガティブプロンプト
bad hand,bad anatomy,worst quality,ai generated images,low quality,average quality,jpeg artifacts,blurry,poorly drawn,ugly
(worst quality, low quality, cgi, bad eye, worst eye, illustration, deformed, cartoon), distorted, disfigured, poorly drawn, bad anatomy, wrong anatomy, open mouth
推奨パラメータ
samplers
steps
cfg
clip skip
resolution
推奨ハイレゾパラメータ
upscaler
upscale
steps
ヒント
HelloWorld 1.0使用時はトレーニング効果を安定させるため、トリガーワード「leogirl」を追加してください。
遠景ポートレートの問題を修正するために、特に全身画像生成時は「adetailer」プラグインを利用してください。
全身画像の顔のディテール向上には強度約0.3で1.5倍の高解像度補正を行うことを推奨します。
SDXLモデルでの出力品質向上には自然言語プロンプトの使用が有効です。
望ましくない暖色調を避けるために「studio light」や「sharp focus」のプロンプトを使用してください。
全身画像は広いシーンになりやすく、1024解像度で顔の詳細がやや劣るため、構図指定プロンプトやadetailerで改善してください。
本モデルはシュールリアリズム、ブドワール、マスク、折り紙、メカ、動物、映画テクスチャなど多彩なコンセプトを含みます。
バージョンのハイライト
新しいSDXLモデルとして、HelloWorldは従来のSD1.5モデルと3つの違いがあります:
SD1.5ベースモデルは通常トリガーワードなしで使用されますが、HelloWorld 1.0では必ずトリガーワード「leogirl」を使ってください。これによりSDXLモデルがトレーニングセット効果を安定的に引き出します。
HelloWorldモデルは1024×1024ピクセルの直接出力をサポートし、高解像度拡大が不要です。近景ポートレートの質はSD1.5に劣りませんが、遠景直出にはまだ欠点があります。よってADetailerプラグインの併用を推奨し、遠景顔問題を効果的に修正可能です。
SDXLは今や単純な自然言語プロンプトでの出力が容易になっており、より多くの自然言語プロンプトを試すことを推奨します。AI写実写真を出力する際、より良い結果が期待できます。
複数回のテストを経て、推奨描画パラメータ設定は:
ステップ数 ≥ 25
サンプラー: DPM++ 2M Karras
CFGスケール: 10
サイズ ≥ 1024×1024
ADetailer: 有効
作为全新的SDXL模型,HelloWorld在使用时有三点与传统SD1.5模型的不同:
HelloWorld 1.0模型使用必备的触发词是leogirl,除此以外,建议同时添加realistic和looking at viewer两个正向提示词。建议使用的负面提示词是:bad eyes, incorrect hands, worst teeth, abnormal anatomy, wrong lips, illustration, cartoon, painting。
HelloWorld模型支持1024*1024分辨率直接出图,不需要高分辨率放大,目前在近景人像直出质感上不输于SD1.5版本,但直出远景人像时仍存在瑕疵,因此建议搭配ADetailer插件使用,可以很好地修正远景人脸问题。
SDXL现在可以使用更简单的自然语言提示词进行出图,建议多多尝试自然语言提示词,输出AI写实照片时会有更好的效果。
经过多轮测试,建议的绘图参数设置包括:
Steps ≥ 25
Sampler: DPM++ 2M Karras
CFG scale: 10
Size ≥ 1024x1024
ADetailer: open
クリエイタースポンサー
🖥️ワンクリックインストールで画像の事前圧縮やタグ付け機能を持つオープンソースGPT4V-Image-Captionerを試してください。
簡単に組み込めるwebuiプラグイン版も利用可能です。
🖥️私と友人が開発したオープンソースのGPT4V-Image-Captionerをぜひお試しください。ワンクリックインストールで、画像の事前圧縮、画像タグ付け、タグ統計など多機能が統合されています。最近、webuiプラグイン版もリリースし、皆様にご利用いただけます!
🌍QQ群「兔狲·AIGC梦工北厂」へようこそ、グループ番号:780132897、「兔狲·AIGC梦工南厂」グループ番号:835297318(参加にはキーワード「兔狲」が必要です)。Telegramグループ「兔狲のSDXLブロードウェイ」のリンクは:https://t.me/+KkflmfLTAdwzMzI1
📖HelloWorld 7.0 アップデート - 2024年6月13日
一言アップデート概要:HelloWorld 7.0は逐次最適化版で、シリーズ中最高のボディパフォーマンスと、さらに拡張されたコンセプト範囲と詳細の豊かさを実現しました。
アップデート詳細:
ネガティブ画像を追加し、ポーズ訓練を強化し、clipモデルを最適化することで、四肢と手の精度が前バージョンより向上しました。推奨するネガティブプロンプトワードは「bad hand, bad anatomy, worst quality, ai generated images, low quality, average quality」です。
公式SPOモデルから微調整したLoRAを抽出し、HelloWorld 7.0に組み込みました。SPOはDPO法のさらなる改良版で、SPOベースモデルはDPO XLベースモデルや元のSDXLベースモデルより性能が優れています。SPO LoRAは画像の細部・コントラストを強化し、美化します。SPOの技術チームに感謝します。
トレーニングセットのコンセプト範囲を拡張しつつ最適化・スリム化しました(大型セットの微調整はコストが高く、H800のレンタルも困難のためローカルトレーニング時間の確保が難しいため)。現在の総画像数は20,821枚です。解像度分布は下記の通りで、画像数の多い解像度を複数使うことを推奨します:
(832, 1248) - 7128枚 (896, 1152) - 6250枚 (1248, 832) - 2402枚 (1024, 1024) - 1639枚 (1360, 768) - 928枚 (1152, 896) - 870枚 (768, 1360) - 432枚 (960, 1088) - 506枚 (992, 1056) - 162枚 (1088, 960) - 140枚 (704, 1472) - 120枚 (1056, 992) - 122枚 (1472, 704) - 115枚 (1632, 640) - 75枚 (640, 1632) - 12枚すべてのデータセットをGPT4Oで再ラベルしました。今回は構造化ラベリング法を採用し、構造は「一文要約記述+複数の画像要素タグ+inspired by XXX+美的品質表現語」で、美的品質は5段階(worst quality, low quality, average quality, best quality, masterpiece)に分けています。代表的なラベル例は次の通りです:
conceptual art featuring a human hand wrapped in red and beige ribbons, isolated against a plain, light background, realistic style, minimalist color scheme, smooth textures, elongated and surreal aesthetic, inspired by salvador dalí's surrealist works, masterpiece
「高頻度タグリスト」およびHelloWorld 7.0版の「高頻度アートスタイルリスト」は、商用ライセンスユーザーのみに提供します。過去にHelloworld XLシリーズモデルの認証を購入済みのパートナーは欠落分を無償で受け取るためにご連絡ください。
ユーザーはHelloWorld 6.0の高頻度タグリストも参照可能です。また、ギャラリーには150枚以上の高品質なHelloWorld 7.0サンプル画像を用意し、皆様の出力の参考にしていただけます。モデル作成は容易ではなく、プレイヤーのご理解とご寛容に感謝します!
📖HelloWorld 6.0 アップデート - 2024年4月20日
LEOSAM HelloWorld 6.0 トップ250高頻度タグリスト
お待たせしました。最近は就職活動のためHelloWorldの更新が遅れました。6.0の主な更新点は以下の通りです:
HelloWorld 6.0は5.0の逐次改良版で、自身のテストによるとリアリズム効果は5.0と大差ありません。6.0の主な強みはトレーニングセットのコンセプト範囲が広がったことです。フィードバックに応じて超現実主義、ブドワール、集合写真、マスク、折り紙、3Dレンダリング、車、ドラゴン、マタニティフォトなど多様なテーマが強化され、図示例もあります。
6.0は意図的に低品質画像を含め、ネガティブプロンプト対応能力を向上させました。推奨ネガティブキーワードは「low quality, jpeg artifacts, blurry, poorly drawn, ugly, worst quality」です。
HelloWorld 6.0の主体トレーニングセットはGPT4vタグ付けを用い、タグ付けできない画像はblip2-opt-6.7bによるcogVQAで補完します。これらマルチモーダルモデルのタグ付け言語スタイルは従来のWD1.4タガーと大きく異なり、異なる概念トリガー精度向上のため、6.0の250高頻度タグリストをこちらの文書で公開しています。
最後に、SD3リリース目前ですが、7.0へ向けHelloWorld XLのさらなる向上を目指してアップデートを続けます!
📖2024年2月22日 「HW5.0_Euler_a_Lightning」紹介
このモデルはHelloWorld SDXLベースモデルの高速版で、SDXL-Lightning技術を組み込んでいます。Eular aサンプラーとCFG 1を搭載し、6-8ステップで画像生成可能で、元のSDXL版より3倍速いです。さらに比較では、LCMやTurbo版より画像描写が優れます。
推奨パラメータ:
サンプラー: Eular a(重要!モデルはEular aに最適化されており、他サンプラーは性能が劣る可能性あり)
CFGスケール: 1
サンプリングステップ: 8ステップ(6~8ステップ可)
ハイレゾアルゴリズム: ESRGAN 4x / 8x_NMKD-Faces_160000_G
ハイレゾアップスケール倍率: 1.5倍
ハイレゾステップ: 8ステップ
ハイレゾノイズ除去強度: 0.3
📖2024年2月11日 「HelloWorld 5.0 GPT4V」紹介
HelloWorld 5.0はシリーズ史上最大のアップデートで、GPT-4vタグ付けが施され、SF、動物、建築、イラスト分野で大幅に微調整されています。
比較テストでの改善点:
1. より多様で動的なキャラポーズと構図により視覚的魅力が向上;
2. 映画テクスチャのトレーニングが大幅に拡充。バージョン2.0~4.0では弱かった映画テクスチャを強化。leogirlスタイルも復活。映画テクスチャは「film grain texture」「analog photography aesthetic」のフレーズで誘発可能;
3. SF、スリラー、動物テーマの表現力強化。メカ等はよりデザイン感が増し、ユキヒョウ、レッサーパンダ、ジャイアントパンダ、トラ、パラスキャット、ペットの猫・犬などがよりリアルに;
4. GPTタグ付けにより、プロンプトの遵守性とコンセプト精度が向上。
欠点:
1. 大幅な微調整のため四肢のエラー率がやや上昇。過去のバージョンは四肢精度向上に時間を費やしたが、新版では時間不足。ただし1.0版よりは正確で、今後も改良予定;
2. 強化された映画テクスチャにより、画像に温かみのあるデフォルトトーンが生じやすい。だが「studio light」や「sharp focus」のプロンプトで高解像度スタジオ品質の画像を生成可能。適切なプロンプト使用で肌トーンや見栄えが良くなる;
3. 全身キャラ画像を増やし全身表現を強化。特定のキャラ構図指定がない場合はより広いシーンが生成されることも。1024解像度の全身顔詳細は半身やクローズアップに比べ鮮明さが劣るが、adetailerや1.5倍ハイレゾ補正(強度0.3)で改善可能。また、構図指定で全身生成を避けるのも手段;
4. 高品質イラストデータセットを少量追加したため、アニメスタイルのプロンプトでアニメ画像が生成される可能性あり。気になる場合はプロンプト調整を推奨。
これが本バージョンの主な更新点です。SDXLベースモデルの学習は困難で、トレーニングセット1万枚に迫ると、タグ付け・学習コストが1モデル当たり300米ドル超。皆様のご利用とフィードバックを歓迎します!満足いただけた場合は、ぜひ広めていただけると幸いです。
📖2024年1月31日 「HelloWorld 4.0」紹介
HelloWorld 4.0はblip+clipタグ付けからGPT4Vタグ付けへの進展的移行版です。最初に純粋なGPT4Vタグ付けモデルを学習し、大部分をHelloWorld3.2版、0.05比率でJuggernaut XL(肌色調整用)を融合しました。新バージョンは3.2と比べ、プロンプト準拠度やコンセプトカバー率が改善しました。
新GPT4Vタグ付け学習セットは、helloworld3シリーズの4000枚から8000枚に倍増し、ポートレートだけでなく動物、建築、自然、食品、イラストなども含みます。しかし純粋GPT4V版は過学習問題が初期的に発生し、原因は画像枚数倍増にあると推定。次回の最適化では、ポートレートを十分訓練しつつ非ポートレートコンセプトも多く含める方策を検討。現在は新旧融合版で微調整しバージョン間の滑らかな移行を図り、拡張コンセプト集合やGPT4Vタグ付けの利点はまだ目立ちませんが、今後の5、6世代で顕著になる予定です。
📖2024年1月5日 「HelloWorld 3.2」紹介
バージョン3.2はDPO技術による最適化版で、3.0と比べ肌色や四肢精度の微調整はあるものの大幅な改善ではありません。そのため4.0ではなく3.2と命名されています。
📖2023年12月15日 「HelloWorld 3.0」紹介
新バージョンは学習セットを拡張し、SFやアートなど多様な表現力を強化しました。
独自制作の品質向上LoCon(スライダー技術で作成)を統合し、画像テクスチャを改善、指や四肢の歪み問題を軽減しました。
📖2023年11月17日 「HelloWorld 2.0」紹介
お待たせしました。様々な問題を乗り越え、HelloWorld 2.0は満足できる状態となりました。1.0との主な違いは:
HelloWorld 2.0はもはやトリガーワード不要で、1.0のトリガーワード付きと遜色ない品質です。1.0の「leogirl」は東アジア人と強く関連していましたが、トリガーワード廃止後も「1girl」などは人種指定がなければ東アジア風になることが多いです。代わりに民族、肌の色などキーワードで人種指定できます。例えば「Chinese」、「Russian」、「Iranian」、「Jamaican」、「Kenyan」、「dark-skinned」、「pale-skinned」等の効果例を以下に示します。

さらに、各国や性別の人物名をプロンプトに入れて多様なスタイルのキャラを生成可能です(例:中国のHan Meimei、フランスのSophie Martin、インドのPriya Patel、アラブのFatima Al-Hassan、ケニアのWanjiru Mwangi)。上記は例示で、多数のプロンプトや遊び方を自由に探求・共有してください。

HelloWorld 2.0は画質・色味のバランスが良く、より多様なスタイルを提供します。1.0は「leogirl」使用時に強いフィルムテクスチャが特徴でしたが、2.0はフィルムテクスチャに縛られず、品質関連のプロンプトでカスタマイズ可能です。テスト済みの有効なプロンプト例は以下の通りです:
high-end fashion photoshoot, product introduction photo, popular Korean makeup, aegyo sal, Sharp High-Quality Photo, studio light, medium format photo, Mamiya photography, analog film, Medium Portrait with Soft Light, real-life image, refined editorial photograph, raw photo, real photo, Scanned Photo, film still
これらのプロンプトによるカラーフィルタ効果は以下の通りです:

HelloWorld 2.0のトレーニングセットは全身写真の比率を大幅に増やし、SDXLの全身および遠景ポートレート生成性能を強化しました。1.0より改善しているものの、全身写真生成時にはadetailerの併用を強く推奨します。さらにVRAMが十分(24GB以上)な方は1.5倍ハイレゾ補正をかけることで顔のディテールが大幅に向上します。
📖2023年8月29日 「HelloWorld」SDXLベースモデル紹介
特別注意: HelloWorld 1.0モデル使用時は必ずトリガーワード「leogirl」を付けてください。
SD1.5ベース「MoonFilm」とは異なり、「HelloWorld」はまったく新しいリアルなSDXLベースモデルシリーズです。より多くのユーザーにHelloWorldを知っていただくため、Moonfilmのモデルリンクは維持しており、SDXLプラットフォーム上のMoonfilmの精神的継承とも言えますが、HelloWorldは単なるリアリズムやフィルム調の追求以上を目指します。SDXLの情報量とテキスト理解能力はSD1.5を遥かに凌ぐため、HelloWorldはすべてのものをリアルに描写すること、すなわちHelloWorldを用いた仮想写真世界を段階的に構築したいと考えています。
SD1.5のリアル系ベースモデルは成熟段階にあり、大幅な性能向上は見込みにくいため、Moonfilm&MoonMixシリーズの更新は基本停止し、HelloWorld SDXL大型モデル開発に主力を注ぎます。1.0版は既に配布中で、2.0版は急ぎ開発中で9月初旬更新予定です。
新しいSDXLモデルであるHelloWorldは従来のSD1.5モデルと3つの違いがあります:
SD1.5ベースモデルはトリガーワードなしが多いのに対し、HelloWorld 1.0では必ずトリガーワード「leogirl」を使ってください。これによりSDXLモデルがトレーニングセット効果を安定的に発動します。
HelloWorldモデルは1024×1024ピクセルの直接出力をサポートし、高解像度拡大が不要です。近景ポートレートの質はSD1.5に劣りませんが、遠景直出にはまだ欠点があります。よってADetailerプラグインの併用を推奨し、遠景顔問題を効果的に修正可能です。
SDXLは今や単純な自然言語プロンプトでの出力が容易になっており、より多くの自然言語プロンプトを試すことを推奨します。AI写実写真を出す際により良い効果が得られます。
複数回のテストを経て、推奨描画パラメータ設定は:
ステップ数 ≥ 25
サンプラー: DPM++ 2M Karras
CFGスケール: 10
サイズ ≥ 1024×1024
ADetailer: 有効
皆様のHelloWorld試用とフィードバックを心より歓迎します。貴重なご意見はモデル改良の次の一歩に不可欠です!
著作権声明:
HelloWorldシリーズモデル(以下「本モデル」)は私(以下「オーナー」)がLiblibAIプラットフォームの支援を得て制作しました。本モデルをLiblibAIやCivitai以外のプラットフォームで再配布する行為は許可していません。
オーナーは、非商用の教育的または情報提供目的での本モデルによる生成画像の使用を無償で許可します。ただし、以下条件を遵守してください:
- 法令を順守し、本モデル及び第三者の権利を侵害しないこと。
- 画像のクレジット表記は「LEOSAMのHelloWorldベースモデルによる作成」と明記すること。
商用利用は事前にオーナーとの商用ライセンス契約が必要です。商用ライセンスやモデルの個別対応に関する問い合わせはオーナーのホームページの連絡先へお願いします。
SDXLモデルの開発と無償配布は重要な取り組みであり、オーナーは個人愛好者向けにHelloWorldモデルの継続的な無償アップデートを約束します。商用の共同開発はモデルの改善に不可欠であり、ユーザーの理解と支援に感謝します。
無許可利用は法令違反となり法的責任を伴う可能性があります。本声明の解釈権はオーナーに帰属し、現行法令に準拠します。