LEOSAMのHelloWorld XL - HW5.0_Euler_a_Lightning
推奨プロンプト
film grain texture,analog photography aesthetic,studio light,sharp focus,high-end fashion photoshoot,product introduction photo,popular Korean makeup,aegyo sal,Sharp High-Quality Photo,medium format photo,Mamiya photography,analog film,Medium Portrait with Soft Light,real-life image,refined editorial photograph,raw photo,real photo,Scanned Photo,film still
film grain texture, analog photography aesthetic
推奨ネガティブプロンプト
bad hand,bad anatomy,worst quality,ai generated images,low quality,average quality,jpeg artifacts,blurry,poorly drawn,ugly
(worst quality, low resolution, bad hands), distorted, twisted, watermark, open mouth
推奨パラメータ
samplers
steps
cfg
resolution
推奨ハイレゾパラメータ
upscaler
upscale
steps
denoising strength
ヒント
HelloWorld 1.0ではトリガーワード「leogirl」を使用して安定した結果を得る。
全身ショットにはADetailerプラグインと1.5倍高解像度修正を使ってディテールを向上させる。
自然言語プロンプトを使用するとAIによるリアルな写真出力が向上する。
HelloWorld 5.0では映画的質感強化による暖色調に注意し、「studio light」や「sharp focus」をプロンプトに追加して肌色を改善する。
バージョン5.0で一部イラストデータセットが追加されたため、アニメ風スタイルのプロンプトは避けることを推奨。
四肢や手の精度と全体画像品質を向上させるため、推奨のネガティブプロンプトを使う。
バージョンのハイライト
このモデルはHelloWorld SDXLベースモデルのラン加速版で、SDXL-Lightning技術を取り入れています。Eular aサンプラーとCFG 1を搭載し、6~8ステップで画像生成可能で、オリジナルのSDXL版より3倍高速です。さらに比較すると、LCMやTurboバージョンよりも画像生成結果が優れているため、ぜひ皆様にテストと利用を推奨します。
このモデルの生成推奨パラメータは:
サンプラー: Eular a(重要!モデルは特にEular a用に調整されており、他のサンプラーでは同様の結果が得られにくい可能性があります)
CFGスケール: 1
サンプリングステップ: 8ステップ(6〜8ステップが許容可能)
高解像度アルゴリズム: ESRGAN 4x / 8x_NMKD-Faces_160000_G
高解像度アップスケール倍率: 1.5倍
高解像度ステップ数: 8ステップ
高解像度ノイズ除去強度: 0.3
クリエイタースポンサー
🖥️私の友人と私が開発したオープンソースのGPT4V-Image-Captionerをぜひお試しください。一括インストールが可能で、画像の事前圧縮、画像タグ付け、タグ統計機能が備わっています。
最近、このツールのwebuiプラグイン版も公開し、皆様にご利用いただけます!
🖥️私の友人と私が開発したオープンソースのGPT4V-Image-Captionerをぜひお試しください。一括インストールが可能で、画像の事前圧縮、画像タグ付け、タグ統計などの機能が統合されています。最近、このツールのwebuiプラグイン版も公開しましたので、どなたでもご利用いただけます!
🌍QQ群「兔狲·AIGC梦工北厂」に参加歓迎、グループ番号:780132897;「兔狲·AIGC梦工南厂」、グループ番号:835297318(参加時のキーワード:兔狲)。Telegramグループチャット「兔狲のSDXLブロードウェイ」、リンク:https://t.me/+KkflmfLTAdwzMzI1
📖HelloWorld 7.0アップデート - 2024年6月13日
一言でのアップデート概要:HelloWorld 7.0は逐次最適化されたバージョンで、シリーズ全体で最高のボディ性能を備え、コンセプト範囲とディテールの豊かさがさらに強化されました。
アップデート詳細:
ネガティブトレーニング画像を追加し、ポーズのトレーニングを強化、clipモデルを最適化することで、四肢と手の精度が前バージョンより向上しました。推奨ネガティブプロンプトワードは「bad hand, bad anatomy, worst quality, ai generated images, low quality, average quality」です。
公式SPOモデルから微調整済みのLoRAを抽出しHelloWorld 7.0に組み込みました。SPOはDPO手法のさらなる改良版で、DPO XLや元のSDXLより良い性能を誇ります。SPO LoRAは画像の細部とコントラストを強化し、美化します。SPOの技術チームに感謝します。
トレーニングセットのコンセプト範囲拡大を継続していますが、セット自体は最適化・精査しています(大規模セットの微調整はコスト高、H800レンタルも困難でローカルトレーニング時間が不足)。合計2万821枚の画像で、解像度の分布は以下の通りです。出力には多く使用されている解像度を複数使うことを推奨します:
(832, 1248) - 7128枚 (896, 1152) - 6250枚 (1248, 832) - 2402枚 (1024, 1024) - 1639枚 (1360, 768) - 928枚 (1152, 896) - 870枚 (768, 1360) - 432枚 (960, 1088) - 506枚 (992, 1056) - 162枚 (1088, 960) - 140枚 (704, 1472) - 120枚 (1056, 992) - 122枚 (1472, 704) - 115枚 (1632, 640) - 75枚 (640, 1632) - 12枚全データセットをGPT4Oで再ラベル付けしました。今回は構造化ラベリング方式を採用し、「一文要約説明+複数の画像要素タグ+XXXに触発された+美的品質記述語」の形式です。美的品質記述語は「worst quality, low quality, average quality, best quality, masterpiece」の五段階です。典型例は以下の通りです:
conceptual art featuring a human hand wrapped in red and beige ribbons, isolated against a plain, light background, realistic style, minimalist color scheme, smooth textures, elongated and surreal aesthetic, inspired by salvador dalí's surrealist works, masterpiece
Inspirited by XXXに関わる「高頻度タグ一覧」および「高頻度アートスタイルリスト」はHelloWorld 7.0の商用ライセンスユーザーにのみ提供されます。過去にHelloworld XLシリーズモデルの権限をご購入のパートナーは、見落としがあればご連絡頂ければ無料で提供いたします。
ユーザーはHelloWorld 6.0の高頻度タグリストも参照できます。また、150枚以上の高品質なHelloWorld 7.0例画像もギャラリーに提供しており、出力の参考に役立ちます。モデル製作は容易ではありません。プレイヤーの皆様の御理解と寛容に感謝します!
📖HelloWorld 6.0 アップデート - 2024年4月20日
LEOSAM HelloWorld 6.0 トップ250高頻度タグリスト
お待たせしました。最近就職活動に時間を割いており、HelloWorldの更新が遅延しました。バージョン6.0の主な更新点は以下です:
HelloWorld 6.0は5.0を基にした逐次改良版です。自身のテストによると写実性は5.0と大差ありません。6.0の主な利点はトレーニングセットのコンセプト範囲が広いことです。フィードバックによりシュールレアリズム、ブドワール、グループ写真、マスク、折り紙、3Dレンダリング、車、ドラゴン、マタニティフォトなどのテーマが強化されました。例はイラストに示されています。
HelloWorld 6.0は意図的に低品質画像を訓練に含め、ネガティブプロンプトへの反応を強化しました。推奨ネガティブプロンプトは「low quality, jpeg artifacts, blurry, poorly drawn, ugly, worst quality」です。
HelloWorld 6.0の主なトレーニングセットはGPT4vタグ付けを使用し、タグ付けできない画像はblip2-opt-6.7bによるcogVQAを利用しています。これらのマルチモーダルモデルのタグ付けスタイルは従来のWD1.4タグ付けと大きく異なります。訓練セット内の異なるコンセプトをより正確にトリガーできるよう、6.0のトップ250高頻度タグを文書でまとめました。
最後に、SD3のリリースが近いですが、HelloWorld XL 7.0のアップデートも引き続き行い、より大きな改善を目指します!
📖2024年2月22日 発表 「HW5.0_Euler_a_Lightning」
このモデルはHelloWorld SDXLベースモデルのラン加速版で、SDXL-Lightningの技術を取り入れています。Eular aサンプラーとCFG 1を搭載し、6~8ステップで画像生成が可能で、オリジナルSDXLより3倍高速です。さらに比較すると、LCMやTurboバージョンよりも画質が優れており、皆様にぜひテストと利用を推奨します。
このモデルの生成推奨パラメータは:
サンプラー:Eular a(重要!モデルはEular aに特化調整されており、他のサンプラーでは良好な結果が得にくい場合があります)
CFGスケール:1
サンプリングステップ数:8ステップ(6~8ステップ推奨)
高解像度アルゴリズム:ESRGAN 4x / 8x_NMKD-Faces_160000_G
高解像度アップスケール倍率:1.5倍
高解像度ステップ数:8ステップ
高解像度ノイズ除去強度:0.3
📖2024年2月11日 発表 「HelloWorld 5.0 GPT4V」
HelloWorld 5.0はシリーズ史上最大のアップデートで、GPT-4vタグ付けを搭載し、SF、動物、建築、イラスト分野で大幅な微調整を経ています。
比較テストでの改善点は:
1. より多様で動的なキャラクターポーズと構図により視覚的に魅力的な画像を生成。
2. 映画質感のデータセットを大幅に強化。2.0〜4.0で弱かった映画的テクスチャを補い、1.0のleogirlスタイルのファンにも配慮。映画質感は「film grain texture」や「analog photography aesthetic」などのフレーズで誘発可能。
3. SF、スリラー、動物などの表現力が向上し、メカやその他テーマのデザイン感も増加。ユキヒョウ、レッサーパンダ、ジャイアントパンダ、トラ、パラスネコ、家猫や犬などがよりリアルに。
4. GPTタグ付けのおかげでプロンプト遵守率とコンセプトの正確さがさらに改善。
一方、欠点は:
1. 大幅な微調整のため四肢の誤差率がわずかに増加する可能性あり。過去のバージョンは四肢改良に多くの時間を費やしたが、新バージョンは時間制約あり。ただし1.0よりは四肢の精度は向上し、今後も改良予定。
2. 強化された映画質感の影響で、GPTタグ付けが正確でも画像にデフォルトの暖色調が入りやすい。ただし「studio light」や「sharp focus」などのプロンプトを追加すればスタジオ品質の高解像度画像が得られ、より良い肌色と視覚効果になる。
3. 全身キャラ画像を増やして全身表現を強化しているため、特定の構図指示がない場合は従来より風景の幅が広くなる可能性あり。現在1024解像度の全身画像の顔のディテールは半身やクローズアップより落ちるが、adetailerと1.5倍Hires・強度0.3の組み合わせや、構図指定で回避可能。
4. 一部高品質イラストデータセット追加により、アニメ風スタイルのプロンプトではアニメ画像が出ることあり。これが気になる場合はプロンプト調整を推奨。
主な更新内容は以上です。SDXLベースモデルの訓練は困難で、約一万枚の訓練セットで1モデル当たりのタグ付けと訓練コストは300USD超になります。みなさんの利用とフィードバックを歓迎します!このモデルを気に入った方は広めていただけると大変ありがたいです。
📖2024年1月31日 発表 「HelloWorld 4.0」
HelloWorld4.0はblip+clipタグ付けからGPT4Vタグ付けへの段階的移行を目指した中間バージョンです。最初に純粋なGPT4Vタグ付けモデルを訓練し、その後多数のHelloWorld3.2版と0.05比率のJuggernaut XL(肌色調整用)を統合しました。3.2版に比べプロンプト準拠とコンセプトカバーの改善が見られます。
新しいGPT4Vタグ付け訓練セットは以前のhelloworld3シリーズの4000枚から8000枚に倍増し、人物だけでなく動物、建築、自然、食べ物、イラストなどもカバーします。ただ純粋GPT4V版は過学習問題に直面し、訓練画像数倍増が一因と考えられます。次の逐次最適化ステップでは人物以外も十分訓練しつつ人物も確保する方法を模索中です。現段階では新旧融合版を微調整に用い、滑らかなバージョン遷移を実現し、拡張コンセプト群とGPT4Vタグ付けのメリットはまだ目立ちませんが、今後5、6世代で顕著になっていく予定です。
📖2024年1月5日 発表 「HelloWorld 3.2」
バージョン3.2はDPO技術を用いた最適化版で、3.0と比較し肌色や四肢の精度向上がありますが、大きな変化はありません。したがって4.0ではなく3.2と名付けています。
📖2023年12月15日 発表 「HelloWorld 3.0」
トレーニングセットを拡充し、SFやアートなど多様な芸術スタイル表現能力を強化。
自作の品質向上LoCon(スライダー技術で作成)を統合し、指や四肢の歪み問題を軽減しながら質感を改善。
📖2023年11月17日 発表 「HelloWorld 2.0」
皆さまお待たせしました。様々な困難を克服し、満足のいく状態でHelloWorld 2.0をリリースします。HelloWorld 2.0と1.0の主な違いは:
HelloWorld 2.0はトリガーワード不要で、1.0のトリガーワード有りの結果と同等品質。1.0のトリガーワード「leogirl」は東アジア系と強く結びついていました。トリガーワード廃止後も「1girl」は指定なし時に東アジア系生成が続きますが、「nationality」や「skin color」等キーワードで人種指定可能です。例えば「Chinese」「Russian」「Iranian」「Jamaican」「Kenyan」「dark-skinned」「pale-skinned」などのトリガー効果は以下に示します。

また、国や性別人名をプロンプトに入れて異なるスタイルのキャラも生成可能です。例:「Han Meimei (中国)」、「Sophie Martin (フランス)」、「Priya Patel (インド)」、「Fatima Al-Hassan (アラブ)」、「Wanjiru Mwangi (ケニア)」。例は一部で、他にも多数のプロンプトや遊び方がありますのでご自身でぜひ探求・共有してください。

HelloWorld 2.0は品質/色味のバランスを保ちつつ多様なスタイルを提供。1.0は「leogirl」使用時に強い映画質感生成でしたが、2.0は映画質感に固執せず、品質関連プロンプトでカスタマイズ可能。テスト済みの有効プロンプト例は:
high-end fashion photoshoot, product introduction photo, popular Korean makeup, aegyo sal, Sharp High-Quality Photo, studio light, medium format photo, Mamiya photography, analog film, Medium Portrait with Soft Light, real-life image, refined editorial photograph, raw photo, real photo, Scanned Photo, film still
これらプロンプトの色調効果は以下の通りです:

HelloWorld 2.0は全身写真の比率を大幅に増やし、SDXLの全身・遠景ポートレート生成性能を向上。1.0より改善はあるものの、全身写真生成時はadetailer使用を強く推奨。メモリ24GB以上のユーザーは、1.5倍高解像度修正を行うと顔のディテールが大幅に向上します。
📖2023年8月29日 発表 「HelloWorld」SDXLベースモデル
特別注意:HelloWorld 1.0モデル使用時は必ずトリガーワード「leogirl」を追加してください。
SD1.5ベースモデル「MoonFilm」とは異なり、「HelloWorld」は全く新しい写実的なSDXLベースモデルシリーズです。より多くのユーザーにHelloWorldを知ってもらうため、元のMoonFilmモデルリンクは残してあります。SDXL新プラットフォーム上でMoonFilmの精神的継続と捉えられますが、HelloWorldは単なる写実性と映画的品質の追求に留まらず、SDXLがSD1.5より圧倒的に多くの情報とテキスト理解能力を持つことを活かし、あらゆるものをリアルに表現し、仮想写真世界を構築することを目指します。
SD1.5の写実的ベースモデルは成熟段階に達し、大幅な性能向上は見込みにくいため、新技術がない限りMoonFilm & MoonMixシリーズは更新を停止します。HelloWorld SDXL大型モデルの開発に注力し、1.0版は既に公開中、2.0版は急ピッチで開発中、9月初旬の更新を予定しています。
新しいSDXLモデルとして、HelloWorldと従来SD1.5モデルの違いは3点あります:
SD1.5ベースは通常トリガーワード不要ですが、HelloWorld 1.0はトリガーワード「leogirl」の使用を推奨し、これによりSDXLモデルのトレーニングセット効果が安定します。
HelloWorldモデルは1024*1024ピクセルの直接出力をサポートし、高解像度拡大不要です。クローズアップポートレートの直接出力品質はSD1.5版に劣りませんが、遠景ポートレートの直接出力にはまだ欠点があるため、ADetailerプラグインの使用を推奨します。これにより遠景の顔の問題を効果的に修正可能です。
SDXLはシンプルな自然言語プロンプトでの出力を容易にしました。より多くの自然言語プロンプトの試行を推奨し、AIによるリアルな写真生成が向上します。
複数回のテストを経て推奨パラメータ設定は:
ステップ数 ≥ 25
サンプラー:DPM++ 2M Karras
CFGスケール:10
サイズ ≥ 1024x1024
ADetailer:オン
みなさまのHelloWorld試用とフィードバックを歓迎します。貴重なご意見は次のモデル改良に非常に重要です!
著作権声明:
HelloWorldシリーズのモデル(以下「本モデル」)は私自身(以下「所有者」)がLiblibAIプラットフォームの助力を得て制作しました。本モデルのLiblibAIおよびCivitai以外のプラットフォームでの無断転載は所有者の許可なく禁止します。
所有者は、本モデルから生成された画像を非営利の教育または情報提供目的で無償利用することを許可します。条件は:
- 利用者は関連法規を遵守し、本モデルや第三者の権利を侵害しないこと。
- 生成画像の著作表示として「LEOSAMのHelloWorldベースモデルによる作成」と明示すること。
営利利用には所有者との事前商用ライセンス契約が必要です。商用ライセンスやモデルの個別対応については所有者のホームページにある連絡先までお問い合わせください。
本SDXLモデルの開発と無料配布は大きな労力を伴います。所有者はオープンソース開発への貢献への感謝として、個人愛好家向けにHelloWorldモデルの無料更新を約束します。共同の商用活動は本モデルの改良と発展に不可欠です。所有者は全利用者の理解と支援に感謝します。
無断使用は法令違反となり法的責任を負う可能性があります。本声明の解釈権は所有者に独占的にあり、現行の法令が適用されます。