LEOSAM 的 HelloWorld XL - HW5.0_Euler_a_Lightning
推薦提示詞
film grain texture,analog photography aesthetic,studio light,sharp focus,high-end fashion photoshoot,product introduction photo,popular Korean makeup,aegyo sal,Sharp High-Quality Photo,medium format photo,Mamiya photography,analog film,Medium Portrait with Soft Light,real-life image,refined editorial photograph,raw photo,real photo,Scanned Photo,film still
film grain texture, analog photography aesthetic
推薦反向提示詞
bad hand,bad anatomy,worst quality,ai generated images,low quality,average quality,jpeg artifacts,blurry,poorly drawn,ugly
(worst quality, low resolution, bad hands), distorted, twisted, watermark, open mouth
推薦參數
samplers
steps
cfg
resolution
推薦高解析度參數
upscaler
upscale
steps
denoising strength
提示
使用 HelloWorld 1.0 時,搭配觸發詞 “leogirl” 可獲得穩定效果。
全身照請使用 ADetailer 插件及 1.5x 高解析修復以提升細節。
自然語言提示詞有助於提升 AI 逼真照片輸出效果。
由於 HelloWorld 5.0 強化了電影質感,請注意圖像可能帶有暖色調,添加 “studio light” 或 “sharp focus” 可優化膚色。
若不希望生成動畫風格,避免使用相關動畫風格提示詞,因 5.0 版本加入了部分插畫數據集。
使用推薦的負面提示詞可改善肢體與手部準確度及整體圖像質量。
版本亮點
該模型為 HelloWorld SDXL 基礎模型的加速版本,融合了 SDXL-Lightning 技術。配備 Eular a 采樣器及 CFG 1,能於 6-8 步內生成圖像,速度為原 SDXL 版本的三倍。此外,其成像效果優於 LCM 或 Turbo 版本,強烈推薦大家測試和使用。
使用該模型生成圖像的推薦參數為:
采樣器: Eular a(重要!模型專為 Eular a 適配,其他采樣器效果可能不佳)
CFG 比例: 1
采樣步數: 8 步(接受 6~8 步)
高解析算法: ESRGAN 4x / 8x_NMKD-Faces_160000_G
高解析放大倍數: 1.5x
高解析步數: 8 步
高解析去噪強度: 0.3
創作者贊助
🖥️歡迎嘗試由我和朋友共同開發的開源 GPT4V-Image-Captioner,可一鍵安裝,集成圖片預壓縮、圖片標註及標籤統計功能。
近期我們推出了該工具的webui 插件版本,歡迎大家使用!
🖥️歡迎嘗試由我和朋友共同開發的開源 GPT4V-Image-Captioner,可一鍵安裝,集成多項功能包括圖片預壓縮、圖片標註及標籤統計。近期我們也推出了webui 插件版本,歡迎大家使用!
🌍歡迎加入QQ群“兔狲·AIGC夢工北廠”,群號:780132897;“兔狲·AIGC夢工南廠”,群號:835297318(入群答案:兔狲)。Telegram 群聊“兔狲的 SDXL 百老匯”,連結:https://t.me/+KkflmfLTAdwzMzI1
📖HelloWorld 7.0 更新 - 2024 年 6 月 13 日
一句話更新摘要:HelloWorld 7.0 是一次迭代優化版本,具備全系列最佳的身體表現,並進一步擴展概念範圍及豐富細節。
更新詳情:
通過新增負面訓練圖像、強化姿態訓練及優化 clip 模型,模型肢體與手部準確度較之前版本提升。推薦的負面提示詞為:“bad hand, bad anatomy, worst quality, ai generated images, low quality, average quality”。
從官方 SPO 模型中提取微調後的 LoRA,並整合到 HelloWorld 7.0。SPO 是對 DPO 方法的進一步提升。SPO 基礎模型性能優於 DPO XL 基礎模型及原始 SDXL 基礎模型。SPO LoRA 能提升圖像細節與對比度並美化圖片。感謝 SPO 團隊的技術支持。
持續擴展訓練集概念範圍,同時優化簡化訓練集(大規模訓練集微調成本高,近期租用 H800 困難,且本地訓練時間有限)。目前訓練集共計 20,821 張圖片。訓練集解析度分佈如下,建議選用圖像數量較多的幾個分辨率作輸出:
(832, 1248) - 數量: 7128 (896, 1152) - 數量: 6250 (1248, 832) - 數量: 2402 (1024, 1024) - 數量: 1639 (1360, 768) - 數量: 928 (1152, 896) - 數量: 870 (768, 1360) - 數量: 432 (960, 1088) - 數量: 506 (992, 1056) - 數量: 162 (1088, 960) - 數量: 140 (704, 1472) - 數量: 120 (1056, 992) - 數量: 122 (1472, 704) - 數量: 115 (1632, 640) - 數量: 75 (640, 1632) - 數量: 12使用 GPT4O 重新標註所有數據集。本次採用結構化標註,具體結構為:“一句話摘要描述 + 多重圖像元素標籤 + inspired by XXX + 美學質量描述詞”,其中美學質量描述詞分為五個等級:worst quality、low quality、average quality、best quality 與 masterpiece。典型標註示例如下:
概念藝術,描繪一隻包裹在紅色和米色絲帶中的人手,背景淨色且明亮,真實風格,極簡色彩方案,質感光滑,延伸且超現實美學,靈感來自薩爾瓦多·達利的超現實主義作品,傑作
HelloWorld 7.0 版本所涉及的 “Inspired by XXX” 中的“高頻標註詞列表”與“高頻藝術風格列表”僅提供給商業授權用戶。此前購買過 HelloWorld XL 系列模型授權的合作夥伴,如有遺漏,請聯繫我免費獲取。
玩家可參考 HelloWorld 6.0 索引的高頻標註詞列表。此外,我還在畫廊中提供了 150 多張高品質 HelloWorld 7.0 範例圖,作為大家輸出的參考。製作模型不易,感謝玩家的理解與包容!
📖HelloWorld 6.0 更新 - 2024 年 4 月 20 日
LEOSAM HelloWorld 6.0 高頻標註詞前 250 名列表
感謝您的耐心。近期因求職導致 HelloWorld 更新有所延誤,以下為 6.0 版本的主要更新:
HelloWorld 6.0 是基於 5.0 的迭代改進。根據本人測試,逼真效果與 5.0 沒有顯著差異,6.0 版本的優勢主要在於擴大了訓練集中概念涵蓋。根據反饋,在超現實主義、閨房畫、團體照、面具、摺紙、3D 渲染、汽車、龍及孕婦攝影等多主題上有所加強。部分示例見圖解說明。
HelloWorld 6.0 故意在訓練中加入一些低質量圖片,以強化模型對負面提示詞的響應。建議在負面提示詞中使用:“low quality, jpeg artifacts, blurry, poorly drawn, ugly, worst quality”。
HelloWorld 6.0 主要訓練集使用 GPT4v 標註。對於 GPT4v 無法標註的圖片,採用由 blip2-opt-6.7b 指導的 cogVQA 進行標註。這些多模態模型的標註語言風格與傳統 WD1.4 標註器差異較大。為方便更精確地觸發訓練集中的不同概念,特整理了 HelloWorld 6.0 訓練集中的前 250 個高頻標註詞,詳見此文檔。
最後,雖然 SD3 即將發佈,我仍會持續更新至 HelloWorld XL 7.0,期望在 7.0 版本達成更大提升!
📖2024.2.22 發佈 「HW5.0_Euler_a_Lightning」
該模型是 HelloWorld SDXL 基礎模型的加速版本,融合了SDXL-Lightning 技術。配備 Eular a 采樣器和 CFG 1,能在 6-8 步生成圖像,速度比原版 SDXL 快三倍。且比較顯示,其成像效果優於 LCM 或 Turbo 版本。
使用該模型生成圖像的推薦參數為:
采樣器: Eular a(重要!該模型專為 Eular a 適配,其他采樣器效果可能不佳)
CFG 比例: 1
采樣步數: 8 步(6~8 步皆可)
高解析算法: ESRGAN 4x / 8x_NMKD-Faces_160000_G
高解析放大倍數: 1.5x
高解析步數: 8 步
高解析去噪強度: 0.3
📖2024.2.11 發佈 「HelloWorld 5.0 GPT4V」
HelloWorld 5.0 是 HelloWorld 系列歷史上最重大的一次更新,附帶 GPT-4v 標註,並在科幻、動物、建築及插畫等領域進行了深度微調。
對比測試顯示該版本提升包括:
1. 角色姿勢和畫面構圖更加多變動態,增強視覺吸引力;
2. 電影數據集得到廣泛訓練。2.0 至 4.0 版本的電影質感較弱,許多粉絲懷念 1.0 的 leogirl 風格。因此,此更新專門強化電影質感,且不影響其他攝影品質。可透過"film grain texture"和"analog photography aesthetic"等詞觸發電影質感;
3. 提升科幻、驚悚及動物主題表現力,機甲等主題更具設計感。雪豹、紅熊貓、大熊貓、老虎、祿氏貓及家貓狗更為逼真;
4. 感謝 GPT 標注,提升了提示詞遵循度及概念準確性。
但缺點包括:
1. 本次為重大微調更新,肢體錯誤率可能略增,屬合理現象。前版本曾進行大量肢體改進測試,新版本時間有限。儘管如此,本版本肢體準確度仍不低於 1.0,未來會持續改進;
2. 強化電影質感後,儘管 GPT 標註盡量精準,圖像不可避免地帶有偏暖色調。但可用"studio light"或"sharp focus"等提示詞獲得高清工作室質感圖像,並達到更好膚色與視覺效果;
3. 版本內包含更多全身人物圖像以加強全身效果,無特定構圖指示時,模型可能生成更廣闊場景。目前 1024 解像度全身臉部細節較半身或特寫略差,但可透過 adetailer 及 1.5x 高解析修復強度 0.3 改善,或使用提示詞避免生成全身圖像;
4. 由於加入少量高質量插畫數據集,某些動畫風格提示詞可能生成動畫圖片。如有顧慮,請調整提示詞。
以上為主要更新內容。訓練 SDXL 基礎模型具挑戰性,當訓練集接近萬張圖片時,標注與訓練每模型成本超過 300 美元。歡迎大家使用此模型並提供反饋!若覺得滿意,請多多宣傳支持。
📖2024.1.31 發佈 「HelloWorld 4.0」
HelloWorld 4.0 是從 blip+clip 標註過渡到 GPT4V 標註的漸進版本。我初期訓練了純 GPT4V 標註模型,然後融合了多數 HelloWorld 3.2 版本及少量(0.05 比例)Juggernaut XL (用於調整膚色)。新版本在提示詞遵循及概念覆蓋方面較 3.2 有所提升。
新 GPT4V 標註訓練集由 helloworld3 系列的 4000 張圖增至 8000 張,涵蓋肖像、動物、建築、自然、食物、插畫等多範疇。但純 GPT4V 版本出現過擬合問題,初步判斷與訓練圖像數量翻倍有關。下一步迭代優化將努力在保證肖像充分訓練的同時,盡可能涵蓋更多非肖像概念。現階段採用新舊版本融合微調以確保版本平滑過渡,目前擴展概念集及 GPT4V 標註帶來的優勢尚不明顯,後續 5、6 代模型將更為顯著。
📖2024.1.5 發佈 「HelloWorld 3.2」
3.2 版為基於 DPO 技術優化的迭代版,較 3.0 版在膚色和肢體準確度有所優化,但提升不大,故用 3.2 標記,而非 4.0。
📖2023.12.15 發佈 「HelloWorld 3.0」
擴充訓練集,提升模型對不同藝術風格的表達力,包括科幻與藝術。
集成自製質量提升 LoCon(使用 slider 技術製作),增強圖像質感,改善手指和肢體變形問題。
📖2023.11.17 發佈 「HelloWorld 2.0」
感謝大家耐心等待。經過諸多挑戰,HelloWorld 2.0 終於以我滿意的狀態呈現給大家。2.0 與 1.0 的主要區別如下:
HelloWorld 2.0 不再需要觸發詞,效果與使用觸發詞的 1.0 相當。1.0 中觸發詞“leogirl”與東亞人高度相關。取消觸發詞後,雖然如“1girl”等詞未指定種族時仍可能生成東亞肖像,但現可以透過國籍、膚色等關鍵詞指定種族。例如:“Chinese”、“Russian”、“Iranian”、“Jamaican”、“Kenyan”、“dark-skinned”、“pale-skinned”等關鍵詞的觸發效果列於下文。

您也可以在提示詞中撰寫來自不同國家和性別的人名,如漢美美(中國)、Sophie Martin(法國)、Priya Patel(印度)、Fatima Al-Hassan(阿拉伯)、Wanjiru Mwangi(肯尼亞),獲得不同風格角色。以上為示例,還有許多提示詞玩法,歡迎自行探索與分享。

HelloWorld 2.0 在品質與色彩上更均衡,並提供更多風格選擇。1.0 使用“leogirl”時常呈現強烈的電影質感,2.0 不再綁定電影質感,可用相關品質提示詞自訂。經測試表現良好的提示詞包括:
高端時尚攝影、產品介紹照、流行韓妝、可愛眼袋、銳利高質量照片、工作室光、數碼中幅相機攝影、Mamiya 攝影、類比膠片、中等柔光人像、實景影像、精緻編輯照片、原片、實拍、掃描照片、電影劇照
提示詞帶來的色彩效果如下圖:

HelloWorld 2.0 的訓練集中大幅提升全身照片比例,以增強 SDXL 生成全身與遠景肖像的效果。雖較 1.0 有所改善,但強烈建議在生成全身照過程使用 "adetailer"。此外,擁有 24GB 以上顯存的用戶建議進行 1.5x 高解析修復,可顯著提升臉部細節。
📖2023.8.29 發佈 「HelloWorld」SDXL 基礎模型
特別提醒:使用 HelloWorld 1.0 模型時,請記得添加觸發詞“leogirl”。
不同於 SD1.5 基礎模型“MoonFilm”,“HelloWorld”是一個全新逼真的 SDXL 基礎模型系列。為了讓更多用戶發現 HelloWorld,本人保留了原 MoonFilm 的模型鏈接,可視為 MoonFilm 在 SDXL 平台上的精神延續,但 HelloWorld 不僅追求逼真與膠片質感肖像。得益於 SDXL 相較 SD1.5 在信息量與文本理解能力上的遠超能力,HelloWorld 是一個旨在逼真展現萬物的基模,即希望用它逐步構建虛擬攝影世界。
SD1.5 的逼真基模已發展至相當成熟階段,性能提升空間有限。除非 SD1.5 平台有突破技術,否則 MoonFilm & MoonMix 系列基本停止更新。我將主力投入 HelloWorld SDXL 大模型的開發。目前 1.0 版本已可下載,2.0 版本正加急開發,預計九月初更新。
作為全新 SDXL 模型,HelloWorld 與傳統 SD1.5 模型有三大不同:
不同於通常不含觸發詞的 SD1.5 基礎模型,請務必在使用 HelloWorld 1.0 時添加觸發詞“leogirl”,確保 SDXL 模型穩定觸發訓練集效果。
HelloWorld 支援直接輸出 1024*1024 分辨率,無需高解析放大。直接輸出的人像質量不遜於 SD1.5 版本,但遠景肖像直接輸出仍存在缺陷,建議搭配 ADetailer 插件,有效修正遠景臉部問題。
SDXL 現允許通過 簡單自然語言提示詞 輕鬆輸出,建議多嘗試使用自然語言提示詞,可獲得更佳的 AI 逼真照片輸出效果。
經多輪測試,建議繪製參數設置為:
步數 ≥ 25
采樣器:DPM++ 2M Karras
CFG 比例:10
尺寸 ≥ 1024x1024
ADetailer:開啟
歡迎大家嘗試 HelloWorld 並提供大量反饋。您的寶貴意見對模型下一步改進非常重要!
版權聲明:
HelloWorld 系列模型(以下稱“模型”)由本人(以下稱“版權方”)利用 LiblibAI 平台協助創作。未經版權方授權,禁止在除 LiblibAI 與 Civitai 外的平台上轉載模型。
版權方允許免費使用模型生成的圖片於非商業教育或資訊用途,條件為:
- 用戶遵守相關法律法規,不侵犯模型或第三方權益。
- 圖像需明確標註“由 LEOSAM 的 HelloWorld 基礎模型創作”。
任何形式的商業用途,均需先與版權方簽訂商業授權協議。商業授權及模型定制相關諮詢,請通過版權方主頁公布的聯繫方式聯絡。
SDXL 模型的開發與免費分發為重大投入。版權方承諾作為對開源社群支持的回饋,持續免費更新 HelloWorld 模型予個人愛好者。商業合作對模型推進和優化至關重要。感謝每位用戶的理解與支持。
未經授權使用,可能違反相關法律並產生法律責任。版權方保留對本聲明的最終解釋權,並遵守現行法律法規。
