模型/LEOSAMs HelloWorld XL - HelloWorld XL 70

LEOSAMs HelloWorld XL - HelloWorld XL 70

推薦提示詞

conceptual art featuring a human hand wrapped in red and beige ribbons, isolated against a plain, light background, realistic style, minimalist color scheme, smooth textures, elongated and surreal aesthetic

film grain texture

analog photography aesthetic

推薦反向提示詞

bad hand,bad anatomy,worst quality,ai generated images,low quality,average quality,jpeg artifacts,blurry,poorly drawn,ugly

bad hand,bad anatomy,worst quality,ai generated images,low quality,average quality

推薦參數

samplers

Restart

steps

30

cfg

7

resolution

832x1248

other models

LeosamHelloWorldV7 (573f4a7d35)

提示

使用 ADetailer 修正遠景人臉。

使用簡單自然語言提示詞以獲得更佳的 AI 寫實照片。

高質量肖像可透過 ADetailer 和 0.3 強度的 1.5x Hires 修復提升。

版本亮點

HelloWorld 7.0 更新 - 2024年6月13日

一句話更新總結:HelloWorld 7.0 是反覆優化版本,擁有系列中最佳的身體表現,並進一步提升了概念範圍及細節豐富度。

更新細節:

  1. 通過加入負面訓練圖片、強化姿態訓練及優化 clip 模型,模型肢體與手部的準確度相比以往版本有提升。建議的負面提示詞為:“bad hand, bad anatomy, worst quality, ai generated images, low quality, average quality”。

  2. 官方 SPO 模型中提取經微調的 LoRA,並整合到 HelloWorld 7.0 中。SPO 是 DPO 方法的進一步提升。SPO 基礎模型性能優於 DPO XL 基礎模型和原始 SDXL 基礎模型。SPO LoRA 能提升畫面細節與對比,並美化影像。感謝 SPO 技術團隊。

  3. 持續擴展訓練集的概念範圍,但對訓練集進行了優化和精簡(大型訓練集微調成本過高,且 H800 最近難以租用,無法負擔本地訓練時間)。目前總訓練集包含 20,821 張圖片。訓練集解析度分佈如下,建議使用含較多圖片數量的幾種解析度進行輸出:

    (832, 1248) - 數量: 7128
    (896, 1152) - 數量: 6250
    (1248, 832) - 數量: 2402
    (1024, 1024) - 數量: 1639
    (1360, 768) - 數量: 928
    (1152, 896) - 數量: 870
    (768, 1360) - 數量: 432
    (960, 1088) - 數量: 506
    (992, 1056) - 數量: 162
    (1088, 960) - 數量: 140
    (704, 1472) - 數量: 120
    (1056, 992) - 數量: 122
    (1472, 704) - 數量: 115
    (1632, 640) - 數量: 75
    (640, 1632) - 數量: 12
  4. 使用 GPT4O 重新標註所有數據集。這次採用了結構化標記方法,具體結構為:“一句話摘要描述 + 多個影像元素標籤 + inspired by XXX + 審美品質描述詞”,其中審美品質描述詞分為五個等級:worst quality、low quality、average quality、best quality 及 masterpiece。典型標記範例如下:

    概念藝術,描繪一隻人手被紅色與米色緞帶纏繞,置於純淨淺色背景中,寫實風格,極簡配色,質地細膩,延展且超現實美學,靈感來自薩爾瓦多·達利的超現實主義作品,傑作

“Inspired by XXX” 涉及的「高頻標籤詞表」與「高頻藝術風格列表」將只提供給商業授權用戶。過去購買過 Helloworld XL 系列模型授權的合作夥伴,如若有遺漏,請聯繫我免費獲取。

用戶可參考HelloWorld 6.0 的高頻標籤詞列表。此外,我還在畫廊中提供了超過 150 張高質量 HelloWorld 7.0 範例圖片,供大家輸出參考。製模不易,感謝玩家的理解與包容!

創作者贊助

🖥️歡迎嘗試由我與朋友共同開發的開源GPT4V-Image-Captioner,提供一鍵安裝並集成多項功能,包括圖片預壓縮、圖片標籤及標籤統計。最近我們也發布了該工具的webui 插件版本,歡迎大家使用!

🌍歡迎加入QQ群'兔狲·AIGC夢工北廠',群號 :780132897 ;'兔狲·AIGC夢工南廠',群號 :835297318(入群答案:兔狲)。Telegram 群聊“兔狲的SDXL百老匯”,鏈接:https://t.me/+KkflmfLTAdwzMzI1

🖥️歡迎嘗試由我與朋友共同開發的開源GPT4V-Image-Captioner,提供一鍵安裝並集成多項功能,包括圖片預壓縮、圖片標籤及標籤統計。最近我們也發布了該工具的webui 插件版本,歡迎大家使用!

🌍歡迎加入QQ群“兔狲·AIGC夢工北廠”,群號:780132897;“兔狲·AIGC夢工南廠”,群號:835297318(入群答案:兔狲)。Telegram 群聊“兔狲的 SDXL 百老匯”,鏈接:https://t.me/+KkflmfLTAdwzMzI1

📖HelloWorld 7.0 更新 - 2024年6月13日

一句話更新總結:HelloWorld 7.0 是反覆優化版本,擁有系列中最佳的身體表現,並進一步提升了概念範圍及細節豐富度。

更新細節:

  1. 通過加入負面訓練圖片、強化姿態訓練及優化 clip 模型,模型肢體與手部的準確度相比以往版本有提升。建議的負面提示詞為:“bad hand, bad anatomy, worst quality, ai generated images, low quality, average quality”。

  2. 官方 SPO 模型中提取經微調的 LoRA,並整合到 HelloWorld 7.0 中。SPO 是 DPO 方法的進一步提升。SPO 基礎模型性能優於 DPO XL 基礎模型和原始 SDXL 基礎模型。SPO LoRA 能提升畫面細節與對比,並美化影像。感謝 SPO 技術團隊。

  3. 持續擴展訓練集的概念範圍,但對訓練集進行了優化和精簡(大型訓練集微調成本過高,且 H800 最近難以租用,無法負擔本地訓練時間)。目前總訓練集包含 20,821 張圖片。訓練集解析度分佈如下,建議使用含較多圖片數量的幾種解析度進行輸出:

    (832, 1248) - 數量: 7128
    (896, 1152) - 數量: 6250
    (1248, 832) - 數量: 2402
    (1024, 1024) - 數量: 1639
    (1360, 768) - 數量: 928
    (1152, 896) - 數量: 870
    (768, 1360) - 數量: 432
    (960, 1088) - 數量: 506
    (992, 1056) - 數量: 162
    (1088, 960) - 數量: 140
    (704, 1472) - 數量: 120
    (1056, 992) - 數量: 122
    (1472, 704) - 數量: 115
    (1632, 640) - 數量: 75
    (640, 1632) - 數量: 12
  4. 使用 GPT4O 重新標註所有數據集。這次採用了結構化標記方法,具體結構為:“一句話摘要描述 + 多個影像元素標籤 + inspired by XXX + 審美品質描述詞”,其中審美品質描述詞分為五個等級:worst quality、low quality、average quality、best quality 及 masterpiece。典型標記範例如下:

    概念藝術,描繪一隻人手被紅色與米色緞帶纏繞,置於純淨淺色背景中,寫實風格,極簡配色,質地細膩,延展且超現實美學,靈感來自薩爾瓦多·達利的超現實主義作品,傑作

“Inspired by XXX” 涉及的「高頻標籤詞表」與「高頻藝術風格列表」將只提供給商業授權用戶。過去購買過 Helloworld XL 系列模型授權的合作夥伴,如若有遺漏,請聯繫我免費獲取。

用戶可參考HelloWorld 6.0 的高頻標籤詞列表。此外,我還在畫廊中提供了超過 150 張高質量 HelloWorld 7.0 範例圖片,供大家輸出參考。製模不易,感謝玩家的理解與包容!

📖HelloWorld 6.0 更新 - 2024年4月20日

LEOSAM HelloWorld 6.0 頂級 250 高頻標籤詞列表

謝謝你的耐心。近日我在求職,導致 HelloWorld 更新有所延遲。6.0 版本主要更新內容包括:

  • HelloWorld 6.0 是基於 5.0 版本的迭代改進。根據我自身測試,寫實效果與 5.0 版差異不大,6.0 主要優勢在於訓練集涵蓋更多概念。反饋顯示對超現實主義、閨房攝影、群體合照、面具、摺紙、3D 渲染、汽車、龍及孕婦攝影等多主題均有所增強。示例見插圖。

  • HelloWorld 6.0 有意納入部分低質量影像於訓練中,以強化模型對負面提示的響應。建議負面提示詞使用:“low quality, jpeg artifacts, blurry, poorly drawn, ugly, worst quality”。

  • HelloWorld 6.0 主要訓練集採用 GPT4v 標記。對 GPT4v 無法標記的圖片,使用由 blip2-opt-6.7b 指導的 cogVQA 進行標記。這些多模態模型的標記語言風格與傳統 WD1.4 標記有明顯差異。為方便更精確觸發訓練集概念,我整理了 HelloWorld 6.0 訓練集的頂級 250 高頻標籤詞,可於文件中查看

最後,雖然 SD3 即將發佈,我仍會更新至 HelloWorld XL 7.0,期望於 7.0 版本達成更大提升!

📖2024.2.22 推出“HW5.0_Euler_a_Lightning”

此模型為 HelloWorld SDXL 基礎模型的運行加速版本,結合了SDXL-Lightning 技術。配備 Eular a 取樣器和 CFG 1,能以 6-8 步生成影像,速度是原 SDXL 版本的三倍。此外,經對比,其成像結果優於 LCM 或 Turbo 版本

該模型生成影像推薦參數為:

取樣器:Eular a (重要!模型專為 Eular a 適配,其他取樣器效果可能較差)

CFG 比例:1

取樣步數:8 步(6~8 步均可接受)

高解析度算法:ESRGAN 4x / 8x_NMKD-Faces_160000_G

高解析度放大倍數:1.5x

高解析度步數:8 步

高解析度去噪強度:0.3

📖2024.2.11 推出 “HelloWorld 5.0 GPT4V”

HelloWorld 5.0 是 HelloWorld 系列歷史上最重大的一次更新,搭載 GPT-4v 標記,並在科幻、動物、建築及插畫等領域進行了大幅微調。

對比測試顯示本版本的提升包括:

1. 角色姿態和影像構圖更為多樣和動態,創造視覺吸引力強的畫面;

2. 大量訓練電影數據。儘管 2.0 至 4.0 版本的電影質感較弱,少數粉絲懷念 1.0 版 leogirl 風格。此次更新專門強化電影質感,且不影響其他攝影質量。電影質感可由film grain textureanalog photography aesthetic等詞觸發;

3. 強化科幻、驚悚、動物等主題的表現,機械及其他題材有更明顯的設計感。動物如雪豹、紅熊貓、熊貓、老虎、Pallas’s cat 及家貓犬更為真實;

4. 託 GPT 標記之力,提示詞遵循度與概念精準度均有提升。

但本版缺點包括:

1. 因為是較大幅度微調,肢體錯誤率稍有增長,這是從舒適區跳向新優化領域的正常現象。先前版本有大量肢體測試改善,新版本受時間限制改進有限。但本版肢體準確度依然高於 1.0 版,未來會持續優化;

2. 強化電影質感,儘管 GPT 標記盡量精確,圖片仍不可避免帶有預設暖調。不過,可利用studio lightsharp focus等提示詞,產出高解析度的工作室級圖片,且適當提示能令膚色和視覺效果優於以往版本;

3. 本版增加更多全身角色圖以提升全身效果,如未指定特定構圖可能會生成較寬場景。目前 1024 解析度的全身臉部細節不及半身或特寫,但可透過 adetailer 及 0.3 強度的 1.5x Hires 修復,或指定不生成全身圖的提示詞予以改善;

4. 新增少量高質插畫數據集,提示詞涉及動畫風格時可能產生動畫風圖片,如有顧慮請調整提示詞。

以上為本版主要更新內容。SDXL 基礎模型訓練困難,當訓練集達一萬張時,每個模型的標記與訓練成本超過 300 美元。歡迎大家使用此模型並提供反饋!如覺得滿意,還請幫忙推廣,非常感謝!

📖2024.1.31 推出 “HelloWorld 4.0”

HelloWorld 4.0 是從 blip+clip 標記過渡到 GPT4V 標記的漸進版本。我最初訓練了一個純 GPT4V 標記模型,並融合了大量的 HelloWorld 3.2 版本及 0.05 比例 Juggernaut XL(用於調整膚色)。新版本在提示合規性和概念覆蓋度上比 3.2 版本有所提升。

新的 GPT4V 標記訓練集從 helloworld3 系列的 4000 張擴增至 8000 張,不僅涵蓋人像,也包括動物、建築、自然、食物、插畫等。但純 GPT4V 版本遇到過擬合問題,初步推測是訓練圖片數量翻倍所致。下一步的優化將尋找如何在確保人像訓練充分的同時,盡可能包含更多非肖像概念。此階段使用新舊版本融合微調,確保版本的平穩過渡,因此訓練集中擴展的概念集與 GPT4V 標記的優勢目前尚不十分明顯,但未來 5、6 代將更加明顯。

📖2024.1.5 推出 “HelloWorld 3.2”

3.2 版本為基於 DPO 技術的迭代優化版,相較 3.0 版本,在膚色和肢體精準度上有優化,但提升不明顯,故標記為 3.2 而非 4.0。

📖2023.12.15 推出 “HelloWorld 3.0”

  1. 新增訓練集,強化模型對不同藝術風格的表達能力,包括科幻與藝術風格。

  2. 整合自製的質量提升 LoCon(使用 slider 技術製作),提升影像質感並緩解手指和肢體的變形問題。

📖2023.11.17 推出 “HelloWorld 2.0”

感謝大家耐心等待。克服多重挑戰後,HelloWorld 2.0 版本終於以令我滿意的狀態呈現。主要差異如下:

  1. HelloWorld 2.0 不再需要觸發詞,成果與有觸發詞的 1.0 版本質量相當。1.0 版本中觸發詞 "leogirl" 與東方人種高度相關。取消觸發詞後,雖然 "1girl" 等詞仍可能生成東方人像,現可透過使用國籍、膚色等關鍵字指定人種。例如,“Chinese”、“Russian”、“Iranian”、“Jamaican”、“Kenyan”、“dark-skinned”、“pale-skinned”等詞的觸發效果如下圖。

    也可在提示詞中撰寫不同國家及性別的名字獲得不同風格角色,如 Han Meimei(中國)、Sophie Martin(法國)、Priya Patel(印度)、Fatima Al-Hassan(阿拉伯)、Wanjiru Mwangi(肯尼亞)。以上為示例,有多種可用提示詞與玩法,歡迎探索與分享。

  2. HelloWorld 2.0 平衡質量與色彩,提供更多風格選擇。1.0 版本在搭配 "leogirl" 時,往往生成強烈電影質感圖像。2.0 版本不再依賴電影質感,可通過某些質量相關提示詞自定義。已測試且效果好的提示詞包括:

    high-end fashion photoshoot, product introduction photo, popular Korean makeup, aegyo sal, Sharp High-Quality Photo, studio light, medium format photo, Mamiya photography, analog film, Medium Portrait with Soft Light, real-life image, refined editorial photograph, raw photo, real photo, Scanned Photo, film still

    這些提示詞所呈現的色彩效果如下:

  3. HelloWorld 2.0 的訓練集大幅增加全身照比例,以提升 SDXL 生成全身與遠景肖像的效果。雖較 1.0 有改善,仍強烈建議生成全身照時使用 “adetailer”。此外,對於擁有足夠視頻記憶體(24g)的用戶,建議對影像進行 1.5x 高解析度修復,能明顯提升臉部細節。

📖2023.8.29 推出 “HelloWorld” SDXL 基礎模型

特別提醒: 使用 HelloWorld 1.0 模型時,請務必加入觸發詞 "leogirl"。

與 SD1.5 基礎模型 “MoonFilm” 不同,“HelloWorld” 是全新實境風 SDXL 基礎模型系列。為讓更多用戶發現 HelloWorld,我保留了原 Moonfilm 的模型下載鏈接。它可視為 Moonfilm 在 SDXL 新平台上的精神延續,但 HelloWorld 目標不僅追求肖像的真實感及電影質感。得益於 SDXL 較 SD1.5 大幅提升的訊息量和文字理解能力,HelloWorld 是一個致力於逼真描繪萬物,換言之,逐步構建虛擬攝影世界的基礎模型。

SD1.5 寫實基礎模型已相當成熟,性能提升空間有限。除非 SD1.5 平台出現突破技術,否則 Moonfilm 與 MoonMix 系列基本停更。我將主要精力投注於 HelloWorld SDXL 大模型的開發。1.0 版本現已上線,2.0 版本緊急開發中,預計九月初更新。

作為全新 SDXL 模型,HelloWorld 與傳統 SD1.5 模型有三大不同:

  1. 傳統 SD1.5 基礎模型通常不含觸發詞,使用 HelloWorld 1.0 時,請記得加入觸發詞 "leogirl",可讓 SDXL 模型更穩定觸發訓練集效果。

  2. HelloWorld 模型支持直接輸出 1024*1024 解析度,無需使用高解析度放大。直出特寫肖像品質不低於 SD1.5 版本,但輸出遠景人像仍有不足,建議使用ADetailer插件,有效修正遠景人臉問題。

  3. SDXL 現支持使用簡單自然語言提示詞更容易出圖,推薦嘗試更多自然語言提示詞,AI 寫實照輸出效果更優。

經多次測試,建議繪圖參數設置如下:

  • 步數 ≥ 25

  • 取樣器:DPM++ 2M Karras

  • CFG 比例:10

  • 尺寸 ≥ 1024x1024

  • ADetailer:開啟

歡迎大家嘗試 HelloWorld 並提供大量反饋,您的寶貴意見對模型下一步改進非常重要!

HelloWorld 系列模型(以下簡稱「本模型」)由本人(以下簡稱「擁有者」)在 LiblibAI 平台支援下製作。未經擁有者授權,不得在 LiblibAI 及 Civitai 以外平台轉載本模型。

擁有者允許以非商業教育或資訊目的免費使用由本模型生成的圖片,但條件如下:

- 使用者需遵守適用法律,不得侵害本模型或任何第三方權益。

- 圖片必須明確標注來源為「由 LEOSAM 的 HelloWorld 基礎模型創作」。

若涉及任何商業應用,需事先與擁有者簽訂商業授權協議。商業授權及模型定制相關諮詢,請通過擁有者主頁提供的聯繫方式聯絡擁有者。

SDXL 模型的開發與免費發佈是重大付出。擁有者承諾持續免費更新 HelloWorld 模型,回饋開源社區對本模型的支持。合作進行商業授權是模型發展與完善的重要途徑。擁有者感謝每一位用戶的理解與支持。

未經授權使用,可能違反相關法律並承擔法律風險。擁有者保留此聲明的最終解釋權,並受現行法律法規約束。

上一個
Incursios Meme Diffusion SDXL Pony - v16PDXL
下一個
LEOSAMs HelloWorld XL - HelloWorld XL 60

模型詳情

模型類型

Checkpoint

基礎模型

SDXL 1.0

模型版本

HelloWorld XL 7.0

模型雜湊值

573f4a7d35

創作者

討論

log in以發表評論。