一位優雅女性肖像,身穿紋理服裝,展現強烈光影對比,具有流暢未來風格及清晰線條。
一位留尖髮、穿藍色冷肩裙的年輕女孩肖像,站在戶外黃昏時分,背後為模糊的綠色背景。
寫實影像:女機械師穿著牛仔工作服與輕薄毛衣,站在飛機庫內,柔和自然光照射,背景有散景與電影色調。
一名長髮深色的少女躺在充滿生機的秋日花田中,穿著白色裙子和淺藍色花卉上衣,在柔和自然陽光下。
寫實影像:一名女子站立於雨中的亞馬遜雨林,周圍環繞著茂密翠綠的叢林葉片,穿著白色露腹背心及紅色短褲,雨水濕潤全身。

推薦提示詞

1girl,best quality,masterpiece,film grain analog photography,little girl,child girl

1girl

推薦反向提示詞

watermark,anime,cartoon,open mouth,digital art

((worst quality, low quality), bad_pictures, negative_hand-neg:1.2)

推薦參數

samplers

DPM++ 2M Karras

steps

27 - 100000

cfg

7 - 9

clip skip

2

resolution

640x768, 512x832

other models

majicmixRealistic_v6 (e4a30e4607)

推薦高解析度參數

upscaler

R-ESRGAN 4x+

upscale

2

steps

21

denoising strength

0.4 - 0.42

提示

避免使用digital art、anime、cartoon標籤,因ACGN風格輸出較弱。

微調SPIN-Diffusion時,建議使用超過5萬總訓練迭代。

使用提示詞如film grain analog photography以觸發膠片風格。

如果FilmGirl Ultra有助提升你的模型,請在模型說明中提及。

遵守Apache-2.0許可證,使用生成圖像時請註明來源。

版本亮點

更新內容:

  • Velvia 3.0主體LoRA模型的訓練集圖片數量已達406張,分辨率進一步提升至1024x1024。

  • 本版本主體模型訓練使用了Scale weight norms功能,以避免模型過擬合。在另一備用版本中我也測試了“Prodigy”優化器,該優化器可在總訓練步數減半下提供與AdamW8bit相當的擬合程度,但可能因參數設置不當,訓練結果人臉美感較差,最終未採用。

  • 在高解析度主體模型基礎上,少比例融合了Velvia 2.0模型,並進行分層調節,以改善人像膚色。

Update Content:

  • The number of training images for the main LoRA model of Velvia 3.0 has reached 406, with the resolution further increased to 1024x1024.

  • In this version, the main model training utilizes "Scale weight norms" functionality to avoid overfitting. I also tested the "Prodigy" Optimizer in another alternative version. Prodigy can provide a fitting degree comparable to AdamW8bit with half the total training steps, but perhaps due to inappropriate parameter settings, the facial aesthetics of the training results were not as good, so it was not adopted in the end.

  • Based on the high-resolution main model, a small proportion of the Velvia 2.0 model was blended, and hierarchical adjustments were made to improve the skin tone in portraits.

創作者贊助

🌍歡迎加入QQ群"兔狲·AIGC夢工北廠"(群號:780132897)和"兔狲·AIGC夢工南廠"(群號:835297318),入群答案:兔狲。

Telegram群聊“兔狲的SDXL百老匯”:https://t.me/+KkflmfLTAdwzMzI1

🌍歡迎加入QQ群"兔狲·AIGC夢工北廠",群號 :780132897 ;"兔狲·AIGC夢工南廠",群號 :835297318(入群答案:兔狲)。Telegram群聊“兔狲的SDXL百老匯”,鏈接:https://t.me/+KkflmfLTAdwzMzI1

🚨FilmGirl Ultra推薦參數:

Clip skip:1

CFG scale: 9

圖片直接輸出分辨率: 約500,000像素 (640x768)

2024.2.29 發佈"FilmGirl Ultra",向SD1.5的AI臉說再見

去年2月24日,我完成了FilmGirl LoRA的第一個版本。該LoRA是我首個高下載量模型,也是我AI夢想的開始。自SDXL推出後,我投入大量精力改進HelloWorldAIArt兩款XL模型。FilmGirl系列亦已8個月未更新。

無論是FilmGirl、後續的Polaroid LoRA或Helloworld XL,我一直追求極致的真實感。如今一年過去,為紀念一週年,我決定發佈一款將SD1.5寫實提升至新高度的模型。LoRA已不足以承載此使命;新的FilmGirl Ultra是SD1.5基礎模型。

為徹底擺脫SD1.5真實感基礎模型的同質化與AI臉問題,FilmGirl Ultra未採用basilmix、chilloutmix及其衍生訓練底模,而選用UCLA新發布的SPIN-Diffusion。 SPIN-Diffusion是一款使用pickapic_v2數據集勝者圖像進行自我對弈微調的SD1.5基礎模型,性能優於SD1.5原版及DPO底模,且提示詞對齊遠勝Chilloutmix等多次微調融合底模。

FilmGirl Ultra的訓練集來自HelloWorld XL。事實上HelloWorld XL的首個版本訓練集也來自最後版FilmGirl LoRA。這一年來,我精心積累筛選訓練集,現約有1萬張圖片。訓練過程採用多種標註方式,包括GPT4V自然語言標註、GPT4V標籤式標註及Blip+Clip標註。為兼容常用提示詞“1girl”、“best quality”、“masterpiece”,這三詞亦適度加於部分圖像(但可用“little girl/child girl”精準觸發小女孩效果)。多套標註旨在最大化觸發效果概率。作為FilmGirl傳統,膠片風格被特別重視,使用“film grain analog photography”可觸發此風格。

模型共經過七階段訓練,不同期使用不同batch size、優化器、學習率及訓練集比例,達到當前效果。如有興趣微調SPIN-Diffusion,建議整體訓練步數超過5萬,我自身以batch size 40~64,共訓練約10萬步。

FilmGirl Ultra的真實感效果超出預期,已接近SDXL圖像質量。以下為該模型與Realistic Vision v6epiCPhotoGasm對比,前者為Civitai下載最高基礎模型,後者為我長期心中最寫實的SD1.5底模,向兩者及其創作者致敬。

特寫情侶肖像,非洲年輕男女,清晰皮膚,凝視鏡頭,時尚攝影,簡約背景
負面提示:水印、動漫、卡通、張嘴

特寫情侶肖像,非洲小女孩與男孩,清晰皮膚,凝視鏡頭,時尚攝影,簡約背景,
負面提示:水印、動漫、卡通、張嘴,

得益於GPT4V標註與SPIN-Diffusion底模,模型提示詞對齊效果極佳。以下為不同概念的xy圖測試。

種族測試

體態測試

膚色測試

年齡測試

動物測試

但FilmGirl Ultra並非所有方面領先,因為它從新起點出發,放棄了社群一年多來對1.5底模的持續優化打磨。大量測試比較後發現,該基模肢體錯誤率高於社群成熟的寫實模型。且由於訓練集缺少動漫ACGN內容,涉及相關標籤時效果不佳,建議避免使用“digital art”、“anime”、“cartoon”等詞。這兩點是FilmGirl Ultra目前的主要缺陷。

FilmGirl Ultra是我AI之旅首年總結,是送給支持我的AI愛好者的禮物。開源社群帶給我許多朋友、回憶、快樂及知識,我亦希望回饋社群。歡迎大家基於FilmGirl Ultra進行模型訓練或融合。如該模型有助提升你的模型,請在說明中提及,願FilmGirl Ultra與SPIN-Diffusion被更多人認識使用。

FilmGirl Ultra將持續更新,祝大家使用愉快!

願我們隨AI共同進步,明年今日再相聚!

去年的2月24日,我完成了第一版FilmGirl LoRA製作。這個LoRA是我的首個高下載量模型,是我的AI之夢的開始。自從SDXL推出後,我將大量精力投入到HelloWorld和AIArt兩個XL大模型的改進中。FilmGirl這個系列也已經8個月沒有更新了。

其實不管是FilmGirl,還是後來的拍立得LoRA、Helloworld XL,我一直都在追求極致的寫實感。如今已整整一年過去,作為一週年紀念,我決定推出一個可以將SD1.5的寫實感抬升至新高度的模型,LoRA模型已不足以承載這個使命,新的FilmGirl Ultra是一個SD1.5大模型。

為了徹底擺脫SD1.5寫實感大模型的同質化和AI臉問題,FilmGirl Ultra沒有選擇basilmix、chilloutmix及其子子孫孫們作為訓練底模,而是選擇了UCLA最新發布的SPIN-Diffusion。SPIN-Diffusion是一個使用 pickapic_v2 數據集勝者圖像進行自我對弈微調的SD1.5底模,其表現優於SD1.5原始底模以及DPO底模,同時提示詞對齊性能遠好於Chilloutmix等經過大量微調與融合的底模。

FilmGirl Ultra的訓練集來自HelloWorld XL。實際上HelloWorld XL的第一版所使用的訓練集也來自最後一版FilmGirl LoRA。這一年我都在精益求精地積累和篩選該訓練集,如今整個訓練集數量已達到1萬張。FilmGirl Ultra的整個訓練過程使用了多種打標方法,包括GPT4V自然語言caption、GPT4V標籤式caption、Blip+Clip caption。同時為了使得該模型可以兼容大家超常用的1girl、best quality、masterpiece 三個詞,也適當地在部分圖像中添加了這三個詞(但您仍可以通過child girl/girl 這兩個詞準確觸發小女孩效果)。之所以使用多套打標,是為了使訓練集的效果可以儘可能高概率地觸發。同時作為FilmGirl的傳統,膠片風格被重點關注,您可以通過film grain analog photography來觸發該風格。

本模型進行了共7階段的訓練,不同階段選用了不同的batch size、優化器、學習率以及訓練集比例,方才達到了目前的效果。如果有朋友同樣對微調SPIN-Diffusion感興趣,我建議您的總體訓練迭代步數應在5萬步以上,實際上我以batch size 40~64,共訓練了約10萬步。

FilmGirl Ultra的寫實效果超出了我的預料,已經與SDXL的圖像效果接近。上圖中列出了該模型與Realistic Vision v6以及epiCPhotoGasm的對比,前者是目前C站下載量最高的1.5底模,後者是我心目中長期以來最為寫實的1.5底模,向這兩個優秀底模以及其背後的作者致敬。

同時得益於GPT4V打標以及SPIN-Diffusion底模,該模型的提示詞對齊性能優異。

但FilmGirl Ultra也並非在所有維度都全面領先。它畢竟是從一個全新起點出發製作,放棄了社區一年多來對1.5底模的不斷調優打磨內容,經過我的大量測試比較,該底模的肢體錯誤率要高於社區成熟的寫實模型。同時由於訓練集缺乏二次元內容,當你的提示詞中涉及二次元相關tag時,出圖效果不佳。建議大家避免使用digital art、anime、cartoon等詞。這兩個問題是FilmGirl Ultra目前最主要的兩個缺陷。

FilmGirl Ultra是我AI之旅第一年的年終總結,是我送給支持我的AI同好們的禮物。開源社區為我帶來了諸多朋友、回憶、快樂以及知識,我也希望回饋社區做出自己的一點點貢獻。希望上述的模型製作總結能為大家帶來一些幫助,同時也歡迎大家基於FilmGirl Ultra進行你的模型訓練或融合。本模型與其訓練底模SPIN-Diffusion一樣,請大家遵循Apache-2.0許可證使用,否則將被追責。如果您覺得這個模型有幫助您讓自己的模型變得更好,請在模型說明中提及下它,希望FilmGirl Ultra以及SPIN-Diffusion能被更多人了解和使用。

FilmGirl Ultra後續還會持續更新,祝大家使用愉快!

希望我們能隨AI一起不斷進步,明年此時,仍能在此相遇!

版權聲明:

FilmGirl Ultra系列模型(以下簡稱“本模型”)是由我(以下簡稱“所有者”)基於SPIN-Diffusion開發的SD1.5大模型。

所有者授權個人或機構可免費使用本模型所生成的圖像用於非商業性質的教育或信息傳播目的,並且:

- 遵守相關法律規定,不侵犯本模型或任何第三方的合法權益。

- 在使用圖像時需註明圖像來源為“由LEOSAM's FilmGirl Ultra大模型生成”。

對於商業目的的使用,必須先與所有者簽署商用授權協議。有關商業授權和模型定制事宜,請通過所有者在Civitai平台的主頁信息聯繫。

所有者將持續為個人玩家免費提供FilmGirl Ultra模型的更新,以此表達對社區開源貢獻者的支持和感謝。商業用戶的有償合作是推動本模型開發和持續改進的重要動力。感謝每一位用戶的理解與支持。

請注意,任何未經授權的使用行為都可能違反相關法律規定,並可能承擔法律責任。本聲明的最終解釋權歸所有者所有,並受相關法律法規約束。

上一個
Copax TimeLess - FluxReal (快速)
下一個
Hassaku XL (Illustrious) - v2.2

模型詳情

模型類型

Checkpoint

基礎模型

SD 1.5

模型版本

VELVIA 3.0 LoRA

模型雜湊值

ac8b0e4aa7

創作者

討論

log in以發表評論。

LEOSAM的FilmGirl Ultra 胶片风 - VELVIA 3.0 LoRA 的圖片

一位優雅女性肖像,身穿紋理服裝,展現強烈光影對比,具有流暢未來風格及清晰線條。
一位留尖髮、穿藍色冷肩裙的年輕女孩肖像,站在戶外黃昏時分,背後為模糊的綠色背景。
寫實影像:女機械師穿著牛仔工作服與輕薄毛衣,站在飛機庫內,柔和自然光照射,背景有散景與電影色調。
一名長髮深色的少女躺在充滿生機的秋日花田中,穿著白色裙子和淺藍色花卉上衣,在柔和自然陽光下。
寫實影像:一名女子站立於雨中的亞馬遜雨林,周圍環繞著茂密翠綠的叢林葉片,穿著白色露腹背心及紅色短褲,雨水濕潤全身。

基礎模型 圖片

寫實風不死角色場景,包括殭屍與骷髏穿行於由發光南瓜燈照亮的陰暗、詭譎天空下的恐怖墳場。

電影 圖片

電影般35mm風格拍攝的 Charger Hellcat SRT 夜間駕駛,伴隨城市燈光和動態模糊
健康的三文魚片頂視圖,放置於黑色餐盤上,配以檸檬片裝飾、蒔蘿和一把叉子,背景為暗色質感表面,光線戲劇化。
超現實肖像,一名長灰白金髮、發光紫眼睛的女孩坐在 eldritchtech 酒吧內,穿著魚網袖和黑色連衣裙。
一個超寫實的惡魔形象,帶有彎曲的角和黑色連體衣上的發光黃色線條,站在戲劇性的電影燈光下,背景為暗色。
照片寫實單色女性特寫肖像,輕觸雨水覆蓋的窗戶,捕捉到高細節與紋理。
一隻有銳利牙齒和發光橙色眼睛的怪物,在潮濕骯髒的下水道隧道中從低角度戲劇性視角向前衝刺。
超真實數碼特寫肖像,一位漂亮女性佩戴未來風賽博眼鏡,帶有霓虹紅色輪廓,展現閃亮嘴唇和電影級光效下細膩逼真的眼睛。
黑白逼真影像,一位戴華麗金屬半面罩及穿著露骨黑袍的惡魔女性形象,從霧氣及詭異陰影中浮現。
超細節電影照片,描繪一個外星人站在火星上一個破舊的電話亭內,手持復古電話聽筒貼近耳朵,透過電話亭後窗可見橙色火星沙漠。
寫實圖像顯示破損、裂痕的人形賽博格女性躺在未來太空船的地板上,周圍環繞著飄渺的霓虹藍色霧氣,窗外可見發光銀河。

照片 圖片

一隻真實感老鼠,穿著精緻的金色盔甲和黑色披風,站在鵝卵石街道上,配有電影般戲劇性燈光及膠片顆粒效果。
一幅半寫實的異國肚皮舞者肖像,擁有長長暗色辮子髮,穿著飄逸的綠色服飾和金色首飾,站立於裝飾有粉紅玫瑰藤的砂岩牆壁環繞的阿拉伯花園中。
一個黑暗戲劇性的夜間城市街道場景,濕潤的人行道映照著街燈,暴風雨般的陰沉天空籠罩在一座荒廢的城市上空。
逼真芭蕾舞者踮腳呈姿勢,雙臂伸展,穿著形成層疊費波納契螺旋的精緻花紋裙子,在明暗對比照明下展示。
自然光下的人型白狼女性士兵特寫肖像,擁有醒目的紅色眼睛、可見的獠牙和微微張開露出舌頭的嘴,佩戴士兵頭盔。
一個小型綠松石色玻璃貓雕像,擁有大眼睛和粉紅色鼻子,坐在敞開的手掌上,背景為深色。
Elsa 的照片寫實特寫肖像,金色辮髮、藍色眼睛及柔和真實光線。
一個超現實場景,一條河流從描繪山脈和船隻的油畫中流出,流淌到米色沙發上,並蔓延到溫馨客廳的木地板上。
一位穿著露肩花卉和服、背部和肩膀有細緻黑色紋身的日本女孩肖像,頭髮裝飾著鮮艷的花朵和飄落的花瓣,背景是寧靜的湖泊並有柔和背光照射。
特寫一位具有肩長黑髮和綠色眼睛的年輕時尚模特兒側面,穿著米色細條紋西裝外套,表情不悅,自然光下伴隨日光暈染

portrait 圖片

插畫描繪一位長髮飄逸、穿著紅色襯衫的少女,背景為充滿活力的紅色飛濺效果。
一名女子手持點燃的蠟燭,漆黑背景中溫暖的燭光照亮她半邊臉龐。
一位白金色頭髮及紫色眼睛的女性肖像,穿著黑色露肩短款上衣,站在黃褐色紋理牆前,露出上臂上的紋身與結實體態。
一名男子的輪廓,他戴著一頂發光的生物發光荊棘冠,紫色燈光,背景為深藍色。
室內溫暖黃金時刻陽光照耀下,綠眼女子躺在床上的特寫肖像。
黑白電影光影下中國年輕女性的肖像,眼睛清晰對焦,身體和背景輕柔的動態模糊。
穿著華麗中世紀盔甲、紋飾繁複的威嚴獅子電影特寫肖像。
一位女性肖像,形似 Levy Tran,採用柴油朋克風格,戴著帽子和夾克,站在一輛復古橙藍色卡車前,配有電影燈光及銳利逼真的細節。
一幅極致細節的頭肩特寫肖像,描繪一位美麗女士,具有雀斑、紅寶石眼睛、短髮、暗色妝容及在柔和光線下帶有大笑容。
Sailor Mars 的肖像,黑髮疲憊的雙眼,穿著紅白相間的水手服,手持血跡斑斑的手槍,臉與武器上都有血跡,背景為黑色。

女性 圖片

一位有雀斑和長紅髮的女子全身肖像,穿著橙、紫及藍色調的多彩飄逸長裙。
一名女子手持點燃的蠟燭,漆黑背景中溫暖的燭光照亮她半邊臉龐。
一位白金色頭髮及紫色眼睛的女性肖像,穿著黑色露肩短款上衣,站在黃褐色紋理牆前,露出上臂上的紋身與結實體態。
3D 渲染肌肉女郎,黑髮帶雀斑,穿著閃亮連體服,對著簡單紅色背景擺姿勢,搭配電影感光效和 Atompunk 風格。
室內溫暖黃金時刻陽光照耀下,綠眼女子躺在床上的特寫肖像。
女子特寫肖像,擁有中等凌亂髮型及嘴唇上的暖光,佈局於復古窗框中,部分陰影及鐵塔倒影映於窗上。
動漫風格的綠色蛇髮女子,穿著商務裝及黑色高跟鞋,坐在藍色辦公椅上辦公桌前。
一位似美杜莎的女子,綠色蛇作為頭髮,戴著眼鏡和紅色連衣裙,帶著大大的綠眼睛向觀者揮手。
一位優雅女性坐在船邊的黑白時尚肖像,風格受彼得·林德伯格啟發,呈現陰鬱美學。
一位穿著黑色服裝、被鮮紅光暈照亮的女子,站立於戲劇性燈光下,描繪寫實且超現實的形象。