電影特寫中,一隻帶著大橙色和黑色葉形翅膀展開的飛翔鳥,背景為模糊的綠色,有大氣霧氣和電影般光影效果。
穿著黑色連衣裙的年輕女子肖像,具迷人眼神與精湛妝容,由體積光效在晴朗藍天下凸顯。
現實的中景鏡頭,一位穿著白色Tutu的芭蕾舞者在劇院中跳舞,背後有聚光燈,背景為深色。

推薦提示詞

1girl

best quality

masterpiece

film grain analog photography

close-up couple's portrait,African young woman and man,clear skin face,looking at camera,fashion photography,simple background

close-up couple's portrait,African little girl and boy,clear skin face,looking at camera,fashion photography,simple background

推薦反向提示詞

watermark,anime,cartoon,open mouth,digital art

watermark, anime, cartoon, open mouth

推薦參數

samplers

Restart

steps

30

cfg

9

resolution

640x768, 576x768

推薦高解析度參數

upscaler

ESRGAN_4x

upscale

2

steps

30

denoising strength

0.45

提示

避免使用含有动漫、数字艺术、卡通等标签的提示词以保持输出质量。

为了更好地微调SPIN-Diffusion,训练迭代步数应超过5万步;该作者训练了约10万步。

可使用提示词“film grain analog photography”触发胶片风格。

模型能输出真实面孔,但肢体错误率高于其他成熟的写实基础模型。

創作者贊助

🌍欢迎加入QQ群"兔狲·AIGC梦工北厂"(群号:780132897)和"兔狲·AIGC梦工南厂"(群号:835297318),入群答案:兔狲。Telegram群聊“兔狲的SDXL百老汇”链接:https://t.me/+KkflmfLTAdwzMzI1

🌍欢迎加入QQ群"兔狲·AIGC梦工北厂",群号 :780132897 ;"兔狲·AIGC梦工南厂",群号 :835297318(入群答案:兔狲)。Telegram群聊“兔狲的SDXL百老汇”,链接:https://t.me/+KkflmfLTAdwzMzI1

🚨FilmGirl Ultra 推荐参数:

Clip skip:1

CFG scale: 9

直接输出图片分辨率:约 500,000 像素 (640x768)

2024.2.29 发布“FilmGirl Ultra”,告别SD1.5的AI面孔

去年2月24日,我完成了FilmGirl LoRA的首个版本。这个LoRA是我第一款高下载量模型,并标志着我AI梦想的开始。自SDXL发布以来,我投入大量精力改进HelloWorldAIArt XL模型。同时,FilmGirl系列已8个月未更新。

事实上,无论是FilmGirl,还是后续的Polaroid LoRA或Helloworld XL,我始终追求极致的写实感。如今一年过去,为纪念一周年,我决定推出一款将SD1.5写实感提升到新高度的模型。LoRA模型已无法满足这个使命;新的FilmGirl Ultra是一款SD1.5基础模型。

为了彻底摆脱SD1.5写实模型同质化和AI脸问题,FilmGirl Ultra未采用basilmix、chilloutmix及其衍生模型作为训练基础,而是选用了UCLA最新发布的SPIN-Diffusion。 SPIN-Diffusion是利用pickapic_v2数据集中胜者图像进行自我对弈微调的SD1.5基础模型,表现优于原始SD1.5基础模型及SD1.5 DPO基础模型,其提示词对齐能力远超Chilloutmix等经大量微调融合的基础模型。

FilmGirl Ultra的训练集来自HelloWorld XL。实际上,HelloWorld XL第一版的训练集也源自FilmGirl LoRA的最后一版。在过去的一年中,我精心积累和筛选训练集,目前共约1万张图像。训练过程中使用了多种标注方法,包括GPT4V自然语言字幕、GPT4V标签式字幕及Blip+Clip字幕。为确保模型能兼容常用提示词“1girl”、“best quality”、“masterpiece”,部分图像亦适当加入这三个词(但仍可通过“little girl/child girl”精确触发小女孩效果)。使用多套标注旨在最大化触发效果概率。作为FilmGirl传统,胶片风格为重点,提示词“film grain analog photography”可触发此风格

该模型共经历7个训练阶段,各阶段使用不同批次大小、优化器、学习率及训练集比例,最终达到现有效果。若有兴趣微调SPIN-Diffusion,建议训练迭代步数超过5万步;实际上我以批次大小40到64进行了约10万步训练。

FilmGirl Ultra的写实效果超出预期,接近SDXL的图像质量。以下图对比了本模型与Realistic Vision v6epiCPhotoGasm,前者为Civitai当前下载量最高的基础模型,后者为我长期认为最真实的SD1.5基础模型。向这两款优秀基础模型及其作者致敬。

close-up couple's portrait,African young woman and man,clear skin face,looking at camera,fashion photography,simple background
Negative prompt: watermark,anime,cartoon,open mouth

close-up couple's portrait,African little girl and boy,clear skin face,looking at camera,fashion photography,simple background,
Negative prompt: watermark,anime,cartoon,open mouth,

得益于GPT4V字幕和SPIN-Diffusion基础模型,模型提示词对齐效果出色。以下为不同概念的xy图测试。

种族测试

体型测试

肤色测试

年龄测试

动物测试

不过FilmGirl Ultra并非所有方面都领先。毕竟它是从新的起点出发,放弃了社区过去一年多对1.5基础模型的持续优化。经过大量测试对比,发现此基础模型肢体错误率高于社区成熟的写实模型。且因训练集缺乏动漫相关内容,如提示词涉及ACGN相关标签,输出效果较差。建议避免使用“digital art”、“anime”、“cartoon”等词。这两个是FilmGirl Ultra当前的主要不足。

FilmGirl Ultra是我AI旅程第一年的总结,赠予支持我的AI爱好者。开源社区带给我许多朋友、回忆、快乐及知识,我亦愿回馈社区贡献微薄力量。欢迎基于FilmGirl Ultra训练或融合自己的模型。如果此模型对您提升自身模型有帮助,请在模型说明中提及。希望FilmGirl Ultra及SPIN-Diffusion被更多人了解和使用。

FilmGirl Ultra将继续更新,祝大家使用愉快!

希望我们与AI共同进步,明年此时依然在此相见!

去年的2月24日,我完成了第一版FilmGirl LoRA制作。这个LoRA是我的首个高下载量模型,是我的AI之梦的开始。自从SDXL推出后,我将大量精力投入到HelloWorld和AIArt两个XL大模型的改进中。FilmGirl这个系列也已经8个月没有更新了。

其实不管是FilmGirl,还是后来的拍立得LoRA、Helloworld XL,我一直都在追求极致的写实感。如今已整整一年过去,作为一周年纪念,我决定推出一个可以将SD1.5的写实感抬升至新高度的模型,LoRA模型已不足以承载这个使命,新的FilmGirl Ultra是一个SD1.5大模型。

为了彻底摆脱SD1.5写实感大模型的同质化和AI脸问题,FilmGirl Ultra没有选择basilmix、chilloutmix及其子子孙孙们作为训练底模,而是选择了UCLA最新发布的SPIN-Diffusion。SPIN-Diffusion是一个使用 pickapic_v2 数据集胜者图像进行自我对弈微调的SD1.5底模,其表现优于SD1.5原始底模以及DPO底模,同时提示词对齐性能远好于Chilloutmix等经过大量微调与融合的底模。

FilmGirl Ultra的训练集来自HelloWorld XL。实际上HelloWorld XL的第一版所使用的训练集也来自最后一版FilmGirl LoRA。这一年我都在精益求精地积累和筛选该训练集,如今整个训练集数量已达到1万张。FilmGirl Ultra的整个训练过程使用了多种打标方法,包括GPT4V自然语言caption、GPT4V 标签式caption、Blip+Clip caption。同时为了使得该模型可以兼容大家超常用的1girl、best quality、masterpiece三个词,也适当地在部分图像中添加了这三个词(但您仍可以通过child girl/girl这两个词准确触发小女孩效果)。之所以使用多套打标,是为了使训练集的效果可以尽可能高概率地触发。同时作为FilmGirl的传统,胶片风格被重点关注,您可以通过film grain analog photography来触发该风格。

本模型进行了共7阶段的训练,不同阶段选用了不同的batch size、优化器、学习率以及训练集比例,方才达到了目前的效果。如果有朋友同样对微调SPIN-Diffusion感兴趣,我建议您的总体训练迭代步数应在5万步以上,实际上我以batch size 40~64,共训练了约10万步。

FilmGirl Ultra的写实效果超出了我的预料,已经与SDXL的图像效果接近。上图中列出了该模型与Realistic Vision v6以及epiCPhotoGasm的对比,前者是目前C站下载量最高的1.5底模,后者是我心目中长期以来最为写实的1.5底模,向这两个优秀底模以及其背后的作者致敬。

同时得益于GPT4V打标以及SPIN-Diffusion底模,该模型的提示词对齐性能优异。

但FilmGirl Ultra也并非在所有维度都全面领先。它毕竟是从一个全新起点出发制作,放弃了社区一年多来对1.5底模的不断调优打磨内容,经过我的大量测试对比,该底模的肢体错误率要高于社区成熟的写实模型。同时由于训练集缺乏二次元内容,当你的提示词中涉及二次元相关tag时,出图效果不佳。建议大家避免使用digital art、anime、cartoon等词。这两个问题是FilmGirl Ultra目前最主要的两个缺陷。

FilmGirl Ultra是我AI之旅第一年的年终总结,是我送给支持我的AI同好们的礼物。开源社区为我带来了诸多朋友、回忆、快乐以及知识,我也希望回馈社区做出自己的一点点贡献。希望上述的模型制作总结能为大家带来一些帮助,同时也欢迎大家基于FilmGirl Ultra进行你的模型训练或融合。本模型与其训练底模SPIN-Diffusion一样,请大家遵循Apache-2.0许可证使用,否则将被追责。如果您觉着这个模型有帮助您让自己的模型变得更好,请在模型说明中提及下它,希望FilmGirl Ultra以及SPIN-Diffusion能被更多人了解和使用。

FilmGirl Ultra后续还会持续更新,祝大家使用愉快!

希望我们能随AI一起不断进步,明年此时,仍能在此相遇!

版权声明:

FilmGirl Ultra系列模型(以下简称“本模型”)是由我(以下简称“所有者”)基于SPIN-Diffusion开发的SD1.5大模型。

所有者授权个人或机构可免费使用本模型所生成的图像用于非商业性质的教育或信息传播目的,并且:

- 遵守相关法律规定,不侵犯本模型或任何第三方的合法权益。

- 在使用图像时需注明图像来源为“由LEOSAM's FilmGirl Ultra大模型生成”。

对于商业目的的使用,必须先与所有者签署商用授权协议。有关商业授权和模型定制事宜,请通过所有者在Civitai平台的主页信息联系。

所有者将持续为个人玩家免费提供FilmGirl Ultra模型的更新,以此表达对社区开源贡献者的支持和感谢。商业用户的有偿合作是推动本模型开发和持续改进的重要动力。感谢每一位用户的理解与支持。

请注意,任何未经授权的使用行为都可能违反相关法律规定,并可能承担法律责任。本声明的最终解释权归所有者所有,并受相关法律法规的约束。

上一個
Featherfall Illustrious-XL - v1.1
下一個
_MOHAWK_ - v2.0

模型詳情

模型類型

Checkpoint

基礎模型

SD 1.5

模型版本

Ultra Base Model

模型雜湊值

b363551a70

創作者

討論

log in以發表評論。

LEOSAM的FilmGirl Ultra 胶片风 - Ultra 基础模型 的圖片

電影特寫中,一隻帶著大橙色和黑色葉形翅膀展開的飛翔鳥,背景為模糊的綠色,有大氣霧氣和電影般光影效果。
穿著黑色連衣裙的年輕女子肖像,具迷人眼神與精湛妝容,由體積光效在晴朗藍天下凸顯。
現實的中景鏡頭,一位穿著白色Tutu的芭蕾舞者在劇院中跳舞,背後有聚光燈,背景為深色。

基礎模型 圖片

寫實風不死角色場景,包括殭屍與骷髏穿行於由發光南瓜燈照亮的陰暗、詭譎天空下的恐怖墳場。

電影 圖片

電影般35mm風格拍攝的 Charger Hellcat SRT 夜間駕駛,伴隨城市燈光和動態模糊
健康的三文魚片頂視圖,放置於黑色餐盤上,配以檸檬片裝飾、蒔蘿和一把叉子,背景為暗色質感表面,光線戲劇化。
超現實肖像,一名長灰白金髮、發光紫眼睛的女孩坐在 eldritchtech 酒吧內,穿著魚網袖和黑色連衣裙。
一個超寫實的惡魔形象,帶有彎曲的角和黑色連體衣上的發光黃色線條,站在戲劇性的電影燈光下,背景為暗色。
照片寫實單色女性特寫肖像,輕觸雨水覆蓋的窗戶,捕捉到高細節與紋理。
一隻有銳利牙齒和發光橙色眼睛的怪物,在潮濕骯髒的下水道隧道中從低角度戲劇性視角向前衝刺。
超真實數碼特寫肖像,一位漂亮女性佩戴未來風賽博眼鏡,帶有霓虹紅色輪廓,展現閃亮嘴唇和電影級光效下細膩逼真的眼睛。
黑白逼真影像,一位戴華麗金屬半面罩及穿著露骨黑袍的惡魔女性形象,從霧氣及詭異陰影中浮現。
超細節電影照片,描繪一個外星人站在火星上一個破舊的電話亭內,手持復古電話聽筒貼近耳朵,透過電話亭後窗可見橙色火星沙漠。
寫實圖像顯示破損、裂痕的人形賽博格女性躺在未來太空船的地板上,周圍環繞著飄渺的霓虹藍色霧氣,窗外可見發光銀河。

照片 圖片

一隻真實感老鼠,穿著精緻的金色盔甲和黑色披風,站在鵝卵石街道上,配有電影般戲劇性燈光及膠片顆粒效果。
一幅半寫實的異國肚皮舞者肖像,擁有長長暗色辮子髮,穿著飄逸的綠色服飾和金色首飾,站立於裝飾有粉紅玫瑰藤的砂岩牆壁環繞的阿拉伯花園中。
一個黑暗戲劇性的夜間城市街道場景,濕潤的人行道映照著街燈,暴風雨般的陰沉天空籠罩在一座荒廢的城市上空。
逼真芭蕾舞者踮腳呈姿勢,雙臂伸展,穿著形成層疊費波納契螺旋的精緻花紋裙子,在明暗對比照明下展示。
自然光下的人型白狼女性士兵特寫肖像,擁有醒目的紅色眼睛、可見的獠牙和微微張開露出舌頭的嘴,佩戴士兵頭盔。
一個小型綠松石色玻璃貓雕像,擁有大眼睛和粉紅色鼻子,坐在敞開的手掌上,背景為深色。
Elsa 的照片寫實特寫肖像,金色辮髮、藍色眼睛及柔和真實光線。
一個超現實場景,一條河流從描繪山脈和船隻的油畫中流出,流淌到米色沙發上,並蔓延到溫馨客廳的木地板上。
一位穿著露肩花卉和服、背部和肩膀有細緻黑色紋身的日本女孩肖像,頭髮裝飾著鮮艷的花朵和飄落的花瓣,背景是寧靜的湖泊並有柔和背光照射。
特寫一位具有肩長黑髮和綠色眼睛的年輕時尚模特兒側面,穿著米色細條紋西裝外套,表情不悅,自然光下伴隨日光暈染

portrait 圖片

插畫描繪一位長髮飄逸、穿著紅色襯衫的少女,背景為充滿活力的紅色飛濺效果。
一名女子手持點燃的蠟燭,漆黑背景中溫暖的燭光照亮她半邊臉龐。
一位白金色頭髮及紫色眼睛的女性肖像,穿著黑色露肩短款上衣,站在黃褐色紋理牆前,露出上臂上的紋身與結實體態。
一名男子的輪廓,他戴著一頂發光的生物發光荊棘冠,紫色燈光,背景為深藍色。
室內溫暖黃金時刻陽光照耀下,綠眼女子躺在床上的特寫肖像。
黑白電影光影下中國年輕女性的肖像,眼睛清晰對焦,身體和背景輕柔的動態模糊。
穿著華麗中世紀盔甲、紋飾繁複的威嚴獅子電影特寫肖像。
一位女性肖像,形似 Levy Tran,採用柴油朋克風格,戴著帽子和夾克,站在一輛復古橙藍色卡車前,配有電影燈光及銳利逼真的細節。
一幅極致細節的頭肩特寫肖像,描繪一位美麗女士,具有雀斑、紅寶石眼睛、短髮、暗色妝容及在柔和光線下帶有大笑容。
Sailor Mars 的肖像,黑髮疲憊的雙眼,穿著紅白相間的水手服,手持血跡斑斑的手槍,臉與武器上都有血跡,背景為黑色。

女性 圖片

一位穿著未來感盔甲的銀髮精靈女子,站立於旋轉多彩的雲朵天空前,呈現生動 cyberpunk 油畫風格。
穿著紫色西裝外套與黑色裙子的Lois Lane動畫肖像,站在有摩天大樓背景的都市街道上,手持紫色手提包並微笑。
一位有雀斑和長紅髮的女子全身肖像,穿著橙、紫及藍色調的多彩飄逸長裙。
一名女子手持點燃的蠟燭,漆黑背景中溫暖的燭光照亮她半邊臉龐。
一位白金色頭髮及紫色眼睛的女性肖像,穿著黑色露肩短款上衣,站在黃褐色紋理牆前,露出上臂上的紋身與結實體態。
3D 渲染肌肉女郎,黑髮帶雀斑,穿著閃亮連體服,對著簡單紅色背景擺姿勢,搭配電影感光效和 Atompunk 風格。
室內溫暖黃金時刻陽光照耀下,綠眼女子躺在床上的特寫肖像。
女子特寫肖像,擁有中等凌亂髮型及嘴唇上的暖光,佈局於復古窗框中,部分陰影及鐵塔倒影映於窗上。
動漫風格的綠色蛇髮女子,穿著商務裝及黑色高跟鞋,坐在藍色辦公椅上辦公桌前。
一位似美杜莎的女子,綠色蛇作為頭髮,戴著眼鏡和紅色連衣裙,帶著大大的綠眼睛向觀者揮手。