模型/LEOSAM的FilmGirl Ultra 胶片风 - Ultra 基础模型

LEOSAM的FilmGirl Ultra 胶片风 - Ultra 基础模型

陳嘉欣 (Chan Ka-yan)

8/7/2025

1:20:48 AM

| Discussion|

提示

避免使用含有动漫、数字艺术、卡通等标签的提示词以保持输出质量。

为了更好地微调SPIN-Diffusion，训练迭代步数应超过5万步；该作者训练了约10万步。

可使用提示词“film grain analog photography”触发胶片风格。

模型能输出真实面孔，但肢体错误率高于其他成熟的写实基础模型。

創作者贊助

🌍欢迎加入QQ群"兔狲·AIGC梦工北厂"（群号：780132897）和"兔狲·AIGC梦工南厂"（群号：835297318），入群答案：兔狲。Telegram群聊“兔狲的SDXL百老汇”链接：https://t.me/+KkflmfLTAdwzMzI1

🌍欢迎加入QQ群"兔狲·AIGC梦工北厂"，群号：780132897 ；"兔狲·AIGC梦工南厂"，群号：835297318（入群答案：兔狲）。Telegram群聊“兔狲的SDXL百老汇”，链接：https://t.me/+KkflmfLTAdwzMzI1

🚨FilmGirl Ultra 推荐参数：

Clip skip:1

CFG scale: 9

直接输出图片分辨率:约 500,000 像素 (640x768)

2024.2.29 发布“FilmGirl Ultra”，告别SD1.5的AI面孔

去年2月24日，我完成了FilmGirl LoRA的首个版本。这个LoRA是我第一款高下载量模型，并标志着我AI梦想的开始。自SDXL发布以来，我投入大量精力改进HelloWorld和AIArt XL模型。同时，FilmGirl系列已8个月未更新。

事实上，无论是FilmGirl，还是后续的Polaroid LoRA或Helloworld XL，我始终追求极致的写实感。如今一年过去，为纪念一周年，我决定推出一款将SD1.5写实感提升到新高度的模型。LoRA模型已无法满足这个使命；新的FilmGirl Ultra是一款SD1.5基础模型。

为了彻底摆脱SD1.5写实模型同质化和AI脸问题，FilmGirl Ultra未采用basilmix、chilloutmix及其衍生模型作为训练基础，而是选用了UCLA最新发布的SPIN-Diffusion。 SPIN-Diffusion是利用pickapic_v2数据集中胜者图像进行自我对弈微调的SD1.5基础模型，表现优于原始SD1.5基础模型及SD1.5 DPO基础模型，其提示词对齐能力远超Chilloutmix等经大量微调融合的基础模型。

FilmGirl Ultra的训练集来自HelloWorld XL。实际上，HelloWorld XL第一版的训练集也源自FilmGirl LoRA的最后一版。在过去的一年中，我精心积累和筛选训练集，目前共约1万张图像。训练过程中使用了多种标注方法，包括GPT4V自然语言字幕、GPT4V标签式字幕及Blip+Clip字幕。为确保模型能兼容常用提示词“1girl”、“best quality”、“masterpiece”，部分图像亦适当加入这三个词（但仍可通过“little girl/child girl”精确触发小女孩效果）。使用多套标注旨在最大化触发效果概率。作为FilmGirl传统，胶片风格为重点，提示词“film grain analog photography”可触发此风格。

该模型共经历7个训练阶段，各阶段使用不同批次大小、优化器、学习率及训练集比例，最终达到现有效果。若有兴趣微调SPIN-Diffusion，建议训练迭代步数超过5万步；实际上我以批次大小40到64进行了约10万步训练。

FilmGirl Ultra的写实效果超出预期，接近SDXL的图像质量。以下图对比了本模型与Realistic Vision v6及epiCPhotoGasm，前者为Civitai当前下载量最高的基础模型，后者为我长期认为最真实的SD1.5基础模型。向这两款优秀基础模型及其作者致敬。

close-up couple's portrait,African young woman and man,clear skin face,looking at camera,fashion photography,simple background
Negative prompt: watermark,anime,cartoon,open mouth

close-up couple's portrait,African little girl and boy,clear skin face,looking at camera,fashion photography,simple background,
Negative prompt: watermark,anime,cartoon,open mouth,

得益于GPT4V字幕和SPIN-Diffusion基础模型，模型提示词对齐效果出色。以下为不同概念的xy图测试。

种族测试

体型测试

肤色测试

年龄测试

动物测试

不过FilmGirl Ultra并非所有方面都领先。毕竟它是从新的起点出发，放弃了社区过去一年多对1.5基础模型的持续优化。经过大量测试对比，发现此基础模型肢体错误率高于社区成熟的写实模型。且因训练集缺乏动漫相关内容，如提示词涉及ACGN相关标签，输出效果较差。建议避免使用“digital art”、“anime”、“cartoon”等词。这两个是FilmGirl Ultra当前的主要不足。

FilmGirl Ultra是我AI旅程第一年的总结，赠予支持我的AI爱好者。开源社区带给我许多朋友、回忆、快乐及知识，我亦愿回馈社区贡献微薄力量。欢迎基于FilmGirl Ultra训练或融合自己的模型。如果此模型对您提升自身模型有帮助，请在模型说明中提及。希望FilmGirl Ultra及SPIN-Diffusion被更多人了解和使用。

FilmGirl Ultra将继续更新，祝大家使用愉快！

希望我们与AI共同进步，明年此时依然在此相见！

去年的2月24日，我完成了第一版FilmGirl LoRA制作。这个LoRA是我的首个高下载量模型，是我的AI之梦的开始。自从SDXL推出后，我将大量精力投入到HelloWorld和AIArt两个XL大模型的改进中。FilmGirl这个系列也已经8个月没有更新了。

其实不管是FilmGirl，还是后来的拍立得LoRA、Helloworld XL，我一直都在追求极致的写实感。如今已整整一年过去，作为一周年纪念，我决定推出一个可以将SD1.5的写实感抬升至新高度的模型，LoRA模型已不足以承载这个使命，新的FilmGirl Ultra是一个SD1.5大模型。

为了彻底摆脱SD1.5写实感大模型的同质化和AI脸问题，FilmGirl Ultra没有选择basilmix、chilloutmix及其子子孙孙们作为训练底模，而是选择了UCLA最新发布的SPIN-Diffusion。SPIN-Diffusion是一个使用 pickapic_v2 数据集胜者图像进行自我对弈微调的SD1.5底模，其表现优于SD1.5原始底模以及DPO底模，同时提示词对齐性能远好于Chilloutmix等经过大量微调与融合的底模。

FilmGirl Ultra的训练集来自HelloWorld XL。实际上HelloWorld XL的第一版所使用的训练集也来自最后一版FilmGirl LoRA。这一年我都在精益求精地积累和筛选该训练集，如今整个训练集数量已达到1万张。FilmGirl Ultra的整个训练过程使用了多种打标方法，包括GPT4V自然语言caption、GPT4V 标签式caption、Blip+Clip caption。同时为了使得该模型可以兼容大家超常用的1girl、best quality、masterpiece三个词，也适当地在部分图像中添加了这三个词（但您仍可以通过child girl/girl这两个词准确触发小女孩效果）。之所以使用多套打标，是为了使训练集的效果可以尽可能高概率地触发。同时作为FilmGirl的传统，胶片风格被重点关注，您可以通过film grain analog photography来触发该风格。

本模型进行了共7阶段的训练，不同阶段选用了不同的batch size、优化器、学习率以及训练集比例，方才达到了目前的效果。如果有朋友同样对微调SPIN-Diffusion感兴趣，我建议您的总体训练迭代步数应在5万步以上，实际上我以batch size 40~64，共训练了约10万步。

FilmGirl Ultra的写实效果超出了我的预料，已经与SDXL的图像效果接近。上图中列出了该模型与Realistic Vision v6以及epiCPhotoGasm的对比，前者是目前C站下载量最高的1.5底模，后者是我心目中长期以来最为写实的1.5底模，向这两个优秀底模以及其背后的作者致敬。

同时得益于GPT4V打标以及SPIN-Diffusion底模，该模型的提示词对齐性能优异。

但FilmGirl Ultra也并非在所有维度都全面领先。它毕竟是从一个全新起点出发制作，放弃了社区一年多来对1.5底模的不断调优打磨内容，经过我的大量测试对比，该底模的肢体错误率要高于社区成熟的写实模型。同时由于训练集缺乏二次元内容，当你的提示词中涉及二次元相关tag时，出图效果不佳。建议大家避免使用digital art、anime、cartoon等词。这两个问题是FilmGirl Ultra目前最主要的两个缺陷。

FilmGirl Ultra是我AI之旅第一年的年终总结，是我送给支持我的AI同好们的礼物。开源社区为我带来了诸多朋友、回忆、快乐以及知识，我也希望回馈社区做出自己的一点点贡献。希望上述的模型制作总结能为大家带来一些帮助，同时也欢迎大家基于FilmGirl Ultra进行你的模型训练或融合。本模型与其训练底模SPIN-Diffusion一样，请大家遵循Apache-2.0许可证使用，否则将被追责。如果您觉着这个模型有帮助您让自己的模型变得更好，请在模型说明中提及下它，希望FilmGirl Ultra以及SPIN-Diffusion能被更多人了解和使用。

FilmGirl Ultra后续还会持续更新，祝大家使用愉快！

希望我们能随AI一起不断进步，明年此时，仍能在此相遇！

FilmGirl Ultra系列模型（以下简称“本模型”）是由我（以下简称“所有者”）基于SPIN-Diffusion开发的SD1.5大模型。

所有者授权个人或机构可免费使用本模型所生成的图像用于非商业性质的教育或信息传播目的，并且：

- 遵守相关法律规定，不侵犯本模型或任何第三方的合法权益。

- 在使用图像时需注明图像来源为“由LEOSAM's FilmGirl Ultra大模型生成”。

对于商业目的的使用，必须先与所有者签署商用授权协议。有关商业授权和模型定制事宜，请通过所有者在Civitai平台的主页信息联系。

所有者将持续为个人玩家免费提供FilmGirl Ultra模型的更新，以此表达对社区开源贡献者的支持和感谢。商业用户的有偿合作是推动本模型开发和持续改进的重要动力。感谢每一位用户的理解与支持。

请注意，任何未经授权的使用行为都可能违反相关法律规定，并可能承担法律责任。本声明的最终解释权归所有者所有，并受相关法律法规的约束。