Chroma - v.35
推奨プロンプト
Extreme close-up photograph of a single tiger eye, direct frontal view. The iris is very detailed and the pupil resembling a dark void. The word "Chroma V.35 now with less steps" is across the lower portion of the image in large white stylized letters, with brush strokes resembling those made with Japanese calligraphy. Each strand of the thick fur is highly detailed and distinguishable. Natural lighting to capture authentic eye shine and depth.
推奨ネガティブプロンプト
low quality, ugly, unfinished, out of focus
推奨パラメータ
samplers
steps
cfg
resolution
クリエイタースポンサー

みなさん、こんにちは、
しばらく前に、進行中のオープンソース基礎モデル「Chroma」について投稿しました。たくさんの素晴らしいフィードバックをいただき、基礎モデルのトレーニングがついに完了し、すべてのモデルファミリーが使えるようになったことをお知らせできてうれしいです!
ここでの約束を簡単に振り返ります:これらは真のベースモデルです。
美的調整やDPOのようなポストトレーニング処理は一切行っていません。これらは未加工で強力かつ中立的な出発点として設計されており、あなたがファインチューニングするための完璧な基盤です。重たい作業は私たちが行いましたので、あなたは気軽に使ってください。
その重たい作業とは、約105,000時間のH100 GPU時間の計算資源を使いました。この大量のGPU時間で膨大なデータ分布に基づいたモデルが作られているので、これらの上にファインチューニングするのは簡単なはずです。
約束通り、すべてApache 2.0ライセンス下で提供されており、制限はありません。
要点:
リリースブランチ:
Chroma1-Base: これは512x512のコアモデルです。あらゆるクリエイティブプロジェクトのためのしっかりした基盤です。長期間のファインチューニングを計画している場合、これを使って最後のエポックでのみ高解像度をトレーニングし、収束を早めるのに適しています。
Chroma1-HD: これはChroma1-Baseの高解像度1024x1024でのファインチューニング版です。高速な高解像度のファインチューニングやLoRAを行いたい場合の出発点です。
リサーチブランチ:
Chroma1-Flash: Chroma1-Baseのファインチューニング版で、これらのフローマッチングモデルを高速化する最良の方法を探るためのものです。技術的にはGANベースのトレーニングを利用せずに高速モデルをトレーニングする実験的な結果です。デルタウェイトは任意のChromaバージョンに適用して高速化できます(強度の調整を忘れずに)。
Chroma1-Radiance [WIP]: Chroma1-Baseの急進的に調整されたバージョンで、これはピクセル空間モデルとなっており、技術的にはVAEの圧縮アーティファクトを受けません。
量子化オプション
代替オプション:FP8スケールド量子化(ComfyUIで使われているフォーマットで推論速度の向上が期待できます)
代替オプション:GGUF量子化(ComfyUI-GGUFのカスタムノードのインストールが必要です)
特別な感謝
本プロジェクトを可能にしてくれたサポーターの皆様に心から感謝します。
驚異的な寛大さで事前トレーニングとデータ収集の資金を提供してくれた匿名の寄付者様。あなたの支援はオープンソースAIにとって革命的でした。
Fictional.aiの素晴らしい支援とオープンソースAIの限界を押し広げる手助けに感謝します。
このプロジェクトをサポートしよう!
https://ko-fi.com/lodestonerock/
BTCアドレス: bc1qahn97gm03csxeqs7f4avdwecahdj4mcp9dytnj
ETHアドレス: 0x679C0C419E949d8f3515a255cE675A1c4D92A3d7
私のDiscord: discord.gg/SQVcWVbqKx

