stable diffusion キャラ固定｜同一人物を安定再現する完全手順

2025年9月4日

StableDiffusionで生成 — stable diffusion キャラ固定｜同一人物を安定再現する完全手順

毎回同じキャラクターの顔、髪型、衣装を維持しながら、背景やポーズだけを変えたい。そんなニーズに応えるための手順とコツをまとめました。IP-Adapter、Reference、ControlNetの使い分けから、LoRAの強度管理、ネガティブプロンプトの最小化まで、すぐに実践できるステップとヒントで解説します。

商業利用や作品を公開する際の注意点も、安全を最優先に案内しますので、ぜひご活用ください。

この記事のポイント

同一人物を安定再現する「キャラ固定」設計の基本
IP-Adapter／Reference／LoRAの最適な組み合わせ
崩れを防ぐネガティブとControlNetの重み目安
公開前チェックと権利配慮の保守的ガイド

Contents

stable diffusion キャラ固定の基本

参照画像とIP-Adapterで顔と衣装の恒常性を優先確保する
Reference/顔強調語の語順最適化で同一性を堅く保つ
seed固定と解像度・画角一致でキャラ比率の揺れを抑える
ControlNetはOpenPose優先、背景拘束は薄く重ねるだけ
ネガティブは手指崩れ中心に最小限で表現力を維持する

参照画像とIP-Adapterで顔と衣装の恒常性を優先確保する

キャラ固定の土台は「良質な参照画像」とIP-Adapterの強度設計です。

まず顔がよく写る高解像度の正面～準正面を用意し、IP-Adapterを0.6～0.8に設定。

衣装や髪の一貫性が弱い場合は0.05刻みで上げます。初期段階はポーズよりも「同一人物の保持」を最優先にします。

Reference/顔強調語の語順最適化で同一性を堅く保つ

プロンプト先頭に「same face, same outfit, identity preserved」を置き、次に被写体（1girl/1boy）、画角（full body/upper body）を続けます。

英語の短い形状語は安定しやすく、顔・髪・服の記述は重複も可。

Reference Only系の拡張がある場合は併用し、顔の再現率を底上げします。

seed固定と解像度・画角一致でキャラ比率の揺れを抑える

seed（乱数）固定、元画像と同じアスペクト比、同等解像度で開始すると安定します。

CFG 6～8、Steps 20～30を目安に、最初は大きな変更を避けて微調整で詰めるのがコツ。

画角のズレは顔パーツの誇張や縮みを誘発するため注意します。

ControlNetはOpenPose優先、背景拘束は薄く重ねるだけ

キャラ固定ではOpenPoseで骨格を指定しつつ、Lineart/Depth/Tile等は薄く（0.3～0.5）に留めます。

背景拘束が強すぎると顔の同一性が崩れることがあります。

OpenPoseの手指キーポイントを丁寧に作ると顔以外の破綻も減ります。

ネガティブは手指崩れ中心に最小限で表現力を維持する

「extra fingers, deformed hands, bad anatomy」などを基本に、「duplicate face」「thin lips」など顔崩れ対策は軽めに。ネガティブ過多は似姿の多様性を損なうため、崩れが出た箇所だけ狙い撃ちで追加・削減します。

stable diffusion キャラ固定の設定集

即使える英語プロンプト表とネガティブの組み合わせ
ワークフローステップ表で再現性と時短を両立する
LoRA/Embeddingsの強度目安で衣装と表情を安定化
ComfyUIノード化とプリセットで共有と量産に強くする
失敗例から学ぶ「似ているけど違う」を避ける調整術

即使える英語プロンプト表とネガティブの組み合わせ

目的	英語プロンプト（先頭に配置）	日本語補助	Negative	推奨設定
顔と衣装の完全一致	same face, same outfit, identity preserved, 1girl, upper body, studio lighting	顔・衣装一致を最優先	duplicate face, low-res, artifacts	IP-Adapter 0.75 / CFG 7 / seed固定
全身でポーズ変更	same face, same outfit, full body, dynamic pose, clean silhouette	全身構図で輪郭を明確	cropped body, cut-off feet	OpenPose 0.7 / Depth 0.4 / Steps 26
背景は固定したい	identity preserved, same background, consistent colors, natural look	背景色味を維持	background change, motion blur	Lineart 0.4 / img2img Denoise 0.35
表情と目元を強調	same face, detailed eyes, gentle smile, soft daylight	目と口角を安定	over-sharpen, harsh shadow	Face restore弱 / IP-Adapter 0.6
衣装を強く固定	same outfit, realistic fabric, identity preserved, upper body	質感と服の一致	texture noise, pattern shift	LoRA(outfit) 0.5～0.7 / CFG 6

ワークフローステップ表で再現性と時短を両立する

Step	内容	目安/数値	チェック
1	参照画像準備（正面・高解像・髪/服が明瞭）	長辺≥1024px	顔と髪が影で潰れていない
2	IP-Adapter設定（顔・衣装を優先）	0.6～0.8	0.05刻みで強度調整
3	OpenPose骨格作成（手指キーポイント重視）	Weight 0.7～0.9	肩・肘・手首の角度検証
4	背景拘束の追加（Lineart/Depthは薄く）	0.3～0.5	顔の再現を阻害していない
5	seed固定・解像度/画角合わせ	CFG 6～8 / Steps 20～30	アスペクト比一致
6	ネガティブ最小化（手指中心）	定番＋必要語のみ	表現痩せがない
7	差分比較で微調整（顔・髪・衣装・骨格）	小刻みに再生成	1要素ずつ変更
8	必要部位だけinpaint	Denoise 0.3～0.45	境界の馴染み確認

LoRA/Embeddingsの強度目安で衣装と表情を安定化

衣装LoRAは0.4～0.7、表情LoRAは0.2～0.4から開始。

合計強度が高いほどポーズ自由度が下がるため、ControlNetの重みと同時にバランス調整します。

mbeddingsは語彙補強として短文プロンプトでも意図を伝えやすくなります。

ComfyUIノード化とプリセットで共有と量産に強くする

成功レシピはノードテンプレート化し、「IP-Adapter → OpenPose → 背景Control → Sampler」の順に固定。

各ノードのStart/EndやWeightを記録すれば、他案件でも同じキャラを再現しやすく、チーム共有や外注とも相性が良いです。

失敗例から学ぶ「似ているけど違う」を避ける調整術

髪色がズレる→IP-Adapter↑、衣装模様が変わる→LoRA↑、顔が別人→Reference Only＋顔キーワードを先頭へ。

背景が勝つ→背景Control↓、ポーズが動かない→OpenPose↑。

一度に複数を変えず、原因を特定しやすい順で調整します。

stable diffusion キャラ固定の注意点

第三者素材・実在人物の参照使用は権利とプライバシーを最優先
配布モデルやLoRAのライセンスと各規約の最新版を確認する
AI生成物の出所を明記し誤認混同を避ける透明性を確保する
未成年や機微情報が写る参照は避け、匿名化や加工を徹底する
商用案件はクライアント合意とチェック体制をルール化する

第三者素材・実在人物の参照使用は権利とプライバシーを最優先

AIモデルの学習や画像生成に、他人の写真や既存のキャラクター、ロゴ、商標などを使用する際は、必ず権利者の許諾を得るか、各プラットフォームの利用規約やガイドラインに従う必要があります。

特に、肖像権やプライバシー権、商標権など、他者の権利を侵害するような素材を無断で使用すると、深刻な法的トラブルに発展する可能性があります。

トラブルを未然に防ぐためにも、作品を公開する前に必ず権利チェックを行うことをルーティン化しましょう。もし少しでも疑わしい点があれば、その素材の使用は避けるのが賢明です。（この内容は法的助言ではありません。法的な判断が必要な場合は専門家にご相談ください。）

配布モデルやLoRAのライセンスと各規約の最新版を確認する

モデルやLoRA（Low-Rank Adaptation）は、配布元によって商用利用の可否、クレジット表記の義務、再配布の禁止など、さまざまな利用条件が設定されています。

これらの利用規約は、モデルのバージョン更新によって変更されることも少なくありません。そのため、使用する直前に必ず最新版のライセンス情報を確認する習慣をつけましょう。もし利用規約が不明確であったり、複雑で判断に迷ったりする場合は、使用しないという判断が最も安全です。

AI生成物の出所を明記し誤認混同を避ける透明性を確保する

AIによって生成された画像や作品は、「Stable Diffusionで生成」「AI加工」といったように、その出所を明確に記載することで、クライアントやユーザーとの認識のズレを防ぐことができます。

特に広告やECサイトなど、商業目的でAI生成物を使用する際は、作品の透明性がユーザーからの信頼に直結します。手書きや写真と見分けがつかない作品であっても、AIで生成されたものであることを正直に開示することで、トラブルのリスクを減らし、誠実な姿勢を示すことができます。

未成年や機微情報が写る参照は避け、匿名化や加工を徹底する

AIモデルの学習や、画像生成の参照元として、未成年者や機微な情報（顔、名札、住所、車のナンバープレートなど）が含まれる画像を使用する場合は、細心の注意が必要です。

これらの個人特定に繋がりうる情報が含まれる素材は、可能な限り使用を避けましょう。どうしても必要な場合は、匿名化やトリミング、ぼかしといった加工を徹底することで、プライバシーのリスクを最小限に抑えられます。

商用案件はクライアント合意とチェック体制をルール化する

商業案件でAI生成物を使用する際は、クライアントとの間で事前の合意形成とチェック体制の確立が不可欠です。

例えば、キャラクターの顔の一致率、衣装の再現度、色の許容範囲など、具体的な品質基準をあらかじめすり合わせておきましょう。また、納品前にはテスト出力を繰り返し、複数のパターンをクライアントと共有することで、認識のズレをなくせます。

さらに、公開後のトラブルに備え、最終的な権利チェックの担当者を明確にし、異議申し立てがあった際の窓口や対応フローも事前に決めておくことが重要です。これにより、スムーズなプロジェクト進行と、リスクマネジメントが可能になります。

よくある質問

IP-AdapterとReferenceはどちらを先に使うべきですか？

初期はIP-Adapterで顔・衣装の恒常性を確保し、その後にReference（Reference Onlyや顔参照特化）で仕上げるのが安定しやすいです。IPを0.6～0.8で開始し、似姿が足りなければ0.05刻みで上げます。逆にポーズが動かなくなったらIPを少し下げ、OpenPoseやDepthの重みを見直すとバランスが戻ります。

キャラが別人化する時、最初に確認するポイントは？

参照画像の品質（解像・ライティング・被写体角度）、プロンプトの語順（same face/outfitが先頭か）、seed固定、画角と解像度の一致です。これらが整っていればIP-Adapterの強度を0.05刻みで上げ、顔キーワード（eye shape, hair length, bangs等）を追加。必要に応じて顔だけinpaintで軽修正します。

LoRAを複数使うとキャラ固定は強くなりますか？

強くなりますが代償としてポーズ自由度が下がります。衣装LoRAを0.5、髪型LoRAを0.3など弱めから開始し、合計強度が高くなり過ぎないよう管理してください。崩れが出たら背景Controlやネガティブではなく、まずLoRA合計を下げるのが近道です。

背景を固定しつつキャラ固定も保ちたい時のコツは？

背景Control（Lineart/Tile/Depth）は薄く0.3～0.5にし、キャラ固定はIP-Adapterで担保します。Promptにも「same background」「consistent colors」を加え、ネガティブに「background change」を入れるとブレが減少。背景強度を上げすぎると顔が崩れるため注意します。