回帰分析とは? NPS改善に効く「重回帰分析」をわかりやすく解説 | 株式会社エモーションテック

回帰分析とは? NPS改善に効く「重回帰分析」をわかりやすく解説

更新日:2025.12.03

このコラムの執筆者
柳 尚弥

株式会社エモーションテック アナリスト

大学院修士課程を経て理学療法士として大学病院に4年間従事。臨床現場と並行して学術研究や論文執筆を経験。2025年よりエモーションテックに参画。前職の医療現場で徹底してきた「エビデンスに基づく実践」を強みとし、統計知識を用いた課題背景の探索や考察を行い、客観的根拠のあるプロジェクト支援を担当。

CX(カスタマーエクスペリエンス)推進部門やマーケティング担当の皆様は、日々NPS®(ネット・プロモーター・スコア)をはじめとする顧客アンケートの実施や、VoC(顧客の声)の収集・分析に取り組まれていることと存じます。

しかし、アンケートで「NPS」と「個別の体験(例:サポートの対応、製品の使いやすさ)の満足度」を両方聴取しても、「何がNPSに最も強く影響しているのか」を客観的に判断するのは困難です。

この記事では、そうした課題を解決するための強力な武器となる統計手法、「回帰分析」について、データ分析の専門家でない方にもわかりやすく解説します。

この記事のポイント

  • 「回帰分析」の基本的な概念を理解できる。
  • なぜCX推進において回帰分析が重要なのかが明確になる。
  • アンケートデータを活用し、NPS(顧客ロイヤルティ)に真に影響を与えている要因(ドライバー)を特定する具体的な手法と思考プロセスが学べる。
  • 分析結果を「次の一手」としての改善アクションに繋げるためのポイントがわかり、データに基づいたCX改善の第一歩を踏み出せる。

「統計」と聞くと難しく感じるかもしれませんが、CX改善のヒントが詰まっています。ぜひ最後までお付き合いください。

EmotionTechのNPS分析・CX関連サービスがわかる資料(概要・支援実績)をダウンロードする

回帰分析とは? 

回帰分析とは「目的変数(例:売上、NPS)が、説明変数(例:広告費、サポート品質の満足度)によってどれくらい変動するのか、あるいはどれくらい説明できるのか」という、変数同士の関係性を数式で客観的にわかりやすくする統計手法です。

ここで示す変数とは、属性や特徴を示し、対象によって変化しうる値で、目的変数は結果になりうる変数、説明変数は原因と考えられる変数のことです。先ほど例示したNPSや売上は目的変数、サポート品質の満足度は説明変数と考えられます。

私たちは日常生活やビジネスの現場で、無意識のうちに「回帰分析的」な思考をしています。

  • 「気温が上がると、アイスコーヒーの売上が伸びる」
  • 「Webサイトの読み込み速度が遅いと、直帰率が上がる」
  • 「サポートセンターの対応が丁寧でないと、顧客満足度が下がる」

これらはそれぞれ「売上、直帰率、満足度」と「気温、速度、対応」の関係性を示しています。回帰分析は、こうした関係性を単なる「関係がありそうだ」という感覚的な把握にとどめず、「気温が1度上昇した時、アイスコーヒーの売上がどれくらい伸びるか」を、データに基づいて具体的に予測・説明できるようにするものです。

CXにおける回帰分析のイメージ

CXの文脈で言えば、私たちが知りたい「目的変数」の代表例はNPS(≒顧客ロイヤルティ)総合満足度です。そして「説明変数」の候補は、顧客が体験する様々なタッチポイント(接点)での評価であり、例えば「品質」「価格」「Webサイトの使いやすさ」「サポート担当者の対応スピード」「営業担当者の提案力」などです。

回帰分析を用いることで、「サポート担当者の対応スピードの評価が1点上がると、NPSが何ポイント上がる傾向にあるのか?」といった、CXの各要素がロイヤルティに与える「影響度」を可視化することができます。

関連記事:
NPS®とは?顧客満足度との違い・質問方法・事例まで詳しく解説!

なぜ回帰分析はCX推進において重要なのか?

CX推進部門のミッションは、顧客体験を向上させ、顧客ロイヤルティを高めることです。そのためにNPSアンケートなどで顧客の声を収集しますが、そのデータを「次の一手」に繋げられなければ意味がありません。

回帰分析はこの「データとアクションの橋渡し」を担い、特に施策の優先順位を決める判断を統計的な目線でサポートする重要な役割を果たします。具体的には、特定の顧客体験要素(満足度)が、最終的なロイヤルティ指標にどれだけ強く影響を与えているかを定量的に分析します。この分析結果に基づき、限られたリソースの中で最大効果を生む施策を客観的に決定できるようになります。

理由1: 複合的な影響力を解析し、真のロイヤルティ・ドライバーを特定

NPSアンケートでは、「製品の品質」「サポートの対応」「価格」など、個々の体験要素に対する満足度を尋ねますが、顧客ロイヤルティ(NPS)は単一の要素だけで決まるわけではありません。

回帰分析を用いることで、ある特定の体験要素がロイヤルティ指標と1対1で関係しているかを見るだけでなく、複数の体験要素が複合的にロイヤルティに与える影響を同時に解析できます。

理由2: 結果を定量的に可視化し、優先順位とリソース配分を最適化

CX改善におけるリソース(人、予算、時間)は常に限られており、「どの施策にどれだけの投資をするべきか」という判断は、経験や勘に頼るべきではありません。

回帰分析は、「Webサイトの使いやすさの満足度が1点向上すると、推奨度が⚪︎点向上する」といった形で、施策の効果を定量的な数値(回帰係数)で明確に可視化することができます。

この定量的な数値の大小こそが、施策の優先順位を決定づけます。数値が大きい要素ほど、改善のインパクトが大きいと判断でき、最大効果を生む施策にリソースを集中させることが可能になります。客観的な根拠に基づき、限られた予算と人員を、効果が高い施策に濃淡をつけて戦略的に配分するための、強力な判断材料となるのです。

理由3:調査構造と分析結果が「共通言語」となり、他部署連携を促進

CX改善は、推進部門だけで完結するものではなく、製品開発、営業、サポート、マーケティングなど、全社的な取り組みが必要です。しかし、「顧客のために」というスローガンだけでは、他部門、特に日々異なるKPIを追っているそれぞれの現場を動かすことは難しい場合があります。

回帰分析は、緻密な調査構造の構築という労力をかけることで、その後の分析に大きな意味をもたらします。構築に関しては後半にも説明します。

この構造自体が共通認識の土台となり、導き出された客観的な数値は、他部署への強力なエビデンスとして機能します。結果、全社的な取り組みを加速させるための論理的な理由と、部門を繋ぐ共通言語が確立されるのです。

回帰分析の種類とCXにおける分析手順

回帰分析にはいくつかの種類がありますが、CX分析で主に使用されるのは「単回帰分析(たんかいきぶんせき)」「重回帰分析(じゅうかいきぶんせき)」です。ここではそれぞれの違いと、なぜ重回帰分析が必要なのかを解説します。

単回帰分析 (Simple Linear Regression)

単回帰分析は、回帰分析の最も基本的な形です。その特徴は、「1つの変数」が「1つの変数」にどう影響するかを直線的な関係に当てはめて分析する手法です。

ポイントは、関係性を分析したい変数が「一つ同士である」という点です。

例えば、「サポートの対応スピード満足度(説明変数)」と「NPS(目的変数)」のシンプルな関係性を見たい場合には単回帰分析を用います。分析結果は、Y = aX + b という私たちにも馴染み深い一次関数(直線)の式で表されます。

  • Y:NPS(予測値)
  • X:サポートの対応スピード満足度
  • a:回帰係数(傾き)。Xが1単位増えたときにYがどれだけ増えるか(影響の強さ)
  • b:切片。Xが0のときのYの値

単回帰分析によって、「サポートの対応スピード満足度が1点向上すると、NPSが〇ポイント向上する」ことがわかります。しかし、皆様もご存じの通り、NPSが、たった1つの体験要素で説明できることはあり得ません。サポートの対応が速くても、製品の品質が低ければNPSは上がらないでしょう。

では、品質や価格についてもそれぞれ単回帰分析を行い、同じように関係性を数式で表せば良いでしょうか。結論、それはNGです。説明変数同士の関係を無視して解釈してしまうため、NPSの向上分が過剰に表現されてしまうのです。

顧客体験をそれぞれ単回帰分析するといったNG手法を克服してくれるのが、本記事の主役である「重回帰分析」です。

重回帰分析 (Multiple Linear Regression)

重回帰分析は、「複数の変数」が「1つの変数」にどう影響するかを分析する手法です。複数の変数を同時に扱うことができ、なおかつ分析結果も扱いやすいため、CX分析には不可欠な分析手法となります。

NPSは、製品の品質や価格、サポート対応、WebサイトのUIなど、様々なCX要素が複雑に絡み合って形成されると考えられます。先ほど、それぞれ単回帰分析を行うと結果が過剰に表現されてしまうためNGであると説明しました。

重回帰分析では、これらの複数の要素が同時にNPSに与えている影響を、「それぞれの影響度」として分離して取り出すことができます。

式で表すと Y = a1X1 + a2X2 + a3X3 + … anXn + b となります。単回帰分析より少し複雑です。

  • Y:NPS(目的変数)
  • X1:製品の品質(説明変数①)
  • X2:価格の納得感(説明変数②)
  • X3:サポートの対応スピード満足度(説明変数③)
  • a1, a2, a3, … , anXn偏回帰係数(へんかいきけいすう)。それぞれの変数がYに与える影響の強さ。
  • b:切片
  • n:CX要素の数

分析結果にはいくつか数値が出てきますが、重要なのは偏回帰係数(a1, a2, a3です。偏回帰係数は、各CX要素がNPSに与える「影響力」を示します。偏回帰係数が大きいほど、NPSへの影響が強い、つまりロイヤルティ・ドライバーであると判断できます。

CXにおける重回帰分析の実行手順

分析実行におけるCX担当者の仕事は、「何を分析するか」を設計し、「出てきた結果をどう解釈するか」に集中することです。

ここでは、NPSアンケートのデータを使って改善の優先順位をつけるための、重回帰分析の基本的なステップをご紹介します。

ステップ1: 目的変数(結果)と説明変数(原因)を決める

このステップが一番始めに取りかかる作業であると同時に、最も重要なプロセスです。この手順を疎かにしてしまうと、後から行う分析の軸がブレてしまい、「結局何が言いたいのかわからない」分析レポートになります。

まず、何を知りたいかを明確にします。考え方としては、ある原因(要因)があって、その結果どうなったのか、矢印をイメージしながら考えると良いでしょう。ただし、重回帰分析では原因と結果を結びつける因果関係の解釈はできませんので注意が必要です。

以下に、目的変数と説明変数として設定されやすい具体例を提示します。

  • 目的変数
    通常は、NPS(推奨度)総合満足度など、顧客ロイヤルティの全体指標を置きます。
  • 説明変数
    目的変数に影響を与えていると想定される、具体的なCX要素の評価を置きます。ここで重要なことは、各CX要素の粒度を揃え、似たような要素は除くことです。
    (例:X1=「製品の品質」、X2=「価格の納得感」、X3=「営業担当者の提案力」、X4=「サポートの対応スピード」、X5=「Webサイトの情報量」など)

これらのデータは、同一のアンケート内で聴取されている必要があります。「当社のサービスをどの程度推奨したいですか?(総合的な推奨度)」と、「推奨度をつける際に、各CX要素(製品、価格、サポート…)はそれぞれどの程度影響しましたか?」という設問群になります。

関連記事:
NPS調査の作り方を解説!アンケートの作成や調査設計のコツがわかる

ステップ2: データを収集・整形する

集まったアンケートデータを解析できるデータへと変換していく作業になります。

まず、アンケート回答データをExcelなどの表形式にまとめます。1行が1人の回答者に対応し、各列に目的変数(推奨度)と各説明変数(製品満足度、価格満足度…)のスコアが入っている状態にします。

満足度は通常「非常に満足〜非常に不満」などの選択肢で調査しますが、数式に当てはめるためスコアへと変換する必要があります。例えば、「非常に満足」は5点、「やや満足」は4点、「どちらでもない」は3点、「やや不満」は2点、「非常に不満」は1点などとスコアへ変換していきます。

また、データの空き、欠損値がないかも確認が必要です。基本的に重回帰分析では、説明変数の中でデータの欠損値が含まれていないことが条件です。もしデータの欠損が含まれていると、ほとんどの統計ソフトでは欠損値が含まれている行を除外して解析を進めます。結果として、アンケートを取得できた人よりも少ない人たちの中で分析していることとなり、結果の解釈もそのようにしなければなりません。

このほかにも、外れ値の確認やデータ分布の確認、多重共線性への考慮、変数選択などの手順を踏みながら実際の分析へ移っていきます。

ステップ3: 分析ツールで実行する

単回帰分析とは異なり、重回帰分析では複雑な計算を行う必要があります。そのため一般的にはPythonやRなどのプログラミング言語で、計算に特化したライブラリやパッケージを用いたり、有料の統計ソフトを用いて解析を行います。

分析が実行できたらすぐに出力結果を確認したいところですが、分析自体がしっかりできているかも確認する必要があります。

例えば、選択した説明変数(原因と考えられている要素)が目的変数にほとんど影響しないものばかりであった場合を考えてみます。その際に偏回帰係数のみをみてしまうと、実際にはほとんど影響がないにもかかわらず「係数の大きいものが重要だ!」と捉えてしまい、分析結果から誤解が生じてしまいます。

そんな時に、説明変数の選択が目的変数を予測する際に十分であるかを判断する基準として、モデルの適合度という考え方があります。決定係数R2やAIC(赤池情報基準)といった指標があり、これらの情報を元に分析した統計モデルがで適切であったかを判断します。

ステップ4: 分析結果を解釈する(最重要)

統計ソフトは重回帰分析の「結果の数値」を出力してくれますが、その数値が何を意味するのかを読み解き、「次の一手」に翻訳するのはCX担当者の皆様の役割です。次のセクションで、この「結果の解釈」について詳しく解説します。

重回帰分析の活用事例と分析結果の「読み解き方」

重回帰分析を実行すると、難解に見える数値が並んだ「分析結果(サマリー出力)」が得られます。CX担当者として、最低限どこに注目すれば「次の一手」に繋がるのか、その読み解き方と活用ポイントを解説します。

ここでは、あるBtoB企業の推奨度と、5つのCX要素(「製品の品質」「価格の納得感」「営業担当者の提案力」「サポートの対応スピード」「Webサイトの情報量」)の関係を重回帰分析した、という架空の事例で見ていきましょう。

ポイント1: 「偏回帰係数」で各CX要素の影響度の大きさを知る

まず最初に見るべき最も重要な数値が「偏回帰係数」です。

今回は架空の分析結果を使用して、その解釈と注意点について説明します。

先ほどの例と同様、目的変数は推奨度であり、説明変数にCX1〜5までを設定したとします。データ収集とデータ整形を経て辿り着いた分析結果は以下の通りになりました。

<架空の分析結果(係数)>

説明変数 (CX要素) 係数
(偏回帰係数)
解釈
(推奨度への影響度)
サポートの対応スピード 1.45 (最も影響 大)
製品の品質 0.80 (影響 中)
営業担当者の提案力 0.65 (影響 小)
Webサイトの情報量 0.33 (影響 わずか)
価格の納得感 0.02 (影響 ほぼ無し)

【読み解き方】

この「係数」は、そのCX要素が推奨度(目的変数)に与える影響の強さを示します。この数値が大きいほど、推奨度への影響力が強い「重要項目(ロイヤルティ・ドライバー)」であると言えます。

この例では、「サポートの対応スピード」の係数が1.45と最も高くなっています。これは、「他の要素(製品品質や価格など)の影響を一定とした場合でも、サポートの対応スピード満足度が1点上がると、推奨度は1.45点上がる傾向にある」ことを意味します。つまり、ここを改善するのが最も効果的だと言えます。

ここで重要なのが、「他の要素の影響を一定とした場合」という前提条件です。重回帰分析を行う最大のメリットはまさにこの点、「他の要素の影響を除外して、要素単体の『純粋な実力』が見える」にあります。

先程の分析結果をもとに、「製品の品質」と「価格」の関係で考えてみましょう。一般的に、「品質が良い製品」は「価格も高い(=価格への不満が出やすい)」傾向があります。そのため、単純な集計だけでは、顧客が「品質で満足した」のか、それとも「価格で不満を持った」のか、影響が混ざり合って区別がつきません。

しかし、この重回帰分析では「仮に、価格への納得感が全員同じだったとしたら?」という条件のもとで計算を行います。 「価格」というノイズを取り除くことで、「品質」そのものがどれだけ推奨度に貢献しているか(=純粋な影響力)を正しく評価できるのです。

【次の一手への活用】

この結果から、NPSを効率的に向上させるための最優先課題は「サポートの対応スピード」の改善である、という明確な方針が立てられます。もしリソースが限られているなら、「価格」や「Webサイト」の改善よりも、「サポート体制の強化」に投資すべきである、というデータに基づいた意思決定が可能になります。

ポイント2:多重共線性(Multicollinearity)の可能性を考える

通称「マルチコ」と呼ばれます。これは、説明変数同士が強すぎる相関関係にある場合に発生する問題です。例えば、説明変数に「製品の満足度」と「製品の使いやすさ」を両方入れてしまうと、この2つは似たような概念(=相関が高い)ため、分析結果(係数)が不安定になり、正しく影響度を測れなくなることがあります。

対策:似たような設問を説明変数に入れないようにする。VIF(分散拡大要因)という指標をチェックし、値が大きすぎる(例:10を超える)変数は、どちらかを外すか、設問を統合する検討をします。

もっと細かく解釈したい方へ: プラスアルファの着眼点

重回帰分析は強力なツールですが、裏を返すと複雑で正確に解釈するためには統計学の知識が必要になります。ここからは、知っておくと重回帰分析がもっと解釈がしやすくなる着眼点をお伝えします。

着眼点1: P値

P値は、「(本当は影響がないのに)たまたまデータ上で影響があるように見えてしまう確率」を示します。つまり、この数値が小さいほど、その係数(影響度)は「統計的に信頼できる(=まぐれではない)」ということになります。

一般的に、P値が0.05(5%)未満、あるいは厳しく見て0.01(1%)未満であれば、「統計的に有意(=信頼できる結果)」と判断されます。

P値が大きな項目については、「影響度が低い」あるいは「データ上、影響があるとは言えない」と判断します。施策の優先順位は、「係数が大きく、かつP値が小さい(信頼できる)」もの(=サポート、製品品質)から立てることをおすすめします。

着眼点2: モデルの適合度

モデル全体の「当てはまりの良さ」も確認しておきましょう。それが「決定係数(R2, R-squared)」や「補正R2」と呼ばれる値です。

これは、「目的変数(推奨度)の変動のうち、どれくらいを説明変数(製品品質やサポートなど、今回分析に使ったCX要素)で説明できているか」を示す割合(0~1)です。

例えば、「決定係数 R2 = 0.65」だった場合、これは「NPSが人によって高かったり低かったりする理由(変動)の65%は、今回分析に使った5つのCX要素(サポート、製品、営業、Web、価格)の満足度の違いによって説明できますよ」ということを意味します。

R2の値が1に近いほど、精度の高い分析(予測モデル)と言えます。CX(人の心理)を扱う分析では、0.5~0.7程度でも十分な洞察が得られることが多いですが、もしこの値が極端に低い(例:0.1)場合、注意が必要です。

R2が低いということは、「NPSの変動を、設定した説明変数でほとんど説明できていない」ことを意味します。つまり、NPSに影響を与える「真のドライバー」が、アンケートの設問(説明変数)から漏れている可能性が高いです(例:ブランドイメージ、競合他社との比較、など)。

その場合は、アンケートの設問設計そのものを見直す必要がある、という「次の一手」に繋がります。

着眼点3:因果関係との混同を避ける

回帰分析が示しているのは、あくまで「統計的な関係性(相関)」であり、必ずしも「因果関係(Aが原因でBが起こる)」を証明するものではありません。

例えば、「NPSが高い人ほど、Webサイトの閲覧時間が長い」という回帰分析の結果が出たとしても、それは「Webサイトを長く見た(原因)→満足してNPSが上がった(結果)」かもしれませんし、逆に「NPSが高い(=ロイヤルティが高い)人だから(原因)→結果としてWebサイトを長く見てくれている(結果)」だけかもしれません。

分析結果を鵜呑みにせず、ビジネスの文脈(顧客の行動プロセス)に照らし合わせて、その関係性が妥当かどうかを考察することが重要です。

まとめ: 回帰分析で「顧客の声」を「次の一手」に変える

本記事では、CX推進担当者の皆様が「顧客の声」を具体的な「次の一手」に変えるための統計手法、「回帰分析(特に重回帰分析)」について、その重要性と活用方法を解説しました。

  • 回帰分析とは、NPSのような「結果」と、各CX要素(サポート、製品、価格など)の満足度といった「原因」との関係性を数値化する手法です。
  • なぜCX推進に重要かというと、感覚ではなくデータに基づいて「改善の優先順位」を客観的に決定でき、社内(現場)を動かすための強力なエビデンス(共通言語)となるからです。
  • 特に重回帰分析は、複数のCX要素が複雑に絡み合ってNPSに影響する実態を解き明かすのに不可欠です。
  • 分析結果の「係数」(影響度の強さ)と「P値」(信頼性)に注目することで、「今、最もNPSに効く(そして信頼できる)ドライバーは何か」を特定し、リソースを集中投下する「次の一手」を導き出すことができます。

回帰分析は、NPSやアンケートデータを「活用して成果を出す」ための第一歩です。もちろん、適切なアンケート設問の設計や、分析結果の正しい解釈には専門的な知見も必要となりますが、そのハードルを越えた先には、データドリブンなCX改善が待っています。

EmotionTechCX資料を
ダウンロードする

このサービス資料でわかること

  • EmotionTechCXのサービス概要
  • EmotionTechの独自分析技術
  • 各種プランの内容
  • 導入事例

よく読まれているコラム

すべてのコラムを見る