決定木分析(デシジョンツリー分析)とは? CX推進における顧客理解と活用ポイントを徹底解説 | 株式会社エモーションテック

決定木分析(デシジョンツリー分析)とは? CX推進における顧客理解と活用ポイントを徹底解説

更新日:2025.12.03

このコラムの執筆者
木下 博貴

株式会社エモーションテック アナリスト

材料メーカーの研究開発5年、データ分析支援2年を経て、2025年エモーションテックに参画。元研究職の視点と分析技術を活かし、多様なデータを掛け合わせ、多角的な視点でプロジェクトを支援。

CX(カスタマーエクスペリエンス)推進部門やマーケティング担当の皆様は、日々NPS®(ネット・プロモーター・スコア)をはじめとする顧客アンケートの実施や、VoC(顧客の声)の収集・分析を行うなど、CXマネジメント(CXM)に取り組まれていることと存じます。

顧客の声というデータを、いかにビジネスの「価値」に変えるか。その鍵を握る強力な分析手法の一つが、今回ご紹介する「決定木分析(デシジョンツリー分析)」です。

この記事では、決定木分析について、基本的な定義から、なぜCXMにおいて重要なのか、そして具体的な分析ステップや活用事例まで、専門家でない方にもわかりやすく解説します。

この記事を最後までお読みいただければ、膨大な顧客の声の中から「最も改善インパクトの大きいポイント」をデータドリブンで見つけ出し、現場を動かすための具体的なヒントが得られるはずです。

EmotionTechのNPS分析・CX関連サービスがわかる資料(概要・支援実績)をダウンロードする

決定木分析(デシジョンツリー分析)とは?

一言でいうと:「最適な打ち手」を見つけるための「樹形図」

決定木分析(Decision Tree Analysis)とは、ある「目的」(例:顧客ロイヤルティの向上)に対して、どの「要因」(例:各顧客体験)が最も影響を与えているのかを、樹木のような階層構造(ツリー構造)で可視化するデータマイニングの手法です。

「デシジョンツリー分析」とも呼ばれ、AIや機械学習の分野では「教師あり学習」という分類手法の一つとしても知られています。

難しく聞こえるかもしれませんが、私たちは日常生活でも無意識に決定木的な思考を使っています。例えば、「明日の朝、傘を持っていくか?」を決める時、

  1. まず「天気予報の降水確率は?」を見る(最初の分岐)
  2. もし「80%」なら → 「傘を持っていく」(結論)
  3. もし「30%」なら → 「帰宅時間の空模様は?」を見る(次の分岐)
  4. もし「曇り」なら → 「念のため折り畳み傘を持っていこう」(結論)

このように、一連の「質問(要因)」によって「結論(目的)」を導き出すプロセスを、データに基づいて自動的に構築するのが決定木分析です。

マーケティングの分野では、顧客の行動パターンを分析し、ターゲットを明確にする「セグメンテーション」の手法としても広く活用されています。

決定木を構成する基本用語

決定木分析の結果は、以下のような「樹形図(デシジョングラム)」で示されます。この図を読み解くために、最低限の用語を覚えておきましょう。


(Root / ルート)
分析の出発点。ツリーの最も上に位置し、分析対象の全データが入っています。
(例:アンケート回答者全体)
ノード
(Node / 節)
分岐点または終点のこと。根や、途中の分岐点(親ノード)、最終的な結論(葉)もすべてノードです。

(Branch / ブランチ)
ノードとノードを繋ぐ線。ある要因による「分岐の条件」を示します。
(例:「製品の品質満足度が高い」「低い」)

(Leaf / リーフ)
ツリーの終点。これ以上分岐しない最終的なセグメント(顧客グループ)を示します。
(例:「品質に満足し、サポートも満足な顧客層」)
深さ
(Depth)
根から葉までの階層の数。
※深すぎると、非常に細かい条件のセグメントができあがり、解釈が困難になることがあります(「過学習」と呼びます)。

CXMの文脈で言えば、決定木分析とは「NPS(目的)が高い/低い顧客層は、どのような体験(要因)によって分類できるか?」を視覚的に明らかにする手法です。

なぜCXMにおいて決定木分析は重要なのか?

決定木分析は「感覚的な改善」から「データドリブンな改善」へとシフトするための強力な武器の一つです。

重要性1:「改善インパクトの大きい要因」を特定できる

顧客からは「Webサイトが使いにくい」「電話が繋がらない」「商品の価格が高い」「サポートの対応が悪い」など、多様な不満が寄せられます。これらすべてに同時に対応することは不可能です。では、どこから手をつけるべきでしょうか?

「最も声の大きい(件数の多い)不満」でしょうか? それとも「社長が気にしている点」でしょうか?

決定木分析は、そうした「声の大きさ」や「感覚」ではなく、「NPSや総合満足度といったKGI(重要目標達成指標)に、どの要因が最も強く影響しているか」をデータに基づいて特定します。

例えば、NPSを目的として分析した結果、ツリーの最初の分岐(根に最も近い分岐)が「サポート対応の満足度」であった場合、「サポート対応の満足度こそが、顧客推奨度(NPS)全体に最も大きな影響を与えている要因である」と判断できます。

たとえ「Webサイトの使いにくさ」に関する不満件数が多くても、NPS全体への影響度が「サポート対応」よりも低いのであれば、優先的にリソースを投下すべきは「サポート対応の改善」である、という客観的な根拠が得られるのです。

重要性2:複雑な「顧客セグメント」を可視化できる

顧客体験は、単一の要因で決まるものではありません。「Aの体験」と「Bの体験」の組み合わせによって、ロイヤルティが大きく変動することは多々あります。

単純なクロス集計では、「製品の品質には満足している(A)が、配送でトラブルがあった(B)顧客」のNPSがどうなるか、といった複雑な掛け合わせを複数組み合わせて分析するのは困難です。

決定木分析は、こうした要因の掛け合わせを自動的に見つけ出し、可視化してくれます。

ツリーの「葉」(終点)は、特定の体験や属性を組み合わせて分類された、具体的な顧客セグメントを示しています。

例えば、以下のようなインサイトが得られるかもしれません。

  • (ノードA):『製品の品質に満足』かつ『サポート対応にも満足』な顧客層 → NPS +80(最強の推奨者層)
  • (ノードB):『製品の品質に満足』だが『サポート対応に不満』な顧客層 → NPS -20(潜在的な批判者層)
  • (ノードC):『製品の品質に不満』な顧客層 → NPS -70(最優先で対応すべき批判者層)

このように、「品質」という一つの軸だけではなく、「品質 かつ サポート」といった形で、どのセグメントが最もロイヤルティが高く(または低く)、その要因は何かを具体的に理解することができます。

重要性3:現場が動く「次の一手」の根拠となる

分析が「分析のための分析」で終わってしまう最大の理由は、その結果が現場の「次の一手」に翻訳されていないからです。

「NPSが5ポイント下がりました」というレポートだけでは、現場は何を改善すればよいか分かりません。

決定木分析の最大の強みは、その視覚的な分かりやすさ具体性にあります。複雑な分析結果を、マーケティングや開発部門など、誰が見ても分かる「樹形図」で示せるため、組織全体の共通認識を作りやすいのです。

前述の(ノードB)「『製品の品質に満足』だが『サポート対応に不満』な顧客層」のNPSが-20である、という結果が出たとします。

これは、現場に対して「製品の品質を評価してくださっている(=本来、推奨者になるポテンシャルがある)お客様が、サポート対応の不備によって批判者へと転落してしまっている。この層のサポート体験を改善することが、最も効率的にNPSを向上させる施策である」という、極めて具体的かつ強力なメッセージとなります。

このように、決定木分析は「どこに問題があるか」だけでなく、「どの問題を解決すれば最もインパクトが大きいか」を示し、関係部署を動かすための客観的な「武器」となるのです。

決定木分析の基本的な分析ステップ

では、実際にCXMの文脈で決定木分析を行う場合、どのようなステップを踏むのでしょうか。ここでは、基本的な流れを5つのステップに分けて解説します。今回は一例として、あるブランドに対するNPSとサポート対応についての分析を想定して説明します。

ステップ1:目的変数(KGI)を決定する

まず、ツリーの「結論」にあたる部分、つまり「何を予測・分類したいのか」を決めます。これが目的変数です。

CXMにおいては、企業の最重要指標(KGI)がこれにあたります。

  • NPS:最も一般的に用いられます。「推奨者」「中立者」「批判者」の3つに分類するケース(分類木)や、0〜10のスコアそのものを予測するケース(回帰木)が多いです。
  • 満足度指標:総合満足度のスコア(例:5段階評価)。

ここで重要なのは、「分析したい目的変数(NPSなど)を含むアンケートが正しく設計・取得されていること」です。これがなければ分析は始まりません。今回の分析では、目的変数としてNPSを採用します。

関連記事:
NPS調査の作り方を解説!アンケートの作成や調査設計のコツがわかる

ステップ2:説明変数(KPI・要因)を決定する

次に、目的変数に「影響を与えている可能性のある要因」をすべて洗い出します。これが説明変数です。決定木は、これら説明変数の中から、目的変数との関連が強い変数を自動的に選び出していきます。

  • 顧客属性データ:年齢、性別、居住地、利用歴、利用頻度、購入金額など。
  • CX評価データ(KPI):CXジャーニーマップ上の各タッチポイント(例:Webサイト、店舗、サポート、製品)に対する満足度や評価。
  • 感情データ:アンケートのフリーコメント(VoC)から抽出したポジティブ/ネガティブな感情の分類。

ここがCXMにおける決定木分析の「肝」です。
もしアンケート項目が「総合満足度」と「顧客属性」しかなければ、「30代男性の満足度が低い」ことは分かっても、「なぜ低いのか(どの体験が悪いのか)」は分かりません。

「Webサイトの検索性」「注文のしやすさ」「配送のスピード」「梱包の丁寧さ」「製品の品質」「価格の妥当性」「サポート対応」といった、具体的な顧客体験(KPI)を網羅したアンケート設計が、分析の質を決定づけます。

今回の分析では単純なケースを想定し、顧客属性データ(問い合わせ方法、電話の待ち時間、Webの検索時間)を説明変数として使用します。

ステップ3:データの準備とクレンジング

ステップ1と2で決めた変数を、アンケートシステムや顧客管理システム(CRM)から抽出し、一つのデータセットにまとめます。

「回答者Aさん」の行には、「NPS(目的変数)」「年齢」「利用歴」「Web満足度」「サポート満足度」(説明変数)…といった情報がすべて紐付いている状態にします。

この際、以下のような「データクレンジング(掃除)」作業が必要になります。

  • 欠損値の処理:アンケートに答えていない(空欄の)項目をどう扱うか。(分析から除外する、平均値で補うなど)
  • カテゴリデータの整理:複数の選択肢を統合や(例:「10代」「20代」「30代」を「30代以下」にまとめる」)数値データの変換など(例:入力時間を「1分未満」と「1分以上」に分類する)、分析に適した形式に整えます。

【※注意点:サンプルサイズ(データ量)について】 

決定木分析で信頼できる結果を得るためには、ある程度のデータ数が必要です。一般的に、ツリーを数段階分岐させるためには、分岐後のツリーの終点(葉ノード)のデータ数が30件以上が目安になります。データが少なすぎると、たまたまの偏りを「法則」として誤検知してしまう可能性があります。

今回の分析では、電話の待ち時間や検索時間などの数値データを、それぞれ「10秒未満」と「10秒以上」、「1分未満」と「1分以上」に変換しています。

ステップ4:決定木アルゴリズムの実行

データが準備できたら、いよいよ分析ツールを使って決定木を構築します。

本記事では具体的なツールの操作には踏み込みませんが、決定木分析を実行する環境としてはSPSS Modelerのような高度な統計ソフトウェアや、PythonやRといった機械学習ライブラリを標準搭載したプログラミング言語が、ビジネスおよび研究の現場で広く活用されています。

決定木分析は、予測したいターゲット(目的変数)が「質的データ」か「量的データ」かによって、大きく「分類木」と「回帰木」の2つの手法に大別されます。両者はツリー構造を作る点は共通していますが、分岐の基準や予測値の算出ロジックが異なります。

分類木
「何であるか(質的データ)」を予測するモデル。

データの中に異なる種類がどれだけ混ざっているかを示す「不純度(ジニ係数やエントロピー)」を計算し、分割後にこの不純度が最も下がる(=中身が純粋になる)条件で分岐を作ります。
最終的な予測結果は、分岐したグループ(葉)に含まれるデータの多数決で決定されます。(例:顧客が商品を購入するか否か、メールがスパムか否か)

回帰木
「いくらであるか(量的データ)」を予測するモデル。

分類木とは異なり、各グループ内の数値のばらつき(平均二乗誤差など)が最小になるような分岐点を探して分割を繰り返します。
最終的な予測結果は、そのグループ(葉)に含まれる学習データの平均値として算出されるのが一般的です。(例:来月の売上予測、家賃の推定)

また、このステップでは「過学習(Overfitting)」に注意が必要です。過学習とは、手元のデータに過剰に適合しすぎて、「データのノイズ」まで学習してしまい、ツリーが細かく複雑になりすぎる状態を指します。例えば「Aが〇〇でBが△△で…Hが××な顧客(3人)のNPSは-100」といった結果が出ても、それはその3人にしか当てはまらない特殊なルールであり、他の顧客への応用が利きません。

これを防ぐため、あえてツリーの深さを制限したり、分岐の最小人数を設定したりする作業を行います。

今回の分析では、数値データであるNPSを目的変数としているため、回帰木を採用します。

ステップ5:分析結果(ツリー)の解釈と深掘り

最も重要なステップです。生成された樹形図(デシジョングラム)を読み解き、「次の一手」に繋がるインサイトを発見します。以下に、上記の分析条件で作成された決定木を示します。

(1)最も影響の大きい要因は何か?
まず、根(ルート)の直下、ツリーの最上部で分岐している要因に注目します。これが、NPSや満足度といったKGIに「最も」影響を与えている要因です。企業の最優先課題がここに示されます。今回の分析では、問い合わせ手段の種類が最も重要であることが判明しました。

(2)最も深刻な課題セグメントはどこか?
次に、ツリーの「葉」(終点)に注目し、NPSや満足度が極端に低いセグメントを探します。そのセグメントがどのような条件(要因の組み合わせ)で構成されているかを読み解き、最も深刻な批判者を生み出している「体験の負の連鎖」を特定します。今回の分析では、「電話問い合わせ」のNPSが低く、更に待ち時間が「10秒以上」と長いセグメントでNPSが-30と最も低いことが分かりました。例えば、オペレータの増員や混み具合いのアナウンスを行うことで、待ち時間の体験を改善することが効果的であると考えられます。

(3)ロイヤルティの高い優良セグメントはどこか?
逆に、NPSが極端に高いセグメントも探します。
その条件を読み解くことで、顧客を「推奨者」に変えるための「成功パターン(勝ちパターン)」、すなわち自社の強みがどこにあるのかを明らかにできます。今回の分析では、「Web問い合わせ」かつ検索時間が「1分未満」のセグメントのNPSが60と最も高いことが分かりました。問い合わせに対してWebを利用を促すことで、NPSの大幅な改善が見込まれます。

(4)VoC(フリーコメント)で「なぜ」を深掘りする
決定木分析は「どこに」問題があるかを教えてくれますが、「なぜ」その体験が不満なのか、という具体的な理由は教えてくれません。
特定した「課題セグメント」(例:サポート対応に不満な層)に絞り込み、彼らがアンケートで寄せた具体的なフリーコメント(VoC)を読み込みます。「電話が繋がらない」「説明が分かりにくい」「たらい回しにされた」など、具体的な不満の「中身」を把握することで、初めて改善アクションが明確になります。

CXMにおける決定木分析の成功のポイント

決定木分析は、理論を学ぶよりも、実際にどのように使われ、どのような成果に繋がったのかを見るのが一番の近道です。ここでは、分析を成功させるための重要なポイントをご紹介します。

分析を成功させるための3つのポイント

これらの事例のように決定木分析を成功させるためには、以下の3つのポイントが重要です。

ポイント1:「分析の質」は「アンケート設計」で決まる

最も重要なポイントです。決定木分析は、与えられたデータ(説明変数)の中から最適な答えを見つけることしかできません。

もしアンケート項目に「配送体験」が含まれていなければ、事例1のように「配送体験が最重要」という結果は永遠に得られません。

分析を始める前に、まずは「自社の顧客体験全体(カスタマージャーニーマップ)を網羅し、NPSに影響を与えうるKPI(体験項目)が正しく聴取できているか?」というアンケート設計の妥当性を徹底的に見直す必要があります。分析が行き詰まる原因の多くは、この上流工程(アンケート設計)にあります。

ポイント2:「分かりやすさ」と「精度」のバランスを取る

決定木分析は、ツリーの分岐を増やせば増やす(ツリーを深くする)ほど、手元のデータを説明する「精度」は上がっていきます。

しかし、前述の「過学習」に陥り、「葉」のセグメントが何十にも分かれた複雑怪奇なツリーが出来上がってしまっては、現場の誰も理解できません。

分析の目的は、高い精度の予測モデルを作ることではなく、「現場が理解し、アクションに繋げられる」インサイトを得ることです。

あえてツリーの深さを制限したり、枝刈り(Pruning)を行ったりして、統計的な精度は多少犠牲にしてでも、「シンプルで、示唆に富む(Actionable)な結果」を得ることを優先すべきです。

ポイント3:「分析」と「VoC(生の声)」を行き来する

決定木分析は「構造化データ(定量データ)」の分析手法です。NPSが「なぜ」低いのか、その構造(=どの要因が影響しているか)は分かりますが、顧客の具体的な不満や要望といった「非構造化データ(定性データ)」の中身までは分かりません。

「サポート対応に不満な層」のNPSが低いことが分かったら、必ずそのセグメントのフリーコメント(VoC)を読み込み、「なぜ彼らはサポートに不満なのか」という具体的な理由(Why)を突き止める必要があります。

定量分析(決定木)で「課題の当たり」をつけ、定性分析(VoC)で「課題の深掘り」をする。この両輪を回すことが、CX改善の精度とスピードを格段に向上させます。

まとめ:決定木分析で「次の一手」の精度を高める

今回は、膨大な顧客の声から「次の一手」を見つけ出すための強力な武器、「決定木分析(デシジョンツリー分析)」について解説しました。

  • 決定木分析とは、NPSや満足度といった「目的」に、「どの要因」が最も影響しているかを樹形図で可視化する分析手法です。
  • CXMにおける重要性は、①改善インパクトの大きい要因を特定できる、②複雑な顧客セグメントを可視化できる、③現場が動く「次の一手」の客観的根拠となる、の3点にあります。
  • 分析を成功させる鍵は、「適切なアンケート設計(説明変数の網羅)」と、分析結果を「VoC(フリーコメント)」と組み合わせて解釈し、具体的なアクションプランに「翻訳」するプロセスにあります。
  • 決定木分析は、CX推進担当者が「感覚」や「声の大きさ」に頼った意思決定から脱却し、データドリブンな改善活動をリードするための強い武器となります。

EmotionTechCX資料を
ダウンロードする

このサービス資料でわかること

  • EmotionTechCXのサービス概要
  • EmotionTechの独自分析技術
  • 各種プランの内容
  • 導入事例

よく読まれているコラム

すべてのコラムを見る