top of page
アンカー 11

11.「重回帰分析」

 ここに、体力テストの総合点と各種目の結果が得られているとします。各データの中からは総合点の高低に関わっている項目を統計的に選び出し、それらを影響度順に並べるなどして実践的な知見を得ることができる可能性があります。つまり、どの設問項目が総合点を左右しているのかを知ることができれば、指導上の観点を浮き彫りにすることができる可能性があります。

 この場合、総合点が「目的変数」、各種目の結果が「説明変数」です。説明変数によって目的変数を「予測」するような多変量方程式の係数解を求めるという手法が重回帰分析です。

 テストの点数(目的変数)=係数1×設問1の回答+係数2×設問2の回答+・・(係数×説明変数)

 重回帰分析に用いるエクセル・マクロ・ブックを2種類、用意しています。1つ目は、エクセルの「分析ツール(アドイン)」を用いたもの、2つ目は、ステップワイズ法によるものです。

エクセル・アドイン連携⇒

ステップワイズ法 ⇒

11.重回帰分析.jpg
アンカー 12

12.「数量化Ⅰ類」

 数量化Ⅰ類とは、従属変数(目的変数)が量的データ(数値)で、説明変数が質的データ(カテゴリカルデータ)であるような場合の重回帰分析です。

 この手法を用いると、アンケート結果などから、個体の特性データや回答データを用いて数値を予測したり、どの変数が大きな影響を与えているかを分析したりすることができます。このブックでは、t値による独立変数(説明変数)の横棒グラフを表示しています。これによって、どの変数が従属変数の多少に影響を与えているかの度合いを視覚的に把握することができます。

12.数量化1類1.jpg
アンカー 21

21.「判別分析」

 判別分析は、事前に2つのグループに分かれていることが明らかな個体がある時、新しいデータが得られた際に、個体の特性データや回答データを用いて、どちらのグループに入るのかを判別するための基準(判別関数)を得るための手法です。

 判別分析は、説明変数が量的変数で、目的変数が離散量の場合に用います。目的変数が量的変数であれば重回帰分析、説明変数が離散量(質的変数)であれば数量化2類を用います。

 このブックでは初期値、第1群×第2群のマハラノビスの距離を手がかりにした判別散布図を、群ごとに色分けして表示します。3群以上の判別分析を実施した場合は、関心のある群の番号を指定すれば、簡単に散布図を描き直すことができ、判別の様子が視覚的に把握できます。

21.判別分析.jpg
アンカー 22

22.「数量化Ⅱ類」

 数量化Ⅱ類とは、質的データ(カテゴリカル・データ)を説明変数とする判別分析です。

判別分析の場合と異なり、固有値問題を設定して固有ベクトルを求め、軸1(X軸)と軸2(Y軸)によって散布図を描き、判別の明瞭度を視覚的に把握することができます。

 分析の結果、「重心」、「相関比」、「偏相関係数」が求められます。「重心」は、各群の中心位置を示しています。「相関比」(群間平方和÷総平方和)は、0から1までの値をとり、値が1に近いほどよく判別され、0に近ければあまり判別されていないことを表しています。レポートされている相関比の総和が累積寄与率です。「偏相関係数」は、外的基準(目的変数=どの群に属するか)と説明変数の間の相関係数で、レポートされている偏相関係数の総計が大きいほど、判別に寄与する度合いが強いと言えます。

22.数量化2類.jpg
アンカー 31

31.「主成分分析」

 主成分分析の目的は,なるべく少ない合成変数で,なるべく多くの情報を把握するという情報の縮約です。外的基準がない多変量解析であるという点では数量化Ⅲ類と類似した手法ですが、扱うデータは「量的データ」です。また、主成分分析では、生データだけではなく、集計された量的データも扱うことができます。

 因子分析とも類似していますが、因子分析が「因子の抽出」を目的とするのに対して、主成分分析は情報の要約を目的としています。分析結果として散布図を得ることができ、カテゴリー散布図による主成分の意味づけと、ケース散布図による類似性の観察が可能です。

 得られた主成分分析の結果は,常に既知の知見と整合性があり、解釈可能であるとは限らないので、用心が必要です。このような原因としては,既知の知見が不十分なために分析結果が正当に評価できない場合、あるいは,分析に使用した変数のセットが不適切な場合、特に、実態を把握するために必要な変数が抜け落ちている場合などがあると考えられます。

 得られた各ケースに対する主成分得点は総合特性値なので、別の分析にも使用できます。例えば,クラスター分析の場合に,もとのデータを用いるかわりに少数個の主成分得点を使用することができます。得られた主成分の個数が多い場合には,第1主成分と第2主成分の組み合わせだけで散布図をプロットをしても全容が把握しにくいことがあります。このような場合には,主成分得点を用いてクラスター分析を行ってみるのもよいかもしれません。

31.主成分分析.jpg
アンカー 32
32.数量化3類.jpg

32.「数量化Ⅲ類」

 重回帰分析によって抽出された「影響度の高い説明変数」、または、因子分析で抽出された因子を構成する項目のうちから因子得点の高い項目を数量化Ⅲ類で分析してみましょう。

 数量化Ⅲ類は因子分析と類似しており、「複数の変数について似ているものをまとめ、分類することによって、その背後にある隠れた要因を明らかにすること」、または「多変量データをより少ない観点で捉えなおすことができるように要約すること」を目的としています。因子分析では量的変数(連続変数)のみを用いるのに対して、数量化Ⅲ類ではカテゴリーデータ(1と0)を用います。因子分析でしばしば、より強い肯定回答に大きな得点を与えるように設定された順序尺度を用いますが、その尺度選択回答を調整して1、0に変換すれば、数量化Ⅲ類で分析することができます。

 数量化Ⅲ類の分析の結果、散布図が得られ、因子分析の「因子」に相当する「軸」を解釈することになります。これは、3次元空間に散らばっている多変量項目同士の相対的な類似関係を距離で表し、どの位置に「定規」を当てればそれらの分布の様子を読み取ることができるか、という考え方に立っています。「定規」というイメージは、多変量を観測する「視座」と言い換えることもできます。

 数量化Ⅲ類では、同時に回答者どうしの類似性を分析し、散布図を活用して、回答パターンの似た者どうしをグルーピングすることができます。

 なお、このブックでは1,0データを元にした2×2クロス分析もできます。すべての設問どうしの相関関係を計算し、相関係数の高いものから順に抽出し、3Dバブルグラフ、または3D円柱グラフに表示することによって、より具体的に視覚的に分析ができるように支援します。

 クロス表についての詳細は「40.クロス分析」、「70.アンケートの集計と分析」を参照してください。

アンカー 41

41.「因子分析」

 重回帰分析によって抽出された「影響度の高い説明変数」に★マークを付けて、他の説明変数と一緒に因子分析をしてみましょう。

 因子分析とは、調査結果について、つながりの強い項目どうしをグループ化し、一群の観測事象を支配していると推測される潜在的な要因を抽出する多変量解析の一手法です。因子分析では、調査データのうち、数量で得られるデータやアンケート調査などの選択肢回答を用いることができます。

41.因子分析.jpg
アンカー 42
42.クロス分析.jpg

42.「クロス分析」

 アンケートを実施する機会はたくさんありますが、その集計には、しばしば「正」の字を書くという古典的な技法が用いられます。しかも、各担当者が手分けして集計し、そのカウント数を合計するという手順を取ることが多いようです。

 アンケートの結果を単純集計してしまうと、各回答者が答えてくれた情報の多くは失われてしまいます。単純集計の結果は、「~が多い(少ない)」という大まかな状況を把握するのには有効ですが、詳細な原因と結果、問題点と解決の糸口などの「関連性」を読み取ることはできません。それぞれを独立した設問として集計しただけで、設問どうしの関係を論ずることは危険です。

例えば、設問Xでaと答えた回答者が設問Yでbと答える傾向が強かどうかは、設問Xと設問Yとの相関係数を見れば発見できます。その場合、設問Xと設問Yの内容関係から実践的なヒントを得るチャンスが拡大します。

 また、集計の結果として得られる相関係数の一覧表から対称型相関クロス表を作り、双対尺度法に渡すことによって、多変量解析を行うことができます。

アンカー 51

51.「クラスター分析」

 提供しているのは階層クラスター分析です。これは、近いものから順番に併合(グルーピング)するという方法をとるので、あらかじめクラスター数を決める必要がありません。また、ただ単に分類するだけでなく、結果として出力される樹形図から、分類の過程で、クラスターがどのように結合されていくかを一つひとつ確認できるので、クラスター数を後から決めることができます。

 例えば、3つに分けようと思えば、縦の線を3本横切るような線を引き、その線から下に繋がっている要素を1つのクラスターと考えれば良いでしょう。

【クラスタリングの種類】

 階層的クラスタリングの主な手法は7種類あります。最適な手法というものはなく、デンドログラム(樹系図)の結果から得られる知見に基づいて選択すれば良いと言われています。

(1)ウォード法:クラスター内のデータの平方和を最小にする。

(2)郡平均法:各クラスターに属する要素の平均値を代表値とする。

(3)最遠隣法(最長距離法):最も遠いものから順に併合する。

(4)最近隣法(最短距離法):最も近いものから順に併合する。

(5)メディアン法:中央値(メディアン)を代表値として継続する。

(6)重心法:複数の項目の重心を代表値として継続する。

(7)可変法:パラメータ(-1.0~1.0)を指定して空間濃縮・拡散する。

51.クラスター分析.jpg
アンカー 52
52.双対尺度法.jpg

52.「双対尺度法」

 双対尺度法とは、クロス表にまとめたデータの関連性を視覚的に表現する分析手法で、外的基準の無い多変量解析の手法の一つです。変数どうしの類似性を距離に置き換え、多変量の持つ情報を観測し、関係性が把握できそうな「視座」を見出す方法という説明ができるでしょう。

 無作為抽出や正規分布などの仮定を前提とせず、データに含まれた情報だけを元に尺度化を考える手法で、応用範囲が広いと言われています。その手順は、概ね次のとおりです。

(1)クロス集計表をもとに行列計算を行い、クロス集計したカテゴリー間の親密性、類似性を自動的に分析します。

(2)引き続いて、固有値(相関係数の自乗)の大きい順に2~3個選択し、

(3)最大固有値によるベクトル値をX軸上(左右)に、次に大きい固有値によるベクトル値をY軸上(上下)に、更にその次の固有値を採用した場合はZ軸上(奥と手前)に配置し、

(4)カテゴリーの親密性、類似性2次元(または3次元)に表示したグラフを作成します。

 解釈に当たっては、数値データを視覚化した散布図が役に立ちます。協議する際にも、グラフを共有議題にすることが効果的です。

アンカー 61

61.「直交回転3D散布図」

 多変量解析の結果、各カテゴリー、またはケースの相対的な親密度を距離に置き換えて散布図に表しますが、それは、各ドットの相対的な位置関係だけが問題となるので、グラフを回転しても構わないのです。回転方法には「直交回転」と、「斜交回転」があります。

 ☆ 直交回転:第1軸と第2軸が独立、相関係数=0と想定して軸を回転し、固有ベクトルを与え直す回転方法です。実際には、多変量データの特徴として、変数群どうしが無相関であると想定することには無理あることが多く、できれば斜交回転を試みると良いでしょう。

 ☆ 斜交回転:X軸付近の項目はよりX軸に沿うように、Y軸付近の項目はよりY軸に沿うように、変数同士の関係をより強調した配置になるように回転し、固有ベクトルを与え直す回転方法です。つまり、X軸とY軸をそれぞれ別々に回転させ、直交座標に写像変換する方法です。

 「直行回転3D散布図」ツールは、数量化Ⅲ類、主成分分析、双対尺度法などによって得られる標準化固有ベクトル(軸1~軸3)を使って、3D(3次元、立体)散布図を作成し、XYZが直交する空間を回転させながらグラフを観察、分析するための視覚支援ツールです。

(1)他の多変量解析の結果から得られる固有ベクトル値をコピー&ペーストしてください。

(2)Ⅰ軸の周り↑、↓:Y軸をZ軸方向に回転させる。倒す、起こす

(3)Ⅱ軸の周り←、→:Z軸をX軸方向に回転させる。右左にひねる

(4)Ⅲ軸の周り↪、↩:X軸をY軸方向に回転させる。右回転、左回転

(5)3D立体回転グラフの初期値は、Ⅰ軸15°,Ⅱ軸-20°,Ⅲ軸0°

   斜め右上から鳥瞰した状態。回転角度を90°にすれば2Dグラフ。

61.直交回転3D散布図の解説書は、62.斜交回転Rotoグラフの解説を含んでいます。

61.直交回転3D散布図.jpg
アンカー 62

62.「斜交回転Rotoグラフ」

 直交回転の場合と同様に、最初に、他の多変量解析によって得られたカテゴリー、あるいはケースの固有ベクトルを使って、それぞれのグラフが描画します。X軸、Y軸をそれぞれ独立して回転させることができるので、濃縮された項目を拡散させたり、拡散しすぎている項目を集めたりすることができます。

また、いずれか一方のグラフを回転させると、他方のグラフも回転します。いずれか一方のグラフの軸を解釈すれば、そのまま他方のグラフも同じ意味になっているでしょう。また、同時に重ね合わせグラフも描画されるので、軸の意味を確認できます。

62.斜交回転Rotoグラフの解説は、

61.直交回転3D散布図の説明書に含まれています。

62.斜交回転Rotoグラフ.jpg
アンカー 70

アンケート単純集計⇒

クロス分析システム⇒

70.アンケート集計.jpg

70.「アンケート集計と分析」

 アンケートの設計、単純集計、クロス分析などに特化したエクセル・マクロ・ブックを提供しています。

 アンケートを集計するとき、複数の担当者が分担して「正」の字をメモし、後にカウント数を合計するというやり方が多く見られます。単純集計をしてしまうと、状況理解のデータとして使うことができるものの、原因を追究したり、解決方策の糸口を模索することは困難になります。元のデータの情報を失わないように、クロス集計をすることが望まれます。

 クロス集計は手作業では困難ですが、エクセルを活用すれば新たな道が開けます。調査的な研究を通じて、状況を理解するだけにとどまらず、原因を洞察し、解決方策の糸口を模索するために、活用できることを願っています。

 単純集計システムには、比率の信頼区間の計算ルーチンも入れてあります。

 クロス分析システムには、カイ二乗検定、相関係数、クラメアの連関係数の計算ルーチンも入れてあります。

bottom of page