授業の要点が分かる学生のための学習辞典サイト

中央値【ちゅうおうち】

中央値(median、メディアン又はメジアン)とは、データや分布の中央の値である。n個のデータの場合、すべてのデータを小さいほうから大きさの順に並べたとき、 nが奇数の場合→小さいほうから(n+1)/2番目の値 nが偶数の場合→n/2番目と(n+2)/2番目の値の算術平均値 のことをいう。ExcelではMEDIAN関数を使用して算出することができる。  

関連した単語

その他の中心的傾向を表す測度

同様に中心的傾向を表す測度には、データの値の総和をデータ個数で割って求める「算術平均」、n個のデータの積のn乗根である「幾何平均値」、分布の中で最も出現回数の多い値である「最頻値(モード)」、データの大きい方と小さい方の一定割合捨てて残りの値から求めた算術平均である「トリームドミーン」などがある。

算術平均値との比較

中央値を算術平均値(一般的には単に平均値と呼ばれる)と比較してみよう。 中央値は、平均値に比べ飛び離れた値の影響を受けにくいため、分布が左右非対称な場合には中心的傾向の測度として平均値より多用される。飛び離れた値を異常値として棄却すべきか検定をする手間も必要ない。一方で中央値では集めたデータの数に関係なく中央の値のみ用いるため情報の欠落が多い点は注意が必要である。 例えば、年収の場合、多い人と少ない人の差が数千倍以上にもなるため平均値を用いると一部の億万長者により吊り上ってしまう。それより対象者を年収の順に並べ、ちょうど真ん中の人の年収を用いる中央値のほうが、実感に近い値が得られる。データによると年収では平均値と中央値では100万円以上の開きがみられる。 一方で、身長のようにデータの開きが小さく左右対称なデータの場合は、中央値と平均値は近似値となる。 なお、中央値と平均値が同じであっても左右対称な分布であるとは限らない

度数分布表からの算出

データの値はすべてわかっている場合の算出方法は前述の通りであるが、度数分布表の形でだけしかわからない場合もある。この場合は、中央値は以下の式で算出することで推定値が得られる。中央値はその定義から、理論的には中央値より小さい数が50%、大きい数が50%となるはずであるから、次式ではその理論値を推定することになる。   中央値(Me)=(中央値に対応する測定値を含む階級の下限値)+{(データ数/2)-(その下の階級までの累積度数)}÷(その階級の度数)×(階級の幅)

問題

以下のデータの中央値を求めよ。 階級 度数 相対度数(%) 累積度数 相対累積度数(%) 1.00~1.50 2 3.77 2 3.77 1.50~2.00 2 3.77 4 7.55 2.00~2.50 10 18.87 14 26.42 2.50~3.00 25 47.17 39 73.58 3.00~3.50 14 26.42 53 100.00

答えを見る

カテゴリ内ランキング

cacicoテキスト買取
cacicoテキスト