5月25日 第5回目

今回は、EXCELを利用したパレート図の作成、
及び連続データのグラフによるまとめ方を学習しました。
そろそろEXCELの使い方も慣れてきた頃と思いますので、
実習で時間が余る人も自分の感性でグラフのアレンジをしてみてください。
まだ、ちょっと不安だという人も丁寧に手順を示しますので、このページを
見ながらもう一度チャレンジしてみてください。


  • パレート図の作成法

    1.累積度数百分率の算出

    まずは累積度数とその百分率を求めます。
    前回も使ったピポットテーブルを用いて以下のようにデータを集計しました。


    図1.支持政党の度数表

    支持政党の度数表に、累積度数及びその百分率を求めます。
    最初のセル(G5)は民主党の度数のみですからE5の値がそのまま累積度数になります。


    図2.最初のセル

     累積度数とは、表を度数の降順に並べたとき、ある値までの度数の合計を
    示したものです。よって図3のように、累積度数は、1つ前の累積度数(図では
    G5)と、現在の値(図ではE6)の和で求まります。

    累積度数2
    図3.累積度数の求め方

     次に百分率を求めます。求め方は前回行った度数の百分率と同じです。
    絶対参照(F4キーを押すと絶対参照と相対参照の切り替えが出来ます)を
    忘れないようにしましょう。


    図4.累積度数の百分率

    以下のように表が求まりました。

    図5.表の完成図


    2.パレート図の作成

     ではパレート図の作成に移りましょう。
     パレート図とは値の大きい順に並べた度数の棒グラフと、その累積百分率の
    折れ線グラフを並べた図で、品質管理などで良く使われています。

    度数と累積百分率を「Ctrl(コントロール)キ
    ー」を用いて選択、グラフを表示します。


    図6.Ctrlキーを押しながら選択すると離れたところも選択できる

    パレート図はユーザー設定タブの「2軸上の折れ線と縦棒」がそれです。
    グラフタイトルを変更して、シート上にグラフを表示します。


    図7.グラフタイトル変更

    3.グラフの調整

     それでは、グラフを見やすいように調整していきましょう。まず、凡例を上に移動。
    そして、左右の軸を「右クリック→軸の書式設定」で変更します。


    図8.軸の書式設定

     度数が折れ線にかからないよう最大値200程度にし、百分率は最大値が
    100%(1.0)になるように変更します。また、軸に限らずグラフ上の表示される文字は
    全て、「書式設定→フォントタブ」から文字の大きさを指定することが出来ます。
    授業では、タイトル以外の文字の大きさを9ピクセルに統一しました。


    図9.度数と百分率の最大値

     パレート図らしくするために、棒グラフの幅を詰めましょう。
    棒グラフを選択して「右クリック→データ系列の書式設定」を選択します。


    図10.データ系列の書式設定

    オプションタブから「棒の間隔」の項目を選び、値を0にします。


    図11.棒の間隔

    パレート図が完成しました。この図は、1998年のアメリカ全土の統計調査における
    国民の支持政党を示したものですが、民主党と共和党で全体の8割を占めており、
    アメリカの2大政党制がはっきり示されています。


    図12.完成したパレート図


  • 連続データのグラフによるまとめ方(教科書 p24〜)

    連続値データでは、グラフにする際、そのままではカテゴリが多すぎる(最大で
    データの個数分のカテゴリが作成されてしまう)ので、全体をある区間に区切って
    表示します。その際、5〜20本のカテゴリに全体が分かれるようにします。

    今回の実習では、小学生の身長のデータを用いました。
    まず、カテゴリの幅を決定するため、データの最大値と最小値を求めます。
    ツールタブから、一番下にある分析ツールを選択、基本統計量を選びます。


    図13.基本統計量の選択

    入力範囲では、1番上のセルを選んでから
    「Ctrl + End(矢印キーの上にあります) + ↓」で全てのデータを選択できます。
    出力先を「新規、または次のワークシート」にし、統計情報のチェックを入れて
    OKボタンを押します。


    図14.入力範囲、出力先の選択

    最大値と最小値、そして範囲が求まりました。



    図15.最小値、最大値

     では、データをヒストグラムを用いて集計しましょう。集計の仕方は色々とありますが、
    授業では3(cm)区切りと、5(cm)区切り[カテゴリ数7]に分けました。
    また、3区切りでは、最初のカテゴリを「108以下(カテゴリ数11)」と、
    「110以下(カテゴリ数10)」に分け、合わせて3つの集計パターンを比較しました。

    ヒストグラムは基本統計量と同じく、分析ツール内にあります。


    図16.ヒストグラム選択

    以下では、「3区切り108以下」を例にして説明します。
    まず、ヒストグラムを利用するためには、データ区間を自分で作成しなくてはなりません。
    この場合、C列のセルに、{108(以下),111,114,・・・,138}と記述します。
    すると、各区間の数値以下の値の度数が集計されます。 

    詳しくは以下の図を参考にしてください。


    図17.データ区間の作成

    ヒストグラムを選択すると、
    入力範囲(図ではA2〜A91)、データ区間(図ではC2〜C12)、
    出力先(図ではE2)の選択画面になりますので、それぞれ適する場所を選びます。

    図18.入力元、出力オプション



    図19.入力元、出力オプション拡大

    集計されたヒストグラムのデータ区間を手動で変更し、棒グラフにします。


    図20.棒グラフ作成

    3パターンとも集計し、グラフを作成したのが以下の図です。
    3区切り(左)と5区切りのデータ区間(右)で集計したヒストグラムでは、
    グラフの偏りが違って見えます。情報の圧縮の仕方によって
    判断も変わってしまう可能性があるということです。

    図21.3つの棒グラフの比較

ホームに戻る