1 of 15

経済学ワークショップ2

第14回:データ分析の実践(1)

2 of 15

もくじ

  • データを取得する
  • データを整理する

3 of 15

はじめに

(Q)これまでの講義から, データ分析の考え方についてわかりました. 実際にテーマを決めてデータ分析をしようと思ったら, どのようにすればよいでしょうか?

(A)まずは興味のある変数を考えましょう. そのうえで, それに関係しそうな要因を考え, それらが入手できそうなデータベースを探します.

3

4 of 15

データを取得する

(Q)テーマが決まったときに, データはどのように見つければよいでしょうか?

(A)ネットを検索すれば, さまざまなデータがみつかります. しかしながら, 出所がさだかでない, 標本の対象がわからないことが多いです. まずは, 官庁や公的研究機関が作成しているデータにアクセスすることをおすすめします.

4

5 of 15

データを取得する

政府統計の総合窓口(https://www.e-stat.go.jp)

  • e-Statは日本の統計が閲覧できる政府統計ポータルサイト
  • 分野や組織, キーワードを用い簡易に検索できる
  • 関心のあるデータを見つけたら, リンクをたどって元のデータの出所やデータの特徴を確認できる.

5

6 of 15

データを取得する

(練習)日本の家計消費に関心がある. 消費や所得のデータが手に入る統計として, 「全国家計構造調査(旧全国消費実態調査)」がある. 政府統計の窓口から「令和6年全国家計構造調査」にアクセスし, 表番号1-1のエクセルファイルをダウンロードしてみよう. (※データベースではなく, ファイルのほうにアクセスすること)

6

7 of 15

データを取得する(DBの場合)

7

・表示項目選択で必要な系列を指定する

・レイアウトでデータの並びを調整する

必要な項目を利用しやすい形でダウンロードできる

8 of 15

データを取得する(まとめ)

8

統計データとしてまずは公的なデータを利用する

公的なデータは官庁や研究機関が作成している

政府統計の総合窓口はそれらのアクセスを容易にする

9 of 15

データを整理する

(Q)エクセルシートをダウンロードできました. 次は, 何をしたらよいでしょうか?

(A)ダウンロードしたデータをすぐに分析することはできません. 必要なデータを抽出し, 自分なりにデータを整理することが最初のステップになります.

9

10 of 15

データを整理する

  • 「全国家計構造調査」(総務省) は, データベースとファイルのそれぞれの形式でデータが提供されています.
  • データベース(DB)形式 … 近年増えてきている形式で, 必要とするデータを自分で選択し, ダウンロードできる.
    • ダウンロードするファイルのサイズが小さくなる
    • データの選択方法に慣れる必要がある

10

11 of 15

データを整理する

  • ファイル形式 … 昔ながらの形式で, 表題に関連するデータがすべてエクセルファイルでダウンロードされる.
    • 簡単にダウンロードできる
    • 必要のないデータも含めてダウンロードするので, ファイルのサイズが大きくなる.

11

12 of 15

データを整理する

  • 「全国家計構造調査」は, 横方向にデータが並ぶワイド形式なっています.
  • 一般にデータ分析は, データが縦方向に並んでいる(ロング形式)ほうがよいです.
  • エクセルファイルでデータの向きを変えるには, 利用するデータの範囲を選択し, 右クリックでコピーを押し, コピーする際に「行/列の入れ替え」をクリックします.

12

13 of 15

データを整理する

ロング形式のデータ

ワイド形式のデータ

13

14 of 15

データを整理する

(練習)世帯の種類を「総世帯」, 世帯区分を「勤労者世帯」, 世帯主の性別を「平均」, 表彰項目を「1世帯当たり1か月間の収入と支出」, 収支項目分類を「消費支出」と「可処分所得」とするデータを, 各都道府県(47都道府県)について取得し, 新しいシートにデータを縦向きにまとめてみよう.

14

15 of 15

データを整理する(まとめ)

15

データをダウンロードしたら, データを整理する.

まずは, 必要なものとそうでないものを区別する.

データが横方向に入力されている場合は向きを変える