経済学ワークショップ2
第14回:データ分析の実践(1)
もくじ
はじめに
(Q)これまでの講義から, データ分析の考え方についてわかりました. 実際にテーマを決めてデータ分析をしようと思ったら, どのようにすればよいでしょうか?
(A)まずは興味のある変数を考えましょう. そのうえで, それに関係しそうな要因を考え, それらが入手できそうなデータベースを探します.
3
データを取得する
(Q)テーマが決まったときに, データはどのように見つければよいでしょうか?
(A)ネットを検索すれば, さまざまなデータがみつかります. しかしながら, 出所がさだかでない, 標本の対象がわからないことが多いです. まずは, 官庁や公的研究機関が作成しているデータにアクセスすることをおすすめします.
4
データを取得する
政府統計の総合窓口(https://www.e-stat.go.jp)
5
データを取得する
(練習)日本の家計消費に関心がある. 消費や所得のデータが手に入る統計として, 「全国家計構造調査(旧全国消費実態調査)」がある. 政府統計の窓口から「令和6年全国家計構造調査」にアクセスし, 表番号1-1のエクセルファイルをダウンロードしてみよう. (※データベースではなく, ファイルのほうにアクセスすること)
6
データを取得する(DBの場合)
7
・表示項目選択で必要な系列を指定する
・レイアウトでデータの並びを調整する
必要な項目を利用しやすい形でダウンロードできる
データを取得する(まとめ)
8
統計データとしてまずは公的なデータを利用する
公的なデータは官庁や研究機関が作成している
政府統計の総合窓口はそれらのアクセスを容易にする
データを整理する
(Q)エクセルシートをダウンロードできました. 次は, 何をしたらよいでしょうか?
(A)ダウンロードしたデータをすぐに分析することはできません. 必要なデータを抽出し, 自分なりにデータを整理することが最初のステップになります.
9
データを整理する
10
データを整理する
11
データを整理する
12
データを整理する
ロング形式のデータ
ワイド形式のデータ
13
データを整理する
(練習)世帯の種類を「総世帯」, 世帯区分を「勤労者世帯」, 世帯主の性別を「平均」, 表彰項目を「1世帯当たり1か月間の収入と支出」, 収支項目分類を「消費支出」と「可処分所得」とするデータを, 各都道府県(47都道府県)について取得し, 新しいシートにデータを縦向きにまとめてみよう.
14
データを整理する(まとめ)
15
データをダウンロードしたら, データを整理する.
まずは, 必要なものとそうでないものを区別する.
データが横方向に入力されている場合は向きを変える