データサイエンス基盤研究室
国勢調査のデータ分析
総務省 内定
総合情報学部 総合情報学科 4年
千葉県千葉経済大学附属高等学校 出身
総合情報学部 総合情報学科 4年
千葉県千葉経済大学附属高等学校 出身
1年次から学んできた統計学の総仕上げとして、研究対象には国勢調査の統計データを選択しました。各府省のポータルサイト「e-Stat」では、日本の総人口約1億2000万人のマクロなデータと、特定の個人または法人その他の団体の識別ができないように加工されたミクロデータである「匿名データ」が提供されています。マクロとミクロ双方のデータを比較した結果、匿名データはある程度信用できるデータであることがわかりました。
左がe-Stat、右が匿名データの図。どちらも2015年の年齢男女別の割合。多少の誤差はあるが、匿名データは特徴をとらえていることがわかります。