データ解析演習II

担当

データサイエンス学部 教授 佐藤彰洋

データサイエンス学部 教授  冨田誠

授業の概要

データ解析演習IIではテーマに沿ってデータの収集、データの分析と可視化、解釈を通じて、データ解析に関するレポートを作成する課題を取り扱っていきます。

授業の計画

第1回 ガイダンス

課題1 マクロ社会経済指標を用いた回帰問題 (佐藤彰洋担当)

世界銀行が提供するData Bankから実際の国ごとのマクロ社会経済指標のデータを取得し、線形回帰分析により国ごとのマクロ社会経済指標間の関係性を調べる。国ごとのマクロ社会経済指標の多くは2変量を取り出すと、あるマクロ指標が増加するともう一方のマクロ指標も増加するという関係を有していることが多い。例えば、国民一人当たりのCO2の排出量は国民一人当たりの国内総生産(GDP)と強い正の相関がある。更には、国民一人当たりの道路長も国民一人当たりのGDPと正の相関があることが知られている。本課題ではデータ収集とデータ分析を通じて国家間の比較を可能とするマクロ社会経済指標の関係について調査する。

参考文献:Atlas of Sustainable Development Goals 2020 From World Development Indicators

課題2 データに基づくリスク推計 (佐藤彰洋担当)

リスクとは不確実性のうち特に定量的に計測できる部分を指す。時系列データに対する不確実性を計量するために、時系列を正規分布に従う確率分布モデルから生成されると仮定し、その分散を用いる方法がよくもちいられるが、実データでは定常性の仮定が成立していないことが多く局所定常性を仮定するスイッチングモデルや、異分散性を考慮したモデルが金融時系列のリスク推計では利用されている。この課題では、時系列モデルに対する正規分布モデルを仮定し、この正規分布の平均と分散が局所定常性の仮定のもとで、しばしば変化するモデル(モデルスイッチング)におけるパラメータ推定とリスク推計について取り扱う。