データ解析演習

担当

データサイエンス学部 教授 佐藤彰洋

授業の概要

  • 統計解析環境Rを利用して、データの要約方法や図の作成方法、統計的仮説検定および回帰分析の実行方法について、実際のデータとコンピュータを利用して学習する
  • 具体的には、Rを効果的に活用するための基礎として、Rの入手とインストール、さまざまな形式のデータ読み込み、データタイプとデータフレーム、基本演算とデータ要約の方法、基本的作図方法とカスタマイズ、組み込み関数の探し方と利用方法などについて実習する
  • データベースとRを組み合わせた処理の方法を理解するためにSQLについて取り扱う
  • 統計的仮説検定を行う関数の使い方や回帰分析を実行するコマンド、分析結果を要約する方法と、得られた結果の読み取り方について学習し、実際にデータ解析を行うための基礎的技術を習得する
  • Rをコマンドとして使うだけでなくコンピュータプログラムとして利用する方法を学習する

授業計画

第0回:講義の概要

第1回:データ解析とソフトウエアR(概要・入手とインストール)

第2回:Rでのデータの扱い方(データの入力と出力)

第3回:Rでの基本演算

第4回:データの要約

第5回:Rとデータベース

第6回:データの分類とデータの可視化

第7回:中間試験(CBT方式で60分間)

第8回:推測統計1(統計的仮説検定の意義, 母集団と標本の考え方)

第9回:推測統計2(平均の検定, 有意水準, P値)

第10回:推測統計3(効果量, 二項検定, 2標本の平均の検定)

第11回:推測統計4(検出力とサンプルサイズの設計, 多重比較の問題)

第12回:推測統計5(適合度検定, 残差分析)

第13回:推測統計6(区間推定)

第14回:推測統計7(相関係数、回帰分析)

第15回:期末試験(CBT方式で60分間)