講座の3つの特徴

実在不動産データを用いた重回帰分析 with R
  • Rでの基礎集計、重回帰分析を実施できるようになり、ビジネスサイドに有益なレポーティングができるようになる。
  • データから読み取れる業務上の背景情報を折り込み、経営層に納得感のある説明ができるようになる。
  • データサイエンス実務に触れて転職後の仕事のイメージが持てるようになる。

学習内容

カルフォルニア大学アーバイン校が公開している商用利用可能な実在のデータセットを使用する。台湾の台北の不動産価格の実在のデータを使用し、基礎集計後、価格の決定要因を重回帰分析を用いて分析する。価格の決定要因が分かったら、手に入れるべき物件、手放すべき物件の特徴をレポーティングし、実際のデータサイエンスの現場で求められる一連の流れを実施する。(tidyverseスタイルを導入し最新のRコーディングを行う)

講座の内容 (所要時間 分:秒)

はじめに1:00 講師紹介1:00
Rプロジェクト環境構築22:00
  • RとRstudioインストール説明10:00
  • Rproject作成4:00
  • .Rprofile作成4:00
  • .Rmdファイルの作成4:00
データについて5:00 使用するデータについて説明5:00
基礎集計41:07
  • 基礎集計の概要1:30
  • 相関係数とは2:30
  • 相関行列の見方3:15
  • ヒストグラムの役割1:15
  • 散布図の役割1:00
  • GGllaryの説明1:30
  • tidyverseのパイプ演算子について3:30
  • 今回分析の設定1:00
  • Rからデータダウンロード7:00
  • Rのデータフレームについて2:07
  • Rstudioで基礎集計実施13:30
  • 基礎集計結果から仮説構築3:00
単回帰分析17:45
  • 単回帰分析の概略2:00
  • 偏回帰係数2:00
  • 決定係数2:00
  • Rでの単回帰分析実装2:30
  • summary()出力結果補足説明5:45
  • 単回帰分析では説明不足なところを見つける3:30
重回帰分析74:30
  • 重回帰分析の概略4:45
  • 偏回帰係数の復習1:30
  • データの標準正規化1:30
  • 標準偏回帰係数5:45
  • F検定の概念2:45
  • 多重共線性4:00
  • VIF1:15
  • 自由度調整済み決定係数2:00
  • 評価指標まとめ1:30
  • 全ての関数を用いた重回帰分析①10:30
  • 全ての関数を用いた重回帰分析②2:30
  • 選択した説明変数で重回帰分析9:00
  • 標準正規化したデータで重回帰分析8:30
  • ビジネスサイドへの成果物作成19:00
レポーティング24:15
  • レポーティングのコツ14:00
  • 見本スライド解説10:15

対象者

  • 統計分析の勉強も行っているが、公式を実在のデータにどのように適用すれば良いかわからない方
  • Rの基礎には触れたが、実在のデータに対してどのように分析を適用すれば良いかわからない方
  • システム化の必要はなくRを中心に分析すれば良い職場環境にあるが、研修で学んだレベルで具体的なビジネスサイドへのレポーティング及び説明の経験が浅い方。

視聴期間

  • 講座動画(チャット質問対応付)の一括提供となります。
  • 動画視聴期限は受講システムへご登録後から3ヵ月(90日)となります。

必須環境

  • Rstudio (環境構築できない場合はcolab代用)
    動画内でも説明しておりますが、不明な点がありましたら受講システム内メンタリングボックスにてお問い合わせください。

担当講師

永澤講師

永沢講師

大学卒業後、医療機器の専門家である臨床工学技士として総合病院に勤務。データサイエンティストに転身後は大手自動車関連メーカーにて、医療工学の知識を活かして生体信号を統計学や機械学習を活用して分析し、快適性向上アイテム開発に従事。データサイエンスベンチャー企業ではスクラムマスターとして分析チームのリードを行う。現在は個人事業主として大手企業にデータ利活用支援を行なっている。

講座のお申し込み・カスタマイズのご相談などご連絡はこちらからお問い合わせください。

お問い合わせはこちらから