大阪府大阪市北区堂島2-4-27 新藤田ビル9F
今回はKaggleというデータサイエンティストの為のコンペティションサイトに登録いただき、登竜門である「Titanic: Machine Learning from Disaster」に挑戦していただきます。
Rをインストールして、何となく変数操作や雰囲気がつかめた方に、実際に分析用のデータを使って、どんな手順で予測モデルを作っていくかをハンズオン形式で体験していただきます。
最後はKaggleのサイトを通じて、自信で作成した予測結果を登録していただきます。
ちなみにこの前日に入門編を開催します。まずは入門から、というかたはこちらも合わせて検討ください :)
1.RStudioインストール(オプション)
2.機械学習の手順とは?
3.Kaggleとは?
4.Rでデータをロード
5.Rでデータ整備
6.Rで機械学習を使って予測モデル作成
7.予測結果をアップロード
8.Oracle R Enterpriseデモンストレーション
資料はこちらRでKaggleの登竜門に挑戦
コマンドの量が多いので、先にスクリプトがほしいという方は、Facebookグループにアップロードしていますので、そちらもどうぞ。
Rスクリプト
ご都合のつく方は近くで一杯やりましょう!
今回もハンズオン形式になりますのでWifi接続可能なノートPCが必要です。
Rでの分析を予定しているため、Rのインストールを事前に済ませておいてください。
また、前回の入門編の内容を最低限理解していることを前提しているため、
下記の入門編の資料を見ていただけると助かります。
また当日回線の混雑が予想されますので、以下のパッケージの事前インストールをしていただけると助かります。
install.packages("dplyr")
install.packages("tidyr")
install.packages("ggplot2")
install.packages("randomForest")
install.packages("mice")
またIDEなので必須ではありませんが、便利なRStudioの紹介もします。
今回のハンズオンでも使いたいという方はサイズが大きいので、RStudioのインストーラーは事前にダウンロードいただけると助かります。
RStudioダウンロードサイト
熱いテクノロジーを学び、新しい可能性に胸躍らせる。そんな技術者であることを120%楽しむためのコミュニティです。 AI、Bot、IoT、クラウドといったホットなトピックについてハンズオン型の勉強会でゼロから学んだり、誰かが開発した面白い仕組みを共有して互いに刺激しあったりして、技術者ならではの発見、交流、知的エンターテイメントの機会を継続的に提供することがこのコミュニティの信条です。 F...
メンバーになる