Kaggleのデータセットを使って、ランダムフォレストで受診予約のNo-Showを予測します。 データセットのロード 今回はKaggleで公開されているMedical Appointment No Showsを使っていきます。 このデータは、受診予約で1レコードとなっており、患者の情報(年齢・性別やかかっている病気など)や予約どおりに現れたか・現れなかったか、などが15の含まれています。 全体では30万レコードになります。 このデータをcsvとしてダウンロードし、DataFrameに読み込ませます。 # ライブラリのインポート import pandas as pd import matplotlib.pyplot as pyplot % matplotlib inline from sklearn.model_selection import train_test_split from