1. NYSOL Partner KSK Analytics 2014/5/31 第39回R勉強会@東京(#TokyoR) Lightning Talk 高速に前処理するNYSOL 株式会社KSKアナリティクス データアナリスト 北島 聡 2. NYSOL Partner KSK Analytics データ分析のプロセス 実は8割以上は前処理 社外データ 業務システム EXCEL 様々なデータ形式 膨大なデータ量 複雑なデータ構造 分析用 データ 各種・分析モデル クラス 分類 回帰 分析 パターン 解析 クラスタ リング CSV 繰り返しの 前処理 SQLクエリ? AWK? ETLツール? Python?Ruby? R? Excel? 3. NYSOL Partner KSK Analytics © KSK Analytics Inc. 3 データ分析のプロセス 実は8割以上は前処理 1