機械学習

tuneRF関数の挙動の検証

RのrandomForestパッケージのtuneRF関数が遅いというお話があったので,調べてみた. tuneRF関数は,ランダムフォレストを用いて予測モデルを構築する際に使用する特徴量の個数を貪欲的な方法により求める. tuneRF関数だけでなく,Rで機械学習のアルゴリズ…

Juliaによる機械学習の予測モデル構築・評価

これは,Julia Advent Calendar 2014 14日目の記事です.MLBaseパッケージを用いて機械学習の予測モデルを構築し,評価する方法について説明します. 以下では,Julia0.3.2,MLBase0.5.1,DecisionTree0.3.4,RDatasets0.1.1を使用しています. Juliaで使用…

mlrパッケージによる予測モデルの構築・評価

これは,R Advent Calendar 2014 6日目の記事です. 本記事では,Rで機械学習の予測モデルの構築・評価を統一的なフレームワークで実行するmlrパッケージについて入門的な説明を行います. mlrパッケージとは mlrパッケージは,Michael Lang氏によって開発さ…

caretで独自アルゴリズムの実行

caretパッケージは,機械学習のモデル構築・評価を統一したフレームワークで実行するための機能を提供している.caretのバージョン6.0.29では150個のアルゴリズムが利用できる. > library(caret) > packageVersion("caret") [1] ‘6.0.29’ > head(modelLooku…

C++で統計解析

先月開催されたJapan.R 2013の懇親会で,「C++で統計解析を行うための良いライブラリは?」という話がありました.統計解析と一口に言っても結構広いので,ここでは以下の4つのカテゴリ 記述統計量(最大値,最小値,平均値,分散等) 統計的検定(t検定,χ2乗…

Applied Predictive Modeling

Max KuhnとKjell Johnsonによる"Applied Predictive Modeling"が届きました.一通りパラパラ読んだ段階ですが,現時点での感想を記しておきます.Applied Predictive Modeling作者: Max Kuhn,Kjell Johnson出版社/メーカー: Springer発売日: 2018/04/27メデ…

不均衡データのクラス分類(R Advent Calendar 2011)

これは,R Advent Calendar 2011の担当分の記事です.機械学習やデータマイニングの実務への適用が脚光を浴びている今日この頃ですが,現実の問題に機械学習を適用する際は,パラメータのチューニング方法など様々な観点から検討を行う必要があります.今回…