2014-01-01から1ヶ月間の記事一覧

knitr+LaTeXでPDFを作成するmakefile

R

以前,TokyoRで「RでReproducible Research」というタイトルの発表を行いました.Reproducible Researchとは再現性のある研究のことで,そのためには処理に再現性が担保されている必要があります.RでReproducible Researchを実現する上で,動的なレポート生…

Rcppによるbigmemoryの拡張

R C++

RのbigmemoryパッケージはC++で実装されているため,ユーザが新たな機能を開発して追加することが可能です.Rcpp Galleryの"Using bigmemory with Rcpp"(各列の合計値を算出する例)をそのまま実行してみます.BigColSums.cpp #include <Rcpp.h> // [[Rcpp::depends</rcpp.h>…

C++で統計解析

先月開催されたJapan.R 2013の懇親会で,「C++で統計解析を行うための良いライブラリは?」という話がありました.統計解析と一口に言っても結構広いので,ここでは以下の4つのカテゴリ 記述統計量(最大値,最小値,平均値,分散等) 統計的検定(t検定,χ2乗…

Million Song Dataset

あけましておめでとうございます.今年もよろしくお願いいたします.Rでbigmemoryやffなどを使用して大規模なデータを扱うときのサンプルデータとして,Data Expo 2009のフライトデータが用いられることが多いようです.しかし,このデータのサイズは約12GB…