データ加工

Million Song Dataset

あけましておめでとうございます.今年もよろしくお願いいたします.Rでbigmemoryやffなどを使用して大規模なデータを扱うときのサンプルデータとして,Data Expo 2009のフライトデータが用いられることが多いようです.しかし,このデータのサイズは約12GB…

NOAA気象データセットの加工

NOAA気象データセットは,米国の国立気候データセンター(National Climatic Data Center; NCDC)が公開しているデータセットです.1900年から最新までのデータが公開されています.このデータセットに対して,以下のようなスクリプトを用いてCSV形式に変換し…