R

R パッケージのCコードを編集する

emdistというパッケージを使おうとしたが、ソースにも書いてある通り、行列のサイズ制限や計算回数に制限が設けられており、都合が悪かったのでソースコードから変更することにした。備忘として、その手順を記す。 まず、ここからemdist_0.3-1.tar.gzをダウ…

R Time Series Analysis 時系列解析(7) (線形定常過程2) 2次ARモデル

こっちでAR1次モデルを扱ったが、2次以降も項が増えるだけで、理屈は似ている。 待ち時間にやってみた。今度はACFの結果も載せる。 AR2 <- function(n,b1,b2,a=0,sd=1,y0=0) { c <- rnorm(n,sd=sd) y <- rep(0,n) y[1] <- y0 for(j in 1:(n-2)) { y[j+2] <- …

R Time Series Analysis 時系列解析(6) (線形定常過程1) 1次ARモデル

線形定常過程とは、 定常過程のうち、ある時点の確率変数が、 それ以前の確率変数とランダムな変動(ホワイトノイズ) の加重平均 となっているものをいう。ホワイトノイズとは次の定義を満たすものを指す。 1. 全ての時点で、平均(期待値)が0である。 2. 全…

R Kernel estimation 2次元カーネル推定

2次元データはこちらで例が載っていたので、ここでは3次元データで2次元カーネル推定を試してみる。MASSパッケージのkde2d関数が、ガウス分布のカーネルを用いて滑らかな密度推定を行ってくれる。 サンプルに用いるデータは、位置情報(lat, long)と各点にお…

R Time Series Analysis 時系列解析(5) (定常確率過程1)

前回までは、平均移動法と指数平滑法を道具とした時系列データの古典的予測方法を見てきた。しかしながら、これらの方法は(重みの度合の差こそあれ)過去に重みを振り分けて和・積を取ることで予想することを前提としており、これとは異なるアプローチもあ…

生存曲線/対応のないt-test メモ

数学いらずの医科統計学 第2版作者: 津崎晃一出版社/メーカー: メディカルサイエンスインターナショナル発売日: 2011/03/24メディア: 単行本購入: 1人 クリック: 37回この商品を含むブログ (2件) を見る 29章 生存曲線の比較 生存曲線に、ハザード比が一貫し…

R 関数を作ってみる (1) 正規分布 塗りつぶし

graph.norm <- function(x1,x2,m,s,oneway=FALSE,rev=FALSE) { sig <- sqrt(s) xmin <- m-4*sig xmax <- m+4*sig dx <- (xmax-xmin)/1000 x <- seq(xmin,xmax,by=dx) y <- dnorm(x,mean=m,sd=sig) xl <- c(xmin,xmax) yl <- c(0,max(y)*1.05) title = paste(…

R Time Series Analysis 時系列解析(4) (HoltWinters法)

#http://www.esri.cao.go.jp/jp/sna/data/data_list/sokuhou/files/2013/qe131_2/gdemenuja.html #より取得し、加工したデータを使用 SNA <- read.csv("GDP_def_extract.csv",header=TRUE) View(SNA) GDP <- ts(SNA$GDP, start=c(1980,1), frequency=4) GDP.…

R Time Series Analysis 時系列解析(3) (filterによる指数平滑化法)

####filter関数を使った指数平滑法#### #データは経済産業省総合原指数【月次】出荷(平成17年=100.0)#資本財を対象とするdat <- read.csv("http://www.meti.go.jp/statistics/tyo/iip/result/h2afdldj/csv/ha2zom3j.csv",skip=2,header=TRUE) #skip=2は上…

R Decision Tree (決定木) (2) 予測モデルの作成と評価

#########1.データの取り込み##########分析対象データは、これと同じ #install.packages("kernlab") ※初回のみ左記コマンドを実行 library(kernlab) data(spam) head(spam) #項目名を確認 #データ型を確認 for (i in 1:ncol(spam)) { print(c(names(spam[i]…

R Logistic Regression (ロジスティック回帰) (2) 予測モデルの作成と評価

#########1.データの取り込み,整形######### #install.packages("kernlab") ※初回のみ実行 library(kernlab) data(spam) attributes(spam)$names #項目名を確認 #項目名の解説は、http://archive.ics.uci.edu/ml/datasets/Spambaseに掲載されている #データ…

R package 'FNN' (1) カルバックライブラダイバージェンス

#install.packages("FNN")library(FNN)#http://nakhirot.hatenablog.com/entry/20130607/1370602095 #で理解したKL.divergenceについて、Rの関数(KL.divergence())を分解して理解する ####KL.divergence####function (X, Y, k = 10, algorithm = c("VR", "br…

R Linear Regression (線形回帰) (3) 最小自乗法の補足

最小自乗法において、y(目的変数)とy^(予測値)の差の2乗の和を最小化する意味について: 差の絶対値を最小化する考え方もある(手計算の場合はこちらの方が次数が低く楽である) 各観測点から、回帰直線に垂線を下ろし、その長さを「誤差」と考える考え方も…

R Linear Regression (線形回帰) (2) 予測モデルの作成と評価

分析の題材はこのデータ: #SPC:Sales per customer,顧客単価(JPY) #OpenH:Hours open,営業時間 #NOHWT:Number of households within trade area,商圏内世帯数(世帯) #NOPWT:Number of people with in trade area,商圏内人口(人) #IPH:Income per households…

R Time Series Analysis 時系列解析(2) (decompose)

#decompose関数を分解して理解する#decompose関数は系列データを季節成分、トレンド、残りに分解する関数 #データは経済産業省より取得した「総合原指数【月次】出荷(平成17年=100.0)」 edit(decompose) dat <- read.csv("http://www.meti.go.jp/statisti…

R Time Series Analysis 時系列解析(1) (filterによる移動平均法)

##inputデータは経済産業省より取得data <- read.csv("http://www.meti.go.jp/statistics/tyo/iip/result/h2afdldj/csv/ha2nsgo3j.csv",header=TRUE)#データの整形delete <- c(1,3) data <- data[-delete,] colnames(data) <- data[1,] new_name <- NULL for…

Bioconductor PETAL

Rのソースコードはここから取得する:http://peiwang.fhcrc.org/research-project.html 論文はこれ:http://www.ncbi.nlm.nih.gov/pubmed/16880200 要約:http://nakhirot.hatenablog.com/entry/2013/05/02/103659 ReadMe.txtの通りに実行すれば良いが、コー…

Bioconductor Package 'xcms'

(On progress)

Bioconductor Package 'MSeasy'

#mzXMLファイル毎にフォルダを作成し、各ファイルについてxcmsで作成した#peaklist.txtとmzXMLファイルを配置しておく(下記で入力するCDFpathには、#各サンプルについてxcmsで作成(xcmsSet)したpeaklist.txtとmzXMLファイルが#1つのフォルダに入っており、そ…

Bioconductor Package 'baseline'

http://www.jpo.go.jp/shiryou/s_sonota/hyoujun_gijutsu/mass/2-4-1.pdf に理論の概要は記載されている GCMSデータに適用するには、縦軸がm/z、横軸がRetention Time、数値がIntensityのマトリックスのinputを作成してから、baseline関数を使用 library(bas…

R Tips(switch関数(条件分岐))

http://cse.naro.affrc.go.jp/takezawa/r-tips/r/29.html より、switch関数の使い方: 条件式の評価結果がケース 1 ,ケース 2 ,ケース 3 ,・・・ と多数あり,その結果によって場合分けを行いたい場合には switch 文を使う.例えば文字列で条件を分けた場合…

R Tips(色)

色のカスタマイズはこちら:http://www.hi-ho.ne.jp/douton/htmlcolor.html 末尾に40をつけると透明色になる(例:#ff00ff40) 多分末尾2桁は色の濃さを表している 色を変えて実験してみた #ユーザー定義関数norm.dense <- function(x,y,r=0.8) { det <- 1 -…

R Tips(不安定なエラーと対処方針)

前の処理の戻り値を使用して、後工程の処理を行う場合、前の処理の戻り値待ちにより後工程にてランダムでエラーを発生することがある。 対処法:Sys.sleep(秒数)を挿入しておく。

R Tips(名前空間について)

関数の依存性について記した"NAMESPACE"ファイルが、R-3.0.0以降では自動的に作成されなくなっている。 R-3.0.0未満で一度パッケージのインストールを行い、そのファイルをライブラリの該当フォルダに移動して解答する。

R tips(parの引数一覧)

グラフのカスタマイズを行う関数parの引数はこちらに詳しい:http://cse.naro.affrc.go.jp/takezawa/r-tips/r/52.html

Linux/R Tip (CRANからダウンロード出来ないとき)

#直接ライブラリフォルダにダウンロード後、Unixコマンドで次を入力 R CMD INSTALL xxx.tar.gz #R-3.0.0以降では自動的にNAMESPACEファイルを作成出来ない。 #そのような場合は、一度バージョンを落としてインストールを行い、NAMESPACEファイルを作成後、再…

R Tips(1変数のグラフ)

choose.files()でファイル格納先のディレクトリが取得できる hist(…, right=T):境界線上をどちらに含めるか。例:hist(data$Score, breaks= seq(30, 110, by=5), col="darkgray",right=F qqplot単独で描くときは、library(Rcmdr)のqqPlot関数 Shapiro-wilk …

R histとhistogram

・histとhistogramの使い分けについて: http://aoki2.si.gunma-u.ac.jp/lecture/mb-arc/arc041/06943.html ・Density, freq, Parcentage of Totalの区別について: http://aaaaushisan.blogspot.jp/2011/11/r.html

R 練習用データをSASサンプルデータより取得する

#こちらでSASのサンプルデータを取得可能 http://ftp.sas.com/samples/A58519 #Rで以下の通り変換すれば、SASのデータをRで使用可能 install.packages("sas7bdat") library(sas7bdat) setwd("ダウンロードしたディレクトリ") data <- read.sas7bdat("拡張子…

R Discriminant Analysis (判別分析)

#線形判別関数はlda(),2次判別の関数はqda() ###################1次判別の例################### x1<-data.frame(hikki=c(68,85,50,54,66),mensetsu=c(65,80,95,70,75)) x2<-data.frame(hikki=c(35,56,25,43,70),mensetsu=c(55,65,75,50,40)) xm1 <- c(mean…