Program

Bioconductor Package 'xcms'

(On progress)

Bioconductor Package 'MSeasy'

#mzXMLファイル毎にフォルダを作成し、各ファイルについてxcmsで作成した#peaklist.txtとmzXMLファイルを配置しておく(下記で入力するCDFpathには、#各サンプルについてxcmsで作成(xcmsSet)したpeaklist.txtとmzXMLファイルが#1つのフォルダに入っており、そ…

Bioconductor Package 'baseline'

http://www.jpo.go.jp/shiryou/s_sonota/hyoujun_gijutsu/mass/2-4-1.pdf に理論の概要は記載されている GCMSデータに適用するには、縦軸がm/z、横軸がRetention Time、数値がIntensityのマトリックスのinputを作成してから、baseline関数を使用 library(bas…

C言語プログラムの実行(linux上)

emacsとgccをインストール emacsで新規文書を作成し、拡張子.cで保存 emacsのマニュアルは http://www.ele.kochi-tech.ac.jp/tacibana/2012/is1/how-to-use-emacs.pdf とか gcc ファイル名:コンパイル ./a.out:実行

R Tips(switch関数(条件分岐))

http://cse.naro.affrc.go.jp/takezawa/r-tips/r/29.html より、switch関数の使い方: 条件式の評価結果がケース 1 ,ケース 2 ,ケース 3 ,・・・ と多数あり,その結果によって場合分けを行いたい場合には switch 文を使う.例えば文字列で条件を分けた場合…

R Tips(色)

色のカスタマイズはこちら:http://www.hi-ho.ne.jp/douton/htmlcolor.html 末尾に40をつけると透明色になる(例:#ff00ff40) 多分末尾2桁は色の濃さを表している 色を変えて実験してみた #ユーザー定義関数norm.dense <- function(x,y,r=0.8) { det <- 1 -…

R Tips(不安定なエラーと対処方針)

前の処理の戻り値を使用して、後工程の処理を行う場合、前の処理の戻り値待ちにより後工程にてランダムでエラーを発生することがある。 対処法:Sys.sleep(秒数)を挿入しておく。

R Tips(名前空間について)

関数の依存性について記した"NAMESPACE"ファイルが、R-3.0.0以降では自動的に作成されなくなっている。 R-3.0.0未満で一度パッケージのインストールを行い、そのファイルをライブラリの該当フォルダに移動して解答する。

R tips(parの引数一覧)

グラフのカスタマイズを行う関数parの引数はこちらに詳しい:http://cse.naro.affrc.go.jp/takezawa/r-tips/r/52.html

Linux Tips (他言語プログラムの起動/実行の繰り返し)

cd (対象ファイルのあるディレクトリ) for i in $(ls | grep -v XXX) ; do YYY; done #XXXは除外すべきファイルに含まれている文字列、YYYはプログラムの命令文。例えば、python get_offset.py $i(←引数)、Java -jar viewerApp.jar --findpeptides INPUT --o…

Python Tips(Linuxから呼び出して実行)

#unix上でpythonを呼び出して実行 python (スクリプトファイル名) (実行対象ファイル※必要に応じて) (他の引数)… (例)python get_offset_tag.py sample.mzXML

Java Tips

#典型的エラー java.lang.ArrayIndexOutOfBoundsException:0 #変域外へのアクセスについてエラーが生じているという意味。

Linux/R Tip (CRANからダウンロード出来ないとき)

#直接ライブラリフォルダにダウンロード後、Unixコマンドで次を入力 R CMD INSTALL xxx.tar.gz #R-3.0.0以降では自動的にNAMESPACEファイルを作成出来ない。 #そのような場合は、一度バージョンを落としてインストールを行い、NAMESPACEファイルを作成後、再…

R Tips(1変数のグラフ)

choose.files()でファイル格納先のディレクトリが取得できる hist(…, right=T):境界線上をどちらに含めるか。例:hist(data$Score, breaks= seq(30, 110, by=5), col="darkgray",right=F qqplot単独で描くときは、library(Rcmdr)のqqPlot関数 Shapiro-wilk …

Linux Tips

稼働しているタスクをチェック:jobs プロセスIDをチェック:ps ジョブを強制終了:kill -KILL プロセスID ファイル数をカウント:ls | wc -w

R histとhistogram

・histとhistogramの使い分けについて: http://aoki2.si.gunma-u.ac.jp/lecture/mb-arc/arc041/06943.html ・Density, freq, Parcentage of Totalの区別について: http://aaaaushisan.blogspot.jp/2011/11/r.html

R 練習用データをSASサンプルデータより取得する

#こちらでSASのサンプルデータを取得可能 http://ftp.sas.com/samples/A58519 #Rで以下の通り変換すれば、SASのデータをRで使用可能 install.packages("sas7bdat") library(sas7bdat) setwd("ダウンロードしたディレクトリ") data <- read.sas7bdat("拡張子…

Linux Tips (ファイルの移動、PATHの変更)

#ファイル検索してコピー for i in $(find ./ -name 'XXXXX') do echo "copy $i" cp $i /directory/ done #directory, XXXXはその場に応じて変える #ファイルを探す locate file名 #パスの変更の仕方の例 cd /directory/R-3.0.0/.bashrc vi .bashrc #最後の…

R Discriminant Analysis (判別分析)

#線形判別関数はlda(),2次判別の関数はqda() ###################1次判別の例################### x1<-data.frame(hikki=c(68,85,50,54,66),mensetsu=c(65,80,95,70,75)) x2<-data.frame(hikki=c(35,56,25,43,70),mensetsu=c(55,65,75,50,40)) xm1 <- c(mean…

R Linear Regression (線形回帰)

#線形回帰 yi = b0 + b1xi +εiにおいて、誤差項εiの仮定は次の4つ。 #1.εiの期待値は0である(i=1,2,…,n) #2.εiの各分散はすべて等しい(i=1,2,…,n) #3.εi,εuは無相関である(i≠u; i,u=1,…,n) #4.εiは正規分布にしたがう(i=1,…,n) #最小自乗法による推定の良さ…

R Correlation Coefficient of Categorical Variables (カテゴリカルデータの相関係数)

#全ての説明変数が量的であれば、主成分分析、因子分析等の #量的変数を対象とした手法の適用が可能。 #カテゴリカル変数が説明変数に含まれている場合に、 #量的変数を対象とした手法の適用が出来るようにする方法を #下記で確認する。 #In case of ordinal…

R サンプルデータ 練習(販売データ) (※on progress)

サンプルデータを使用してRの練習 データはこちら:http://www.tsware.jp/study/vol8/qrybiz_01.htm

R Quantification Theory (数量化理論)

##################数量化1類################## #数量化1類は回帰分析において、説明変数にカテゴリカル変数が #含まれる場合と同じ解析方法。 head(PlantGrowth) summary(PlantGrowth) tapply(PlantGrowth$weight, PlantGrowth$group, mean) tapply(PlantG…

R Decision Tree (決定木)

#目的変数がカテゴリカル変数の場合は、目的変数がどのカテゴリーに #属するのかを予測するための方法としては、ロジスティクス回帰 #分析や判別分析などの方法を用いることが可能 #決定木は全体を説明変数を用いて段階的にグループ分けする #classification…

R Correspondence Analysis (対応分析)

「Rで学ぶデータサイエンス カテゴリカルデータ解析」より抜粋 library(vcd) tabledata <- xtabs(Freq~Status+Urban, data=DanishWelfare) tabledata result <- chisq.test(tabledata) round(prop.table(tabledata,margin=2), digits=3) #margin = 1:horizon…

R Tips(データの加工)

#列に名前を付ける x <- matrix(c(1,1,2,2,1,2,1,2,5,3,6,2,6,5,1,4), nrow=4) dimnames(x) <- list(x[1:4], c("id","time", "x1", "x2")) colnames(x) #列を追加する head(cbind(tips, type = ifelse(tips$tp < 2, "少ない", "多い")),3) #変数を削除する r…

R Possion Regression Analysis (ポアソン回帰)

・ポアソン分布の前提3つ -時間を細かく分けていくと、各時間帯で発生するイベントは1回だけである -細かく分けた時間帯でのイベントの発生確率は同じである -他の時間帯のイベントの発生状況の影響は受けない --------------------------------------------…

R 初級講座構成案(Memo)

■Chapter1 なぜ分析が必要なのか? ・よく使うデータの変形方法 ・企業の中で役立てるとすればどうするか ・ダイナミックオペレーションを目指して(過去の分析から、現在の察知、未来の予測へ) ・知見とは何か? ・多様性に富む世界、知見をたくさん共有し…

R Logistic Regression (ロジスティック回帰)

#ロジスティクス回帰分析は、1つのカテゴリカル変数を目的変数 #とし、その目的変数を説明変数で説明するモデルによる分析方法。#より実践的なのはこちら ################目的変数が2値の場合################ ##単項多重ロジスティック回帰 #個票データが…

R 初級講座ネタ検討(2元表の解析) (On progress)

#2×2表の解析 #########独立性のカイ2乗検定######### binom.test(512,1897) attr(,"conf.level") Ctable <- matrix(c(512,1385,567,2419),nr=2) chisq.test(Ctable) library(MASS) Ctable <- xtabs(~Sex+W.Hnd, data=survey) Ctable chisq.test(Ctable) #独…