Linux Tips (他言語プログラムの起動/実行の繰り返し)

cd (対象ファイルのあるディレクトリ) for i in $(ls | grep -v XXX) ; do YYY; done #XXXは除外すべきファイルに含まれている文字列、YYYはプログラムの命令文。例えば、python get_offset.py $i(←引数)、Java -jar viewerApp.jar --findpeptides INPUT --o…

Python Tips(Linuxから呼び出して実行)

#unix上でpythonを呼び出して実行 python (スクリプトファイル名) (実行対象ファイル※必要に応じて) (他の引数)… (例)python get_offset_tag.py sample.mzXML

Java Tips

#典型的エラー java.lang.ArrayIndexOutOfBoundsException:0 #変域外へのアクセスについてエラーが生じているという意味。

Linux/R Tip (CRANからダウンロード出来ないとき)

#直接ライブラリフォルダにダウンロード後、Unixコマンドで次を入力 R CMD INSTALL xxx.tar.gz #R-3.0.0以降では自動的にNAMESPACEファイルを作成出来ない。 #そのような場合は、一度バージョンを落としてインストールを行い、NAMESPACEファイルを作成後、再…

R Tips(1変数のグラフ)

choose.files()でファイル格納先のディレクトリが取得できる hist(…, right=T):境界線上をどちらに含めるか。例:hist(data$Score, breaks= seq(30, 110, by=5), col="darkgray",right=F qqplot単独で描くときは、library(Rcmdr)のqqPlot関数 Shapiro-wilk …

5/15 ゼミ整理

ヒストグラムを描く目的:確率密度関数の形状を知ること 箱ひげ図の目的:データの粗密を表現すること 解析手法で表現するなら、変数は連続/離散(2値,名義,順序)。2値は連続・離散双方の手法が使用できることもあり、あえて分けている。

講習準備

5/13(月) 決定木done, 線形回帰/ベイズ線形回帰code作成, ロジスティック回帰code作成【注力】 5/14(火) 線形回帰/ベイズ線形回帰done,ロジスティック回帰done【注力】 5/15(水) 演習問題見直しdone, 基本部分作成 5/16(木) 基本部分作成, +α因子分析, 正準…

線形回帰モデル(3章)

パターン認識と機械学習 上 - ベイズ理論による統計的予測作者: C. M.ビショップ,元田浩,栗田多喜夫,樋口知之,松本裕治,村田昇出版社/メーカー: シュプリンガー・ジャパン株式会社発売日: 2007/12/10メディア: 単行本購入: 18人 クリック: 1,588回この商品を…

近似推論法(確認中)

[パターン認識と機会学習 下] [第10章]

A Variational Bayesian Framework for Graphical Models

[Hagai Attias] [Gatsby Unit, University College London] [In Advances in Neural Information Processing Systems 12, 2000] 論文はこちら:http://www.goldenmetallic.com/research/nips99vb.pdf 1章:Introduction graphical modelをlearnする標準的方…

Linux Tips

稼働しているタスクをチェック:jobs プロセスIDをチェック:ps ジョブを強制終了:kill -KILL プロセスID ファイル数をカウント:ls | wc -w

R histとhistogram

・histとhistogramの使い分けについて: http://aoki2.si.gunma-u.ac.jp/lecture/mb-arc/arc041/06943.html ・Density, freq, Parcentage of Totalの区別について: http://aaaaushisan.blogspot.jp/2011/11/r.html

A statistical method for chromatographic alignment of LC-MS data (PETAL)

[Pei Wanga] [Department of Statistics, University of Chicago] [Biostatistics(2007), 8, 2, pp. 357–367] ・論文はこちら: http://med.stanford.edu/tanglab/publications/PDFs/AStatisticalMethodForChromatographicAlignmentOfLC-MSData.pdf) Peptide…

R 練習用データをSASサンプルデータより取得する

#こちらでSASのサンプルデータを取得可能 http://ftp.sas.com/samples/A58519 #Rで以下の通り変換すれば、SASのデータをRで使用可能 install.packages("sas7bdat") library(sas7bdat) setwd("ダウンロードしたディレクトリ") data <- read.sas7bdat("拡張子…

Linux Tips (ファイルの移動、PATHの変更)

#ファイル検索してコピー for i in $(find ./ -name 'XXXXX') do echo "copy $i" cp $i /directory/ done #directory, XXXXはその場に応じて変える #ファイルを探す locate file名 #パスの変更の仕方の例 cd /directory/R-3.0.0/.bashrc vi .bashrc #最後の…

R Discriminant Analysis (判別分析)

#線形判別関数はlda(),2次判別の関数はqda() ###################1次判別の例################### x1<-data.frame(hikki=c(68,85,50,54,66),mensetsu=c(65,80,95,70,75)) x2<-data.frame(hikki=c(35,56,25,43,70),mensetsu=c(55,65,75,50,40)) xm1 <- c(mean…

R Linear Regression (線形回帰)

#線形回帰 yi = b0 + b1xi +εiにおいて、誤差項εiの仮定は次の4つ。 #1.εiの期待値は0である(i=1,2,…,n) #2.εiの各分散はすべて等しい(i=1,2,…,n) #3.εi,εuは無相関である(i≠u; i,u=1,…,n) #4.εiは正規分布にしたがう(i=1,…,n) #最小自乗法による推定の良さ…

R Correlation Coefficient of Categorical Variables (カテゴリカルデータの相関係数)

#全ての説明変数が量的であれば、主成分分析、因子分析等の #量的変数を対象とした手法の適用が可能。 #カテゴリカル変数が説明変数に含まれている場合に、 #量的変数を対象とした手法の適用が出来るようにする方法を #下記で確認する。 #In case of ordinal…

R サンプルデータ 練習(販売データ) (※on progress)

サンプルデータを使用してRの練習 データはこちら:http://www.tsware.jp/study/vol8/qrybiz_01.htm

R Quantification Theory (数量化理論)

##################数量化1類################## #数量化1類は回帰分析において、説明変数にカテゴリカル変数が #含まれる場合と同じ解析方法。 head(PlantGrowth) summary(PlantGrowth) tapply(PlantGrowth$weight, PlantGrowth$group, mean) tapply(PlantG…

R Decision Tree (決定木)

#目的変数がカテゴリカル変数の場合は、目的変数がどのカテゴリーに #属するのかを予測するための方法としては、ロジスティクス回帰 #分析や判別分析などの方法を用いることが可能 #決定木は全体を説明変数を用いて段階的にグループ分けする #classification…

R Correspondence Analysis (対応分析)

「Rで学ぶデータサイエンス カテゴリカルデータ解析」より抜粋 library(vcd) tabledata <- xtabs(Freq~Status+Urban, data=DanishWelfare) tabledata result <- chisq.test(tabledata) round(prop.table(tabledata,margin=2), digits=3) #margin = 1:horizon…

R Tips(データの加工)

#列に名前を付ける x <- matrix(c(1,1,2,2,1,2,1,2,5,3,6,2,6,5,1,4), nrow=4) dimnames(x) <- list(x[1:4], c("id","time", "x1", "x2")) colnames(x) #列を追加する head(cbind(tips, type = ifelse(tips$tp < 2, "少ない", "多い")),3) #変数を削除する r…

R Possion Regression Analysis (ポアソン回帰)

・ポアソン分布の前提3つ -時間を細かく分けていくと、各時間帯で発生するイベントは1回だけである -細かく分けた時間帯でのイベントの発生確率は同じである -他の時間帯のイベントの発生状況の影響は受けない --------------------------------------------…

R 初級講座構成案(Memo)

■Chapter1 なぜ分析が必要なのか? ・よく使うデータの変形方法 ・企業の中で役立てるとすればどうするか ・ダイナミックオペレーションを目指して(過去の分析から、現在の察知、未来の予測へ) ・知見とは何か? ・多様性に富む世界、知見をたくさん共有し…

R Logistic Regression (ロジスティック回帰)

#ロジスティクス回帰分析は、1つのカテゴリカル変数を目的変数 #とし、その目的変数を説明変数で説明するモデルによる分析方法。#より実践的なのはこちら ################目的変数が2値の場合################ ##単項多重ロジスティック回帰 #個票データが…

遺伝統計学拠点メモ

大学:MIT, ミシガン, ワシントン DB:UCSC, NCBI, Magil, Emble

R 初級講座ネタ検討(2元表の解析) (On progress)

#2×2表の解析 #########独立性のカイ2乗検定######### binom.test(512,1897) attr(,"conf.level") Ctable <- matrix(c(512,1385,567,2419),nr=2) chisq.test(Ctable) library(MASS) Ctable <- xtabs(~Sex+W.Hnd, data=survey) Ctable chisq.test(Ctable) #独…

R Tips データのマージ

#a,bの2テーブルを1対多で紐付ける a <- data.frame(ID=c("a","a","a","b","b","b","c","c","c"),mz=c(1:9)) b <- data.frame(ID=c("b","c","d"),Risk=c(1:3)) merge(b,a,by="ID") #不要な列を削除する df <- ( データフレーム ) 不要 <- c( 要らない列番号…

R 初級講座ネタ検討(カテゴリカル・データ、割合の検定)

#練習問題 binom.test(x=134,n=200,p=0.5) #p値の推定値はp値への影響を与えるが、pの推定値の信頼区間に対しては影響を与えない。 #pの推定値の信頼区間は、測定値が最尤推定値であることを過程した分布によって推定する。 #p値と信頼区間からの離れ具合に…