基因富集分析 (gene set enrichment set analysis)
數據庫下載: 與自己的差異基因進行搜尋及比對
AnnotationHub 是生物數據庫的中轉站,方便搜尋目標數據,另一個相似套件為 biomaRt 參考網址:https://www.jianshu.com/p/ae94178918bc
AnnotationHub 是生物數據庫的中轉站,方便搜尋目標數據,另一個相似套件為 biomaRt 參考網址:https://www.jianshu.com/p/ae94178918bc
資料型態: 幾乎任何資料都可以拿來做資料探索,實務上,當變數數目跟觀測數都夠多時,資料探索的用處比較大。資料探索的目的為處理觀測值之間的交互關係,並將期間模式凸顯給實驗者。
最近接觸到滿多次雙因子變異數分析,想說就記錄一下了解這個統計方法的過程吧
許多情況下,一組觀測值的取值很明顯是取決於另一組觀測值。
本次的案例中每個「個體」都有兩個觀測值。
一個觀測值是「原因變數」、「x 變數」、「預測變數」、「自變數」,
此變數的取值為實驗者的設定或選擇;
另一個觀測值是「效果變數」、「y 變數」、「應變數」,此變數的取值非實驗者設定。
有一系列方式可以判斷原因和效果之間的關係形式和強度,每個方法對變數及其關係的假定各有不同,
這裡考慮五種檢定: 線性回歸、Kendall 最佳配適線、羅吉斯回歸、第二型模式回歸和多項式回歸。
第一次沒有人陪同飛往國外
所以做事前功課比以前還要勤,分享這次去古晉的旅程。
主要去Sarawak Cultural Village (沙勞越文化村), Bako National Park ( 峇哥國家公園), Sarawak River (沙勞越河)
sd<- 1;L<- 0.5*sd
n<-(qnorm(1-0.05/2)^2)*sd^2/L^2
n
dnorm(3, mean = 5, sd= 2)
要快速在不同工作系統間傳輸檔案
比較方便的選擇可以是遠端登入
操作流程是在freeBSD遠端登入win10取得目標檔案
—> 除了校內使用wifi連上興大的網路以外
也可以在家連上,不過要使用一種叫虛擬伺服器的服務
其實學校也有使用教學,可以直接點擊下方連結
以下的語法都是參考 「輕鬆學習R語言 從基礎到應用,掌握資料科學的關鍵能力」 這本書所作的筆記
iris
是R內建的dataset
nrow(iris) #顯示有幾個觀測值
ncol(iris) #顯示有幾個變數
dim(iris) #顯示有幾個觀測值幾個變數
head(iris)#列出前六個觀測值
tail(iris)#列出後六個觀測值
names(iris)#列出變數名稱
summary(iris)#印出每個變數的描述性統計
str(iris) #顯示資料結構