数据归一化
归一化后数据分布在(0,1)之间
min-max 归一化
1 | x' = (x - x_min) / (x_max - x_min) |
平均 归一化
1 | x' = (x - x_mean) / (x_max - x_min) |
z-score 标准化
标准化后数据方差为 1,均值为 0,数值范围在 0 附近
1 | x' = (x - x_mean) / x_sd |
适用条件
(1)如果对输出结果范围有要求,用归一化。
(2)如果数据较为稳定,不存在极端的最大最小值,用归一化。
(3)如果数据存在异常值和较多噪音,用标准化。
FDR
使用 qvlaue 对 GWAS p 值进行多重检验矫正:
1 | result =qvalue(data$p,pfdr = TRUE,fdr.level=0.05) |
适用 sampleM 推算有效的独立测试数:
1 | Rscript simpleM_Ex.R |
threshold = 1 (0.05) / out_number