数据预处理与 多重测试矫正

数据归一化

归一化后数据分布在(0,1)之间

min-max 归一化

1
x' = (x - x_min) / (x_max - x_min)

平均 归一化

1
x' = (x - x_mean) / (x_max - x_min)

z-score 标准化

标准化后数据方差为 1,均值为 0,数值范围在 0 附近

1
x' = (x - x_mean) / x_sd

适用条件

(1)如果对输出结果范围有要求,用归一化。
(2)如果数据较为稳定,不存在极端的最大最小值,用归一化。
(3)如果数据存在异常值和较多噪音,用标准化。

FDR

使用 qvlaue 对 GWAS p 值进行多重检验矫正:

1
2
3
result =qvalue(data$p,pfdr = TRUE,fdr.level=0.05)
view(result$qvalues)
view(result$significant)

适用 sampleM 推算有效的独立测试数:

1
Rscript simpleM_Ex.R

threshold = 1 (0.05) / out_number