当前位置:首页 >> 农林牧渔 >>

QTL作图中的问题和对策


第四届“QTL作图和育种模拟研讨会”,2009年8月17-20日,山东泰安

QTL作图中的问题和对策
中国农科院作科所 王建康 E-mail: wangjk@caas.net.cn
1

QTL作图中的遗传学概念
Locus, Allele, Gene, Chromosome Genotype, Pheno

type, Haplotype Population stratification Hardy–Weinberg equilibrium Effective population size Linkage phase Linkage disequilibrium Additive, dominance, and epistasis Genotype by environment interaction
2

QTL作图中的统计学方法
T-test ANOVA: analysis of variance (estimate heritability) Maximum-likelihood estimate Likelihood ratio test Binomial and Multinomial distributions Principal-components analysis Regression models Stepwise selection procedure Shrinkage methods Permutation test Frequentist and Bayesian statistics

3

QTL作图的基本原理
一个标记位点上3种基因型的性状平均数

4

QTL 作图的2大类别
连锁作图 (Linkage mapping) 关联作图 (Association mapping)

5

问题1:什么是假阳性和假阴性?
Type I error

Type II error

6

统计假设检验
真阳性(True positive) 真阴性(True negative) 假阳性(False positive, Type I error) 假阴性(False negative, Type II error) 第一类错误 (Type I error rate) 的概率 =P{拒绝零假设H0|零假设H0为真} 第二类错误的概率 (Type II error rate) 的 概率=P{未拒绝零假设H0|零假设H0为假}
7

显著性水平α与假阳性 (Type I error)
Error: 把有说成没有 N次独立检验的显著性水平为: 1-(1- α)N N次独立检验的Bonferroni校正: ≈ α / N 问题: 很多时候多重检验是不独立的! 排列检验 (permutation test) (非参数方法 的一种), 用于计算多重检验中检验统计 量的临界值
8

问题2:什么是LOD 值?
LRT 的一般定义
L0 LRT = ?2 ln( ) LA

LOD (likelihood of odd)值
LA LOD = log( ) = log( L A ) ? log( L0 ) L0

二者的关系
LOD = LRT LRT ≈ 2 ln(10) 4.61



LRT ≈ 4.61LOD

9

问题3:什么是QTL的检测功效?
定义: The power of a statistical test is the probability that the test will reject a false null hypothesis (i.e., it will not make a Type II error). 功效= 1.0 - 第二类错误的概率 (即对 于一个真实存在的QTL, 你通过检验说 的确有)
10

问题4:什么是功效分析? 功效分析的作用是什么?
定量分析一个统计方法的有效性 比较不同的统计方法 功效分析一般通过Monte Carlo模拟来实现

11

完备区间作图 (ICIM ,上图) 和简单 区间作图 (SIM,下图) 的功效分析

12

RIL群体大小与检测功效

13

FDR: false discovery rate
(在所有检验显著的QTL中假QTL的比例)

14

问题5:ICIM需要哪些输入参数?
回归模型中变量进出的概率
PIN POUT (=2*PIN) PIN的经验值: 0.05 ~ 0.01

LOD临界值

15

3种作图参数的ICIM一维扫描LOD曲线

16

问题6:用多大的LOD临界值?
一次检验:α (例如0.1, 0.05, 0.01) n次独立检验犯错误的概率:1-(1- α)n 全基因组QTL作图包含许多次检验 这些检验不独立 经验LOD临界值: 2.0 – 3.0
17

问题7:如何提高QTL作图精确度?
作图方法 扩大群体 减少表型测量误差 增加标记? CSSL
18

问题8:有利等位基因的来源?
遗传效应的解释 亲本标记类型编码: 2 (P1), 0 (P2), 1 (F1) P1: m+a; F1: m+d; P2: m-a
基因型 基因型值 A 2 A2 中亲值m G22 G12 G11 A1 A2 A1 A1

加性效应a

加性效应a 显性效应d
19

问题9:什么是PVE? 为什么报道 QTL时要指明PVE的大小?
PVE = Phenotypic variation explained (%) 单个QTL解释表型变异的百分数 PVEg =Vg/Vp * 100% BC,DH和RIL群体中,Vg=a2 (a为加性效应) F2群体中,Vg=a2/2+d2/4 (d为显性效应)

20

遗传效应大是否PVE一定高?
当有奇异分离存在时, 回交、DH或RIL,
Vg=(1-q)*a2+q*a2-[(1-2q)*a]2=4q(1-q)a2

21

问题10:PVE能相加吗?
Z=X+Y, X和Y是随机变量 E(X+Y) = E(X) + E(Y) V(X+Y) = V(X) + V(Y) +2Cov(X, Y) QTL独立遗传时, 多个QTL的PVE等于单 个QTL的PVE之和; QTL连锁时, PVE不能 简单相加
22

问题11:PVE能否超过100%?

RIL群体中,位点A-a的遗传方差:a12 ,位点B-b的遗 传方差: a22 ,总遗传方差: a12 +a22+2(1-2r)a1a2 QTL连锁时, 多个QTL的PVE之和有可能>100%; 但多 个独立的QTL的PVE之和不可能>100%
23

问题12:什么是奇异分离?
Distortion segregation P1 (AA) X P2 (aa)无选择
P1BC1: AA:Aa=1:1 P2BC1: Aa:aa=1:1 F2: AA:Aa:aa=1:2:1 DH, RIL: AA:aa=1:1

奇异分离的原因:
随机飘变 配子/合子的生活力不同 (自然选择)
24

一个大麦DH作图群体中的奇异分离
上图: 2个等位基因频率的比值 下图: 奇异分离的显著性概率

25

问题13:什么是缺失数据?
标记数据缺失
根据连锁关系补齐

表型数据确实
群体平均数替代 删除不用

26

大麦DH作图群体中的标记缺失
(空白处为缺失标记)

27

问题14:标记缺失对QTL作图的影响?
(First simulated F2 population from QTL distribution model I and population size 500) 无标记缺失 5%标记缺失

10%标记缺失

15%标记缺失

28

问题15:该用多密的标记?
经验
连锁作图: 10-20 cM有一个标记 关联作图: 越多越好

29

Power and FDR for two marker densities: 10 cM (up), and 20 cM (down)
(置信区间为整条染色体)

30

Power and FDR for two marker densities: 10 cM (up), and 20 cM (down)
(置信区间10cM, QTL居中)

31

每条染色体上只要3个标记行吗?
上: 置信区间10cM, QTL居中; 下: 置信区间为整条染色体

Power and FDR for marker density 80 cM

32

问题16:什么QTL by E?

33

Chromosome segments showing QTL for ACE
Chromosome Segment E1 LODa E2 E3 E4 E5 E6 E7 E8 b ADD E1 E2 E3 E4 E5 E6 E7 E8 c E1 PVE E2 E3 E4 E5 E6 E7 E8 1 M4 0.00 0.00 2.06 0.04 0.35 0.13 0.08 0.01 -0.11 -0.07 3.89 -0.24 1.06 -1.22 -0.52 -0.09 0.01 0.00 3.61 0.04 0.35 0.46 0.11 0.01 2 M18 0.26 1.05 4.03 0.04 0.66 0.38 5.07 0.00 -0.72 2.21 4.69 -0.23 1.22 1.73 3.74 0.05 0.48 2.24 7.76 0.05 0.68 1.37 8.28 0.00 3 M21 0.01 2.88 0.00 0.00 0.41 1.06 0.22 0.02 -0.12 -2.98 0.11 -0.04 -0.75 -2.29 -0.56 -0.11 0.02 6.60 0.01 0.00 0.41 3.88 0.29 0.02 3 M23 0.00 4.66 0.20 4.03 3.13 1.35 0.21 0.45 -0.08 4.35 -0.84 2.05 2.42 2.88 0.61 0.63 0.01 11.44 0.33 5.62 3.51 4.99 0.29 0.52 5 M35 1.87 0.95 0.84 0.05 0.40 0.30 0.04 2.16 -2.13 -2.11 -2.03 -0.25 -0.94 -1.53 -0.31 -1.63 4.15 2.04 1.45 0.06 0.41 1.07 0.06 2.66 5 M39 0.00 0.14 2.60 0.32 0.00 0.22 0.26 1.54 0.06 0.78 -3.66 -0.61 0.07 -1.30 -0.78 -1.31 0.00 0.28 4.73 0.38 0.00 0.78 0.36 1.70 7 M49 0.12 0.35 0.05 0.04 4.09 0.32 1.47 0.01 -0.36 -0.88 0.32 -0.16 2.30 -1.11 -1.37 -0.09 0.23 0.69 0.07 0.05 4.61 1.07 2.13 0.02 7 M50 0.03 0.30 9.61 0.02 12.51 0.02 0.33 0.02 -0.19 -0.89 -6.12 0.12 -5.19 -0.30 -0.69 -0.12 0.06 0.59 21.28 0.03 19.86 0.07 0.46 0.02 7 M51 0.03 0.11 4.64 0.49 16.53 0.18 0.07 0.01 0.25 -0.72 5.11 0.76 8.28 -1.14 -0.41 0.09 0.06 0.24 9.19 0.59 31.26 0.60 0.10 0.01 8 M54 0.01 0.13 0.04 0.70 2.04 0.00 0.03 0.67 -0.13 0.54 -0.32 -0.67 -1.59 0.13 -0.19 -0.62 0.03 0.26 0.07 0.86 2.18 0.02 0.04 0.73 8 M56 0.02 5.84 0.04 0.05 3.18 0.16 5.52 0.17 0.17 4.43 0.35 -0.18 2.20 0.86 3.11 -0.33 0.04 14.54 0.07 0.05 3.57 0.55 9.25 0.17 8 M57 6.06 3.92 3.98 15.89 5.56 1.84 6.33 16.89 4.13 4.51 4.62 5.84 3.86 3.79 4.29 5.94 15.60 9.36 7.54 34.66 6.79 6.60 10.89 35.08 9 M59 0.47 2.89 3.36 6.26 9.04 4.15 4.07 10.01 1.27 4.62 5.16 3.71 6.40 7.38 4.01 4.95 1.00 6.66 6.35 9.49 12.65 16.93 6.44 16.53 10 M69 0.01 0.22 4.35 2.57 0.31 0.90 1.66 0.01 0.08 -0.72 3.57 1.32 0.60 -1.87 1.44 -0.09 0.01 0.46 8.53 3.35 0.31 3.06 2.33 0.01 12 M77 0.17 0.12 0.89 0.10 0.42 0.29 4.04 0.00 -0.35 -0.43 -1.21 -0.20 -0.55 -0.85 -1.91 0.03 0.34 0.25 1.53 0.11 0.41 0.98 6.37 0.00 12 M79 0.61 0.05 2.17 0.24 0.15 0.05 0.01 0.00 -1.99 -0.78 5.68 -0.91 0.98 1.04 -0.21 0.09 1.24 0.10 3.91 0.29 0.15 0.17 0.01 0.00

34

问题17:表型数据是否要求服从正态分布?

一对显性主基因和多 基因混合遗传模型 但随机效应仍要求符 合正态分布

35

问题18:能用复合性状进行QTL作图吗?
复合性状使得遗传模型更为复杂
Effect Mean A1 A2 A3 A4 A12 A13 A14 A23 A24 A34 A123 A124 A134 A234 A1234 Trait I 25 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 Trait II 20 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 Addition 45 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 Subtraction 5 1 1 -1 -1 0 0 0 0 0 0 0 0 0 0 0 Multiplication 500 20 20 25 25 0 1 1 1 1 0 0 0 0 0 0 Division 1.2563 0.0503 0.0503 -0.0631 -0.0631 0 -0.0025 -0.0025 -0.0025 -0.0025 0.0063 0 0 0.0003 0.0003 0

36

复合性状降低QTL的检测功效、提高 QTL检测过程中的假阳性率(FDR)
QTL Trait I Trait II Addition Subtraction Multiplication Division Power (%) Q1 Q2 Q3 Q4 FDR (%) Model II Power (%) Q1 Q2 Q3 Q4 FDR (%) Model III Power (%) Q1 Q2 Q3 Q4 FDR (%) Model I 95.10 94.80 92.50 94.50 21.63 22.98 95.40 92.90 93.70 91.90 21.35 22.18 95.20 95.00 92.90 92.60 19.78 23.44 69.60 69.80 67.20 68.40 27.42 67.40 62.40 69.90 62.40 28.76 66.60 69.20 63.40 61.50 28.83 69.30 70.40 65.30 65.40 28.05 65.60 66.00 67.00 64.90 28.59 52.40 51.60 47.80 49.90 27.71 55.20 54.10 76.90 77.80 28.07 54.80 50.00 79.20 73.50 28.07 53.60 54.70 69.70 72.60 29.74 50.50 50.90 75.20 75.20 29.68 49.90 49.90 74.90 72.90 28.89 37.70 36.40 56.20 58.00 30.18
37

练习1
以大麦DH作图群体为例
给出IM和ICIM的作图结果 比较不同作图参数下ICIM作图结 果的异同 利用ICIM寻找互作QTL

38

练习2
QTL作图的功效模拟
4条染色体,长度均为150cM,均匀分布16个标记 考察的性状为株高,广义遗传力为50% 模型I: 第一染色体18cM和第二染色体75cM处有2个株 高QTL,加性效应分别为10.0cm和7.0cm (无连锁) 模型II: 第一染色体上18和75cM处有2个株高QTL,加 性效应分别为1.0和7.0cm (有连锁) 问题1: 用200个RIL检测到2个QTL的统计功效有多大? 问题2: 比较IM和ICIM在QTL检测功效、位置和效应估 计上的差异
39


相关文章:
QTL 作图标记密度及群体大小(Li 2010英)
QTL 作图标记密度及群体大小(Li 2010英)_生物学_自然科学_专业资料。Heredity (2010) 105, 257–267 & 2010 Macmillan Publishers Limited All rights reserved ...
实验设计翻译
收缩的技术能解 决大 p 和小 n 问题,但是这是内部的计算,因此在扫描大量标记位点的 QTL 作图里,可能 是不可行的。一个关键的问题是,是否性状应该在多性状...
S20135420-何涛-染色体导入系在QTL定位中的应用
染色体导入系在 QTL 定位中的应用 S20135420 何涛 摘要: 染色体导入系是指借助...根 据分离群体的特点,作图群体分为:1.临时性群体。如 F2 及其衍生的 F3、F4...
散点值+平均值作图方法
散点值+平均值作图方法_教育学/心理学_人文社科_专业资料。散点值+平均值作图...几何最值问题的几种中考... 暂无评价 2页 1下载券 QTL作图中零假设检验统计...
第十一届挑战杯获奖作品
算法在电子表面装贴分配问题中的应用》 320 分...《金融海啸背景下农民工就业问题对策研究--基于 ...《水稻抗纹枯病主效 QTL-qSB-9 的位置、效应及...
RAPD技术及其在动物育种中的应用
RAPD技术及其在动物育种中的应用_畜牧兽医_农林牧渔...以内感区间作图法对鸡 19 种产 肉性状基因位点...标记,他指出这些标记 可用于今后产蛋性状的 QTL ...
更多相关标签: