当前位置:首页 >> 农林牧渔 >>

QTL作图中的问题和对策


第四届“QTL作图和育种模拟研讨会”,2009年8月17-20日,山东泰安

QTL作图中的问题和对策
中国农科院作科所 王建康 E-mail: wangjk@caas.net.cn
1

QTL作图中的遗传学概念
Locus, Allele, Gene, Chromosome Genotype, Pheno

type, Haplotype Population stratification Hardy–Weinberg equilibrium Effective population size Linkage phase Linkage disequilibrium Additive, dominance, and epistasis Genotype by environment interaction
2

QTL作图中的统计学方法
T-test ANOVA: analysis of variance (estimate heritability) Maximum-likelihood estimate Likelihood ratio test Binomial and Multinomial distributions Principal-components analysis Regression models Stepwise selection procedure Shrinkage methods Permutation test Frequentist and Bayesian statistics

3

QTL作图的基本原理
一个标记位点上3种基因型的性状平均数

4

QTL 作图的2大类别
连锁作图 (Linkage mapping) 关联作图 (Association mapping)

5

问题1:什么是假阳性和假阴性?
Type I error

Type II error

6

统计假设检验
真阳性(True positive) 真阴性(True negative) 假阳性(False positive, Type I error) 假阴性(False negative, Type II error) 第一类错误 (Type I error rate) 的概率 =P{拒绝零假设H0|零假设H0为真} 第二类错误的概率 (Type II error rate) 的 概率=P{未拒绝零假设H0|零假设H0为假}
7

显著性水平α与假阳性 (Type I error)
Error: 把有说成没有 N次独立检验的显著性水平为: 1-(1- α)N N次独立检验的Bonferroni校正: ≈ α / N 问题: 很多时候多重检验是不独立的! 排列检验 (permutation test) (非参数方法 的一种), 用于计算多重检验中检验统计 量的临界值
8

问题2:什么是LOD 值?
LRT 的一般定义
L0 LRT = ?2 ln( ) LA

LOD (likelihood of odd)值
LA LOD = log( ) = log( L A ) ? log( L0 ) L0

二者的关系
LOD = LRT LRT ≈ 2 ln(10) 4.61



LRT ≈ 4.61LOD

9

问题3:什么是QTL的检测功效?
定义: The power of a statistical test is the probability that the test will reject a false null hypothesis (i.e., it will not make a Type II error). 功效= 1.0 - 第二类错误的概率 (即对 于一个真实存在的QTL, 你通过检验说 的确有)
10

问题4:什么是功效分析? 功效分析的作用是什么?
定量分析一个统计方法的有效性 比较不同的统计方法 功效分析一般通过Monte Carlo模拟来实现

11

完备区间作图 (ICIM ,上图) 和简单 区间作图 (SIM,下图) 的功效分析

12

RIL群体大小与检测功效

13

FDR: false discovery rate
(在所有检验显著的QTL中假QTL的比例)

14

问题5:ICIM需要哪些输入参数?
回归模型中变量进出的概率
PIN POUT (=2*PIN) PIN的经验值: 0.05 ~ 0.01

LOD临界值

15

3种作图参数的ICIM一维扫描LOD曲线

16

问题6:用多大的LOD临界值?
一次检验:α (例如0.1, 0.05, 0.01) n次独立检验犯错误的概率:1-(1- α)n 全基因组QTL作图包含许多次检验 这些检验不独立 经验LOD临界值: 2.0 – 3.0
17

问题7:如何提高QTL作图精确度?
作图方法 扩大群体 减少表型测量误差 增加标记? CSSL
18

问题8:有利等位基因的来源?
遗传效应的解释 亲本标记类型编码: 2 (P1), 0 (P2), 1 (F1) P1: m+a; F1: m+d; P2: m-a
基因型 基因型值 A 2 A2 中亲值m G22 G12 G11 A1 A2 A1 A1

加性效应a

加性效应a 显性效应d
19

问题9:什么是PVE? 为什么报道 QTL时要指明PVE的大小?
PVE = Phenotypic variation explained (%) 单个QTL解释表型变异的百分数 PVEg =Vg/Vp * 100% BC,DH和RIL群体中,Vg=a2 (a为加性效应) F2群体中,Vg=a2/2+d2/4 (d为显性效应)

20

遗传效应大是否PVE一定高?
当有奇异分离存在时, 回交、DH或RIL,
Vg=(1-q)*a2+q*a2-[(1-2q)*a]2=4q(1-q)a2

21

问题10:PVE能相加吗?
Z=X+Y, X和Y是随机变量 E(X+Y) = E(X) + E(Y) V(X+Y) = V(X) + V(Y) +2Cov(X, Y) QTL独立遗传时, 多个QTL的PVE等于单 个QTL的PVE之和; QTL连锁时, PVE不能 简单相加
22

问题11:PVE能否超过100%?

RIL群体中,位点A-a的遗传方差:a12 ,位点B-b的遗 传方差: a22 ,总遗传方差: a12 +a22+2(1-2r)a1a2 QTL连锁时, 多个QTL的PVE之和有可能>100%; 但多 个独立的QTL的PVE之和不可能>100%
23

问题12:什么是奇异分离?
Distortion segregation P1 (AA) X P2 (aa)无选择
P1BC1: AA:Aa=1:1 P2BC1: Aa:aa=1:1 F2: AA:Aa:aa=1:2:1 DH, RIL: AA:aa=1:1

奇异分离的原因:
随机飘变 配子/合子的生活力不同 (自然选择)
24

一个大麦DH作图群体中的奇异分离
上图: 2个等位基因频率的比值 下图: 奇异分离的显著性概率

25

问题13:什么是缺失数据?
标记数据缺失
根据连锁关系补齐

表型数据确实
群体平均数替代 删除不用

26

大麦DH作图群体中的标记缺失
(空白处为缺失标记)

27

问题14:标记缺失对QTL作图的影响?
(First simulated F2 population from QTL distribution model I and population size 500) 无标记缺失 5%标记缺失

10%标记缺失

15%标记缺失

28

问题15:该用多密的标记?
经验
连锁作图: 10-20 cM有一个标记 关联作图: 越多越好

29

Power and FDR for two marker densities: 10 cM (up), and 20 cM (down)
(置信区间为整条染色体)

30

Power and FDR for two marker densities: 10 cM (up), and 20 cM (down)
(置信区间10cM, QTL居中)

31

每条染色体上只要3个标记行吗?
上: 置信区间10cM, QTL居中; 下: 置信区间为整条染色体

Power and FDR for marker density 80 cM

32

问题16:什么QTL by E?

33

Chromosome segments showing QTL for ACE
Chromosome Segment E1 LODa E2 E3 E4 E5 E6 E7 E8 b ADD E1 E2 E3 E4 E5 E6 E7 E8 c E1 PVE E2 E3 E4 E5 E6 E7 E8 1 M4 0.00 0.00 2.06 0.04 0.35 0.13 0.08 0.01 -0.11 -0.07 3.89 -0.24 1.06 -1.22 -0.52 -0.09 0.01 0.00 3.61 0.04 0.35 0.46 0.11 0.01 2 M18 0.26 1.05 4.03 0.04 0.66 0.38 5.07 0.00 -0.72 2.21 4.69 -0.23 1.22 1.73 3.74 0.05 0.48 2.24 7.76 0.05 0.68 1.37 8.28 0.00 3 M21 0.01 2.88 0.00 0.00 0.41 1.06 0.22 0.02 -0.12 -2.98 0.11 -0.04 -0.75 -2.29 -0.56 -0.11 0.02 6.60 0.01 0.00 0.41 3.88 0.29 0.02 3 M23 0.00 4.66 0.20 4.03 3.13 1.35 0.21 0.45 -0.08 4.35 -0.84 2.05 2.42 2.88 0.61 0.63 0.01 11.44 0.33 5.62 3.51 4.99 0.29 0.52 5 M35 1.87 0.95 0.84 0.05 0.40 0.30 0.04 2.16 -2.13 -2.11 -2.03 -0.25 -0.94 -1.53 -0.31 -1.63 4.15 2.04 1.45 0.06 0.41 1.07 0.06 2.66 5 M39 0.00 0.14 2.60 0.32 0.00 0.22 0.26 1.54 0.06 0.78 -3.66 -0.61 0.07 -1.30 -0.78 -1.31 0.00 0.28 4.73 0.38 0.00 0.78 0.36 1.70 7 M49 0.12 0.35 0.05 0.04 4.09 0.32 1.47 0.01 -0.36 -0.88 0.32 -0.16 2.30 -1.11 -1.37 -0.09 0.23 0.69 0.07 0.05 4.61 1.07 2.13 0.02 7 M50 0.03 0.30 9.61 0.02 12.51 0.02 0.33 0.02 -0.19 -0.89 -6.12 0.12 -5.19 -0.30 -0.69 -0.12 0.06 0.59 21.28 0.03 19.86 0.07 0.46 0.02 7 M51 0.03 0.11 4.64 0.49 16.53 0.18 0.07 0.01 0.25 -0.72 5.11 0.76 8.28 -1.14 -0.41 0.09 0.06 0.24 9.19 0.59 31.26 0.60 0.10 0.01 8 M54 0.01 0.13 0.04 0.70 2.04 0.00 0.03 0.67 -0.13 0.54 -0.32 -0.67 -1.59 0.13 -0.19 -0.62 0.03 0.26 0.07 0.86 2.18 0.02 0.04 0.73 8 M56 0.02 5.84 0.04 0.05 3.18 0.16 5.52 0.17 0.17 4.43 0.35 -0.18 2.20 0.86 3.11 -0.33 0.04 14.54 0.07 0.05 3.57 0.55 9.25 0.17 8 M57 6.06 3.92 3.98 15.89 5.56 1.84 6.33 16.89 4.13 4.51 4.62 5.84 3.86 3.79 4.29 5.94 15.60 9.36 7.54 34.66 6.79 6.60 10.89 35.08 9 M59 0.47 2.89 3.36 6.26 9.04 4.15 4.07 10.01 1.27 4.62 5.16 3.71 6.40 7.38 4.01 4.95 1.00 6.66 6.35 9.49 12.65 16.93 6.44 16.53 10 M69 0.01 0.22 4.35 2.57 0.31 0.90 1.66 0.01 0.08 -0.72 3.57 1.32 0.60 -1.87 1.44 -0.09 0.01 0.46 8.53 3.35 0.31 3.06 2.33 0.01 12 M77 0.17 0.12 0.89 0.10 0.42 0.29 4.04 0.00 -0.35 -0.43 -1.21 -0.20 -0.55 -0.85 -1.91 0.03 0.34 0.25 1.53 0.11 0.41 0.98 6.37 0.00 12 M79 0.61 0.05 2.17 0.24 0.15 0.05 0.01 0.00 -1.99 -0.78 5.68 -0.91 0.98 1.04 -0.21 0.09 1.24 0.10 3.91 0.29 0.15 0.17 0.01 0.00

34

问题17:表型数据是否要求服从正态分布?

一对显性主基因和多 基因混合遗传模型 但随机效应仍要求符 合正态分布

35

问题18:能用复合性状进行QTL作图吗?
复合性状使得遗传模型更为复杂
Effect Mean A1 A2 A3 A4 A12 A13 A14 A23 A24 A34 A123 A124 A134 A234 A1234 Trait I 25 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 Trait II 20 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 Addition 45 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 Subtraction 5 1 1 -1 -1 0 0 0 0 0 0 0 0 0 0 0 Multiplication 500 20 20 25 25 0 1 1 1 1 0 0 0 0 0 0 Division 1.2563 0.0503 0.0503 -0.0631 -0.0631 0 -0.0025 -0.0025 -0.0025 -0.0025 0.0063 0 0 0.0003 0.0003 0

36

复合性状降低QTL的检测功效、提高 QTL检测过程中的假阳性率(FDR)
QTL Trait I Trait II Addition Subtraction Multiplication Division Power (%) Q1 Q2 Q3 Q4 FDR (%) Model II Power (%) Q1 Q2 Q3 Q4 FDR (%) Model III Power (%) Q1 Q2 Q3 Q4 FDR (%) Model I 95.10 94.80 92.50 94.50 21.63 22.98 95.40 92.90 93.70 91.90 21.35 22.18 95.20 95.00 92.90 92.60 19.78 23.44 69.60 69.80 67.20 68.40 27.42 67.40 62.40 69.90 62.40 28.76 66.60 69.20 63.40 61.50 28.83 69.30 70.40 65.30 65.40 28.05 65.60 66.00 67.00 64.90 28.59 52.40 51.60 47.80 49.90 27.71 55.20 54.10 76.90 77.80 28.07 54.80 50.00 79.20 73.50 28.07 53.60 54.70 69.70 72.60 29.74 50.50 50.90 75.20 75.20 29.68 49.90 49.90 74.90 72.90 28.89 37.70 36.40 56.20 58.00 30.18
37

练习1
以大麦DH作图群体为例
给出IM和ICIM的作图结果 比较不同作图参数下ICIM作图结 果的异同 利用ICIM寻找互作QTL

38

练习2
QTL作图的功效模拟
4条染色体,长度均为150cM,均匀分布16个标记 考察的性状为株高,广义遗传力为50% 模型I: 第一染色体18cM和第二染色体75cM处有2个株 高QTL,加性效应分别为10.0cm和7.0cm (无连锁) 模型II: 第一染色体上18和75cM处有2个株高QTL,加 性效应分别为1.0和7.0cm (有连锁) 问题1: 用200个RIL检测到2个QTL的统计功效有多大? 问题2: 比较IM和ICIM在QTL检测功效、位置和效应估 计上的差异
39


相关文章:
育种考试题
(2) QTL 作图群体与育种群体的脱节: 由于 QTL 表达存在很强的遗传背景效应,...(2)回答育种过程中遇到的复杂问题。(3)平衡杂交的规模及 分离时代的大小,用于...
实验设计翻译
收缩的技术能解 决大 p 和小 n 问题,但是这是内部的计算,因此在扫描大量标记位点的 QTL 作图里,可能 是不可行的。一个关键的问题是,是否性状应该在多性状...
QTL
QTL_农学_农林牧渔_专业资料。QTL部分介绍~今日推荐 180份文档 2014...QTL 9页 免费 四种不同QTL作图方法的比... 5页 免费喜欢此文档的还喜欢 ...
散点值+平均值作图方法
散点值+平均值作图方法_教育学/心理学_人文社科_专业资料。散点值+平均值作图...几何最值问题的几种中考... 暂无评价 2页 1下载券 QTL作图中零假设检验统计...
QTL定位方法之区间分析
复合区间作图法目前存在的主要问题有: (1)不能分析上位性及 QTL 环境互作等 复杂的遗传学问题; (2)为了保证检验统计量有一定的自由度, 需要从大量的标记中...
QTL定位方法
( Q×E) , 无法检测复杂的遗传效 应( 如上位效应等) ; 当相邻 QTLs 相距较近, 由于其作图精度不高, QTLs 间相互干扰导致出现 Ghost QTL;一次只应用两...
mapmaker3.0QTL1.1实用作图命令
mapmaker3.0QTL1.1实用作图命令_计算机软件及应用_IT/计算机_专业资料。[资源]【...构建遗传图谱 将标记数据和表型数据保存在*.raw 文件中,如图所示: data type ...
作物QTL分析的理论研究进展
相关性状QTL的选择 水资源短缺已成为世界性问题, ...区间作图法( IM) 、将其他标记一并考虑到模型中以...
QTL 作图标记密度及群体大小(Li 2010英)
QTL 作图标记密度及群体大小(Li 2010英)_生物学_自然科学_专业资料。Heredity (2010) 105, 257–267 & 2010 Macmillan Publishers Limited All rights reserved ...
转录组测序方法简介
另外,除去 cDNA 转化过程中的实验误差两种方法同 时...发现更有效的标签酶, 提高标签长度, 是解决这些问题...群体较好,而 QTL 作图 以 RIL 和 DH 群体较好。...
更多相关标签:
qtl作图 | 尺规作图不能问题 | 造桥选址问题作图 | 古代三大作图问题 | 三大几何作图问题 | 几何尺规作图问题 | 尺规作图问题 | 三大作图问题 |