structure 2.3 - 中文


9.5 估计的等位基因频率(P)的打印资料

Locus 5

3 alleles 19.0% missing data 2 0.511 0.821 0.656 3 0.444 0.171 0.317 1 0.045 0.008 0.027


9.6 连锁模型的位点接位点输出


每一行显示一个个体的一个位点的分派概率(assignment probability)。该行的前两列注明个体的数目(从1到NUMINDS)和位点的数目(分布在从1到NUMLOCI的范围内),按照它们在数据文件里出现的次序。


如果使用连锁模型(LINKAGE=1)并且数据没被完全确定连锁相(PHASED=0),则每个位点上的等位基因拷贝的后验分派概率可能是强烈相互依赖的(co-dependent)。Structure因此输出二个等位基因拷贝的联合分派概率,意味着每个位点有K2个条目(注意这个选项对PLOIDY? 2无效)。

如果MARKOVPHASE = 1,则前面K列给出数据文件中的第一个等位基因拷贝在群体1中、第2个等位基因拷贝在群体1…K中的概率,随后的列与群体2…K中的第一个等位基因拷

贝的概率相关。如果MARKOVPHASE = 0,则不是指到数据文件中的第1和第2个列举的等位基因拷贝,概率指的是母亲和父亲链(strand)的起源的群体。如果没有连锁相的信息(PHASEINFO = 0),则后验概率基体理论上应该是对称的,因此母亲的等位基因在群体k1中而父亲的等位基因在k2中的概率将等于母亲的等位基因在群体k2而父亲的等位基因在群体k1中的概率。实际上,因为用MCMC来估计该矩阵,如果NUMREPS是小的,将有显著的与对称性的不符合。

例如,假定下面是一个没有连锁相信息的二倍体个体的两个位点的位点接位点(site-by-site)输出,具有MARKOVPHASE = 0。

1 1 0.001 0.000 0.008 0.000 0.000

0.001 0.007 0.001 0.982

1 2 0.001 0.000 0.008 0.000 0.000

0.001 0.008 0.001 0.982


locus 1




origin of maternal(X)


pop1 pop2 pop3

0.001 0.000 0.008 0.000 0.000 0.001 0.008 0.000 0.982

0.009 0.001 0.990

origin of paternal 0.009 0.000 0.991 chromosome (missing)



10 供Structure使用的其他资源

10.1 Structure结果的绘图

CLUMPP和distruct是诺厄·罗森堡(Noah Rosenberg)的实验室为制作Q矩阵的好的图编制的两个程序。前端生产相似的图,但是这两个程序提供对图表输出的很多更精细的控制。见

10.2 将细菌的MLST数据导入Structure格式

由Xavier Didelot和Daniel Falush开发的软件xfma2struct按照扩展的Fasta格式提取单倍体序列数据,并且把它们转变成Structure格式。见ClonalFrame网站:

11 怎样引用这个程序

对基本方法的合适的引用是Pritchard et al. (2000a)。Falush等(2003a)的文章是在2.0版中实现的连锁模型和相关等位基因频率模型的合适的参考文献。含糊的基因型数据,例如显性标记(2.2版新增)的方法由Falush等(2007)描述。小数据集的信息性先验的模型(2.3版新增)由Hubisz等(2009)描述。

