MISA SSR结果输出格式

该格式用以记录SSR所在的location,以及类型。

Fields 说明

1. 示例:

ID	SSR nr.	SSR type	SSR	size	start	end
scaffold30_1	6	p2	(TA)6	12	9013	9024
scaffold12_1	31	p2	(TG)12	24	76920	76943
scaffold12_1	36	p2	(TG)6	12	81729	81740
scaffold231_2	602	c	(CA)8ctctcactctctca(CT)12	54	1759093	1759146

2. 格式说明:

  • 第一列:ID,记录SSR所在的位置,如chromsome号,或者Gene ID 等。
  • 第二列:SSR nr, 表示每个相同ID的SSR编号,即相同ID所包含的第几个SSR
  • 第三列:SSR type, 表示SSR类型:
    • p1,单碱基重复(Mono repeats),如(A)10
    • p2,双碱基重复(Di repeats),如(CA)8
    • p3,三碱基重复(Tri repeats),如(ACT)6
    • p4,四碱基重复(Quad repeats),如(ATCT)5
    • p5,五碱基重复(Penta repeats),如(TCATG)7
    • p6,六碱基重复(Hexa repeats)),如(CATAAG)7
    • c,复合微卫星(repeats with compound),如(A)10tagt(AT)7
  • 第四列:SSR,表示该SSR的序列特征
    • 如示例中,(TA)6, 表示有6个TA重复
    • (CA)8ctctcactctctca(CT)12 表示,8个CA的重复,随后有一串ctctcactctctca序列,然后再接12个CT重复
  • 第五列:size,表示该SSR的大小
  • 第六列:start,表示该SSR的起始位置
  • 第七列:end,表示该SSR的的终止位置

3. 格式扩展

由于上述格式仅仅是描述SSR所在的位置,而无多态性信息,因此我们扩展了该格式,用于更好的记录分型信息,可查看MISA SSR扩展格式




Contributors: rongzhengqin@basepedia.com

  • 公共/生物信息学知识库/misa_ssr格式输出.txt
  • 最后更改: 8年前
  • 由 rongzhengqin