MISA SSR结果输出格式
该格式用以记录SSR所在的location,以及类型。
Fields 说明
1. 示例:
ID SSR nr. SSR type SSR size start end scaffold30_1 6 p2 (TA)6 12 9013 9024 scaffold12_1 31 p2 (TG)12 24 76920 76943 scaffold12_1 36 p2 (TG)6 12 81729 81740 scaffold231_2 602 c (CA)8ctctcactctctca(CT)12 54 1759093 1759146
2. 格式说明:
- 第一列:ID,记录SSR所在的位置,如chromsome号,或者Gene ID 等。
- 第二列:SSR nr, 表示每个相同ID的SSR编号,即相同ID所包含的第几个SSR
- 第三列:SSR type, 表示SSR类型:
- p1,单碱基重复(Mono repeats),如(A)10
- p2,双碱基重复(Di repeats),如(CA)8
- p3,三碱基重复(Tri repeats),如(ACT)6
- p4,四碱基重复(Quad repeats),如(ATCT)5
- p5,五碱基重复(Penta repeats),如(TCATG)7
- p6,六碱基重复(Hexa repeats)),如(CATAAG)7
- c,复合微卫星(repeats with compound),如(A)10tagt(AT)7
- 第四列:SSR,表示该SSR的序列特征
- 如示例中,(TA)6, 表示有6个TA重复
- (CA)8ctctcactctctca(CT)12 表示,8个CA的重复,随后有一串ctctcactctctca序列,然后再接12个CT重复
- 第五列:size,表示该SSR的大小
- 第六列:start,表示该SSR的起始位置
- 第七列:end,表示该SSR的的终止位置
3. 格式扩展
由于上述格式仅仅是描述SSR所在的位置,而无多态性信息,因此我们扩展了该格式,用于更好的记录分型信息,可查看MISA SSR扩展格式。
Contributors: rongzhengqin@basepedia.com