DNA正负链
没学懂,不完善,待补充,欢迎指正!!!
关于DNA正负链的定义
biostarts
DNA是互补双链,一条是正链(forward strand),一条是负链(reverse/minus strand)。
————————————————不重要,不懂—————————————————
biostarts认为正负链可以任意指定
关于DNA正负链的定义认为:
-
把碱基序列与mRNA一致(只是T和U的区别)的核酸单链定为==正链(+)==,
不作模板转录,
也称为有义链(sense strand), 又称编码链(coding strand)。
-
将碱基序列与mRNA互补的核酸单链定为==负链(-)==,
作为模板转录,
也称为反义链(antisense strand)或模板链(template strand)
——————————————————————————————————————
基因在正负链上都存在,但是一般像ucsc、NCBI、Ensembl等数据库存的都是正链(forward strand)的碱基序列。
基因的正负链问题: ucsc,ensembl等定义基因在正链上是指转录本序列与正链上该基因的序列一致。
所以当从基因组中取到的序列和直接获得到的基因序列呈反向互补时,说明该基因就在**负链(reverse strand)**上。
不管正负链,读基因序列的顺序永远是从5‘(上游)到3’(下游)的。
demo:
5'AA[T...G]CA[CG....TA]CGT......GTC CGT....TAA CGT3' ---> 正链(forward strand)
|| |...| || ||....|| |||......||| |||....||| ||| ---> 氢键
3'TT[A...C]GT GC....AT GCA......CAG[GCA....ATT]GCA5' ---> 负链(reverse strand)
启动子 gene1 gene2
描述:一条DNA双链,反向互补。这里启动子不知道标的对不对。假定上面的是正链,下面的是负链。
对于gene1:我们在从正链中根据坐标拿到的序列是CG....TA
对于gene2:我们在正链中根据坐标拿到的序列是CGT....TAA
,与gene2是反向互补状态。
分析CGT....TAA
到gene2的变化过程:
- 反向:
AAT....TGC
- 互补:
TTA...ACG
- 得到的就是gene2
发散:
拿到另一条链,用于扩充数据是不是可以