1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
 ____                                                   ____                                                                                __
/\ _`\ /\ _`\ /\ \
\ \ \L\_\ __ ___ ___ ___ ___ __ \ \,\L\_\ __ __ __ __ __ ___ ___ __ __ ___ \_\ \
\ \ \L_L /'__`\/' _ `\ / __`\ /' __` __`\ /'__`\ \/_\__ \ /'__`\ /'__`\/\ \/\ \ /'__`\/' _ `\ /'___\ /'__`\ /'__`\ /' _ `\ /'_` \
\ \ \/, \/\ __//\ \/\ \/\ \L\ \/\ \/\ \/\ \/\ __/ /\ \L\ \/\ __//\ \L\ \ \ \_\ \/\ __//\ \/\ \/\ \__//\ __/ /\ \L\.\_/\ \/\ \/\ \L\ \
\ \____/\ \____\ \_\ \_\ \____/\ \_\ \_\ \_\ \____\ \ `\____\ \____\ \___, \ \____/\ \____\ \_\ \_\ \____\ \____\ \ \__/.\_\ \_\ \_\ \___,_\
\/___/ \/____/\/_/\/_/\/___/ \/_/\/_/\/_/\/____/ \/_____/\/____/\/___/\ \/___/ \/____/\/_/\/_/\/____/\/____/ \/__/\/_/\/_/\/_/\/__,_ /
\ \_\
\/_/
____ __ ____ __
/\ _`\ /\ \ /\ _`\ __ __/\ \__
\ \ \/\_\\ \ \___ _ __ ___ ___ ___ ___ ____ ___ ___ ___ __ \ \ \/\ \/\_\ __ __ __ _ __ ____/\_\ \ ,_\ __ __
\ \ \/_/_\ \ _ `\/\`'__\/ __`\ /' __` __`\ / __`\ /',__\ / __`\ /' __` __`\ /'__`\ \ \ \ \ \/\ \/\ \/\ \ /'__`\/\`'__\/',__\/\ \ \ \/ /\ \/\ \
\ \ \L\ \\ \ \ \ \ \ \//\ \L\ \/\ \/\ \/\ \/\ \L\ \/\__, `\/\ \L\ \/\ \/\ \/\ \/\ __/ \ \ \_\ \ \ \ \ \_/ |/\ __/\ \ \//\__, `\ \ \ \ \_\ \ \_\ \
\ \____/ \ \_\ \_\ \_\\ \____/\ \_\ \_\ \_\ \____/\/\____/\ \____/\ \_\ \_\ \_\ \____\ \ \____/\ \_\ \___/ \ \____\\ \_\\/\____/\ \_\ \__\\/`____ \
\/___/ \/_/\/_/\/_/ \/___/ \/_/\/_/\/_/\/___/ \/___/ \/___/ \/_/\/_/\/_/\/____/ \/___/ \/_/\/__/ \/____/ \/_/ \/___/ \/_/\/__/ `/___/> \
/\___/
\/__/

染色体(chromosome): 由DNA和蛋白质结合构成。具有如下性质:分子结构相对稳定;能够自我复制,使亲、子代之间保持连续性;能指导蛋白质的合成,从而控制生命过程;能产生可遗传的变异。

DNA包装为染色体具有几个重要的功能:

  1. DNA比细胞大很多,压缩DNA使之更适合存在于细胞中;
  2. 这种包装可以保护DNA免于损伤,细胞中存在大量DNA有关的酶,完全裸露的DNA分子在细胞中相当不稳定;
  3. 只有包装成染色体的DNA才能在每次细胞分裂时有效地将DNA传递给两个子代细胞;
  4. 染色体将每个DNA分子全面组织起来,该组织可以通过调节DNA的可接近性来调控细胞内所有DNA参与的事件;

染色质(chromatin):一段给定区域的DNA和与之结合的蛋白质形成的结构,可分为常染色质和异染色质两种类型。

组蛋白(histone):是带正电荷的小分子蛋白质,是与真核 DNA 相关的丰度最高的蛋白质,是保守的 DNA 结合蛋白,染色体的结构蛋白,分为 H1、H2A、H2B、H3、及 H4 五种,后四种与 DNA 共同组成核小体。这些组蛋白都含有大量的赖氨酸和精氨酸。可分为两种:核心组蛋白和组蛋白 H1,核心组蛋白相对较小,组蛋白 H1 相对较大。

非组蛋白(non-histone):在染色体中除了组蛋白之外的结构蛋白,是丰度较低的核染色体结合蛋白,这些蛋白质包含大量的DNA结合蛋白,可以调控细胞DNA的转录、复制、修复和重组。

核小体(nucleosome):是真核生物染色体组装的基本单位。每个核小体包括约 200bp 的 DNA,由 H2A、H2B、H3、H4 组成核心组蛋白八聚体以及一分子 H1.其中 147bp 的 DNA 像线缠绕线轴一样围绕盘装核心组蛋白八聚体 1.65 圈。H1 在核心颗粒外结合额外 20bpDNA,锁住核小体的进出端,相邻核小体间以连接 DNA 相连。将DNA压缩到比较小的细胞核中, 同时对组蛋白进行修饰可以控制DNA的可接近性, 来调控基因的表达。

基因组序列和染色体的多样性

原核生物基因组与真核生物基因组的区别

真核基因组特点:

  1. 庞大,一般都大于原核生物的基因组。
  2. 存在大量的重复序列。
  3. 大部分为非编码序列,占整个基因组的绝大部分。
  4. 转录产物为单顺反子。
  5. 真核基因是断裂基因,有内含子。
  6. 存在大量的顺式作用元件,如启动子,终止子,沉默子等。
  7. 存在大量的DNA多态性。
  8. 具有端粒结构。

原核生物基因组特点:

  1. 基因组很小,一般只有一条染色体。
  2. 主要是单拷贝基因,只有很少数基因以多拷贝形式存在。
  3. 整个染色体DNA几乎全部由功能基因与调控序列组成。
  4. 几乎每个基因序列都与它所编码的蛋白质呈线性对应状态。
  5. 有重叠基因,同一般DNA含有两种不同蛋白质的信息。
  6. 无内含子。
  7. 转录产物为多顺反子。

质粒(plasmid):在某些单细胞真核生物和细菌中的小的、独立的环状DNA,称为质粒。通常不是细菌生长所必需的,携带赋予细菌良好特性的基因,如抗生素抗性基因等。每个细胞中可以有多个完整质粒拷贝存在。常应用于克隆大量目的基因的实验中。

二倍体(diploid):细胞中每条染色体有两个拷贝, 大多数真核细胞是二倍体。

单倍体(haploid):细胞每条染色体只有一个拷贝, 并且参与有性生殖。例如精子和卵子都是单倍体细胞。

多倍体(polyploid):细胞中每条染色体都超过两个拷贝。

为什么巨核细胞不分裂?(结合拷贝数)

巨核细胞是一种特化的多倍体细胞,每条染色体大约有28拷贝,能产生数千个人体血液所必需的、没有染色体的血小板。通过多倍体形式,巨核细胞维持高水平的新陈代谢,以产生大量的血小板。由于多条染色体的分离非常困难,因此多倍体细胞几乎处于停止分裂的状态。

基因组的大小与生物体复杂程度相关

基因组的大小:单倍体染色体中的DNA长度。在不同的生物中有相当大的变化。生物体的复杂程度与基因组的大小大致呈正相关。

许多复杂程度与基因组大小显著不同,基因数目与生物复杂性更密切相关。

基因数目:一个基因组所包括的基因数目,与生物复杂性相关性更密切。

E.coli的基因组几乎全部由基因构成

E.coli染色体的绝大部分DNA编码蛋白质或结构RNA,大部分非编码序列参与基因转录调控。

E.coli复制起始区:基因组的一个关键元件,直到整个复制机器的组装,仅为4.6Mb基因中的几百个碱基对。

复杂度高的生物基因密度低

基因密度(gene density):每Mb基因组上基因的平均数目,可以解释具有相似复杂程度的生物体有明显不同的基因组大小的现象。生物体的复杂程度与基因密度之间存在大致负相关的关系,目前所发现的基因密度最高的生物是病毒,某些病毒利用DNA的两条链编码重叠基因。与原核生物比,真核生物的基因密度较低且多变,基因密度随生物体复杂程度增加而降低。

基因仅占真核染色体DNA的一小部分

为什么真核基因密度降低及真核基因更长?

  1. 基因大小的增加: 蛋白质编码基因之间有非蛋白编码区,称为内含子。内含子的存在极大增加了一个基因所需的DNA长度,编码蛋白质的基因中,平均仅有5%的序列直接参与了编码蛋白质,95%的基因由内含子构成,简单真核生物的内含子较少,与其较高的基因密度一致。
  2. 基因间DNA的增加(基因间序列):
    1. 基因间DNA是基因组中与蛋白质或结构RNA的表达无关的部分。主要分为单一的和重复地两类,超过60%部分由基因间序列组成。人类基因组的基因间DNA的单一区段包含了无功能的突变基因、基因碎片、假基因等。
    2. 随着生物体复杂度增加,单一基因间序列中指导和调节转录所需的DNA序列(称为调控序列)显著增加。

pseudogene
假基因(pseudogene):是功能基因的缺陷拷贝,它在序列结构与功能基因非常相似,但已丧失了正常的蛋白质编码功能。

假基因能否发生能否翻译成蛋白质?

虽然这个基因是逆转录产生,再整合到宿主细胞的DNA上,但是它的整合是随机的。如果插入的部位是非基因区,则不表达,因为缺少启动子,终止子,但是如果插入部位正好是原来目的基因的部位,上游有启动子,下游有终止子,则可以表达。比如HIV病毒。

假基因的来源:

  1. 是基因组DNA重复或染色体不均等交换过程中基因编码区或调控区发生突变,比如碱基置换、插入、缺失,导致复制后的基因丧失正常功能而成为假基因,这种假基因称为重复假基因。
  2. 是mRNA转录本反转录成cDNA后重新整合到基因组,由于插入位点不合适或序列发生突变而失去正常功能,这样形成的假基因称为加工假基因。

假基因的重要性体现在以下几个方面:

  1. 假基因为基因组动态学研究和进化研究提供了非常宝贵的材料。
  2. 研究表明有些假基因是有功能的,功能主要包括2个方面:
    1. 有些假基因对基因的表达调控发挥着重要作用,主要是在RNA水平上参与基因的表达调控。
    2. 曾“死去”的假基因有时可以重新获生,对新基因的产生和功能拓展有所贡献。
  3. 由于功能基因之间的相似性,假基因对基因注释和遗传疾病的诊断与治疗带来很大麻烦。

人的基因间隔区序列主要由重复DNA构成

几乎一半的人类基因组由在基因中重复多次的DNA序列组成。
重复DNA一般有两种:微卫星DNA和基因组范围内的重复。

satellite DNA

satellite DNA: 卫星 DNA 是位于真核生物基因组中的高度串联重复序列,通常位于异染色质,可用密度梯度离心法在氯化铯介质中将其与染色体主体分离开,具有物种特异性,可作为分子遗传标记。

microsatellite DNA

微卫星DNA(microsatellite DNA):由非常短的(小于13bp)串联重复序列构成,常见的微卫星序列是二核苷酸重复序列,这种重复序列几乎占了人类基因组的3%。

genome-wide repeats

基因组范围内的重复序列(genome-wide repeats):比微卫星大得多,每个重复单元的长度都大于100bp,许多大于1kb单一拷贝散布在基因组中,或紧密相连成簇存在,其共同特点为都是转座子,大约占人类基因组的45%。

染色体的复制和分离

真核染色体在细胞分裂过程中需要着丝粒、端粒和复制起始位点

对于细胞分裂过程中染色体的正确复制和分离所需要的三个重要原件:

  1. 复制的起始位点(origins of replication);DNA复制机械组装和复制起始的位点,间隔约为30-40kb,分布在每条真核染色体上,与真核不同的是,原核染色体只有一个复制起始位点。复制起始位点属于非编码区。
  2. 着丝粒(centromere):是DNA复制后染色体准确分离所必需的,指导一个精细的蛋白质复合体的形成,此结构称为动粒。每条染色体只有一个着丝粒,若着丝粒缺失,复制后染色体随机分配可能会使子细胞的染色体缺失或加倍;如果一条染色体上存在一个以上拷贝的着丝粒,会导致染色体断裂。着丝粒在不同生物中大小变化很大,在酿酒酵母中为不到200bp的单一序列,在大多数真核生物中大于40kb,主要由大量重复的DNA序列组成。
  3. 端粒(telomere):位于线性染色体的两端,由许多蛋白质结合。大部分以单链形式存在,少部分以双链形式存在。大多数端粒具简单的重复序列,固物种而异。典型的重复序列由一段短的、富含TG的序列组成。端粒的重复序列组成特性由其特殊复制方式造成。

动粒(kinetochore):由着丝粒指导形成的一个精细的蛋白质复合体,作用机制是与着丝粒DNA和蛋白质纤维(微管)相互作用,拉动姐妹染色体相互远离并进入两个子细胞。

端粒蛋白质具有的功能:

  1. 端粒蛋白区分染色体的天然末端与细胞中染色体断裂和其他DNA的断裂区;
  2. 端粒作为一种特殊的复制起始位点,可以使细胞复制染色体的末端。端粒通过招募一种叫做端粒酶的特殊DNA聚合酶来促进末端复制。

真染色体的复制和分离发生在周期的分裂期

在细菌细胞中染色体的复制和分离过程是同时发生的

真核染色体的复制和分离发生在细胞分裂过程的不同时期。

细胞周期(cell cycle):细胞完成一轮分裂所需要的过程;

有丝分裂(Mitosis):细胞分裂过程中,子代细胞染色体数目维持与亲本一致。

分裂期(M phase)事件:姐妹染色单体附着纺锤体(动粒介导),黏粒消失,姐妹染色单体分离,(黏粒与纺锤体两极附着相互牵制,使姐妹染色单体正确发生分离)

真核细胞分裂时染色体的结构发生变化

分裂期(M phase):最压缩状态,染色体相互之间完全独立。

间期(G1, S, G2):松散状态,压缩程度大大降低,染色体结构仍有变化。复制时,结合蛋白的解离和重组装。复制刚完成时,姐妹染色单体相互连接。细胞周期中部分基因的转录调控:染色体相关位置的结构改变。

有丝分裂维持亲本染色体的数目

二价联会(bivalent attachment):在分裂中期,有丝分裂纺锤体形成,姐妹染色体的动粒与微管结合。只有当一对姐妹染色单体的两个动粒分别与从相对的微观组织中心发出的微管结合后,正确的染色单体连接才完成。这种连接类型是二价联会。会产生微管对染色单体对施加拉张力,向相反方向牵拉姐妹染色单体。

单价联会(monovalent attachment):从同一微管组织中心发出的微管与两个染色单体或其中之一结合,称为单价联会。

有丝分裂过程图8-15书P218

细胞周期的间期为下一个细胞周期作准备,同时检查上一个阶段是否正确完成

G1期发生于DNA合成之前,G2期位于S期与M期之间。

细胞周期有两个作用:

  1. 为下一个细胞周期阶段做好时间上的准备
  2. 检查上一个细胞周期阶段是否正确完成

细胞周期检查点(cell cycle checkpoint):在细胞周期中,如果前一阶段存在问题,那么细胞周期检查点会停止细胞周期并给细胞提供时间完成这一步。含有损伤DNA的细胞将细胞周期阻止在DNA合成之前的G1期或者有丝分裂之前的G2期,防止产生损伤的染色体。

减数分裂减少了亲本染色体的数目

减数分裂过程图8-16书P220

在显微镜下可以观察到不同时期的染色体结构

处于非有丝分裂期的染色体DNA凝聚程度较低,在电子显微镜下可以观察到两种状态:直径30nm的纤丝和直径为10nm的纤丝。通常组装成一串串有规则的“念珠”,即核小体。

核小体

核小体是染色体的结构单位

核小体结构:在真核细胞中大多数DNA被包装进核小体。核小体由8个组蛋白所形成的核组成,DNA缠绕在组蛋白核上。

linker DNA
连接DNA(linker DNA):每个核小体之间的DNA叫做连接DNA。在所有生物中,长度约147bp的核心DNA是核小体一个不变的特征。

core DNA
核心DNA(core DNA):与核小体结合最紧密的DNA叫做核心DNA,它像缠绕线轴一样盘绕组蛋白八聚体约1.65圈。而连接DNA的长度是可变的,距离一般为20-60bp,每个真核生物都有各自特征性的连接DNA平均长度。

微球菌核酸酶实验

原理:微球菌核酸酶能讯速剪切无蛋白质保护的DNA序列,而对结合有蛋白质的DNA序列剪切效率低。利用微球菌核酸酶可以有控制地处理染色质,得到与组蛋白结合的DNA,进一步用微球菌核酸酶处理,使全部的连接DNA降解,剩下的最小的核小体仅包括147bp的DNA,称为核小体核心颗粒。

过程:

  1. 用微球菌核酸酶温和处理染色质
  2. 一部分提取DNA后进行凝胶电泳,电泳结果则是一组具有长度梯度的片段,长度为核小体到核小体距离的整数倍。
  3. 另一部分进一步消化,进行电泳,则只有单个条带,约147bp。

组蛋白是带正电荷的小分子蛋白质

组蛋白(histone):是带正电荷的小分子蛋白质,是与真核DNA相关的丰度最高的蛋白质,是保守的DNA结合蛋白,染色体的结构蛋白,分为H1、H2A、H2B、H3、及H4五种,后四种与DNA共同组成核小体。这些组蛋白都含有大量的赖氨酸和精氨酸。可分为两种:核心组蛋白和组蛋白H1,核心组蛋白相对较小,组蛋白H1相对较大。

组蛋白的一般特性:

  1. 进化上的极端保守,不同种生物组蛋白的氨基酸组成是十分相似的,特别是H3、H4。
  2. 无组织特异性,几乎所有生物染色体的组蛋白仅这五类。
  3. 肽链上氨基酸分布的不对称性,碱性氨基酸集中分布在N段端的半条链上,大部分的疏水基团都在C端。
  4. 存在较普遍的修饰作用:包括甲基化、乙酰化、磷酸化及ADP核糖基化。

组蛋白折叠域(histone-fold domain): 由3个a螺旋组成,螺旋之间被两个短的无规则环隔开。组蛋白折叠域调节头尾相连、专一配对的组蛋白异源二聚体的形成,在没有DNA存在时,调节核心组蛋白在溶液中形成中间组装体,是每种核心组蛋白中都存在的一个保守区域。

组蛋白N端尾巴可稳定盘绕在八聚体上的DNA

从DNA螺旋之间或两侧伸出的组蛋白尾巴,指导DNA以左手螺旋方式盘绕于组蛋白八聚体的圈盘上。

染色质的高级结构

异染色质和常染色质

异染色质(heterochromatin):能被多种染料染成深色,折叠压缩程度高,处于聚缩状态的染色质,由组装进高级结构的核小体DNA组成,转录不活跃。

常染色质(euchromatin):染料染色浅,折叠压所程度低,处于伸展状态的染色质,转录比较活跃。

组蛋白H1与核小体之间的连接DNA结合

组蛋白H1的作用:
核小体与组蛋白H1结合,进一步加强了核小体与DNA的紧密结合;组蛋白H1与核小体结合保护额外20bpDNA免受微球菌核酸酶的消化。

核小体束能形成更复杂的结构

30nm纤丝

当盐浓度增加时,组蛋白H1的加入使核小体DNA形成一条30nm纤丝。目前有两种模型:螺线管模型、锯齿模型。

组蛋白N端尾巴对于30nm纤丝的形成是必需的

N端尾巴的作用:核小体结构的稳定、修饰改变核小体功能

形成30nm纤丝所必需的两个条件:组蛋白N端尾巴和组蛋白H1

组蛋白的变构体影响核小体的功能

核心组蛋白是最保守的真核蛋白之一。在真核细胞中有很多组蛋白变构体能替代四种标准组蛋白中的一种,形成替代型核小体。这一类核小体可能用来划分染色体的特定区域,或者赋予核小体特定的功能。
例如H2A.X是H2A的一种变构体,广泛分布于真核细胞的核小体中,当染色体发生断裂时,邻近断点的H2A.X会被磷酸化,磷酸化后可以被DNA修复酶特异性识别,并将修复酶定位到DNA损伤位点。
另一个组蛋白变构体CENP-A与含有着丝粒DNA的核小体结合,它替代了核小体中的组蛋白H3亚基,这些核小体整合进动粒,介导染色体与有丝分裂纺锤体黏附。

染色质结构的调控

DNA与组蛋白八聚体的相互作用是动态的

核小体重塑复合体有助于核小体的移动

nucleosome-remodeling complex
核小体重塑复合体(nucleosome-remodeling complex):一种蛋白质大复合体,有酶活性,可以影响组蛋白和DNA相互作用的稳定性,有助于以ATP水解为能量的核小体-DNA的相互作用或核小体位置的改变。

核小体重塑复合体改变核小体的三种基本类型:

  1. 催化DNA沿着组蛋白八聚体表面滑动;
  2. 催化组蛋白八聚体进入溶液或从一个DNA螺旋向另一个螺旋转移;
  3. 促进核小体中的二聚体H2A/H2B转换成其它形式的二聚体。

组蛋白N端的尾巴经常被修饰

  1. 组蛋白的修饰:在细胞周期特定时间可发生甲基化、乙酰化、磷酸化和ADP核糖基化等,H1可被泛素化和磷酸化修饰,H2A、H2B可被泛素化和乙酰化修饰,H3、H4以甲基化和乙酰化为主。
  2. 甲基化:可发生在组蛋白的赖氨酸和精氨酸上,而且精氨酸残基能够发生单、双、三甲基化,而赖氨酸残基能够单一甲基化,甲基化增加组蛋白修饰和调节基因表达的复杂性,与基因沉默和基因激活有关。
  3. 乙酰化:主要发生在核心组蛋白上,H3和H4乙酰化程度高于H2A和H2B,乙酰化的主要位点分布在H3和H4的N端较保守的赖氨酸位置,高水平的乙酰化会使转录活化。
  4. 磷酸化:丝氨酸和算算主要受磷酸化修饰。
  5. 泛素化:修饰位点为高度保守的赖氨酸残基,能够招募核小体到染色体,与经典的蛋白质泛素化不同,不会导致蛋白质的降解,参与X染色体的失活,影响组蛋白的甲基化和基因的转录。

组蛋白修饰如何改变核小体的功能?

所有的这些修饰作用都有一个共同的特点,即降低组蛋白所携带的正电荷,从而降低了组蛋白对带负电荷的DNA的亲和力。

  1. 改变染色体的结构直接影响转录活性;
  2. 核小体表面发生改变,使其它调控蛋白易于和染色体相互接触,从而间接影响转录活性。一般来说,组蛋白乙酰化能够开放某些基因的转录,增强表达水平。甲基化可以抑制也可以增强基因表达。在细胞有丝分裂和凋亡过程中,磷酸化修饰能调控蛋白质复合体向染色质集结。

核小体N端尾巴的修饰和核小体重塑的共同作用能显著改变DNA的可接近性。

特定的酶负责组蛋白的修饰

组蛋白乙酰转移酶催化乙酰基团添加到组蛋白上
组蛋白去乙酰化酶除去乙酰基团
组蛋白甲基转移酶将甲基基团加到组蛋白上
组蛋白去甲基酶将甲基基团去除

核小体的组装

DNA复制后核小体组装即开始

核小体组装过程:

  1. 组蛋白H3和H4首先形成异源二聚体;
  2. 然后两个异源二聚体形成四聚体,H2A和H2B在溶液中形成异源二聚体;
  3. H3·H4四聚体和DNA结合;
  4. 然后两个H2A·H2B二聚体结合到H3·H4-DNA复合体,形成最后的复合体。

染色体组装过程:

在DNA的复制过程中,子代染色体至少半数是新合成的,原有组蛋白不完全随机分布在两条子代染色体中,核小体暂时解体,此过程中二聚体和四聚体不会分解为单体再重新组装。
组蛋白H3-H4四聚体和H2A-H2B二聚体被随机分配到任一子代分子中,在DNA复制后,核小体立即被组装,这涉及到特定的组蛋白伴侣的功能,这些组蛋白伴侣护送H3-H4四聚体和H2A-H2B二聚体到达复制叉。
随后,在旧蛋白的“种子”作用下,发生相似修饰,一旦DNA包装成核小体,它有能力借助组蛋白的H1来进行进一步压缩DNA,开成染色质形式(30nm纤丝),在细胞分裂间期,染色质进一步浓缩成染色体。

核小体的组装需要组蛋白“伴侣”

组蛋白伴侣(histone chaperone):在生理盐浓度下对核小体组装的研究鉴定出的一些能指导组蛋白在DNA上组装的因子。这些因子是带负电荷的蛋白质,与H3·H4四聚体或H2A·H2B二聚体形成复合体,并护送它们到核小体组装的位点。这些因子可以避免组蛋白与DNA发生无效的相互作用。

考点补充

为什么基因只占真核生物基因组的一小部分?(为什么真核基因密度低/为什么真核基因长)

简述染色体复制和分离重要的关键DNA元素的三个作用

图片中的文字内容按照层次结构输出如下:

真核染色体在细胞分裂过程中需要着丝粒、端粒和复制起始位点。

  • 1.复制的起始位点 (origins of replication): DNA复制机械组装和复制起始的位点, 间隔约为30-40kb,分布在每条真核染色体上, 与真核不同的是,原核染色体只有一个复制起始位点, 复制起始位点属于非编码区
  • 2.着丝粒 (centromere): 是DNA复制后染色体准确分离所必需的, 指导一个精细的蛋白质复合体的形成,此结构称为动粒, 每条染色体只有一个着丝粒若着丝粒缺失,复制后染色体随机分配可能会使子细胞的染色体缺失或加倍, 如果一条染色体上存在一个以上拷贝的着丝粒,会导致染色体断裂, 在不同生物中大小变化很大,主要由大量重复的DNA序列组成
  • 3.端粒 (telomere): 位于线性染色体的两端,由许多蛋白质结合, 大部分以单链形式存在,少部分以双链形式存在, 大多数端粒具简单的重复序列,因物种而异, 典型的重复序列由一段短的、富含TG的序列组成, 端粒的重复序列组成特性由其特殊复制方式造成, 作为一种特殊的复制起始位点,可以使细胞复制染色体的末端, 端粒通过招募一种叫做端粒酶的特殊DNA聚合酶来促进末端复制

动粒 (kinetochore)
由着丝粒指导形成的一个精细的蛋白质复合体
作用机制是与着丝粒DNA和蛋白质纤维(微管)相互作用,拉动姐妹染色体相互远离并进入两个子细胞

简述高级染色质结构是如何形成的?

列举3项实验证明染色质中DNA与蛋白质分子发生相互作用

  1. 染色质DNA的Tm值比自由DNA高。
  2. DNA酶I对染色质DNA的消化比对纯DNA慢。
  3. 在染色质状态下,由DNA聚合酶和RNA聚合酶催化的DNA复制和转录活性大大低于在自由DNA中的反应。

简述真核与原核细胞染色体结构的差别。(2005) #learnlater

蛋白质含量(多/少)、DNA数目和状态、相对分子质量结构精炼or冗余、多态性、着丝粒端粒、操纵子结构单元有无、复制起点数目、调控序列扩展

真核生物基因组中有几种类型的DNA序列?你如何设计实验来证明?(2006)

根据复性动力学研究将真核生物的DNA序列分为四类:

  • 1.单拷贝序列: 在基因组中只出现一次或少数几次的序列,大多数真核生物的基因都属于此类。
  • 2.轻度重复序列: 在一个基因组中有2到10个拷贝,如组蛋白基因和一些rRNA基因。
  • 3.中度重复序列: 有十至几百个拷贝,通常是非编码的序列,例如Alu序列,可能在基因表达调控中发挥作用。
  • 4.高度重复序列: 有几百到几百万个拷贝,包括rRNA基因、tRNA基因以及卫星DNA等。

可以使用复性动力学实验鉴定: 光谱法(减色效应)
原理:不同类型的序列在DNA变性后的复性速率不同,单拷贝序列复性最慢,高度重复序列复性最快。
方法:首先将DNA完全变性,然后在一定条件下让DNA复性,通过测量复性过程中吸收光谱的变化来分析不同复性速率对应的序列类型。

【实验步骤】

  1. DNA提取与纯化:从组织或细胞中提取总DNA,并去除RNA和蛋白质等杂质,确保DNA的质量和纯度。
  2. DNA变性:将DNA加热至约95°C以上,使双链DNA解开成为单链DNA。这个过程称为变性,通常在碱性条件下进行,以确保完全变性。
  3. 复性反应:将变性的DNA迅速冷却到较低温度(如室温或低于室温),此时单链DNA开始寻找互补链并重新形成双链。复性过程可以通过改变温度、盐浓度或时间来控制。
  4. 监测复性:使用紫外光吸收法(260nm)监测复性过程。DNA双链的形成会导致紫外光吸收值降低,因为双链DNA的紫外吸收小于单链DNA。记录复性过程中不同时间点的紫外吸收值。
  5. 数据分析:根据复性曲线,可以计算出不同DNA序列的复性速率。通常,会看到一个快速复性阶段(代表高度重复序列)、一个中间复性阶段(代表中度重复序列)和一个缓慢复性阶段(代表单拷贝序列)。
  6. 结果解释:通过比较不同样品的复性动力学曲线,可以推断出样品中各种类型DNA序列的相对
    丰度。

请阐述真核生物与原核生物基因结构的特点与差异

如果从基因数据库中找到一个真核生物基因全长 cDNA(长度为1.5Kb),你如何设计实验证明该真核基因是否有内含子结构的存在?如何计算内含子占全长基因的比例?如果该基因为未知功能基因,你可以设计什么实验来研究该基因的功能或特点?(2011)

1.真核生物基因组特点

  • 庞大: 一般都大于原核生物的基因组
  • 存在大量重复序列
  • 大部分为非编码序列, 占整个基因组的绝大部分
  • 转录产物为单顺反子
  • 真核基因是断裂基因, 有内含子
  • 存在大量的顺式作用元件, 如启动子、终止子、沉默子等
  • 存在大量的DNA多态性
  • 具有端粒结构

    2.原核生物基因组特点

  • 基因组很小, 一般只有一条染色体

  • 主要是单拷贝基因, 只有很少数基因以多拷贝形式存在
  • 整个染色体DNA几乎全部由功能基因与调控序列组成
  • 几乎每个基因序列都与它所编码的蛋白质呈线性对应状态
  • 有重叠基因, 同一般DNA含有两种不同蛋白质的信息
  • 无内含子
  • 转录产物为多顺反子

    3.验证明该真核基因是否有内含子结构的存在

  • 1.R环定位法(R-loop mapping): 当RNA在适当条件下与包含一段相同序列的双链DNA一起培养时,RNA与其互补序列杂交,使得另一条非互补DNA链形成一个环,然后使用观察核酸的方法进行染色,就可在电镜下看到R环,因为双链DNA或DNA:RNA比单链的核酸显得要粗。

  • 2.通过直接测序的方法/数据库查找: 将cDNA和该基因同时进行测序,测序之后比对,cDNA缺失的部分即为内含子的部分或者去数据库中查找该基因的基因信息,通过序列比对与cDNA进行比较
  • 3.PCR: 以该真核生物的基因在基因数据库中的序列信息两端设计引物,提取该物种的mRNA,逆转录形成cDNA文库,提取真核生物基因组,以基因组和cDNA文库分别作为模板,用引物去PCR,将PCR产物进行凝胶电泳,若长度不一致,则表明内含子存在

组蛋白N端尾巴

真核细胞蛋白质磷酸化主要发生在哪三种氨基酸上?催化蛋白质磷酸化和去磷酸化的酶是什么?请举两个例证说明蛋白磷酸化对功能的影响?(2015)

真核细胞中蛋白质磷酸化主要发生在以下三种氨基酸上:丝氨酸(Serine,Ser)、苏氨酸(Threonine,Thr)、酪氨酸(Tyrosine,Tyr)

催化磷酸化的酶:蛋白激酶(Protein kinases),这类酶能够将ATP或GTP的磷酸基团转移到底物蛋白的特定氨基酸残基上。例如,丝裂原活化蛋白激酶(MAPKs)和酪氨酸蛋白激酶(PTKs)。

催化去磷酸化的酶:蛋白磷酸水解酶(Protein phosphatases),这类酶能够移除蛋白质上已经存在的磷酸基团,恢复蛋白质的原始状态。例如,蛋白酪氨酸磷酸酶(PTPs)和丝氨酸/苏氨酸磷酸酶(Ser/Thr phosphatases)。

蛋白磷酸化对功能的影响的例子

1.MAPK(促丝裂原活化蛋白激酶)信号通路:(RTK-Ras-MAPK)影响:在细胞受体接收到外部信号后,一系列的激酶级联反应被激活,最终导致MAPK的磷酸化。磷酸化的MAPK进入细胞核,激活转录因子,进而调控基因表达,影响细胞的生长、分化和凋亡。
例证:EGF(表皮生长因子)刺激细胞时,ERK(一种MAPK家族成员)被磷酸化并激活,促进细胞周期进程,从而促进细胞分裂和生长。

2.胰岛素受体的自磷酸化:(PI3K-PKB)影响:当胰岛素与其受体结合时,受体的酪氨酸残基发生自磷酸化,这使得受体能够进一步磷酸化下游的信号分子,PI3K-PKB (Akt)信号通路始于RTK和细胞因子受体的活化,产生磷酸化的酪氨酸残基,从而为募集PI3K向膜上转位提供锚定位点,触发一系列生化事件,包括葡萄糖摄取和糖原合成,以及脂肪和蛋白质的合成。
例证:在胰岛素信号通路中,受体酪氨酸激酶(RTKs)的磷酸化是启动细胞响应胰岛素的关键步骤,这对于维持血糖稳态至关重要。

假基因

  • 定义: 是功能基因的缺陷拷贝,它在序列结构与功能基因非常相似,但已丧失了正常的蛋白质编码功能。根据来源不同可以分为复制假基因与加工假基因.
  • 复制假基因: 通过DNA复制产生,由基因组DNA重复或是染色体不均等交换过程中发生突变导致复制后的基因丧失正常的功能而成为假基因。
    • 常位于其起源功能基因附近
    • 与功能基因有非常相似的结构
    • 含有内含子
    • 在细菌、真核生物中均存在
  • 加工假基因: 起源于反转录转座作用,即通过DNA转录为mRNA,在反转录成cDNA重新整合到基因组,但由于转座过程中对插入位点无序列选择性,cDNA往往被插入基因间隔区或插入基因内部造成基因失活从而失去正常功能。
    • 两末端一般存在短的正向重复序列
    • 3’末端由poly(A)尾
    • 终止密码子的提前出现
    • 产生移码突变
    • 缺乏内含子和启动子
    • 目前只在真核生物中发现且形成过程多与RNA pol II有关
  • 能否翻译成蛋白质: 虽然这个基因是逆转录产生,再整合到宿主细胞的DNA上,但是它的整合是随机的。如果插入的部位是非基因区,则不表达,因为缺少启动子,终止子,但是如果插入部位正好是原来目的基因的部位,上游有启动子,下游有终止子,则可以表达。比如HIV病毒。
  • 意义
    • 1.假基因为基因组动态学研究和进化研究提供了非常宝贵的材料。
    • 2.研究表明有些假基因是有功能的,功能主要包括2个方面:
    • a.有些假基因对基因的表达调控发挥着重要作用,主要是在RNA水平上参与基因的表达调控。
    • b.曾”死去”的假基因有时可以重新获生,对新基因的产生和功能拓展有所贡献。
    • 3.由于功能基因之间的相似性,假基因对基因注释和遗传疾病的诊断与治疗带来很大麻烦。

请简述单个核小体的结构与功能。(2018)

染色体结构保持完整和稳定的三大要素及其作用(2019)

基因密度

真核生物基因密度比原核生物低的原因。(2020)

名词补充

Genome

基因组, 指生物体所有遗传物质的总和。这些遗传物质包括DNA或RNA(病毒RNA)

regulatory regions and sequence

调控序列, 是一段控制基因表达的DNA片段调控序列主要有以下几种:

  1. 在5′端转录起始点上游约20~30个核苷酸的地方,有TATA框(TATA box)。 TATA框是一个短的核苷酸序列,其碱基顺序为TATAATAAT。TATA框是启动子中的一个顺序,它是RNA聚合酶的重要的接触点,它能够使酶准确地识别转录的起始点并开始转录。当TATA框中的碱基顺序有所改变时,mRNA的转录就会从不正常的位置开始。
  2. 在5′端转录起始点上游约70~80个核苷酸的地方,有CAAT框(CAAT box)。CAAT框是启动子中另一个短的核苷酸序列,其碱基顺序为GGCTCAATCT。CAAT框是RNA聚合酶的另一个结合点,它的作用还不很肯定,但一般认为它控制着转录的起始频率,而不影响转录的起始点。当这段顺序被改变后,mRNA的形成量会明显减少。
  3. 在5′端转录起始点上游约100个核苷酸以远的位置,有些顺序可以起到增强转录活性的作用,它能使转录活性增强上百倍,因此被称为增强子。当这些顺序不存在时,可大大降低转录水平。研究表明,增强子通常有组织特异性,这是因为不同细胞核有不同的特异因子与增强子结合,从而对不同组织、器官的基因表达有不同的调控作用。例如,人类胰岛素基因 5′末端上游约250个核苷酸处有一组织特异性增强子,在胰岛素β细胞中有一种特异性蛋白因子,可以作用于这个区域以增强胰岛素基因的转录。在其他组织细胞中没有这种蛋白因子,所以也就没有此作用。这就是为什么胰岛素基因只有在胰岛素β细胞中才能很好表达的重要原因。
  4. 在3′端终止密码的下游有一个核苷酸顺序为AATAAA,这一顺序可能对mRNA的加尾(mRNA尾部添加多聚U)有重要作用。这个顺序的下游是一个反向重复顺序。这个顺序经转录后可形成一个发卡结构。发卡结构阻碍了RNA聚合酶的移动。发卡结构末尾的一串U与转录模板DNA中的一串A之间,因形成的氢键结合力较弱,使mRNA 与DNA杂交部分的结合不稳定,mRNA就会从模板上脱落下来,同时,RNA聚合酶也从DNA上解离下来,转录终止。AATAAA顺序和它下游的反向重复顺序合称为终止子,是转录终止的信号

Histone code

是认为基因调控部分主要依赖于组蛋白尾部的组蛋白修饰,是表观遗传密码的一部分,是通过专用于修饰的蛋白结构域对修饰的组蛋白进行特异性识别,然后招募一些蛋白质,可以改变染色质的结构和促进转录。

Haplotype

Haplotype单倍体基因型,简称单倍型,是指在同一染色体上进行共同遗传的多个基因座上等位基因的组合,即基因在一条染色体上的组合。

Nucleosome positioning 核小体定位。

Nucleosome positioning 核小体定位, 是指染色质中的核小体与 DNA 的相对位置,核小体与 DNA 的相互作用是动态的。核小体定位可由 DNA 结合蛋白或特异性的 DNA 序列指导,另外,富含 AT 碱基对的 DNA 区域更倾向于组装核小体。

Chromatin remodeling

Chromatin remodeling 染色质重塑。是指染色质结构调控的一种方式,是指在复制、表达等过程中染色质上的 DNA 与组蛋白相对位置改变从而改变 DNA 的可接近性的过程。

telomerase

端粒酶(telomerase):是一种特殊DNA聚合酶,它既含有多蛋白亚基,也含有RNA成分,端粒酶发挥特殊功能的关键所在是该酶的RNA组分。端粒酶的一个蛋白质亚属于DNA聚合酶,称为反转录酶,用于延伸其DNA底物的 3’端,不需要外源性DNA模板来指导dNTP的添加,利用其RNA成分作为模板,将端粒序列添加到染色体末端,特异性地延伸特定单链DNA序列的3’-OH。可以解决先行染色体末端复制问题, 防止DNA复制结束后新合成的链中基因被破坏, 正常细胞一般不存在端粒酶活性, 而在癌细胞与干细胞中端粒酶活性较高。

histone chaperone

组蛋白伴侣(histone chaperone):在生理盐浓度下对核小体组装的研究鉴定出的一些能指导组蛋白在 DNA 上组装的因子。这些因子是带负电荷的蛋白质,与 H3·H4 四聚体或H2A·H2B 二聚体形成复合体,并护送它们到核小体组装的位点。这些因子可以避免组蛋白与 DNA 发生无效的相互作用。

histone-fold domain

组蛋白折叠域(histone-fold domain):由 3 个α螺旋组成,螺旋之间被两个短的无规则环隔开。组蛋白折叠域调节头尾相连、专一配对的组蛋白异源二聚体的形成,在没有 DNA存在时,调节核心组蛋白在溶液中形成中间组装体,是每种核心组蛋白中都存在的一个保守区域。

Exon

Exon 外显子。真核生物的基因多为断裂基因,即转录产物会经历剪接加工,外显子就是经剪接后可能会被保留下来的 RNA 所对应的 DNA 序列,即编码序列。

Intron

Intron 内含子。真核生物的基因多为断裂基因,即转录产物会经历剪接加工,在剪接过程中可能被切除的 RNA 所对应的 DNA 序列,即编码序列之间的间隔序列,最终不出现在成熟的 mRNA 上,不具有编码功能。

作业

问: 组蛋白的修饰方式有哪些?你能举例几种吗?