再来看看这种DNA的压缩与基因组演化之间的关係。一般可用C值(C Value)来度量一种生物的基因组的大小,它指一种生物的单倍体基因组的DNA总量。细菌和古菌的C值(单位pg)的中位值约在10-3–10-2之间,而真核生物约在1-10之间,高约3个数量级。绝大多数C值落于中位数±1.5个数量级之间。此外,真核细胞略为原核细胞直径的10倍。若考虑中位数及其上限偏移,以及细胞直径一个数量级的差异,真核生物DNA的压缩倍数大约应该是3.5个数量级(图4),带箭头的红色虚线表示C值中位数的演化轨迹,绿色虚线表示大多数真核生物C值的主要分布区间,问号表示该类生物起源的年代仍然存在争议。这与现代真核生物的DNA压缩比(packing ratio of DNA)惊人地一致!譬如,人的染色体中DNA分子伸展开来的长度平均约为几个厘米,而染色体被压缩到只有几纳米长(1 cm = 107nm)。原核生物的C值与真核生物中的原生动物和真菌亦有交集,特别是与原生动物的交集更深。
图4 原核生物和真核生物基因组大小的比较
压缩与结构化假说
压缩与结构化假说(packing and structurization hypothesis)认为,细胞核源自基因组複杂化的诱导。在大气逐渐氧化的背景下,地球上的生命(无论是形态结构,还是遗传信息)加速了从简单到複杂的演化历程,可能主要由于DNA的複製错误或多倍化并在一定程度上叠加了不同种类之间的各种侧向基因转移方式以及内共生融合(endosymbioticfusion)等导致了一些原核细胞基因组的大型化。这一方面需要骨架蛋白的强化来支撑更大的细胞体积,同时通过个体生存的随机性筛选,细胞内部逐渐结构化,从而形成了複杂的内膜系统——细胞器,被膜包裹的核及其在细胞分裂中的分离方式亦是这种结构化的产物。核的成型及有丝分裂的出现主要是为了满足将巨大的DNA分子準确地分配到子代中去的需求,这里,如何将长链DNA有效地压缩(藉助组蛋白)成若干染色体以及如何将多个染色体同时分离(藉助纺锤体)是核演化的关键。核膜的形成虽然并非轻而易举,但亦不会困难无比,膜有多种可能的来源,譬如,原核细胞分裂时DNA就得锚定在细胞膜上。其实,生命就起源自膜耦联的光化学过程,细胞亦能产生各种各样的膜。从本质上来看,包括核膜在内的细胞内膜系统就是为了实现对複杂生化系统进行秩序化管控,或者说,秩序化是通过细胞内部的模组化得以实现的。这虽然可视之为一种自演化模型,但在压缩原理和结构化等的基础上,诠释了核演化的动因与本质(谢平2016)。