130种。构成细菌细胞的基因组的dna分子,代表了从101000000种可能序列中的一种或为数不多的几种选择。显然,自然界只可能检验了其中的一小部分。数学上,一条包含了人类v个残基的序列,允许有种可能拷贝在k个位置被取代。图32示意一个基因,它是对129个氨基酸编码的序列。
某些微观态可能会强烈地影响宏观行为。这样的涨落可能放大并引起先前的稳定态被打破。非线性通过远离热平衡的过程加入进来。
生命的经典的必要条件是:1自复制以保持物种,而不致被稳步解体,2变异和选择以放大和完善物种的可能性,偏爱某种价值标准,3代谢以补偿稳定的熵产生。
曼弗雷德艾根提出了一种方案,可以通过数学优化过程来实现这些标准。在此模型中,自复制的成核和进一步进化的系统,在诸如蛋白质和核酸这样的随机大分子序列的分布中,以一定的期待值出现。自复制的起始拷贝的选择是偶然的,但是后继的进化优化到独特效率水平是受物理原理引导的。在此模型中,无论何地,只要物理的和化学的条件得到满足,就可能发现生命,尽管某些分子结构表现出与我们所知的系统没有多少相似性。
最后的结果是一种独特的结构,例如,某种优化了的分子序列。达尔文的适者生存原理进行了数学处理,即对可能的分子序列的微观态进行优化。这里假定,在简单的情形下,生物分子通过自催化而倍增。例如,两种生物分子a和b,从底物gs通过自催化而倍增,但是一种分子除了倍增以外,它还得到另一种的支持,且反之亦然图33a。在更复杂的有多种生物大分子的情形下,后一种采取了循环催化的方式进行倍增艾根的“超循环”图33b。这种伴随着突变的机制能够实现进化过程。
艾根提出了一个进化优化的简化模型:生物细胞的机制在某一个有4种构成基因的化学物质actcg的序列中编码。每一基因都代表了一个功能单元,它是优化地适应了其环境的特定目的。自然界的基因的长度一般很少超过1000个序列位置。因此,对于4种符号,长度为1000,就有41000种可能的基因“突变”。在科学记法中,这大约是10600种可能性。为了获得对这种巨大数目的印象,我们应该记住,整个宇宙中的物质量相当于1074个基因,宇宙的年龄小于1018秒。
因此,如果所有的宇宙物质从其一开始“大爆炸”就用来进行替换,从而每秒钟产生出一种新的长度为1000的基因,那么至今也仅应检验了1093种突变。艾根得出结论:代表优化功能单元的基因不可能是在随机过程中产生出来的,而必定是通过自优化过程发展起来的。
数学上,适应过程可以设想为一系列的位置置换,其目标是获得最后的“优化的”序列。这是一种典型的计算机科学中的问题求解方式的解释。为了成功地求解一个问题,我们必须找到一种合适的自优化策略的空间表象。因为对于大量的数目,一个三维空间显然是不合适的。策略的长度,即从基因到其优化变异体的距离,是太长了。人们会误入歧途。进一步,高度相似的序列不可能在三维空间的邻域中得到适当的表示。因此,人们提出以如下方式来改变维数。
一条具有n个位置的序列定义为n维空间的一个点。对于两个符号0和1,有2n种可能的序列,它们是此空间的点。每一点具有n个近邻,它们代表了仅有一个位置不同的突变“1个误差突变”。在两个仅仅为0或仅仅为1的端点之间,有n个可能的关联。在图34a-d中,对此二元情形有一些n维序列空间的例子。这些空间的巨大优点在于其非常短的距离和密集的可能关联的网络。举一个例子,在1000维空间中最长的距离仅仅是1000个单元,在1014个点的2