《复杂》读后感3500字
\第一驱动\ 系列.
有情怀有眼光的编辑团队, 甄选出的人类智慧之精华.
单是入选系列, 就已经代表了品质.
一旦开卷, 熟悉感扑面而来.
..
.
~
[ 热2 ]
对于, 热2定律是否是真实的物理规律 还是 只是统计学的一个花招 的争论, 由来已久.
生命是否违背热2, 从未消停过.
其中一个case是 Maxwell demon: 妖可以在几乎不输入能量时, 减少系统的熵.
结论是:
麦妖是要做判断和记忆运算的 -- 凡是 记忆擦除运算 都会造成熵增, 抵消系统的熵减.
..
.
[ entropy ]
热力学熵 (克劳修斯)
在19世纪, 热力学在工业的推动下, 快速成长起来.
最开始只是认为它是对于浪费掉的能量 的一个热力学量度.
Δs = ΔQ/T (Q热量, T绝对温度)
玻尔兹曼熵
直到后来玻尔兹曼发现了其信息属性. (遗憾的是, 其思想太过反直觉, 因而不容与学界. 大哥最终悲惨自戕.)
s = k log(W), W 为样本的可能微观状态数量, k 为玻尔兹曼常数.
信息熵
Claude Shannon在此基础上, 建立了 信息论, 并提出了与之相似的 信息熵.
..
.
[ calculation ]
the universe is calculation. 这是一个相当反直觉的陈述.
1900年巴黎国际数学家大会上, 德国大师David Hilbert提出了23个 重大问题.
其中, 乐观的认为 数学是完备的, 且 数学是自洽的.
然而, 在短短几个小时后, 就被25岁的 Kurt Godel当场打脸 -- 数学如果是一致的, 就不是完备的.
即, Godel不完备定理.
而对于 是否有明确程序判断命题是否可证, 23岁的Alan Turing给出答案为: 否!
由此引发了 Turing machine -- 一种能进行任何数字和符号运算的机器, 信息处理机.
..
.
[ complexity ]
复杂性如何定义? 似乎一目了然, 却又莫可名状.
不过有三个衡量方向: 1多难描述 2多难构造 3组织形态如何.
1 描述难度
人类有30亿的碱基对中, 只有2%组成了gene (25000个). 其中非基因部分又称 \非编码区\, 其作用包括: 防止染色体解体, 功能调控, 或未知, etc.
若以 基因数量 衡量复杂性, 人类基因还少于变形虫.
以 Shannon entropy 来衡量, 也有困难 -- 比如, 大脑的复杂性, 很难被转化成 信息.
1969年因 基本粒子标准模型 而获nobel的大神, the Quack & the Jaguar 作者(理论物理大牛居然写书也这么好看! damn!), Murray Gell-man 提出 effective complexity: 需要先用最简有效方式描述, 再衡量其复杂性 -- 最有序, 和最随机的, 复杂性最低.
而科学研究, 就是找到理论和解释, 和将信息压缩的过程. 再加上Ockhams razor.
2 构造难度
数学家Bennett提出了 logical depth, 即 构造该物的难度, 来衡量复杂性. 并认为, 逻辑深度之物, 本质上都是长期运算和动力过程的产物. 问题是, 想法很棒, 就是没法操作.
80年代末, Heinz Pagels提出 thermodynamic depth. 思路也是基于 构造难度, 其定义是 生成该物的全部时间序列, 及其过程所消耗的热力源和信息源的总量.
还有一些基于信息论, 计算理论, 分形等的复杂性定义, 不下40种.
(fractal的定义, 因人而异, 并非一定是直观的 自相似, 但大体上都指 在任意尺寸维度都有细微的结构.)
3 组织形态
1962年, (政治学, 经济学, 心理学)大神Herbert Simon提出 系统复杂性可用 degree of hierarchy (层次度) 来衡量 -- 复杂系统由子系统组成.
高层功能的有效运转, 依赖低层系统的完善和完整.
..
.
[ cellular automaton ]
冯.诺依曼机 是以cpu, 内存, 硬盘位基本模式的计算机模型, 从创立之初就奠定了现代计算机的架构, 一直没变. 它本质上是一个串行序列的连续计算.
与之差异的, 是 cellular automata(元胞自动机), 指大规模单元的并行统计运算.
(蜂群, 和大脑, 就是以 cellular automaton 的方式在运算.)
讽刺的是, 人们为了区别, 称之为 反冯诺依曼机, 然而它却又是变态冯诺依曼本人创造的 -- 并证明了, CA也是general turing machine (全部cellular的状态即为一个时序节点).
(Turing证明了, 存在General Turing Machine. 冯诺依曼证明了, 自复制机, 也是General Computer.)
最简单的 CA 是1970年, 数学家John Conway创造的 he life game\: 二维格子阵列动态系统.
规则: 1创生(旁活=3), 2孤独死(旁活<2), 3挤死(旁活=4)
更复杂的模式不是没想到过, 只是运算量太大, 几乎无法实现.
另一个天才的变态Stephen Wolfram (1959年生于London, 15岁发表物理学论文, 创造了知识体系搜索引擎Wolfram Alpha那个神) 创造了 一维the life game, 并发现了4中模式.
其中规则30(初始条件), 被用于生成伪随机数, 并申请了专利.
很难证明每个规则是否 GTM (Wolfram助手证明了规则110是GTM).
2002年, Wolfram提出了 The Principle of Computational Equivalence (运算等价性原理), 有4则:
1 自然界的过程, 皆为 计算
2 general computing, 在自然界广泛存在
3 general computing 是自然系统或过程的复杂性上限 -- 没有 不可计算 的行为
4 自然界各种过程实现, 在计算复杂程度上, 几乎等价
..
.
[ calculation ]
生命活动被越来越多的被看作 计算.
\免疫\
首先, 淋巴细胞(白细胞的一种) 表面布满各种受体, 可以适配不同形状的靶向分子(抗原)结构 -- 识别出了抗原, 像挂钩一样与之接合.
当接合数量超过某个阈值, B细胞就被T细胞激活, 被送到淋巴结, 大量复制, 释放受体到血液中.
\蚁群\
蚂蚁的大脑很小, 只能执行非常简单的算法任务 -- 比如, 发现食物, 返回巢穴, 沿途留下 pheromones(信息素), 其它蚂蚁会沿着信息素寻去, 如果靠谱, 就会得到强化.
蚂蚁相遇, 会通过触须进行简单的交流 \我正在做什么任务\, 然后会根据环境的需求, 和遇到同类执行任务的概率, 调整自己的工作.
..
.
[ model ]
模型, 是我们人为创造出来的思维抽象或简化, 是我们1理解(解释) 和2预测世界的框架.
game theory 是一个有效的框架和(许多互动场景的)简化模型.
在prisoners dilemma 中, nash equilibrium 是 背叛, 即 最大数学期望策略.
but! 但是, 这只适用于 单次.
而对于多回合博弈, 最佳策略则是 合作 -- 真人实验, 或遗传算法.
尤其当群体存在 记忆 时, 性本善 + 赏善罚恶, 产生了最佳的效果. 甚至可以扭转 作恶者 的策略逻辑, 迫使其就范.
(一个有 良好秩序道德 的体系, 更容易让赏善罚恶发生正面激励效果. )
而参与者 信号明确 且 原则如一, 会更快速的引导周围博弈者进入稳定的策略模式.
对于没有记忆的 元胞 网络 (或生物网络, 比如蚁群), 其 分布式状态 本身就承担着 记忆 的功能, 时长远远大于单体记忆, 甚至寿命.
相对于混乱和高流动的环境, 稳定的环境 更容易形成群体长期记忆, 和稳定的良性规范 -- 比如小村庄相对于大都市.
..
.
[ network ]
真实世界网络大都有两个特点:
1小世界(分布式) 2无尺度(自相似, 分形)
自相似不仅仅体现在结构上(连接分叉), 也体现在统计上(链接节点数量成幂率分布).
分布式 注定了存在中心节点和长程传播路径, 确保了整体连接效率和成本的最优平衡. (比如婴儿大脑.)
\交通网络\
\神经网络\
\代谢网络\
大部分细胞都有上百种代谢路径-- 每个节点是一租代谢的产物可能性. 全部可能性流程, 组成一个网络. 同样, 也符合幂率.
\流行病\ (性传播疾病), \性关系网\
\食物网\
\连锁失效\
网络中的关键节点故障, 导致压力过度集中中在另一路径, 导致过载失效的级联扩散效应.
\preferential attachment\
无尺度(自相似, 幂率特性) 网络是如何产生的?
1999年俩物理学家提出了一种网络生长机制: preferential attachment(偏好附连) -- 链接多的节点, 获得新的连接的可能性更高 (朋友多的人, 更容易交到新朋友).
PA不一定是所有自相似(幂率)网络的成因. 也有其它方式. 但其核心都是the Matthew effect -- 自因果. (这在 傅渥成 的 临界 一书中也有提到.)
..
.
[ proportion ]
生物不是封闭系统.
相反, 是个临界态的开放系统. 能量和物质流过, 转化为低熵的信息.
体型与散热, 并不与体重成正比 -- 平均功率时不同的.
但, 普遍认知的 \功率正比于表面积\ (或体重的2/3次幂), 也与数据不符 -- 真实的数据是3/4次幂, 即 Kleibers Law. (就是说, 体型较大的动物, 代谢率比表面积的限定要高.)
神奇的是, 不仅仅对哺乳动物成立, 对于鱼类, 植物, 甚至单细胞生物都同样适用.
类似的 \quarter-power scaling laws / 四分幂比利率\:
~寿命与体重, 呈1/4幂率.
~心率与体重, 呈-1/4幂率.
原因? fractal 是产生幂率的模式.
身体的大小, 受限于代谢系统 向细胞输送养料 的3能力.
理论假设: 进化已经将 养料输送 的效率和时间优化到极致. 因而, 输送养料的 最小单元 是一致的.
(实时也是如此, 所有动物的毛细血管尺寸相同. )
以此(能量时间最优, 终端单元一致, 的分形结构)为假设, 计算得出, 任意尺寸的 \代谢输速率\ 与 体重 呈3/4幂率分布.
关于单一这事儿, 学界还有极大争议. 研究越细, 就越多声音跳出来称: \不可能有单一理论解释如此纷繁\.
..
.
[ gene ]
gene是什么?
DNA转录RNA构造蛋白质实现生物功能, 只是故事的一部分.
还存在一些普遍误解:
1 gene不是完全独立. 有的片段互重叠, 甚至有嵌套.
2 gene不是固定不变的. 可在染色体上(甚至染色体间)移动, 即 \jumping gene\. 于是染色体可以重排. 该变化比\基因复制错误或突变\ 产生更大的变异率, 是导致多样性的重要机制 -- 也解释了近亲或同卵双胞胎的显著差异.
3 gene不是1对1. 片段会编码不同的蛋白质. 这很反直觉. 但事实是, 蛋白质数量超过基因数量. 解释是: alternative splicing(多重剪接)和RNA editing -- 相同原料, 不同加工方式.
4 生物系统的复杂性, 来自gene网络, 而非单一gene的作用.
5 甲基化: 即使gene序列不变, 也并不代表phenotype不变. 一些片段可以被甲基化-- 关闭功能-- 并且可遗传给后代.
6 trash gene: 以前认为是没有功能的噪音, 现在发现有调控基因表达的作用, 比如gene switch.
尤其是4, \网络效应\ 基本否定了全部 \单一基因\的假设, 以及与之相关的专利体系.
而 gene switch的发现, 则很好的解释了, 为何人类和老鼠有90%, 与猩猩95%基因相同, 却在表达上如此不同.
天才的Kaufmann(先从事核物理, 后转向分子生物), 提出了所谓的 \候选的热力学第4定律\:
生物体有天然的趋向更加复杂的倾向-- 低熵体的Matthew effect.
进化论者基本分为三个流派: 1适应选择论(古典Darwinism) 2历史偶然(随机漂变+棘轮积累) 3Kaufmann的生物体天然自复杂倾向.
而作者认为, 将3者统一, 才是故事的全貌.
..
.
.
~
不得不说, 系统神作中, 女作者比例偏低.
然本书作者Melanie Mitchell, 确能位列大咖仙班.
也不奇怪, 男人思维 像微积分(单一, 少量数据), 而女性思维恰是 网状的 -- 一如本书所论的 复杂系统.
对于complexity的衡量, entropy并不胜任--复杂, 不仅仅是 负熵!
而对于生命和信息来说, 极致有序(晶体) 或 极致随机(混乱) 都是信息和复杂性低态 -- 当然, 也远离了 相变的临界.
书不单行, 本书与 傅渥成的 临界 共览, 则更具启发. 尤其是对于 秩序 vs. 复杂性 的部分.
Kaufmann的 热4 (生命天然聚集负熵), 也为理解生命的产生铺设了通路.
\生命是什么\?
本质上, 生命就是以计算(而非仅仅是动力学)为核心的, 复杂性聚集 -- 无论其形式是碳, 硅, artificial neural network, 还是其它. 理解生命, 必将借助复杂系统, 信息计算, 等框架, 而主流物理学显然不足.
确为神作, 乃理解进化和生命的基础思维框架.
圣贤庸渣, 此书中圣, 当之无愧!
.