进化如何学习


【序】

IPL在NTU办了一个“复杂性系统——无声的转变”主题的会,3天时间不长不短,但是来人五花八门:有工业界的,有退休的企业中层,有DSO和MINDEF的管理人员,物理学家,作家,研究“社会交流”的人类学家,研究“宗教作为复杂系统”的神学家,当然,也有各个领域的PHD学生。

因为“复杂性系统”领域的人员如此“复杂”,演讲人的报告我也经常如坠云雾,但这个会议确实是一个拓宽视野的好场合。至少布达佩斯大学的“理论进化生物学家” Eörs Szathmáry (这个title是不是有点玄乎) 的报告“How can Evolution Learn”(也是纪念他和Richard A. Watson教授在Cell上的同名文章)就让我大开眼界,灵光乍现,不明觉厉。本着“他山之石,可以攻玉”的原理,我想我还是趁没有忘干净,把我听懂的那部分记下来为好,指不定何日会再受启发。创意归其,误读归我。


【正】

首先这个报告颠覆了我可怜的高中水平的生物学(进化论)认知。“拉马克的用进废退论是错的,长颈鹿脖子长不是因为它总是去够高处的叶子;达尔文的理论是“自然选择,适者生存”,同时突变出长脖子长颈鹿和短脖子长颈鹿,因为短脖子没吃的所以死绝了,剩下的清一色是长脖子,种群是这么进化的。”

Eörs一开场就说,达尔文这个不全对。因为我们观察到的变异(mutation)并不是完全随机的,而是大方向正确的基础上稍稍有不同——类似金融模型里波动性不大的有趋势的随机游走(显然这个比方是我自己打的)。这怎么解释呢?(解释之前好像先取了个绚丽的名字——“适应性进化 adaptive evolution”)

其实也很好解释,允许我作为外行武断的引入“宏观进化”和“微观进化”的概念——微观进化研究的基因和表型层面局限在一个物种和很少的世代之间(例如孟德尔的黄圆绿皱9:3:3:1),而宏观进化观察整个物种的基因池。所以整个物种的基因统计状况是“存”在这个物种里的。报告之后我问了Eörs具体是怎么存的,他说是存在“B-矩阵”里。这个B-矩阵是什么我真的解释无力,它貌似是指的“性别间协方差矩阵”,详见文章1文章2。除了B-矩阵,他们还发明了G-矩阵(基因方差-协方差矩阵)、P-矩阵(表型方差-协方差矩阵)=_=我感觉我需要休息。

存在物种里面就成了参数嘛,自然选择就相当于修正参数的数据嘛。是不是感觉有点熟,因为下面真要爆炸了:进化和机器学习其实是一回事!incremental adaptation和reinforcement learning只是不同领域一个东西的黑话嘛,识得唔识得呀 😉 你们看看这个analog对应的多完美——贝叶斯公式和自然选择公式

2A189437-0099-44B6-9291-75DA427C2A02

如果你们觉得,Eörs是生物学家,安能语计算机的事儿,那Geofferey Hinton你们总该信对不对~_~··· 在做了数值模拟之后,Hinton写了这么一篇文章表示“学习真的指导着进化过程”。其实Hopfield网络的灵感就来自于神经科学中的“赫布理论”——神经元之间的连接结构在持续重复的刺激突触之后得到了巩固,突触真的是越用越发达,不用就消失的。而且赫布理论在某些方面还过于简化了:

突触的可塑性不仅仅发生在神经元A和B之间,也会影响邻近的神经元。这是因为赫布学习对于突触的改变,取决于逆向信号对于前突触神经元的作用。通常传递逆向信号的化合物是一氧化氮,具有高度的可溶性和扩散能力,常常会影响到邻近的神经元。这一类扩散性的突触改变机制,被称作集结学习(Volume learning)—— Wikipedia again

这个集结学习感觉还没太听说过,不知道会不会有这个模型的新ML方法发展出来。

另一个Eörs提到的问题是自然界中很多系统是模型化为极限环包络的。例如洛特卡-沃尔泰拉方程

        

中的捕食者和猎物数量此消彼长:所以自然界常常重复选择表型,从而形成“记忆”,这是神经联结主义的观点。而且基因型和表型的关系远远不是显性隐性这么简单。如果以达尔文和唐纳德(其实我并不知道这个唐纳德是谁)作为自然选择的目标表型,那么即使一开始基因层面的表达是随机的,随着时间推移,成年后会发展出哪种表型也将很快决定下来:

09E3C4EE-1C38-4EB6-8894-395FE0A11C4C

不仅如此,基因型中的信息也不是静态的,而是随着生物体成长而发展变化。一旦某种表型形成了记忆,成长过程可以从部分的胚胎表型中发展出完整的成年表型(我不太理解这里的生物学意义是什么),就像:

3681ECFF-DA28-417B-B1CC-70B81F7A03C5

一个此类理论的佐证是,实验已经证明了恢复以前有过的表型,比发展出新的表型需要的时间更少:如果人类的进化轨迹真的如题图所示,那么从信息时代的驼背键盘侠进化到直立状态也比大猩猩进化成直立状态要快得多(因为在历史上直立过)。

最后一个论点是。。。我说不清楚了,反正进化是一个复杂的过程。物种的进化(evo)、成长(devo)、个体的适应(ego)相互作用,形成了自然选择、表型变异、基因遗传的万千现象,直接上图:

7C90046D-B572-4EFF-8319-F959871B080A

我能回忆到的内容大概就是这些,虽然这些speakers我一个都不认识(确实隔行如隔山啊),但感觉都是Big Name,一个个Nature, Science发得不要不要的,有点期待明年的会议“复杂性系统——因果性与现实世界”还有机会去参加呢~


【跋】

今天[AlphaGo vs. 李世石] 第一局胜。终于见识了什么叫搞个大新闻。至少中国网民(在百度贴吧里?)集体高潮了一把(个人觉得这种高潮更像早泄)。学界在面对业界巨擘、媒体和民科时依然发声无力。天下合久必分,分久必合;泡沫时而鼓起,时而幻灭。希望大家不要太快把AI的泡沫吹破,如果被搞出个“第三次低谷”,以后本人找不到工作岂不是很惨。


 

 

发表评论

电子邮件地址不会被公开。 必填项已用*标注