统计学习杂谈(一)——模型社会

来源:百度文库 编辑:神马文学网 时间:2024/04/30 09:54:57

模型的社会(model society)

    在机器学习的世界里,主体就是被人赋予了某种智慧形式的“模型”,既然人们能够让模型具有智慧进行自主的学习,那么人们同样能够让这些模型结成某种群体结构——乃至更高级的社会结构,让模型群在一定的交互环境中成长。这里对模型群体的演变和社会发展的关系进行一些肤浅的探讨。

 (一)共同决策(decision together)

   在人类的社会活动中,最简单的莫过于基于“少数服从多数”原则的“投票决策”了:当一群人为干什么事情争论不休的时候,一种简单又最能被大家所接受的形式就是大家进行投票,然后选择干最多人支持的事情。在统计学习中,Multi-model voting就是这种简单原则的体现。可是,最多人支持的东西就是最好的吗?不要忘了一句很著名的谚语“真理往往掌握在少数人手中”。基于这个原理,又出现了另外一种决策方式“精英决策”——通过一定的评比,选出最好的人,让他代表大家做出决策,对于统计学习,相应的典型的策略就是Cross Validation。这两种极端的方式,都有着很明显的优缺点:投票机制,要广泛发动群众投票,费时费力,效率不高,而且往往多方掣肘,导致决策有明显惰性,裹足不前,但是投票的决策稳定,能反映大多数需求,不容易出轨;精英决策,高效果断,进取性强,但是完全依赖一个人,导致决策随心所欲,欠缺稳定,风险很大。为了克服这两种决策方式的弊端,有两种折中的方式:第一种,就是给不同的人不相等的投票权,一方面多倾听专家见解,又照顾群众的需要,这就是现在统计学习里面用的很多的weighted voting。第二种,就是不同需要的群体分别选出自己的精英,由一群精英共同决策,以达到平等和效率的平衡。在政治学术语中,叫做“代议民主”,统计学习里面叫做hierarchical decision。

    决策是推动社会发展的重要活动,但是,我们想过没有?每个人在投票时的决策是怎么形成的,是受什么影响的呢?这些每个参与投票的人是怎么培养出来的呢?每个社会成员的平时的观察和实践,以及社会成员之间的关系和互动,对于每个成员的成长有什么影响呢?因此,要真正研究一个社会,我们不能只把眼睛盯着决策时刻,更重要的是关心决策背后的社会构成,社会关系以及社会运动形式。在人类社会如此,在模型的社会,对于模型之间的联系,模型的相互作用,和模型群的联合演变等等论题的关怀,同样对于我们营造一个和谐而强大的模型集体有着重要的意义。后面会逐步探讨这些问题。

(二) 模型社会如何运动 (the activity)

   在讨论之前,先提出一个几个大前提。嗯,听起来有点像著名的科幻小说中的“机器人三定律”:

   第一前提,模型的社会“绝对听命”于控制他的人。他们依据人的指令去执行各自的学习和工作计划,并且是尽自己最大的能力去执行。绝对不会因为报酬不足而怠工,或者耍小性子不听话。而且在它们身处的机器的寿命以内,能够连续不断不知疲倦地工作。由于人和模型之间的这种“单向支配”关系,因此模型和人之间不存在nontrivial的互动,所以模型和人的关系在下面的讨论中就忽略了。

    第二前提,模型的社会是一个“守法”的社会。在一个系统中,所有的模型都是为了一个共同的目标运行的,虽然它们的知识背景,对世界的观察方式,以及身处的样本环境各不一样,但是他们不会做出诸如“故意攻击其它模型”或者“故意破坏社会秩序”之类的罪行。人可以给他们设置一些规范来约束和指导他们的行为,但是不必担心他们去“违反法律”。不过,这里只是假定他们不会有“主观恶意”,但是由于能力和知识局限,他们可能犯错误,并且他们的错误认识可能沿着他们直接的交流渠道扩散,因此对于错误的辨别和抑止将是一个重要的问题。关于这个问题,我们的改革开放的总设计师给我们指出了一个重要的法宝“实践是检验真理的唯一标准”,因此我们虽然允许模型之间把各自学到的知识通过“非实践性”的途径传播(比如我们在书本上学知识),但是这些知识必须最终通过“实践”的方法进行检验。这一点需要通过一定的“法律制度”加以实现。

    第三前提,模型的社会是一个“积极而善良”的社会。模型社会的运动有一个终极目标,整个体系的发展将朝向它发展。但是,对于一个困难的目标,是需要分阶段实现,每个局部都有一个“局部目标”,这个前提指出,在给定目标的指引下,模型群体的运动将朝着接近目标的方向发展,而不是背道而驰,开历史的倒车。
     

   需要说明的是,每个局部的目标往往需要两部分共同组成——“功利目标”和“道德目标”。功利目标引导“模型”们去为实现最大利益而学习和工作,道德目标则是着力维护模型之间的良性关系以及使得模型的走向不至于因为过分最求眼前利益而偏离主方向。这就是媒体中常常宣传的“物质文明和精神文明两手抓”的问题。由于精神建设不足导致社会问题丛生,对于这点,其实我们在现实生活中是有着很深刻的教训,因此当我们营造模型社会的时候对此要非常注意。
     

    回到数学上来,这就是一个optimization问题的formulation和implementation,事实上任何一个恰当的优化算法都能保证第三前提的满足,对于模型社会的设计者来说,关键是formulation的问题。许多研究中,人们已经发现在formulation中加入regularization是一项保证不致过早陷入local optima的重要手段,这个regularization term从社会运动的角度说就是一种软性的道德约束,因此某些literature中对加入regularization的做法叫做"learning with conscience"(有良心的学习)。

    这三个前提总体上说并不矛盾,但是在某些地方有可能出现矛盾的情况,这个时候,第三前提服从第二前提,第二和第三前提服从第一前提。

    模型毕竟不是真正有生命的东西,模型社会要运动起来,需要人的“第一推动力”:人通过设置一些规则和发展目标,然后在某个初始状态下让模型社会系统开始运作。在不破坏前面说的大前提的条件下,模型的运动其实是“高度自治”的。至于模型社会最后是成功到达“世界大同”还是遭遇“万世之劫”,就和人设置的规则和目标是否合理有很大关系了。对于允许随机性存在的体系,偶然因素也可能扮演重要角色。

    早期的时候,人们希望模型按照确定性的道路向前走,但是,在统计学习的最近发展中,人们开始认识到随机性的重要意义。因为人类事实上是在一个未知的世界探索,固定的走向未必是最好的,通过对模型的随机构造,和对前进路线的随机化干扰,模型将能在运动过程中接触到并且积累丰富的知识。并且在一个多样化的探索氛围中,更有可能发现更优异的状态。对于一个模型社会来说,随机构造更是产生多个不同个性的模型的重要源泉,也是社会多样化的根基所系。在数值优化领域,stochastic annealing和genetic algorithm已经显示出对比于传统非随机方法在搜寻全局最优上的优势,而在统计学习来说,随机化的方法还在非常初级的萌芽状态,而且备受争议。但是我相信,通过随机化构造一个具有多样性的模型群体,并且通过合理的引导,共同努力去探索目标是一个非常有promising的approach,而这种信念根植于这样的观察:在多样化的社会中创造的巨大的社会进步。