罗辑思维：最优策略是如何产生的

by 互联网 · 2013 年 09 月 23 日

罗辑思维：最优策略是如何产生的

最优策略是如何产生的

在互联网这个原始丛林中：最优策略是如何产生的呢？

艾克斯罗德（Robert Axelrod）在开始研究合作之前，设定了两个前提：一、每个人都是自私的；二、没有权威干预个人决策。也就是说，个人可以完全按照自己利益最大化的企图进行决策。

艾克斯罗德做了一个实验，邀请多人来参加游戏，什么时候结束游戏是未知的。他要求每个参赛者把追求得分最多的策略写成计算机程序，然后用单循环赛的方式将参赛程序两两博弈，以找出什么样的策略得分最高。

第一轮游戏有14个程序参加，再加上艾克斯罗德自己的一个随机程序(即以50%的概率选取合作或不合作)，运转了300次。结果得分最高的程序是加拿大学者罗伯布写的”一报还一报”(tit for tat)。

这个程序的特点是：

第一次对局采用合作的策略，以后每一步都跟随对方上一步的策略，你上一次合作，我这一次就合作，你上一次不合作，我这一次就不合作。

艾克斯罗德还发现，得分排在前面的程序有三个特点：

第一，从不首先背叛，即”善良的”；

第二，对于对方的背叛行为一定要报复，不能总是合作，即”可激怒的”；

第三，不能人家一次背叛，你就没完没了的报复，以后人家只要改为合作，你也要合作，即”宽容性”。

为了进一步验证上述结论，艾氏决定邀请更多的人再做一次游戏，并把第一次的结果公开发表。第二次征集到了62个程序，加上他自己的随机程序，又进行了一次竞赛。结果，第一名的仍是”一报还一报”。

艾氏总结这次游戏的结论是：第一，”一报还一报”仍是最优策略。第二，前面提到的三个特点仍然有效，因为63人中的前15名里，只有第8名的哈灵顿程序是”不善良的”，后15名中，只有1个总是合作的是”善良的”。可激怒性和宽容性也得到了证明。

此外，好的策略还必须具有的一个特点是”清晰性”，能让对方在三、五步对局内辨识出来，太复杂的对策不见得好。”一报还一报”就有很好的清晰性，让对方很快发现规律，从而不得不采取合作的态度。

罗胖曰：

不要忽略这个实验的前提——

1，每个人都是自私的。

2，每个人都有自由意志。

所以，在教堂和官场，也许还可以有别的最佳策略。

推荐文章