实证经济学的方法论

来源：百度文库编辑：神马文学网时间：2024/04/25 16:15:02

MILTON FRIEDMAN
在凯恩斯的名著《政治经济学的范围与方法》一书中，约翰. 梅纳德·凯恩斯对实证科学及规范科学作了区分。他认为：“一门实证科学……是关于什么是这一类问题的系统的知识体系；而一门规范科学（或称为管理科学）……是关于什么应该是这一类问题的标准的系统的知识体系……；是一门艺术……是为达到某一特定目标而设立的原则体系”；他指出：“这二者之间的混淆带有很大的普遍性，并成为很多殆害大分之谬误的根源”；他还强调了“创立一门准确无误的政治经济学的实证科学的重要性。”
本文将主要对某些方法论问题加以阐述，这些问题产生于人们为创立凯恩斯所倡导的“准确无误的实证科学”所作的努力，其中特别涉及的是，如何确定某一被提出的假说或理论，是否应被暂时地接受为“关于什么是这一类问题的系统的知识体系”的一部分。但是，凯恩斯所悲叹的这种混淆仍然如此之普遍，并极大地妨害了人们对经济学可以是——而且部分地确实是——一门实证科学的认可。所以，我们最好在本文的开头先论述一下实证经济学与规范经济学之间的关系。
1．实证经济学与规范经济学之间的关系
在某种程度上，实证经济学与规范经济学之间的混淆是不可避免的。在几乎每一个人看来，经济学所研究的问题与其自身是极为攸关的，而且是困于他们自己的经历与能力的范围之内；这一现象便是不断的广泛的分歧的根源，并成了频繁立法的契机。那些自许为“专家”的人们意见迟异，而且我们很难保证他们都是毫无偏见的。无论如何，在那些事关重大的问题上，即使这些“专家”们几乎一口同声而且毫无偏见，我们也很难完全不加考虑地接受他们的观点。实证经济学的结论似乎是，而且确实是与重要的规范问题密切相关的，是与应该做什么及如何取得某一既定目标等问题密切相关的。门外汉与专家一样，都在无一避免地试图改造实证结论以适应为他们所极力坚持的规范性的先入之见，并当这些实证结论的规范性含义——或所谓的这些实证结论的规范性含义——不合他们的口味时就否定这些实证结论。
从原则上说，实证经济学是独立于任何特别的伦理观念或规范判断的。正如凯恩斯所说，它要解决的是“什么是”，而不是“什么应该是”一类的问题。它的任务是提供一套一般化体系，这个一般化体系可以被用来对环境发生变化所产生的影响作以正确的预测。这一体系的运行状况可以通过它所取得的预测与实际情况相比的精确度、覆盖率及一致性等指标来加以考察。简而言之，实证经济学是，或者说可以是一门“客观的”科学，这里“客观”一词的含义完全等同于任一自然科学上的定义。当然，经济学所涉及的是人与人之间的关系，而且调查研究者本身就是被调查研究的事物的一部分。与自然科学相比，调查研究者与被调查研究的事物之间更具有本质上的联系。上述事实在使社会科学家得到了一系列自然科学家无法得到的数据的同时，也使社会科学家在实现客观性的目标上遇到了特有的困难，但是在我看来，这些都不是这两类科学之间的根本差异之所在。
另一方面，规范经济学及经济学的技术也不可能独立于实证经济学。任何政策结论都不可避免地要基于对采取某一种而不是另外一种行动将产生的影响所作的预测，而预测则必须明确或不明确地基于实证经济学。当然。在政策结论与实证经济结论之间并不存在着—一对应的关系；如果有的话，那么则不必另外再创立一门规范经济学了。两个不同的个体可能在对某一个别立法的结果问题上意见一致。但其中的一个可能认为这些结果有利于平衡，进而拥护这项立法；而另外一个却可能认为这些结果是不合意的,进而反对这项立法。
然而，我对这样一种看法提出疑义：这种看法认为，在目前的西方世界，特别是美国，在毫无偏见的公民之间所存在的有关经济政策的分歧，主要地来源于人们对所采取的行动将带来的经济影响的不同预测。而这些分歧从原则上说是可以通过实证经济学的发展而予以消除的。持这种看法的人不认为人们关于经济政策的分歧是来源于人们在基本的行为准则方面的根本性分歧，来源于人们在最终可能出现的矛盾双方问题上的分歧。一个明显的而且并非不重要的事例就是最低工资限制问题。尽管在形式上存在着对这一立法的褒贬纷争，但人们在为所有的人争取到一个“生存工资”这一政策目标上却形成了根本一致的意见。而且“生存工资”这一含义模糊的概念在这一类问题的讨论中得到了广泛的运用。人们的意见分歧主要产生于人们在预测方面的隐含的或明确的分歧。这一预测涉及的是最低工资限制这一特殊手段在实现目标中的功效问题。该项立法的支持者们认为（即预测），法定的最低工资通过提高那些工资收入在最低工资线之下的劳动者的收入，及提高那些工资收入在最低工资线之上的劳动者的收入，进而消除了贫困。而且与此同时并不存在完全失业人数增加及就业条件因该立法的实行而恶化一类的消极作用。而该项立法的反对者们认为（即预测），法定的最低工资通过失业人数的增加及就业条件的恶化而加重了贫困现象。而且这一消极作用不仅抵消了该项立法给在业者工资收入所带来的有益影响，市且还可能使之状况更加恶化。人们在该项立法的经济影响问题上的看法一致，并不能使人们在该项立法的合意性问题上看法一致。这是因为仍然存在着人们在该项立法的政治或社会影响等问题上的分歧。但是，在目标一致的情况下，人们一定会经过漫长的道路而趋于一致的。
人们在工会的适当作用及地位的问题上的各种不同意见，及人们对直接的价格与工资控制的合意性及关税的合意性等问题的各种不同看法，都是以实证分析中的一些密切关税的分歧为依据的。人们对所谓的规模经济的重要性的不同预测，在很大程度上说明了人们在工业部门中政府的全面控制的合意性及必要性，甚至在社会主义（而不是私人企业）的合意性及必要性等问题上的不同看法。而且关于这一方面问题的事例举不胜举。当然，我的这一主张——即在西方社会中人们在经济政策问题上的主要分歧具有如上所述的性质——其本身就是一种“实证”阐述，它的正确与否还有待于经验证据的检验。
如果这一主张是合理的，那么它意味着。人们在“正确的”经济政策问题上的一致意见较少地取决于规范经济学的进步，而更多地是取决于这样一种实证经济学的发展：它所得出的结论不仅而且值得受到广泛的赞同。它还意味着：对实证经济学与规范经济学加以严格的区分的主要原因就在于这样一种贡献，即这一区分促进了人们在政策问题上的意见一致。
2．实证经济学
实证科学的终极目的就是要发展这样一种“理论”或”假说”，使之能够对尚未观察到的现象作出合理的、有意义的（而不是老生常谈的）预测。总体说来，这样一种理论是一个由两种元素构成的复杂的混合体。部分地说，它是一种‘语言”，旨在促进“系统的、有组织的推论方法”。部分地说，它是一系列假说的综合体，旨在从纷繁复杂的现实中抽象出事物的本质特征。
作为一种语言，理论不具有任何实质性的内容；它是一系列同义反复的词语的综合体。它的作用在于为经验材料的组织及对经验材料的理解提供文牍服务；而且用以检验这一服务质量的标准也是那些适合于文牍体系的标准。对这些事物的种类所下的定义清楚而准确吗？对这些事物种类的划分穷尽了吗？我们知道每一单个项目都应归于哪一类吗？或者，在这其中是否存在着相当的似是而非现象呢？人们对大标题及次标题体系的划分是否已达到这样的完备程度，从而使我们能够迅速地找到我们所要的条目呢？还是由于混乱不清而使得我们不得不一处一处地加以涉猎呢？我们将要研究的条目是否都已编排到一起了呢？条目的编排系统是否已避免了交叉重复呢？
对上述这些问题的回答部分地取决于逻辑上的考虑，部分地取决于事实上的考虑。标准的逻辑准则本身可以说明某一特殊语言是否是完全的及连续的，即这一语言中的命题是“正确的”还是“错误的”。事实上的证据本身可以说明“逻辑编排系统”的种类能否在实际中找到有意义的对应物，即在分析具体问题中的某一特殊种类时，这些条目划分是否能起到一定的作用。“供给”与“需求”这一简单的事例既说明了这一点也说明了前面所谈到的一系列逻辑分析问题。作为经济理论这种语言的构成要素，供给与需求是两大主要类别，影响产品的相对价格的因素及影响生产的因素都被划到这两大类别中来。这种二分法的实用性取决于“它在经验资料方面的高度概括性，即如果我们把任一问题中影响需求的力量与影响供给的力量分别开列出来的话，那么我们将会得到这样两类资料：它们之间很少有哪些项目是共同的。”现在，这样一种概括对于象消费品终极市场一样的市场来说是合理的。在这一类市场中，可以被看作是需求产品的经济单位与可以被看作是供给产品的经济单位之间存在着明确的、严格的区分。很少存在这样的混乱现象：从某一方面看来，某一特殊因素应被划归影响供给的项目之类，而从另一方面看来，又应被划归影响需求的项目之类。而且也很少有必要考虑两个类别之间的交叉效应（即交叉重复）。在这类问题中，在标题“供给”与＿“需求”下对有关因素进行编排所需要采取的步骤既简单又明了，从而极大地简化了我们所面临的问题，而且这种简单明了的方法还防止了在其它情况下可能出现的差错。但是，这种概括并不是在任何情况下都是合理的。例如，在一个主要是投机性的市场中，对于价格的每日波动来说，这一概括就是不合理的。例如，一则关于增加超额利润税的谣传，对于股票市场来说，是应当看作是主要对今天的公司股票供给发生影响的因素呢，还是应当看作是主要对今天的公司股票需求发生影响的因素呢？在类似的情况下，几乎对于每一因素来说，将其划归“供给”标题之下的理由大约与将其划归“需求”标题之下的理由一样多。这些概念仍然可以使用而且不可能是毫无意义的；它们仍然是“正确的”，但与在第一个例子中的情况相比它们的用处则明显地要小得多，这是因为它们没有有意义的实证对应物。
作为一种实证假说体系，理论应该通过其对它意在加以“解释”的那一类现象的预测能力来检验。唯有实际证据才能表明该理论是“正确的”还是“错误的”。或者更为准确地说，唯有实际证据才能表明该理论是被作为合理因素而暂时地得到“接受”呢，还是遭到了“拒绝”。正如我下面将更为详细地阐述的那样，对某一假说的合理性的唯一有关的检验，是将其预测与实际情况所作的比较。郊果该假说的预测（“频繁地”或比来自于另一假说的预测更为经常地）与实践相抵触，那么该假说则遭到了否定；如果该假说的预测没有与实践相抵触，那么它则为人们所认可；如果该假说业已多次成功地避免了可能出现的抵触现象，那么它则具有极大的可信赖程度。实际证据永远也不可能“证实”某一假说的正确性，它只能通过无法将该假说驳倒来显示该假说的正确性。当我们说到某一假说已经在实践中得到了确认时（并不十分准确），我们通常所指的就是这个意思。
为了避免误解，可能有必要明确一下：我们用来检验某一假说的合理性的“预测”，并不一定非得是对尚未发生的现象所作的预测，也就是说，不一定非得是对将来事件的预见。它可以是对业已发生了的现象所作的预测，但前提条件是对这一现象所作的观察尚未进行，或者是虽然对这一现象的观察业已作出。但进行预测的人尚不知晓。例如，在其它一些情况已知的情况下，某一假说预测在1906年将会有某些情况发生。如果对这一时期的史料记载所作的研究表明，在1906年某些情况确实发生了，那么该预测则得到了实践的确认。反之，如果研究表明在1906年某些情况并没有发生，那么该预测则与实际情况发生了抵触。
从这种意义上讲，某一假说的合理性本身并不足以作为对其它假说进行取舍的标准。人们可以观察到的事实在数量上必然是十分有限的，但可能的假说却是无限的。如果存在某一种假说与可得证据相一致，那么一定还有无数的假设也与这一可得证据相一致。例如，假设对某一特殊消费品所征收的一种特别货物税，导致了价格的上涨，其上涨幅度完全等同于税收的数量。这与竞争情况下稳定的需求曲线、水平的且稳定的供给曲线是一致的；但它也与竞争情况下需求曲线或供给曲线发生必要的相应移动后的斜率为正或为负的供给曲线相一致：它也与垄断情况下常边际成本及稳定的需求曲线相一致，只是为了取得上述结果要求后者具有某一特定的形状；等等，等等，无穷无尽。这一假说所适应的另外一种证据可以起到剔除上述某些可能情况的作用；但它绝不可能把这些可能性削减为一种，而独自地与这一有限的证据相一致。对那些与可得证据同等一致的假说所进行的选择，在某种程度上是任意的。虽然我们一致同意这样的观点：对选择所进行的考虑应以“简洁性”与“成效性”为出发点，但这二条标准的本身就意味着否定完全的有目的的简化。一理论越是“简单明了”，在某一既定领域内对现象进行预测所需要的初始知识也就越少；一理论越是“富有成效”，它对现象所作的预测也就越精确，而且该理论进行预测所依据的范围也就越大，同时，为了进一步研究的需要，它所要加以说明的东西也就越多。逻辑上的完整性与一致性虽然也与评判的标准有关，但只起一个辅助作用；二者的作用在于确保该假说能够正确地阐明宗旨，而且做到使每一个研究该假说的人的理解都准确无误——在这里，它们与统计计算中对数字精确度的检验所起的作用是一样的。
不过，我们对社会科学中某一特殊预测所作的检验，很少能够通过这样一种实践来进行：这种实践是经过专门设计的，意在消除被认为是最重要的干扰因素。通常，我们不得不依赖于偶然发生的“实际情况”所提供的证据来进行我们的检验、在我看来，社会科学中无法进行所谓的”有所控制”的实验，这并不能反映社会科学与自然科学之间的根本区别。这既是因为“无法控制”的实验并非为社会科学所特有（自然科学中的天文学就是一例），又是因为有控制的实验与无控制的实验之间的差异充其量不过是一个程度上的差异。没有哪一种实验是可以完全控制的，同时每一种实验中又都存在着部分的控制，这是因为某些干扰因素在整个实验过程中应保持相对的稳定．
实践所提供的证据是大量的，而且常常是确定性的，犹如经过了设计的实验一般。所以，无法指导实际情况并不是通过预测的成功来检验假设的根本性障碍。但如此得到的证据在解释上却要比前种情况困难得多。它常常是复杂的，而且总是间接的和不完全的。对这种证据的收集常常是困难的，而且对这些证据的解释通常需要进行细致入微的分析工作，同时还涉及到一系列的推理判断，而这些很少能够真正做到把握事物的真谛。“具有决定性意义”的实验所带来的大量的直接证据与经济学之无缘，的确妨碍了检验假说工作的顺利进行。但与这一情况在取得合理的结论，及在由可得证据所证明了的结论上取得一致意见等方面所带来的巨大困难相比，前一种妨碍则显得微不足道了。它使得人们对失败的假说的摒除工作进展缓慢且困难重重。这些失败的假说很少永远告别经济舞台，相反却总是一再出现。
当然，这些方面的问题并不是整齐划一的。有时，实践所提供的证据与有控制的实验所能提供的证据几乎一样地直接、大量与确定。也许，最明显的重要例证要数通货膨胀问题。这种通货膨胀证据是服务于这样一种假说的：在一个较短的时期里，货币数量的大量增加必然伴随着价格的大幅度上升。这里，这方面的证据是大量的，且为对这些证据加以解释所需要的推理判断较少。然而，尽管存在着大量的价格大幅度上涨的事例，但这些事例与货币存量的大量增加之间的本质上的—一对应关系，及在其它相关的情况下的变异程度等，决定了每一次新的通货膨胀体验都必将带来激烈的争论，而且这种争论不仅仅是来源于非职业经济学家的人民大众。反对原假说的观点认为：货币存量的增加或者是来源于由其它因素所导致的价格上涨的偶然性影响，或者是价格上涨的一个完全偶然且不必要的附带物。
检验大量的经济假说的困难性所造成的一种影响就是：它使得我们的检验工作退回到纯粹的正统或繁琐分析中去。正如我们业已阐述的那样，繁琐重复在经济学及其它科学中，作为一种专门的语言或“分析编排体系”而占有极为重要的地位。此外，同样是同义反复的正统逻辑学与数学又成了这些问题的重要工具：检验判断推理的正确性；发现假说的深刻含义；确定是否一系列被假定为不同的假说的确不可能是等价的，或者在它们之间存在着差异等。
但是，如果一经济理论想保能够预测未来，而不仅仅是描绘行动的结果，那么仅作为一个同义重复的体系是远远不够的。同样，如果一经济理论想要有别于模糊数学时，那么仅作为一个同义重复的体系也是远远不够的。而且如我们前面所提到的那样，这些同义反复的实用性本身还将最终地取决于关于将某一棘手的实际问题划归某一种类的那些假说的可接受性。
通过预测而对经济假说加以检验所具有的困难造成了另一个更为深刻的影响，那就是它使人们对经验证据在理论著作中的作用产生了误解。在下述两个虽联系紧密但并不相同的阶段中，经验证据起到了至关重要的作用：一是构造假说的阶段，二是检验假说的合理性的阶段。完整且详尽的经验资料，作为我们将通过假说而予以概括总结或“加以解释”的实际现象的代表，除在提出新假说时所具有的重大作用外，还被用来验证一假说确实说明了它旨在说明的问题——即该假说对某一现象所作的阐述并不与人们业已观察到的实际情况相矛盾。在某一假说与人们掌握的实际资料相一致的情况下，人们对该假说所作的进一步检验，是要将那些事先并不知道然而却可以从实践中观察到的新因素从假说中剔除出去，同时还要对这些被剔除的因素加以检验，以了解这些因素与其它的经验证据之间的背离情况。为了使后一种检验同前一种检验密切相关，那些被剔除的因素必须与该假说旨在说明的问题同属一类现象；而且对这些被剔除的因素所作的限定必须足够地准确，从而使得人们所作的观察能够证明这些因素是不正确的。
构造假说与检验其合理性这两个阶段之间的相互联系可以从两个方面表现出来。第一，在某种程度上可以这样说：进入每一阶段的那些特定的因素，是由资料的收集及某一特定的调查者的知识水平所决定的一个偶然现象。被用来检验某一假说的内涵的那些因素可能同样适当地属于被用来构造假说的那些原始资料，反之亦然。第二，创立一假说的过程从来都不是从零开始的。所谓的最初阶段本身也总是要涉及到对一系列早些时候提出的、以实际观察为依据的假说所进行的比较。这些假说的涵义之间的相互矛盾，成了促进人们构造新假说或修改原有假说的始动力。所以，这两个在方法上截然不同的阶段，在实际进程中又总是相辅相成、互为前提的。
人们对这一简洁明了的过程所产生的误解，主要在于下面这一表述：“该假说是为解释这一类现象而提出的。”社会科学中，对这一类现象的新证据的获得十分困难，而且对这些新证据与该假说的含义之间的一致性的判断也十分困难，这些情况使得社会科学试图作出这样的假设：其它的、更为可得的证据与该假说的合理性是同样相关的。这就等于说假定假说不仅具有“含义”，而且还具有”“假设”；这些“假设”与“现实”之间的一致性是检验该假说的合理性的标准——这一标准或者不同于通过含义所进行的检验，或者是对通过含义所进行的检验的一种补充。这一为人们所广泛持有的观点不仅是根本错误的，而且还成了更多的缪误产生的根源。它不仅没有为不合理的假说向合理的假说的转化提供捷径，相反却混淆了是非，造成了人们对经验证据在经济理论中的重要性的误解，使得人们为促进实证经济学的发展所作的智睿的探索迷失了方向，而且阻碍了实证经济学中人们在试验性的假说上一致意见的取得。
即使在一理论可以被说成是具有“假设”的限度内，即使在这些‘假设”的”真实性”可以独立于预测的合理性而接受检验的限度内，该理论的重要性与它的“假设” 的“真实性”之间的相互关系，也完全不同于我们前面所批评的那种观点所提出的内容，甚至几乎是后者的反面。那些真正重要且伟大的假说所具有的“假设”，是对现实的一种粗略的、不十分精确的、描述性的表述．而且，一般说来，某一理论越是杰出，那么它的“假设”（在上述意义上）就越是超脱现实。这其中的原因是非常简单的。如果一假说能够通过极为有限的资料而进行大量的“阐述”，即如果一假说能够从它旨在解释的那一现象周围的大量复杂且详尽的情况中，抽象出共同且关键的因素，并能保证仅在这些有限资料的基础上作出合理的预测，那么，这一假说就是意义重大的。所以，为了意义重大，一个假说在其假设方面必须运用一些描述性的技巧；既然该假说的伟大成功将证明其它许多的有关情况与该假说旨在阐明的现象是毫不相关的，那么该假说也就不必考虑并说明这些情况。
为了使这一点不那么难于理解，我们所要问的另一个与一理论的“假设”有关的问题，不是这些假设是否在描述上是“现实主义的”，因为它们从来就不是，而是这些设想对于我们已有的目标来说，是否是一个足够好的近似物。而对这一问题的回答唯有道过考察该理论是否应验，即该理论是否取得了足够精确的预测水平来进行。这样，这两种原假设为独立的检验方法合二为一。
垄断的与不完全的竞争理论，就是在经济理论中忽视上述主张的一个例子。被说成是构成新古典经济理论的基础的“完全竞争”或“完全垄断”假设，是现实生活的一幅虚假的图象这样一种观点，明确地促进了垄断与不完全竞争分析的发展，而且也大致地说明了该分析得到广泛的接受与赞同的原因。而这一观点本身，几乎全部地以这些假设的这种直接可见的不精确性为基础，而不是以从新古典经济理论中导出的预测的任何得到认可的矛盾点为基础的。许多年以前，《美国经济评论》对边际分析问题所进行的长篇累牍的讨论，是另一个虽不如前一个例子重要，但比前者更为明确的例子。争论双方的文章，在很大程度上都忽略了在我看来似乎是关键性的问题——即边际分析原理与实践经验的一致性问题，而注重于商人是否确实地通过考察代表边际成本与边际收益的表格、或曲线、或多变量函数，来制定他们的决策这样一个几乎毫不相关的问题。也许这两个例子及它们所业已揭示的其它许多事例，可以对所涉及的方法论原则问题的讨论起到判别作用，而且通过这两个例子所说明的问题也许要比其它似乎是适当的方法所能说明的问题要广泛得多．
3．可以通过一假说的假设的真实性来检验该假说吗？
我们先从自由落体法则这样一个简单的自然事例开始来进行我们的讨论。在真空中，一落体的加速度是一个常数——g，在地球上是每平方秒大约32呎——而且落体的加速度与该物体的形状、投掷方法等因素无关，这一假说已得到了人们的广泛接受。这就等于说一落体在任一特定的时间范围内所下落的距离可以用S=1／2 gt2这一公式来算出。这里， S是该落体下落的距离，单位是呎，t是物体下落的时间，单位是秒。将这一公式应用到一个从楼顶下抛的实心球上，就等于说这样抛下的那个球的运行情况就如用它在真空中被抛下时的运行情况。通过这一假说的假设来对其进行检验，可能意味着对实际气压进行测量，并确定它是否接近于零。在海平面上，气压大约是每平方时15磅。为了使这一气压差别被判定为可忽略不计的，15是否是足够趋近于零的呢？因为这一实心球从楼顶降落到地面实际所需的时间与这一公式所给出的时间非常接近，所以很明显，这一15之差足够趋近于零。然而，假定现在抛下的是一根羽毛而不是一个实心球。那么这一公式所得出的结果则是非常之不精确的．很明显，对于一根羽毛（而不是对于一个实心球）来说，每平方时 15磅完全不同于零。或者，我们再假定这一公式的应用对象是从3万呎高的飞机上抛下的一个球。在这一高度，气压绝对地小于每平方吋15磅。然而，从3万呎降到2万呎（在这一点上的气压仍然大大小于海平面上的水平）所用的实际时间却完全不同于上述公式所预测的时间——大大地高于实心球从楼顶落到地面所需的时间。按照上述公式，该球的速度应为gt，而且还应该稳定地增长。事实上，一个从3万呎降落的球是在它碰到地面以前达到它的最高速度的。而且上述公式的其它含义也都与此类同。
为了使气压差别能够被判定为是可以忽略不计的，15是否足够地趋近千零这一初始问题本身就是明显地愚不可及的。每平方吋15磅等价于每平方呎2160磅，也等价于每平方吋0．0075吨。如果没有一些外在的比较标准，则不存在对这些数字评判大小的依据。而这唯一相关的比较标准就是在一系列既定的情况下，该公式可以应用或不可以应用的气压水平。但这又在另一个层次上带来了同样的问题。“可以应用或不可以应用”的含义是什么？即使我们可以消除测量上的误差，但物体降落的实际测得时间与公式计算所得的时间，很少（如果曾经有过的话）完全相等。为了能够判定自由落体理论之“不可以应用”，这二者之间的差异必须要多大呢？下面将是进行比较的两条重要的外在标准。一个是与该理论进行比较、且在所有其它方面与该理论是同等地可接受的另一理论所能达到的精确度。另一个是这样一种标准，它只有在存在着某一业已为人们所知道的、具有更好的预测水平，然而其预测成本较高的理论的前提下，才会存在。而且更高的精确度所带来的效益（这取决于人们的使用目的），一定能够弥补取得这一精确度所需要的成本。
这一例子既证明了通过一理论的假设来检验该理论的不可能性，也证明了“某一理论的假设”这一概念的模糊性。S=1／2 gt2这一公式对于真空中的落体来说是正确的，而且可以通过对这一类物体的运行情况的分析而推导出来。所以，可以这样阐述：在多种情况下，在实际大气中降落的物体，其运行情况如同在真空中所进行的降落。如果用我们经济学中最常用的话来表述，那么上述文字立刻会被表述成：这一公式假设存在着一个真空。然而很明显上述表述并没有作任何诸如此类的假设。上述表述的真正意思是：在许多情况下，气压的存在，物体的形状，投掷物体者的姓名，投掷物体所采用的方法及许多其它的附加条件，对于该物体在一定时间内所下降的距离并无可估计的影响。我们完全可以对该假说重新进行表述，从而完全不再提及真空因素：在许多情况下，一物体在一给定的时间内所下降的距离由公式s=1/2 gt2给出。如果我们撇开该公式的历史不谈，撇开与之相联的其它自然科学理论不谈，那么说该公式假设存在着一个真空还有意义吗？就我所知，还可能存在着其它的假设体系，而能够取得这同样的公式。这一公式之所以被接受是因为它与现实相符，而不是因为我们生活在一个大致的真空里 ——不管这种大致的真空指的是什么。
与这一假说相联系的一个重要的问题，是要限定该公式可以应用的条件，或者更为准确地说，是要限定在各种情况下该公式预测的总的误差范围。的确，正如上述对该假说的重新表述中所蓄含的那样，这样的限定与该假说并不是截然不同的两件事。限定本身就是该假说的一个重要组成部分，而且它是这样一个组成部分：随着实践的不断增加，它是特别有可能被修改与扩展的部分。
在落体这一特殊情况中，还存在着另一虽仍不完善但更为一般化的理论。这一理论主要来自于人们为解释前一种简单理论中存在的误差而进行的探索；而且在这一理论中，人们可以对某些可能存在的干扰因素的影响加以衡量；而且在这一理论中，前一种简单理论只是作为一种特例而存在。然而，这一更为一般化的理论并不总是能够得到应用。这是因为，它所取得的精确度的增加可能不能弥补使用这一理论所带来的成本的增加。所以，在何种情况下前一种较简单的理论可以“充分完善地”反映现实，这仍然是一个事关重要的问题。气压是限定该理论可应用的情况的那些变量中的一个，但只是其中之一；物体的形状，使达到的速度，及其它变量也都是与限定有关的。对气压以外的这些变量加以阐述的方法之一，就是将这些变量视为决定对真空“假设”的某种背离是否是事关重大的。例如，每平方吋15磅的气压对于一支羽毛来说是截然不同于零的；但对于从一高度不大的地方下抛的实心球来说，却是可以视为趋近于零的，这些都是物体的形状所带来的差别。然而，这样的表述绝然区别于下面这种不同的表述：该理论不能应用于羽毛落体，因为该理论的假设是错误的。然而它们之间的相互关系却完全是另一种情况：对于羽毛来说，这些假设是错误的，原因在于该理论不能应用于羽毛落体。这一点需要引起大家的重视。这是因为，在限定某一理论可以成立的条件的过程中，“假设”的完全正确的运用通常错误地被理解为假设可以被用来确定某一理论可以成立的条件，而且，这一误解成了理论可以通过其假设而进行检验这一观点的主要根源。
下面我们再来看另一个例子。这一次是一个臆造的事例，旨在使之成为社会科学中的许多假说的同类物。让我们来考虑一下一棵树上叶子的密度。我提出的假说是：这些叶子的位置是这样确定的：在其周围的叶子位置一定的条件下，每一片叶子都好象有意地使它所能得到的阳光数量最大化；每一片叶子都好象知晓决定在不同的位置上可得阳光数量的自然法则，并且能够迅速地（或曰即刻地）由任一位置移到任一其它合意的且尚未被占据的位置。现在，该假说的某些更为明确的含义明显地与实际情况相一致：例如，一般来说，树南侧的叶子密于树北侧的叶子，但如本假说所意含的那样，在山的北坡，或当树的南侧为其它东西所遮盖的情况下，树的南北两侧叶子密度的差异就不会那么明显。或完全不是原来的那种情况。就我们所知，叶子不能“有计划地行事”，或者说不能有意识地“追求”什么，它们没有进过学校并学会为计算“最佳”位置所必需的科学或数学的有关法则，难道我们可以据此认为该假说是不可接受的或曰不合理的吗？很明显，该假说的这些与事实相矛盾的情况中，没有一个是至关重要的。这里所涉及的现象不在“该假说旨在阐述的那一类现象”的范围之内。该假说并没有宣称叶子可以做到上述事情，它只是认为：这些叶子的密度是同一的，就犹如它们可以做上述事情一般．尽管该根说的“假设”中存在着明显的非现实性，但由于该假说的含义与实际观察的一致性，使得该假说具有极大的合理性。我们倾向于在下述意义上“阐述”该假说的合理性：由于阳光促进了叶子的生长，所以，在阳光较多的地方叶子将生长得更加茂密，或者说将有更多的假定存在的叶子能够得以生存下来。所以，完全被动地将这一假说应用到更为广泛的情况中去所得到的这一结果，与通过将某些特定环境附加其上所得到的结果是完全相同的。这后一种说法比前面造的那一种假说更为引人入胜，这不是因为后一种假说的“假设”更具“现实性”，而且因为后一种假说的“假设”本身就是一个更为一般化的理论的一部分。这种更为一般化的理论所能应用的现象种类更为广大，而且在这一更为一般化的理论中，一棵树上叶子的具体位置不过是该理论的一个特例。这一更为一般化的理论有着更多的可能招致异议的含义，但由于该理论可适用的范围更为广泛从而使得这些含义避开了可能发生的任何抵触。这样一来，叶子生长的直接证据为来自于这一更为一般化的理论所适用的其它现象的间接证据所加强。
我们所臆造的这一假说大致说来是正确的，也就是说，仅对于某些现象来说，该假说关于叶子密度的预测达到了“足够的”精确水平。我不知道这某些现象是什么，也不知道如何去定义它们。然而，有一点似乎是明确的，那就是：在这一例子中，该理论的这些“假设”并不属于该理论的假设范围：也就是说，树的种类，土地的性质等都是可能影响到该理论的合理性所存在的范围的变量种类，而叶子进行复杂的数学计算，或从一个位置移到另一个位置的可能性问题，却与该理论合理性的范围限制无关。一个与人类行为有关的例子大致类似于我们刚才所举的那个例子。这个例子我与萨维奇已在别处引用过。现在，让我们来考虑一下一位台球行家对击球情况进行预测的问题。下述假设似乎并非毫无道理：绝妙的预测通常都是通过这样的假说来取得。这种假说认为，这位台球行家的击球活动就犹如他知晓将会给出最佳运行方向的那个复杂的数学公式一般。而且这一数学公式可以通过眼睛对角度的观察，并确定该球所在的位置等而精确地进行计算。这位台球行家通过该公式而进行闪电般的计算。然后使球按该公式所指定的方向运行。我们对这一假说的信赖并不是基于这样一种观点：台球手（即使是台球行家）可以而且确实经历过前面所描述过的过程；相反，我们对该假说的信赖是缘于这样一种观点：除非这些台球手可以通过这样或那样的方法而取得与上述过程同样的结果，否则的话，他们事实上就不是台球行家。
由这些例子进而引申出下面这个经济原说，这似乎是很容易做到的。这一经济假说认为，在许多情况下，单个企业常常是如此行事，犹如他们在有计划地使其预期成果（通常，如果理解有误的话，则称之为‘利润”）最大化，而且掌握着为成功地实现这一目的所必需的全部数据资料；也就是说，犹如他们知晓相关的成本与需求函数，可以通过他们所掌握的所有情况来计算边际成本与边际收益，并使得他们所采取的每一个行动都恰到好处地符合边际成本与边际收益相等的原则。当然，现在的商人实际上并不完全按照经济数学家所发现的方便途径来解这一联立方程体系。只不过他们这样做的可能性比叶子或台球手明确地完成复杂的数学计算，或落体决定创造一个真空的可能性要大一些。如果台球手被问到他是如何确定击球方向的，那么他可能回答说他“恰好算了出来”，但此外他还要摩擦一下兔后腿来证实一下。而如果一位商人被问到他是如何决策的，那么他可能回答说他是以平均成本来定价的，而且当市场情况发生了变化时，当然也会出现一些微小的偏差。这一表述与前一个表述几乎是同样有帮助的，但它们之中没有一个与对有关假说所进行的检验有联系。
人们对上述成果最大化假说的信赖是由一非同寻常的特征证据所证明的。在某种程度上，这一证据与关于台球手行为的假说中所引证的证据是非常相似的——也就是说，除非商人可以通过这种或那种方法而使其行为近似于与成果最大化相一致的行为，否则，他们似乎不可能长久地维持他们的生意。这里不管明显地、直接地决定商业行为的因素是什么——习惯性的反应，随机性的机遇，或难于归类的一些东西——其结果都是一样的。不论什么时候，只要这一决定因素碰巧导致了与合理的、有实际根据的成果最大化相符合的行为，则生意使会兴隆，并进而需求资源以扩大经营；反之，只要这一决定因素不能带来与合理的、有实际根据的成果最大化相符合的行为，则生意将会亏损，且只有从外部引入新资源才能维持存在。这样一来，“自然选择”过程促进了该假说合理化的实现，或者说在自然选择既定的情况下，人们对该假说恰当地概括了生存条件这一判定，成了人们接受该假说的主要依据。
该成果最大化假说的另一更为重要的证据，来自于该假说在特殊问题中的无数次应用，及在这多次应用中，该假说的含义与实际情况并没有发生抵触这一事实。然而，如果要让这一证据提供佐证那是极为困难的。这是因为它散落在无数的商业便函中、文章中，及专题著作中，而这一切主要地是与特殊的具体问题相联系，而与对该假说的检验并不相关。然而，在很长时期内人们对该假说的持续使用与接受，及未能创立一种逻辑严密、自圆其说的假说来取而代之并得到广泛的接受这一情况，间接地有力地证明了该假说的存在价值。任一假说的证据都总是由人们试图证明它与实际情况相抵触而遭到的多次失败所组成。只要该假说仍在继续使用，那么这一证据就会继续增加。而且，由于该证据的特殊性质，让该证据提供完全充分的证明是十分困难的。这已开始变成某一科学的传统及传说的一部分，后者反映在人们持有假说的坚定性方面，而不是反映在教科书中对那些未能证明该假说与实际情况相抵触的事例所进行的罗列上面。
4．理论“假设”的重要性与作用
到现在为止。我们对一理论的‘假设”的重要性问题所作的结论几乎全都是否定的：我们已经证明了一理论是不能用其“假设”的“真实性”来加以检验的，而且，一理论的“假设”这一概念充满了可疑之点。但是，如果这就是问题的全部，那么我们将很难对这一概念的广泛应用作出解释。同时我们也很难说明这样一种较强的倾向：我们每个人都常常身不由已地谈到一理论的假设，并对各种理论的假设加以比较。有烟就有火。
在方法论当中（如同在实证科学中一样），作出否定性的结论通常要比作出肯定性的结论更有把握。所以，与前面的评述相比，我对下面这些有关“假设”的重要性及作用的评述的把握性较小。就我所能认识到的，一理论的“假设”具有三种虽则紧密相连但却完全不同的实证作用：（1）它们是对一理论进行描述或表述的一种简便形式；（2）它们有时会促进通过假说的含义而对假说所作的间接检验；而且（3）如我们前面已经提到过的，它们有时是对一理论预期的合理性的存在条件加以限定的方便途径。前两个方面还需要作进一步的讨论。
1．“假设”在表达一种理论中的作用
叶子的例子证明了假说的第一个作用。不采用叶子力图使它们所得到的阳光最大化这一说法，我们同样可以在没有任何明显的假设的情况下来表述这一假说。我们的表述是以预测叶子的密度所须遵循的一系列原则的形式来进行的：如果一棵树生长在一处平地上，且没有别的树木或其它物体来阻挡阳光的照射，那么，这棵树上叶子的密度将是如何如何。……相反，如果一棵树是生长在山的北坡，且位于由同样树木所形成的森林的中央，那么，这棵树上叶子的密度将是如何如何……等等。很明显，与叶子力求使它们所能得到的阳光最大化这种表述相比，刚才的那一种表述远不是这一假说的简便形式。事实上，由于前一种较简便的表述既指出了如何确定对本问题来说是非常重要的环境特点，又指出了如何对它们的影响加以评价，所以，前一种表述是对上述一系列原则的简单概括——即使这一原则系列被扩展到无穷大。前一种表述更为精悍而又不失全面。
更广泛地说，一假说或理论通常都含有这样的断言：某些力量（言外之意就是别的力量不是这样）对于某一特定种类的现象来说是重要的；并通常对它所断言的重要力量的行为方式加以限定。我们可以把这一假说看作是由两部分组成的：第一部分是一个概念性的世界，或者说是一个与“现实世界”相比较为简单的抽象模型。这一世界只包含该假说认为是重要的各种力量。第二部分是一系列原则。这些原则定义了这样一类现象——它们使得上述模型得以成为“现实世界”的一个适当的代表，同时，这些原则还对模型中的变量或实体与可观测的现象之间的对应关系作了限定。
从本质上看，这两个部分是截然不同的。模型是抽象的、完整的，它是一种“代数学”或“逻辑学”。在检验模型的一致性与完整性，探究模型的含义方面，数学与正统的逻辑学回归它们的老本行。在模型当中，“大概”、“可能”、或“近似于”这一类东西根本没有存在的余地，而且也不起任何作用。对于真空来说，气压是零，而不是“较小”；对于竞争性市场上的产品生产者来说，需求曲线是水平的（斜率为零），而不是“几乎是水平的。”
另一方面，使用模型的原则却又不可能是抽象的和完整的。它们必然是具体的，从而也就必然是不完整的。这是因为，不论人们如何定义“现实世界”，完整性只有在概念性的世界里才会存在，而不可能存在于”现实世界”中。模型是“在太阳之下不存在任何新的东西”这一只有部分真实性的欺人表述的逻辑体现；然而，在应用模型的原则中却不能忽略具有同等重要性的另一个只有部分真实性的欺人表述：“历史永远不会重新开始。”当一理论是一明显地更为一般的理论的一部分时（如落体这一例子中的真空理论一样），在相当程度上，我们可以把模型的应用原则明确地、系统地阐述出来。尽管这时的阐述仍不完整，但却是最容易进行的。为了使一科学尽可能地具有“客观性”。我们的目标应当是尽其所能地对这些原则作以明确、系统的阐述。并不断地扩大可以进行如此阐述的现象范围。但是，不论在这一努力上面我们取得了多么大的成功，总是不可避免地要在实行这些原则时出现新的问题。每一种情况都有其独特之处．而这是那些明文规定的原则所不能—一囊括的。对这些特殊情况加以判断，并对这些特殊情况是否应影响到可观测现象与模型中的实体之间的对应关系加以判断，这需要具备这样一种能力：这种能力不能靠别人的传授来获得。它只能通过实践并置身于一种“正确的”科学氛围中来掌握，而不能机械照搬。正是在这一点上，出现了业余爱好者与专职人员之间的分水岭，这对所有的科学来说都是一样的。也正是在这一点上，体现了怪诞者与科学家之间的微妙差异。下面这个简单的例子可能会有助于弄清这一点。欧几里得几何学是一个抽象的模型。从逻辑上看它是完整的和一致的。模型中的实体（或称变量）都经过了严格的定义。如一条直线的定义不是一个其长度要比其宽度或深度“大得多”的几何图形，而是一个其宽度与深度为零的图形。它同时也是非常“非现实主义的。”在“现实”中不存在如欧几里得之点、之线、或之面一样的东西。让我们将欧几里得这一抽象模型应用到我们用粉笔在黑板上所作的一个记号上面。这一记号是与欧几里得之线，还是与欧几里得之面，还是与欧几里得之体相一致呢？很明显，如果这一记号正在被用来表示（比如说）一条需求曲线，那么它完全与一直线相一致。但是，如果这一记号正在被用来为（比如说）地图上的国家着色，那么它就不能与直线相一致了，这是因为那将意味着该地图永远也不会具有颜色。为了实现这一目的，这同一记号必须与面相一致。但是，对于粉笔的生产者来说，它却不能与面相一致，因为如果是这样的话，那么粉笔将永远也用不完。出于这种考虑，这同一记号必须与体相一致。在这一简单例子中，上面所提到的那些判断将取得广泛的一致意见。然而，似乎很明确，虽然我们可以对指导这些判断的一般性原则作一系统的阐述，但这些原则永远也不会真正作到包罗万象，囊括每一种可能出现的情况。它们并不具有欧几里得几何学本身所具有的自圆其说、自成体系的特点．
我认为，在谈到一理论的“至关重要的假设”时，我们是在试图对这一抽象模型的关键因素加以阐述。通常，可以用许多不同的方法来对这一模型加以完整的描述。也就是说，存在着许多不同的“基本原理”体系；作为一个整体，它们既包含了模型的內容又为模型的内容所包含。从逻辑学的角度上看它们是等价的：从某一角度来说可以视为一模型的公理或曰基本原理的东西。从另一角度来说也可以视为一模型的定理。反之亦然．被称为是至关重要的那些特定的“假设”是以下述因素为依据选择出来的：这些‘假设”在阐述模型方面的简洁性或经济性，直观的合理性，及提出假设的能力等．如果仅仅从含义上来看，也就是与人们判断或应用模型有关的那些原则的一部分。
2．“假设”作为理论的间接检验标准所起的作用
在任一假说的表述中通常存在着这样一种情况：用来阐述该假说的那些论段中，哪一些与假设有关，哪一些与含义有关似乎是泾渭分明的。然而，这二者之间的区别却难以准确定义。我认为，这不是由这类假说本身的特点所决定的，而是由该类假说将被用于的对象的特征所决定的。如果确实是这样，那么要想使对这些论述的划分易于进行，就必须确保该假说旨在服务的目的的明确性。在一抽象模型中定理和公理之间互换的可能性，意味着在与这一抽象模型相对应的那个独立的假说中，也存在着“含义”与“假设”之间互换的可能性。但这并不是说任一含义都可以与任一假设互换，而是说那种可以包含其它论述的论述体系可能不止一个。
例如，让我们来看一下寡头行为理论中的一特殊主张，如果我们假定：（1）企业通过各种方法来使其成果最大化，甚至不惜获得或扩大垄断力量。这将意味着，（2）当对某一“产品”的需求存在着地区性的不稳定，运输费用极高，公开的价格协议不合法，且该种产品的生产者为数极少时，他们将会试图建立基点定价体系。由于我们已将市场行为预测接受为本分析的目的，所以我们将论述（1）视作该理论的假设，而将论述（2）视作该理论的内容。如果我们发现（2）中所描述的情况通常与基点定价法结合在一起，那么我们将认为假设（1）是可以接受的；反之亦然。现在让我们将该分析的目的改为：按照谢尔曼反托拉斯法对控制贸易同盟的禁止，确定哪些情况应予上诉。如果我们现在假定：（3）基点定价方法是在（2）中所限定的条件下蓄意产生的一种手段，以利于协同一致．那么这将意味着，（4）参加墓点定价的企业参与了“控制贸易同盟”。先前作为假设的东西现在变成了内容；同样，先前作为内容的东西现在变成了假设。现在，如果我们发现企业参与了基点定价，那么我们将现假设（3）为合理的。当一企业参与基点定价时，通常还会存在其它的证据，如书信、便函等．这些材料将被法庭视为“控制贸易同盟”的证据。
假定该像说服务于第一种目的，即预测市场行为。很清楚，这并不等于说该假说将服务于第二种目的，即预测是否存在足够的证据来证实“控制贸易同盟”的存在，从而确定法院所应采取的行动。反之，如果该假设服务于第二个目的，这同样不等于说它将服务于第一个目的。然而，在缺乏其它证据的情况下，该假设服务于一种目的所取得的成功（在解释一类现象方面所取得的成功），与该假说服务于另一种目的所可能取得的成功相比（即在解释另一类现象方面所取得的成功），前者将给我们带来更大的信心。要想具体说明前者所证实的把握性比后者到底大多少，将更为困难。这是因为这取决于我们对这二类现象之间相互联系的紧密程度的判断；而这本身又将通过复杂的途径而取决于某些同种的间接证据——即在通过单纯的理论现象进行解释时我们所具有的在其它方面的经历。而这些单纯的理论现象在某种程度上又是同样纷呈复杂的。
为了更进一步地阐述这一观点，我们可以通过那些被称作一假说的假设的东西，来取得一些间接证据。这些间接证据是关于一假说的可接受性的。上述结论仅在如下意义上才能成立：假设本身可以被视作等同于该假说的含义。因为这样一来，假设与现实的一致性就可以被视作等同于人们在试图证明某些含义与现实相抵触时所遭到的失败。或者说上述结论仅在如下意义上才能成立：这些假设可能使人们想起该假说中另外一些易受偶然的实际观察所影响的含义。之所以说这一证据是间接的，是因为这些假设或该假说的各种含义所指的那一类现象，通常不同于该假说旨在说明的那一类现象。的确，如我们前面所讲的那样，这一点似乎是我们在确定哪些论述应冠之以“假设”，而哪些论断应冠之以“含义”时所依据的主要标准。这一间接证据所具有的重要性，取决于我们对这两类现象之间相互联系的紧密程度的判断。
一假说的“假设”为该假说提供间接检验的另一种途径是：找出该假说与其它假说之间的相互关系，从而使得正待接受检验的该假说的合理性与其它假说的合理性的证据联系起来。例如，一假说正在对某一特殊种类的行为作出解释。同以前一样，我们也可以不限定任何“假设”而对该假说加以阐述．但是，假定我们能够证明该假说与某一假设体系是等价的，并且这一假设体系中还包括了人人都在追求自己的利益这一假设，那么，这一假说就可以通过与它具有同样假设的那些假说在其它种类现象上的成功，而间接地获得其合理性；即使不能的话，我们这里所作的探索也不会完全是前无古人后无来者的，至少不会是在任何方面都一无所获。实际上；为引出表面上互不相同的假说之间的相互关系而对假设所作的这番研究，正是我们在通向一个更为一般化假说的道路上迈出的一步。
从相关的假说中导出的这种间接证据，在很大程度上说明了持有不同背景的人，在对某一特定假说的信任程度上的差异。例如，让我们来考虑这样一个假说：在某一特定地区或行业内，在就业问题上所存在的种族或宗教歧视，与该地区或该行业中的垄断程度密切相关。也就是说，如果该行业不是垄断性质的而是竞争性的，那么，只有在就业者的种族或宗教影响到其它就业者与他们一起工作的情愿性，或影响到消费者对他们所生产的产品的接受性，而与雇主的偏见毫不相关时，才可能存在较为严重的种族歧视。这一假说对于经济学家所具有的吸引力将远远大于它对于社会学家所具有的吸引力。这一假说可能被说成是“假定”在竞争性的行业里，雇主一门心思地追求其在金钱方向的利益；而且，这一“假设”适用于许多经济假说。这些经济假说，涉及的是经济学所要研究的许多大宗现象。所以，在经济学家看来，这一假设同样地也适合于我们所讲的这一情况，似乎是合情合理的。另一方面，为社会学家所熟悉的那些假说其模型或曰理想世界与此是截然不同的。在他们的模型或理想世界中，一门心思地对金钱方面的个人利益的追求只起到非常小的作用。对于社会学家来说，在这一假说问题上可得的间接证据，对于该假说并不十分有利；而对于经济学家来说，在这一假说问题上可得的间接证据，对于该假说的有利程度与前者相比则要大得多。所以，社会学家对该假说可能持有较大的怀疑态度。
当然，一经济学家的证据与社会学家的证据都不是决定性的。该假说对于它旨在说明的现象来说是合起作用这才是决定性的检验。但是，在做出任何令人满意的决定性检验之前，还需要作出一种判断。而且，很有可能，如果这种检验不能很快地作出时，在这种情况下，这一判断将不得不以可得到的不充分的证据为依据来进行。此外，即使这样的检验可以作出，科学家们的背景情况对于他们所取得的判断来说也不是完全不相干的．在科学中永远不存在一定的东西．证据对一假说所起的肯定的或否定的作用，永远不能说是完全“客观的”。在判断假说的含义与实际情况的一致性方面，经济学家要比社会学家更为“宽容”，而且较少的几个“一致性”事例就可以促使他暂时地接受假说。
5．经济学中的某些含义问题
我们一直在进行讨论的这些抽象的方法论问题，与人们对“正统的”经济理论作为一种“非现实主义的”理论所进行的旷日持久的批评，及人们对为迎合这一批评的要求而重新构造理论的种种尝试所进行的旷日持久的批评之间，有些直接的联系。经济学是一种“沉闷无趣的”科学，因为它假定人是自私的和唯利是图的，人是“欢乐与痛苦的计算器，且其计算速度如闪电一般。人这架计算器，就象一粒充满着幸福渴望的水珠一样，在某些使他游离于幸福与痛苦之间的动因的作用下，振荡不已，但在这当中人是不变的。”说经济学是一门“沉闷无趣的”科学，还因为经济学是建立在旧心理学的基础之上的，从而必须随着心理学的新发展而同步改进。第三点原因在于经济学假定人（至少对于商人来说是这样）总是处于“一种连续的警觉状态”，一旦他们那敏感的直觉嗅察到了供给与需求状况的变化，他们将立即改变价格或改变定价原则。第四点原因在于，经济学假定市场是完美的，竞争是纯粹的，而且商品、劳动力与资本等都是同质的。
正如我们所看到的，除非这一类的批评得到了下面这一证据的补充说明，否则的话将主要集中在其它方面。这一证据就是：存在着某一种假说，它与正在受到批评的理论在上述那些方面中的某一方面上并不相同的，然而该假说在较大范围的现象的预测上取得了较好的成果．然而大部分的此类批评都没有这种证据作为补充；它们几乎全部地取决于“假设”与“现实世界”之间所谓的直接可见的差异。最近一段时间人们对成果最大化假说所作的批评，为说明上述问题提供了明显的例证．这一批评的理论依据就是商人没有，而且确实也不可能象该理论所“假设”的那样去做。被用来作为该论断的佐证的证据，通常来自于两个方面。或者是来自于商人对影响其决策的因素问题的回答——这是检验经济理论的一种程序，这种程序与通过向80岁的老人询问长寿的秘诀来检验长寿理论的作法别无二致。或者是来自于对单个企业的决策活动所作的描述性研究。一方面，人们很少（如果曾有过的话）能够提供这样的佐证：这里的证据是关于商人的实际行为与正在受到批评的假说的含义之间的一致性问题的，即是关于商人的所作而不是关于商人的所说的证据。另一方面，人们也很少（如果曾有过的话）能够提供这样的佐证：这里的证据是关于商人的实际行为与另一假说的含义之间的一致性问题的。
就人们时常对一理论或其“假设”所赋予的直接描述性而言，一理论或其“假设”不可能是完全“现实主义的”。关于麦子市场的一个完全“现实主义的”理论，不仅需要包括直接决定麦子的供给与需求的那些情况，而且还需要包括用于交易的现金或信用工具的种类。此外还有：交易者的头发与眼睛的颜色，他的祖先及受教育程度，他的家庭人数，他家庭成员的特征，祖先，受教育程度等个人特征；种植麦子的土壤种类，土壤的物理及化学属性，在生长期内的主要天气情况；种植小麦的农民及最终食用小麦的消费者的个人特征，等等，等等，无穷无尽。为达到这样一种“真实”而作的过分努力，都只会使该理论失去真实有用的作用。
当然，部分地说，完全现实的理论这一想法不过是一个稻草人。没有哪位理论批评家会以这一逻辑极端作为目标。任何一种理论批评都可能这样说：正受到批评的这一理论的“假设”“太”脱离现实了；而它的目标是这样一种假设体系：尽管不是完全地毫无创造性地追求真实，但要比正受到批评的这些假设“更为”真实一些。但是，只要“真实性”的检验标准是“假设”的直接可见的描述准确度，则不存在进行上述区分的依据，那永远也不会存在前一段所描述的那个稻草人。例如，“真实性”的检验标准可能是这样一些实际观察：“商人似乎并不象边际理论所描绘的那么贪婪，那么精悍，那么富有逻辑性”；或者，“在当前的情况下，对于多工序工厂的管理者来说，试图算出每一生产要素的边际成本与边际收益，并使二者相等这将是绝对不可行的。”判断某一特定的偏离现实情况是否可以接受的标准是什么呢？在分析商业行为时，为什么忽视商人的成本大小比忽视商人的眼睛的颜色更为“不现实”呢？答案很明确，这是因为对于商业行为来说，省略前者会比省略后者带来更大的偏差。但是，简单地通过商人之间确实存在着成本大小的不同及眼睛颜色的差别这一观察，并不能使我们知道这一点。很清楚，将一种因素考虑进来与将另一种因素考虑进来将会对偏差产生不同的影响。而我们唯有通过它们对实际行为与预测行为之间的偏差的影响的比较，才能知道上述答案。这样一来，即使是真实性假设的最极端的拥护者，当他们对各种假设按真实程度大小加以划分时，也必然要被迫放弃他们的标准，而接受通过预测的检验标准。
描述方面的准确性与分析方面的相关性之间的根本性混淆，构成了大部分经济理论批评的主要内容。这些经济理论批评是关于理论假设的非现实性的。这一根本性的混淆及导致这一混淆的那些观点的正确性问题，都在一篇关于商业循环的文章中得到了充分的说明。这一篇文章中有这样一段似乎是无害的评述：“经济现象是变幻莫测、纷繁复杂的，所以，任何一种能与现实紧密地结合起来的关于商业循环的综合性理论，都必定是极为复杂的。”科学的一个基本的假说就是：现象是具有欺骗性的，而且我们可以通过某种方法而对证据加以考察、解释或组织。从这些证据中我们将发现那些表面上直不相关、各不相同的现象事实上却是一种更为基本且相当简单的结构的表现形式。而且，对这一假说加以检验的标准，同其它假说的检验标准一样，是它所取得的成果——即迄今为止科学所取得的巨大成就。如果某类‘经济现象”看起来好象是变幻莫测、纷繁复杂的，那么我们只好这样假定：这是因为我们没有适当的理论来对它们作出解释。我们决不可能把已知的事实放在这一边而把 “与现实紧密结合的”理论放在另一边。理论是我们“透视”事实的桥梁，而且如果没有理论，我们将不能透视事实。“经济现象是变幻莫测、纷繁复杂的”这种主张，否定了知识的试验性状态，殊不知这种状态本身也可以使科学活动富有意义；这种主张与约翰·斯图尔特·穆勒的以下完全荒谬的观点同属一类。穆勒认为： “很幸运，在价值法则中不存在任何有待于现在（1848年）或将来的作者来加以澄清的东西；关于这一问题的理论是完美的。”
描述方面的准确性与分析方面的相关性之间的混淆，不仅导致了在许多不相关的方面对经济理论所作的批评，而且还导致了对经济理论的误解及在弥补所谓的缺陷的努力中方向性错误。由经济理论家们提出的抽象模型中的“理想类别”，已经被视为严格的描述性的分类。这些描述性的分类将直接地、完全地与现实世界中的现象实体相对应，而独立于该模型的使用目的。而描述性的分类与现实世界中的现象实体之间存在的明显的偏差，导致了在构造理论的努力上的不可避免的失败，这是因为，重新构造理论的努力是以这些意在具有充分的描述性的分类为基础的。
人们对“完全竞争”与“垄断”概念所作的解释，及“垄断性的”或“不完全竞争的”理论的发展，可能再清楚不过地说明了这种倾向。据说，马歇尔假定存在“完全竞争”；可能曾经有过这种消沉。但是，很明显，现在已经不再存在这种情况了。所以，我们必须放弃马歇尔的理论。读者可能将不辞劳苦地到处搜寻（我预言这将是徒劳的），试图在马歇尔的著作中找到关于完全竞争的明确假设，或任何这样的主张：从描述的角度来说，世界是由参与完全竞争的基本单位——企业所组成的。然而，读者将发现马歇尔的如下论述：“在一个极端上，存在着这样的世界市场，在这个世界市场里，竞争直接地从地球的每一部分展开；而在另一个极端上。存在着这样的封闭市场，在这个封闭性的市场里，所有来自远方的直接竞争都被排斥在外，然而即使在这样的市场中，人们仍然可以感觉到间接竞争与传导性的竞争之存在。而且在这两个极端之间还存在着大量的其它种类的市场，这种市场的情况还有待于经济学家和商人的进一步研究。”马歇尔按照世界的本来面目来描述世界；他所追求的是为分析世界开辟道路，而不是使现实世界得到摄影般精确的再现。
在按照世界的本来面目而对世界进行的分析中，马歇尔构造了这样一个假说：在很多问题中，众多的企业将被组合成“部门”，这样做的目的是使得每一集团中各企业之间的相同之处远远胜于它们之间的差异。这些问题通常都具有这样的特点，即下述情况对于它们来说同样是重要的：企业集团也将受到某些变动的影响，如对它们的产品的需求方面的变动。或者生产要素供给方面的变动。但是，并不是所有的问题中都存在这种情况，也就是说，上述重要情况可能是只作用于某些特殊企业的个别影响。
与这一假说相对应的抽象模型，包含着两种“理想的”企业类型：作为基本单位的竞争性企业（这些企业将组合成部门）与垄断性企业。在所有其它企业的价格一定的条件下，如果对该企业产品的需求曲线相对于该企业的产品价格来说具有无限弹性的话（这适用于某些价格及全部产量），那么该企业则是竞争性的。它隶属于某一 “部门”，这种部门的定义是生产单一“产品”的企业集团。这里“产品”的定义是那些对于购买者来说具有完全的替代性的产品的集合。所以，某一企业的产品相对于同部门中另一企业的价格的需求弹性，对于某些价格和某些产量来说是无限的。囫如果某企业产品的需求曲线对其所有产品的某种价格皆不具有无限弹性，那么该企业则是垄断性的。对于垄断性的企业来说，企业就是部门。
同往常一样，作为一个整体该假说不仅包含了这一抽象模型及其理想的企业类别，而且还包含了一系列原则——这些原则大部分是含蓄的且通过例证来体现。这些原则系列是为使实际生活中的企业与这种或那种理想类型相一致，及为将企业划归部门而设立的。这些理想类型本来并不是描述性的；它们最初的使命是对那些对某一特定问题来说极为重要的特征
海耶克大战奥巴马
张五常
已故的海耶克一九八八年出版了一本题为《The Fatal Conceit》的书——中译《致命的自负》——其中一个要点说在计划经济中，政府官员以为在没有足够的讯息及赏罚的情况下，他们可以把产品定价，指导市场。顾题思意，这是「自负」，对经济会带来「致命」之伤。
今年六月十四日，贝加（Gary Becker）在他的博客以同一题目为文，指责奥巴马及他的财政部长盖特纳犯上相同的「自负」行为，试图左右数以百计的企业高职人员的薪酬。凡是受到美国政府资助的大机构，例如美国银行、花旗银行、AIG、通用汽车等，其高职行政人员的薪酬与花红等要由政府委任的一个「沙皇」拍板决定，而拍板后是不能上诉更改的。
这就带来一个似浅实深的话题︰政府这样做是对还是错呢？我想知道读者怎样看。不要读下去，把自己的答案先写下来才读，你可能发觉你的想法跟我的很不一样。
首先要说的，是通用汽车已成国企，既为国企，政府要怎样处理职员薪酬是政府的权力，没有什么不对。政府应不应该把通用收归国有是另一回事，但米已成炊，市场的薪酬只能用作参考，仅此而已。AIG的性质略为不同，但我也看不到政府左右薪酬有什么不妥。这家庞大的企业面对破产，无可救药，生意暴跌，政府挽救接管。不难想象，政府不左右薪酬是难以止血的。美银、花旗及其它接受政府资助的大机构怎样看呢？政府大手资助，某些获助的机构出现了大派花红的例子，也不难想象，政府不管，资助的钱很容易花清光！我不知道政府有否事先言明︰向我借钱资助我要管你们的薪酬。如果言明，政府跟着左右薪酬理所当然。如果没有，但政府见受助者大手花钱，借出去的可能输清光，左右薪酬有点不对，但可以理解。政府是为了自保，说不上是自负，不管薪酬，获「致命」伤的可能是政府。
面对可能破产倒闭的企业，或大或小，好些时的确有点乱来的意向。这次金融危机带来的效应，政府资助出现了一些乱来的行为，但我欣赏的是大部分遇上财政困难的企业没有这样做。另一方面，政府应否资助是不容易决定的。我认为除了银行政府不应该挽救。一位货币大师认为银行也不应该挽救。另一方面，不少学者及专家今天认为政府当时（去年九月）应该挽救雷曼兄弟。是复杂的问题，我不知细节，就是知道也不一定有答案。我的观点是，既然政府出手挽救，耗资甚巨，为了自保，左右被救的企业的某些职位的薪酬，算不上是海耶克说的「致命的自负」。
海耶克大战奥巴马，战到此间，奥巴马胜。当然，海耶克是不会同意政府出手挽救企业的，但这是另一回事。
写到这里，困扰我的问题还没有开始。这就是金融的专业或行政人员的收入非常高，究竟值不值那么多钱呢？就是在雷曼兄弟事发之前，政府应该约束或管制他们的收入吗？这些问题由我这个教授提出，读者可能以为我发了神经。无可置疑，金融行业的收入是在市场竞争下决定的，市场说值那么多钱，海耶克不可能错。然而，去年雷曼兄弟事发后不久，我读到一篇森穆逊写的专栏，简直破口大骂。森氏是个了不起的经济学者，平生作出的贡献无数，也是个深知市场运作的大师人物。他认为十多年来金融专业的收入上升了不知多少倍，近于发神经，不成理，言下之意是政府早应考虑干预。也是去年，我读到一份报告，说有些出道不久的金融「天才」，几分钟赚佣金五万美元也嫌少！不知读者怎样看这个问题。在市场竞争下决定的收入，怎可以是「过高」的呢？
金融这门专业学问起自六十年代初期的洛杉矶，我当时有染指。主要是从费沙的利息理论加上风险，其后转到芝加哥及麻省理工等大学发扬。因为收入比较高，从经济学转到金融学的研究生不少。这是指在美国兴起的金融学，与当时的老一套的英国传统的金融学是不同的。一九八二年起我到香港大学主事那里的经济系，跟着发展为经济金融学院，经验上我遇到一个大难题。论求学的难度，经济与金融差不多，而到了研究院，从经济转读金融不会有困难。然而，起码有十多年的时间，从国际的市场看，大学聘请一个初出道的金融学博士的薪酬，要比一个经济学博士的高出一倍！香港大学不同学系的薪酬是划一的，所以金融学不容易搞上去。当时我们逼着起用经济老师教金融，没有困难，因为金融学的基础文献一律出自经济学者之手。
为什么金融博士的出道薪酬会比经济的高出那么多呢？事实上，有一段长时期，金融专业的收入冠于所有行业，比医生还要高。当时我的解释，今天回顾没有错，是大学之外的市场对金融专业人材的需求很大，而这需求不断上升。大学研究院攻读经济的学生没有大部分转到金融那边去，可能因为经济学的趣味性比较高，也可能因为恐怕金融市场的需求增加会缓慢下来。
我要到去年金融危机爆发之后才知道，美国的借贷量十多年上升了三倍！这惊人的升幅显然是由那些所谓衍生工具及保险安排的发明促成的。这个迅速的发展，加上分红制度很自然地在金融市场流行，金融专材的收入动不动每年逾美元百万。算不算是过高呢？政府要不要管？经济学的答案是否定的，因为那是市场的运作使然。
问题是，不管好些经济学者认为这个由无数衍生工具组合而成的金融制度是伟大的发明，给美国带来繁荣，但到头来从效果衡量，这制度奇劣无比。人类历史没有出现过任何制度，可以在几个月之内使整个地球输那么多的钱！事实上，这些年整个金融行业赚得的高收入，全部回吐也不能填补一小部分的损失。是艰深难明的制度：股神毕菲特早就说这制度会带来灾难，但事到临头他自己还是中了大计。我呢？当然更不懂，但还是认为去年十月十七发表的《浮沙指数：金融浮沙要向下面看》提供了一个关键性的解释：借贷与抵押的比例不应该高于一，而美国的新潮金融制度把这指数弄得远高于一。另一方面，我认为金融借贷与保险合约的纵横织合是愚蠢的安排。
这里的重点问题是：如果美国的金融制度是纯由市场自由发挥地搞起来的，市场难辞其咎：海耶克会一铺输清光。但明显地，美国的金融制度不是自由市场的杰作。政府的管制法例不少；评级机构是得到政府认许的；格林斯潘主席联储局时，几次赞赏美国的金融制度！我历来欣赏的格老，当时被奉若神明。
政府监管与市场运作加起来的混合制度容易闯祸，不少经济学者指出过，只是没有谁想到会闯出那么大的祸。这制度的深不可测使我无从判断，在雷曼兄弟事发之前，政府应不应该左右金融专家们的收入。一个近于肯定的看法，如果政府早就约束这收入——不容易说得通——美国的金融行业不会发展得那么疯狂，为祸也因而不会是那么严重了。这可能是森穆逊去年的直觉吧。

实证经济学的方法论新制度经济学的方法论经济学方法论经济学方法论现代产权经济学的基本方法论实证经济学的可能性和方法：韦伯和弗里德曼 11实证经济学的可能性和方法：韦伯和弗里德曼谢作诗：经济学方法论对“经济学方法论”的几点思考ll 经济学方法论-专业术语简释如何写第一篇经济学实证研究与林老师对话：经济学方法论篇林毅夫教授谈经济学方法论（一）林毅夫教授谈经济学方法论（二）林毅夫教授谈经济学方法论（三）林毅夫教授谈经济学方法论（四）经济学方法论中的两个经典隐喻orz 时光倒流的实证! 时光倒流的实证! 如何写第一篇经济学实证研究论文如何写第一篇经济学实证研究论文 ::投机获利的方法论什么是正确的方法论职业教育的教学方法论