主义。它对于在科学领域中建构理论至关重要,尤其对于评估心理学中的理论及观念具有重要作用。
尽管操作主义形式多样,但是对于科学信息的使用者来说,用最广泛的思路去思考操作主义是最有效的。“操作主义”只是这样一种思想:科学理论里的概念必须立足于可观测事件,或与可观测事件相关联,而这些可观测事件是可以被测量的。将概念与可观测事件相联系的是概念的操作性定义,这使概念公开化了。操作性定义使得概念从个人化的感觉和直觉中分离出来,并且允许任何实施可测量操作的人对概念进行检验。
例如,把“饥饿”这个概念定义为“我胃里不好受的感觉”,并不是一个操作性定义,因为它与个人对于“不好受的感觉”的体验相联系,因此不能被其他观察者知悉。相反,涉及一些可测量的食物剥夺时间或者像血糖水平这样的生理指标的定义才是操作性的,因为它包含了任何人都可以实施的可观测的测量。同样,心理学家不同意将“焦虑”定义为“我不时会感到的不舒服和紧张”,而是必须用像问卷和生理指标测量这样的操作来定义概念。上述那个定义是个人对身体状况的解释,他人无法复制;而后者则是把概念放在公共科学领域进行解释。
在科学领域里,定义一个概念靠的是一系列操作,而非单独的行为事件或任务,意识到这点非常重要。相反,一些差别细微的任务和行为事件通常聚合在一个概念上(在第8章我们将会更多地讨论聚合性操作)。例如,教育心理学家根据利用诸如“伍德库克阅读能力量表”之类(Woodcock,1998)的标准化工具测得的成绩来定义“阅读能力”这个概念。该量表测出的阅读能力总分包含了一些不同分量表测得的能力指标。这些分量表测查的能力稍有不同,但全都与阅读相关。例如,阅读一篇文章、想出一个合适的单词在文章中填空、写出一个词的同义词、独立拼读一个较难的词,等等。所有这些任务上的表现综合地定义了“阅读能力”这个概念。
操作性定义促使我们认真地、经验性地思考我们如何定义一个概念,所谓经验性,是指要根据我们对真实世界的观察。试想我们要给一个看起来相当简单的概念“打字能力”下一个操作性定义。想象一下你这么做是为了比较两种打字教学方法的优劣。思考一下你所要做的所有决定。当然,你想要测量“打字速度”。但是要打多长的一段文章呢?仅有100个单词的文章可能太短,而10000个单词的文章又似乎太长。那么到底多长才算好呢?打字速度维持多久才最符合我们对打字能力这一概念的理论建构?用什么类型的文章来测试呢?文章是否要包含数字、公式和不常见的间距?我们如何处理错误?当我们测量打字能力的时候,时间和错误似乎都应被考虑在内,但是,如果把这两个指标同时考虑进去的话,要如何来计算一个总分呢?我们想要让时间和错误具有相同的权重,还是一个比另一个更重要?寻求一个好的操作性定义会迫使你认真考虑所有这一切;它会让你对如何将“打字能力”进行概念化做一番透彻的思考。
概念的操作性定义要想有用,必须同时具备信度和效度。信度是指测量工具的一致性。如果你对同一概念进行多次测评,是否能够得到相同的测量结果。信度的科学概念很容易理解,因为它与常识中的定义以及字典里的定义非常相似:“任何总能够产生相同结果的系统所具备的一种属性”。
试想一下,一个外行人士会如何评价一件事是否可信呢?想象一个每天早上要赶公共汽车从新泽西去曼哈顿上班的人。按照时间表,公共汽车每天应该在上午7:20到达此人等车的站点。在一个星期中,如果公共汽车到达的时间分别是7:20、7:21、7:20、7:19和7:20,那么我们就可以说在那一周汽车的到达