果关系的方向可能是相反的,即从B到A。第二种是有关第三变量的问题,此问题已经通过糙皮病的例子(以及烤箱—节育和私立学校—学业成就的例子)加以论述。两个变量之间的相关并不能预示任何方向上的因果,因为当这两个变量都和第三变量相关时,该相关还是会出现。
在一些情境下,虚假相关很容易出现。这也正是选择性偏差非常容易出现的原因。“选择性偏差”这个术语指的是特定主体和环境变量之间的关系,当不同生理、行为、心理特点的人们选择不同类型的环境时,就有可能出现选择性偏差。选择性偏差造成环境特征和行为-生物特征之间的虚假相关。
让我们通过一个例子来了解选择偏差是如何产生虚假相关的。请快速说出一个州名,在这个州里,由呼吸系统疾病导致的死亡率高于平均水平。当然,答案之一是亚利桑那州。什么?等等!难道亚利桑那州没有清洁的空气吗?难道洛杉矶的烟雾弥漫得如此之远?难道凤凰城的郊区环境已经变得那么差了吗?不是,肯定不是!让我停下来想一想。可能亚利桑那州的确有清洁的空气,可能患有呼吸疾病的人都愿意搬到这里,然后他们死在了这里。这样就对了。如果我们不够认真,就会出现上面所说的那种情形:我们可能会受到误导,认为是亚利桑那州的空气害死了这些人①。
但是,选择性偏差并不总是那么容易辨别。尤其是当我们事先就期望看到因果联系时,这种偏差经常会被忽略,就像在“自尊”的例子中那样。充满诱惑的相关性证据加上固有的偏见,就能够欺骗最聪明的头脑。下面让我们看一些事例。
从关于“美国教育质量”的全国性讨论中可以很容易地看到选择性因素的重要性,这场讨论已经在美国全国范围内持续了近二十年。在这场辩论中,公众被各种教育统计数据所淹没,但研究者却没有提醒公众,警告他们避免从相关数据去推论因果关系,因为相关数据内含有大量具有误导性的选择性偏差。
纵观这场辩论,许多怀有政治目的的人试图不断地提出证据,用以说明教育质量和教师的薪资水平、班级规模是没有关系的,尽管已有许多研究表明这二者都非常重要(Ehrenberg,Brewer,Gamoran,&Williams,2001;Finn&Achilles,1999)。他们所提到的证据当中,有一个是50个州的SAT(学术能力评估测试)的成绩。这个测试的参加者是有意升入大学的高中生,测试中的学生平均分确实表明,学生成绩和教师薪资水平、教育的支出是没有关系的。即使有关系,其趋势看起来也与期望的方向相反。在许多州,教师薪资水平很高,但是SAT的测试成绩很低,有些州教师的薪资水平在全国工资水平排行垫底,而学生的SAT测试成缋却很高。对这组数据的仔细审视给我们上了另外一课:
选择偏差导致虚假相关是多么容易。
举例来说,在进一步的检验中,密西西比州学生在SAT考试中的得分高于加利福尼亚州学生(Powell&Steelman,1996;Taube&Linden,1989),而且差异是非常显著的,密西西比州比加州的平均分要高出100分。而密西齿比州的教师薪资水平在全国是最低的,这无疑会让那些鼓吹削减教师工资的人们弹冠相庆。但是,请等一下!密西西比州的学校真的好于加利福尼亚州?前者的教育水平真的高于后者?当然不是。几乎任何一个客观的指标都显示,加利福尼亚州的学校更好(Powell&Steelman,1996)。但是如果这是真的,那么SAT的成绩又该如何解释?
这个问题的答案要用选择性偏差来解释。SAT和学校通常选择的那些标准化考试不同,在标准化考试中,所有学生一律都要参加。但SAT并