论大学英语测试中质量指标应用

论大学英语测试中质量指标应用【摘要】语言测试是目前大学外语评价体系中的重要组成部分，评估语言测试最为关键的两个质量指标是信度和效度，但两者从本质上来说又是相互冲突的。在一定的约束条件下尝试论证，为了使总效用达到最大化，在某一特定测试中我们能够找到平衡效度和信度的结合点，从实践中摸索经验，由此而为大学英语测试的改革实践提供一些参考性建议。【关键词】效度信度英语语言测试语言测试随着语言观的发展而发展，也随着教学理念、教学模式的更新而更新。八十年代中期开始流行的交际功能观和九十年代以后兴起的任务教学法都对语言测试的改革提出了新的要求。总效用性是评价英语测试最重要的原则。根据Bachman 和Palmer (1996： 18)的观点，一般测试的“总效用性“的主要构成因素有六个，评价一次考试是否有效用需要综合考察这些因素，在它们之间寻求最佳的平衡点，即效用性 (Usefulness )二信度(Reliability ) +构想效度 (Constructvalidity) + 真实性(Authenticity) + 互动性 (Interactiveness ) + 冲击力 (Impact ) + 适用性 (Practicality)。这里需要说明的是：Bachman 和 Palmer 之所以把“构想效度”作为“效用性”六大特征之一，是因为构想效度关系到我们根据测试成绩所作的解释的意义性和适切性。其它五个因素均与测试成绩的使用有关，而“适用性”与测试的方法有关，能够在很大程度上决定测试的可行性。对于一般学校考试，教师较多考虑考试任务的真实性、互动性和对教学的冲击力(或称后效作用)，对于大规模考试，考试策划者需在试卷设计和考试任务设置时重点考虑信度和效度，而目前，在中国的语言测试中，据全国大学英语四、六级考试委员会与英国文化委员会的合作研究结果认为：大学英语四级和大学英语六级是信度很高的考试，每次考试客观题的内部信度都达0.9以上；效度相当高，回收问卷中有92%的教师认为CET能反映学生的实际英语水平。笔者以为这里所指的信度和效度的界定很模糊，就某次具体的测试而言，信度和效度是受特定条件限制的，不可能是绝对的。到目前为止，我国的高考、研究生入学考试、公共英语等级考试(PET),包括CET等大规模英语测试还是客观性题型占的比例较大，主观题只占10%或20%左右。就评分方法而言，因客观性试题答案的唯一性，可用机器批阅，从而使测试结果的客观性和一致性有了保证，无疑具有相对较高的信度，但不足之处就是难以确保效度。同时大量采用主观性、直接性试题的测试在阅卷信度上也令人怀疑。这样的疑虑总是或多或少存地在于考试的开发、设计和评估过程中。如果我们想检验一次特定的考试成绩能否真正反映学生的语言能力，那在设计和实施测试时，信度和效度是我们首要考虑的问题。Bachman把信度定义为“测试的一致性” (consistency of measurement)o 简言之，就是测试结果的可信度、可靠度。信度所涉及的问题是个体测试成绩在多大程度上是由测试误差或其它因素所影响的。个体测试成绩在多大程度上和个体语言能力相关效度是所关注的问题。因此，我们研究信度的目的是使测试误差造成的影响最小化，研究效度的最终目的在使我们想要检测的语言能力的效果最大化，它们是两个相互补充的因素。一项测试若没有信度, 也就无所谓效度。信度是效度的前提或必要条件。权衡信度和效度，效度是首要的。然而Underhill和Heaton指出信度和效度特征在本质上是互相冲突的。测试效度较高的试题有时测试信度较低。相反，测试信度较高的试题有时测试效度较低o Morrow也认为想把测试任务设计得兼顾可信性和真实性不现实。Hughes却说虽然测试的各种特征相互排斥，但是这并不意味着我们可以完全放弃这些特征。我们能否使信度和效度同时最大化呢？如何平衡信度和效度？ Bachman和Palmer在其测试理论中认为可设置“可接受的最低程度”的效度或信度等质量指标从而使得语言测试的“效用性“(usefulness)原则中各特征之间达到适度平衡。由于测试总是在一定的价值判断、测试目标、社会环境等约束条件下进行的，本文尝试探索在可行性条件下，测试的总效用(overall usefulness)最大化时效度和信度之间可能存在的关系。通过以上的理论已经证明：信度和效度作为评估测试质量的两个重要基本特性，两者虽然在表面上和一定程度上是相互矛盾的，但完全可以通过采取相互协调的措施使之达到适度的平衡，把两者的优势发挥到最大，进而保证测试的总效用性最大化。我们从这一结论中得到的启示是：在英语测试的设计和命题过程中，不能绝对、片面、盲目地追求或强调某一方，只有综合平衡二者的关系才能获得最大的总效用。测试是教和学的导向。问题是如何提高测试的正面反拨效应，减少负面反拨效应。四、六级考试长期以来采用固定不变的模式，客观上造成了学生猜题、押题，教师偏向应试教学，产生了不良的教学效果。Hughes提出了若干提高正面反拨效应的建议：测试要培养能力；测试内容要覆盖面广并具有一定的不可预测性；尽量使用直接测试法；成绩测试要与教学目标相结合，使用尺度参照等。这些建议多数涉及效度，也与信度相关。信度和效度是影响反拨效应的重要因素, 正确处理好两者的关系能使测试产生积极有利的反拨效应。结束语测试的最终目的是服务于教学。作为教师，重视语言测试理论的研究，掌握命题的原则，在试卷编制过程中把握好信度、效度及其它评价指标之间最佳的平衡关系，将有利于优化各类英语测试的质量，更有效地推动英语教学的发展。 ※黑龙江省社会科学项目研究成果项目编号 12512083 参考文献： [1] Bachman, L. F & Adrian S. Palmer 1996. Language Testing in Practice. Oxford： Oxford University Press. [2] Bachman , L. F. 1999. Fundamental Con-siderations in Language Testing. [M]. Shanghai : Shanghai Foreign Language Education Press. [3] Carroll, B. J. 1980. Testing Communica-tive Perance： An Interim Study. [M]. Oxford： Pergamon Press. （作者单位：哈尔滨商业大学，外语学院）