“PSC評分細則”是對《普通話水平測試大綱》中有關評分標準內容的具體表述,是國家級、省級普通話水平測試員對普通話水平測試應試人的普通話水平等級進行測評的客觀依據,應具有較強的可操作性,必須規范和統一。從目前全國各省市試行的“PSC評分細則”來看,絕大部分與《大綱》的原則基本上是相符的,同時由于在個別問題上存在著認識上的分歧,在確定評分方法時就產生了一定的差別,這給測試員的測評工作帶來了一定的麻煩,在一定程度上影響了應試人的測試成績的準確性,因此需要進行統一的修訂與完善。從普通話水平測試的性質與效果看,各省市在制定“PSC評分細則”時也應遵循統一的原則與方法。因此,從一定意義上說,有必要制定統一的與《大綱》相配套的、不違背《大綱》精神的、全國通用的“PSC評分細則”。
一、制定“PSC評分細則”的原則
制訂“PSC評分細則”應遵循以下幾條原則:
1、依據《大綱》的原則
《普通話水平測試大綱》是普通話水平測試的指導性文件,也是綱領性文件。作為國家社會科學基金項目,《大綱》的研制歷時四載,并經學術委員會嚴密論證后才予以公布,因此具有一定的科學依據。作為《大綱》的補充和細化,“評分細則”的制定必須嚴格按照《大綱》“總論”部分的闡述進行,對《大綱》的原則意見要進行正確的理解與闡述,不允許出現偏離《大綱》原則的評判標準,更不允許為了操作方便或尊重個別人的主觀意愿而對《大綱》確定的原則進行隨意修改。如《大綱》規定第一題限時3分鐘,超過3分鐘就要扣分。有些地方在執行時就人為地將時間延長至3′30″才算超時,甚至提出4′以內也可以不扣分,這樣做其實違背了《大綱》的原則。從語言測試的信度與效度來分析,時間的限定是測試的一個取量成分,是必須的。《大綱》在研制的過程中,對此也是經過認真的研討與實驗的,不是憑空確定的。要改變這一時間限定,必須有足夠的理由,并要經過《大綱》學術委員會的認可。
2、尊重學術成果原則
對普通話的學術研究已有幾十年的歷史,語音、語調、方言等的研究歷史更長,學術成果頗多,許多理論已成公認的權威理論,一些學術研究成果已作為國家標準予以公布。如《普通話水平測試等級標準(試行)》是作為部級標準頒布的,作為信息處理的詞匯也有國家標準。制定“評分細則”時應充分利用已有的成果,在統一的前提下進行研討,不應強制推廣尚未取得公認的個人觀點。對于有學術爭議的問題,如關于輕聲、兒化、詞語輕重格等問題的處理尚未有國家級、部級標準,就應采取從寬的原則,不應強求一致。同時從語言規范化、推廣普通話的角度出發,也希望有關部門盡快組織力量,解決一些與普通話水平測試密切相關的迫切需要解決的問題,如關于必讀兒化詞、輕聲詞、普通話語調內涵的確定等問題。?
3、理論聯系實際原則
理論畢竟是在不斷發展的,《大綱》不可能也沒有必要對普通話水平測試中將會遇到的所有問題進行全面的闡述。有些問題是在測試的實踐中才發現的,如說話項語音面貌定量與定性錯位而造成的提降檔問題,方音明顯程度的判斷方法等。這就需要我們在《大綱》確定的原則的指導下,對實際出現的情況進行分析、歸類、研究,運用語言學的理論進行解釋、評判,找出比較適合實際的、具有一定科學依據的解決方法。?
4、客觀為先的原則
普通話水平測試是一種主觀判斷性測試,測試員測評能力的強弱起了很重要的作用。目前全國已有普通話水平測試員近2萬人,而且隊伍還在不斷發展。由于測試員個體的學術層次有高低,加上對測試標準理解上的主觀偏差,因此對同一個應試人,測試員的評分會有一定的差異,有的還會有較大差異。要解決這一問題,除了加強測試員隊伍建設、對測試員不斷地進行繼續培訓之外,更主要的是要遵循客觀為先的原則,在制訂細則時盡可能具體、客觀,要體現出較強的可操作性;對有些原則問題要用通俗易懂、明確而不含糊的語句加以闡述,以減少測評時的主觀偏差。因此,必須盡可能較少主觀評判幅度較大的一些評分條目,增加一些操作性較強的、較為剛性的評分條目,使主觀評分客觀化。
要讓主觀判斷性測試客觀化,必須增加客觀評分的分量,樹立客觀為先的意識。如關于語音發音錯誤、缺陷的界定,可以用音位學原理加以闡述,也可以用一般的列舉法來加以說明。《大綱》采用了舉例的方法,大部分測試員在培訓時更愿意用具體的例子來解釋這對概念,制訂細則時也可以采用這種客觀性強的方法。再如關于方言語調的判斷,可以將涉及語調的幾個主要內容加以說明,如字調、句調、輕重音的處理、停頓的方式、節奏的把握等,使測試員不至于因為主觀的感性模糊判斷影響具體目的測試項的客觀評判,以縮小評分的差異。
二、制定“PSC評分細則”的方法
1、對《大綱》“總論”的部分內容進行具體解釋
由于《大綱》對評分標準的表述原則性與綜合性較強,因此制定“評分細則”時必須將其加以具體化,一些較為概括性的、容易產生誤解的語句要進行詳細的解釋,以利操作。
比如,《大綱》“總論”部分有以下闡述:
a、讀音有缺陷只在第一題讀單音節字詞和第二題讀雙音節詞語兩項記評。
這句話的意思并不是說讀音的缺陷不影響第三題朗讀與第四題說話的評分,而是說在這兩項的評分中不能將它們按照第一題與第二題那樣記錄一個讀音缺陷就扣一個字音的讀音缺陷分,而是要將它們進行歸類,再按照每一題目的測試項的不同評分要求進行評分。根據這一理解,“評分細則”可以將其表述為:“語音缺陷”在朗讀項與說話項的測評中,不能按字的個數進行記錄并扣分,但需要對發音缺陷類型進行歸類以作為認定有無方言語調的參考條件和確定“方音”明顯程度的依據。
b、應試人有較為明顯的語音缺陷的,即使總分達到一級甲等也要降等,評為一級乙等。
這里所講的“語音缺陷”,是指成系統的語音缺陷類型,或分布較為廣泛,涉及類型較多的語音缺陷,而不是指偶爾出現的或數量較少不成系統的語音缺陷類型。“評分細則”對此要有明確的表述。同時應說明什么樣的情況才算是成系統的,什么樣的情況還沒有構成系統等等。?
c、語速過快或過慢一次性扣2分。
朗讀語速怎樣算“過快”或“過慢”?《大綱》沒有解釋。宋欣橋先生在《普通話水平測試評分中的幾個問題》(《語言文字應用》1997年第3期)中提出語速的一個“準極限數”的概念:每分鐘字數上限為360音節,下限為120個音節。宋先生認為:“每分鐘超過270個音節,可視為‘過快’”、“每分鐘少于170個音節的,……可視為‘過慢’”。實際上,很多測試員都有類似的體會:不同題材的文章,不同的朗讀者進行朗讀,朗讀速度會有很大的差別。測試材料盡管選用的多是記敘文、散文,但每分鐘超過270音節的情況在測試中比較少,而且超過270音節/分鐘的語速會使聽的人感到十分的吃力,甚至會覺得難以容忍,因此把它定為“過快”還是比較合理的,值得注意的是朗讀速度確定為“過慢”似乎不應是每分鐘少于170個音節。從對目前公開出版發行的50篇朗讀材料的朗讀示范分析,語速每分鐘少于170音節的比較多,但也未給人以“過慢”的感覺。倒是接近了“準極限數”下限線(120音節/分鐘)時,才給人以難以忍受的感覺,此時判其為“過慢”比較合理。經過對50篇文章朗讀速度的對比分析,我們認為以確定每分鐘少于130音節為“過慢”比較合理。“評分細則”對此應有一個明確的說法。
將朗讀速度定為每分鐘不少于130音節的另一合理解釋之處是,《大綱》對全文朗讀時間有一個限定,為4分鐘,并且有30秒的可容空間。作品46號是所有朗讀篇目中篇幅最長的一篇,共578字,按每分鐘130字的速度計算,需用時為4分25秒,很接近限定的扣分時間但又沒達到必須扣分的標準。
2、對《大綱》確定的原則進行適當的補充和闡述
對于《大綱》沒有涉及的或較為原則的意見應進行適當的補充和闡述,使“細則”的操作性更強、更為客觀、具體,評分更為科學。
(1)關于讀音錯誤與缺陷的界定
讀音缺陷與錯誤的界定不論是國家級普通話水平測試員資格考核培訓班還是省級普通話水平測試員資格考核培訓班上都是作為重頭戲進行訓練的,但遺憾的是相當一部分測試員在測試時還是云里霧里的,只是憑著感覺來評判。這一方面是因為這些測試員缺乏語音學的基本理論知識,無法對讀音缺陷進行具體描寫,同時也由于方言的復雜性和應試人發音的不確定性,即使一些掌握一定語音知識的測試員也無法對某些發音缺陷進行較為精確的描寫。這對于普通話培訓、提高應試人的普通話水平時非常不利的,因此有必要對一些較為特殊的發音缺陷進行分析研究,將其歸類整理,然后根據各省市方音特點,詳細描述出讀音錯誤與缺陷的各種類型,供測試員培訓與測試時參考。
讀音錯誤與缺陷的界定在《大綱》“總論”部分有舉例性質的說明,由于地區的差別,方言的特點,各省市對語音錯誤與缺陷的界定(尤其在類型上)會有所不同,這是正常現象。考慮到語音發音錯誤與缺陷的界定涉及的范圍較廣,數量較多,因此建議將它作為“ PSC評分細則”的“附件”印發。
(2)關于聲調成系統缺陷的扣分問題
這里首先要明確,什么是聲調缺陷成系統。所謂聲調發音缺陷成系統,是指同一類聲調大部分的發音都保持相同或相近的一種狀態,而這種狀態是可以判斷為是發音有缺陷的。《大綱》認為,聲調缺陷“一般是成系統的,每個聲調按五個單音扣分”。從實際操作情況看,聲調發音缺陷成系統主要是通過量的積累而加以定性的,量較少時,我們可以認為聲調發音缺陷不成系統,但較為復雜的情況是,有時候量的積累較難判斷聲調發音缺陷是成系統還是不成系統,這種情況下,測試員對于聲調發音缺陷成系統的扣分是有差別的。因此建議“評分細則”對此可以作如下規定:“一類聲調發音缺陷數量超過十次,可以按五個單音錯誤一次性扣分;數量不足十次,以按實際發音缺陷個數扣分為宜。”
(3)關于詞語輕重格問題
詞語的輕重格問題是很多測試員較為關注也較為頭疼的問題。實事求是地說,相當一部分測試員對輕聲問題都覺得難以掌握,更不用提“中?次輕”、“中?重”、“重?中”、“重?輕”等不同的輕重格式了。而國家語委至今也未出臺按類型分項的規范的輕重格詞表,兒化也是如此。對此,“細則”應有說明:凡應試人已掌握“中?重”、 “重?輕”兩種基本格式的,其他格式可以不作評分要求。但由于詞的輕重格涉及語調問題,因此在評定一級普通話時,應對此提出評分要求。
其他諸如朗讀項的“方言語調”、“停頓、斷句”、說話項的“方音”明顯程度、“語音面貌”的定檔問題、“自然流暢程度”的確定、“詞匯、語法規范程度”等問題的處理,都需要進行具體的闡述和補充。
3、遵循《大綱》精神,根據實際情況適當加以發展
《大綱》有這么一條意見:隨著情況的變化應適當增加說話評分的比例。
目前試行的《大綱》確定說話項的分值為30分,并有以下表述:“試行階段采用以上評分辦法。隨著情況的變化應適當增加說話評分的比例。”根據這一精神,結合國家語委普通話培訓測試中心的指導性做法,從96年開始,很多省市采用取消“判斷測試”項,將其分值10分加入到“說話”項中的評分辦法。由于說話項所增加的分值一般都消化在“語音面貌”的評分中,使“語音面貌”的檔間分值距離相差加大,尤其是四檔以下,分值相差分別為6分和3分。這對應試人普通話等級進入二級增加了難度,測試結果與應試人的實際水平也有一定的差距。有鑒于此,部分省市對兩種不同類型的評分方法進行對比測試評分,提出提高五、六檔分值的意見,并經報請國家語委普通話培訓測試中心審定后實施。目前,大部分省市都采用說話項“語音面貌”每檔分值相差3分的做法,在實際操作中證明是比較合理的。因為這一評分辦法是對《大綱》原則意見的發展,因此在制訂“評分細則”時應有比較明確的表述。
4、制訂“評分細則”時盡可能使用比較容易把握與操作的表述語句
作為測試員在測評時的主要參照依據,“評分細則”應具有較強的可操作性,使不同測試員在把握、評判時不會產生較大的誤差。比如對于“方音”明顯程度的判定,不能光憑主觀判斷,還要根據應試人說話時存在的語音錯誤與缺陷類型的多少,提出比較容易把握的指導性意見。如“說話時有一類聲調存在成系統的缺陷,即可判定應試人方音明顯;有一類聲調存在成系統的錯誤,可以判定應試人方音重。”
制定“PSC評分細則”是一項嚴謹而又復雜的工作,它需要在《大綱》原則的指導下,根據測試實踐,運用語言學、語音學、方言學、語言測試理論等知識,依據測試手段、測試方式、測試對象的特點,進行科學而又具體的論述,其目的是統一測試員的評分標準,使PSC的評分減少主觀性差異,更具有客觀性,從而使普通話水平測試向著更為科學、客觀、健康的方向發展。
[參考文獻]
①[英]阿蘭·戴維斯.語言測試原理.北京:經濟科學出版社,1997。
②宋欣橋.普通話水平測試員實用手冊.?北京:商務印書館,2000。
③劉照雄主編.普通話水平測試大綱.吉林:吉林人民出版社,1994。
④語言文字報刊社.語言文字應用.北京:語言文字應用雜志社,1997-3。
⑤何文征.加強普通話水平測試的客觀性.北京:語文建設,1998-9。
⑥劉鐮力.漢語水平測試研究.北京:北京語言文化大學出版社,1997。
⑦李筱菊.語言測試科學與藝術.湖南:湖南教育出版社,1997。
(作者:屠國平)