提要:普通話水平測試實行數年來的實踐積累了豐富的經驗,實踐證明現行的《普通話測試大綱》的基本原則與指導思想是科學的。任何首創性的工作都是在不斷探索與總結中獲得完善的,經驗的積累與總結為我們今天從理論與方法上對這一首創性的工程方案提出修改與完善提供了必要性和可能性。本文聯系廣東省近年普通話水平測試的實踐,擬從理論與實際的結合上對現行測試方案的內容與方法進行剖析,并針對現行測試方案中尚存在的待完善的問題提出個人的修改建議。
關鍵詞:普通話水平測試?總體構架?分值比例?
自國家三部委發布《關于開展普通話水平測試工作的決定》、國家語委發布《普通話水平測試實施辦法》(試行)以來,普通話測試工作在全國全面展開,取得了可喜的成績,我們不但建立了一套工作大綱與檢測方法,而且培養了一支具有實戰經驗的測試隊伍。七年來的工作實踐證明,這項工作是非常必要的,它受到了全國各條戰線上的普通話應用工作者的普遍肯定。
語言測試工作本身是一項科學含量高、方法細致的動態測評工作,國外亦處不斷探索、完善的過程中。普通話水平測試工作的開展在我國是一項首創性的工作,無論在理論上還是方法上,均處在試行的起步階段,七年來的實踐和探索為我們積累了寶貴的經驗,這是我們今天有可能對這項首創性的工作作出豐富和發展的基礎。
一、關于普通話水平測試總體構架的思考
我們是身處一線的測試員,數年的測試實踐告訴我們,設計詞語、朗讀、說話三個相互銜接的測試層面是科學的,把握了普通話測評的基本規律。評分方法的設計也具有可操作性。就總體而言,現行測試大綱的總體構架是基本合理的,但仍有進一步調整、完善的必要。
我們認為在目前普通話水平測試的總體構架上,對試項的設置與總體分值比例的設計兩個方面尚存在修改的必要,具體建議如下:
(一)、關于重新調整測試項目的建議?
建議保留“詞語”、“朗讀”、“說話”三項測試內容,撤銷“判斷”項,加大“說話”項的測試比重。其理由有四:
1、“判斷”項包括常用詞語選擇、量詞選擇、句式選擇三部分,涉及詞匯、語法兩方面內容。從理論上說,這套試題庫應涉及全國各片方言與普通話間有差異的詞匯與語法內容才是科學的,因為被測人員來自于全國各方言區,方言覆蓋率是100%,而現有試卷中該套試題方言內容的覆蓋面還是相當窄的。方言與普通話的對比研究是一項專業性較強的工作,就目前我國現有的方言研究成果來看還遠不能滿足這一要求。
2、方言詞語與普通話詞語間并非都是一對一的關系,如普通話的常用程度副詞“很”做狀語時可對應吳語的“交關”,但作補語時情況就不完全一樣。普通話“胖得很”是一般說明;吳語“胖交關”一定是比較說明(比以前、比他人),且不用助詞“得”,對譯成普通話的意思是“胖得多”。“交關”在廣州話中的詞義有兩項:①表示程度深;②厲害。該類細微的對應差異如何在卷面的詞語選擇中準確落實不是一個簡單的問題。另外,方言中的很多使用頻率極高的詞語是無字可寫的,要將這些都落實到卷面上,難度是可想而知的。
3、設計這些對比判斷的目的是為了檢測特定方言區應考者的規范判斷能力,其目標十分具體。要達到這一目的,試卷的設計必須具有很強的針對性,從道理上說應當因人而宜,起碼是因方言區而宜。如果做不到這一點就不能保證該項測試基本目標的落實;要落實這一目標,在目前確實有較大的資源困難。即使依靠各地高校的科研隊伍弄出一套選擇試題庫,也與目前抽簽選題的方法相矛盾(抽簽選題是任意的,沒有明確的目標)。廣東省語委近年一共組織進行了十三批測試,每一批應試者的來源都比較復雜,幾乎遍布全國各大方言區,母語各不相同,如何保證該項選擇測試的針對性,實際操作實在有較大的難度。
4、目前該項選擇的內容完全是以書面形式呈現的,在我所接觸的測試對象中,幾乎每一個人都具備較理想的書面閱讀能力,絕大多數應試者都能拿到該項測試的滿分,這中的一個重要原因是他們可以憑借規范的書面語習得作準確的判斷。卷面呈現的絕大多數方言詞語和語法形式在他們的閱讀經歷中從未出現過,也就是說,應試者從小到大很少具備方言書面語的語感,因而正確選擇也就不成問題了。一句話,該項選擇往往不是應試者直接依憑普通話口語語感作出的判斷,因而設立該項選擇的意義就不是太大。
(二)、適當調整總體分值比例的建議
目前《普通話測試大綱》(以下間稱《大綱》)規定的分值比例是這樣的:一、讀單音節字詞10分;二、讀雙音節字詞20分;三、朗讀30分;四、判斷10分;五、說話30分。其中一、二項純屬語音(音節和音節連讀)分值,第五項說話的語音分值也占20分,只有第三項朗讀所占的語音分值不好確計。我們不妨用排除法對第三項的語音分值作大概的估計:該項一共有6個評分標準,只有2(漏讀增讀)、4(停頓、斷句不當)、5(語速過快或過慢)、6(超時)不屬語音(音節和音節連讀)考察,若以該項的總分減去非語音考察分即是該項的語音分值。假定一個中等程度的應試者參加測試,一次漏、增讀8個字(應該不算少了)扣0.8分,停頓、斷句不當5次扣5分,語速過快或過慢與超時各扣1分,非語音扣分累計也只7.8分。該測項共30分,扣除7.8分,該測試者的朗讀測項中語音分值仍有22.2分,占該項總分的74%。如果將五項測試內容中的語音分值累加起來,共計72.2分,這一分值比例就約近于普通話水平測試總分的3/4了。如果刨開判斷項10分,純語音(音節和音節連讀)考核分值占普通話水平測試總分值的80.2%,只有19.8%是考察語音之外的普通話內容,這一比例顯然是值得商榷的。我們都知道,規范語音并不是普通話的全部內容,我們也從未見過一個只教普通話聲韻調和音節發音的老師能真的教會學生說普通話。普通話的內涵包括語音、詞匯、語法三個有機聯系的部分,普通話水平測試實際是一個人普通話交際應用能力的測試,過分地偏于語音權重顯然容易忽略應試者實際“能力”的考察,從而“水平”的檢驗也就難以落實了。
當然,語音的考核還應該是測試的重要內容之一,音節和音節連讀是起碼的基本功,可是孤立的音節與語流中的音節并不是同一回事,前者是相對靜止的、死的,后者是流動的、活的。在具體測試中我們常常發現,有些應試者在讀詞語時很順利,幾乎挑不出什么大毛病,可一旦進入說話項時就幾乎成了另一個人:當他顧及到語音時就話不成句、斷斷續續,當他顧及到表達連貫時就方音百出,這證明規范語音的真正掌握也必須在活的語流之中。上述現象具有一定的普遍性,其根本問題正是缺少普通話交際的實踐,而普通話水平的衡量恰恰應該是普通話應用能力的衡量。
根據上述理由,我們的傾向是從測試的總體權衡上減少字詞項的分值比例,擴大說話項的分值比例,取消“判斷”項,將該項的分值移入“說話”。
二、普通話測試分項設計的思考
(一)、“讀單音節字詞”與“讀雙音節詞語”試項設計的思考
1、存在的問題
在數年的測試實踐中,我們接觸了數百份不同的試卷、上千名測試對象,我們認為這兩個測試項尚有以下幾個問題值得討論:
(1)、此兩項卷面的設計對普通話聲、韻、調的覆蓋率均有一定的要求,而異讀現象卻是普通話不可回避的事實。在雙音節詞語中因為語素的相互制約,異讀受到控制,可在單音節字詞中完全沒有制約的條件,只要是異讀就存在一定的任意性。1985年修訂的《普通話一讀詞審音表》共收異讀字256個,看似不多,但在現有卷面上出現的頻率卻并不低,試以《普通話水平測試大綱》中“讀單音節字詞”的兩份樣卷為例:Ⅰ型樣卷除去輕聲異讀外,尚有洗、炸、思、沙、親、胖、空、分8個異讀字;Ⅱ型樣卷除去輕聲異讀外,尚有縮、思、撇、臊、否、蚌、暈、巷、佛、上10個異讀字,占10%。按Ⅱ型卷聲母的出現率1-7次、韻母的出現率1-5次來衡量,10%的比例足以左右單音節字詞聲韻母規定的覆蓋率。
(2)、字是書寫用的符號,作為書寫形式的漢字與口說的普通話本身并沒有直接的關系, “民”、“言”、“語”、“習”、“豐”等均是大家再熟悉不過的字,盡管如此,這些“字”在正常的普通話語流中從不會單獨使用,獨立出現在普通話中的只能是詞語。既然這些“字”不會在普通話中單獨出現,那么這些非普通話成分也就不宜作為普通話測試的內容。閱讀《大綱》的Ⅱ型樣卷第一試項,卷面共出現旅、思、鏢、否、暫、凝、罐、翁、巷、庸、迥11個普通話不能獨立成詞的單“字”,這說明我們在該考項的設計上還有欠科學的成分。
(3)、一、二兩個試項除考察應試者語音的規范程度外,我們認為還應該將他們規范閱讀的熟練程度納入考察的內容。目前兩個試項的規定時間分別都是3分鐘,在我們的評考經驗中,最快的應試者78秒讀完第一項,43秒讀完第二項;最慢的應試者也用不完3分鐘,可見3分鐘的時限規定太寬,無法區分應考者規范的熟練程度。
2、改訂建議
鑒于上述原因,我們提出如下改進建議:
(1)、建議在調查研究的基礎上做出適當的規定,將試項一卷面出現的異讀單音節詞限制在一定的比例范圍內(完全回避不容易辦到),以避免對聲韻母覆蓋率產生明顯的影響;
(2)、建議針對各方言區的語音特點,適當增加該方言與普通話讀音差異較大的聲韻母覆蓋率的指數;
(3)、建議將測試第一項的名稱改為“讀單音節詞”,取消普通話中不能成詞的單音節字。
(4)、建議將該兩項的閱讀時限分別由3分鐘改為兩分鐘。
(二)、“朗讀”試項設計的思考
1、存在的問題
目前朗讀試項在設計上的主要問題是與詞語考核項的界限不清,《大綱》雖明確規定“重點測查連讀音變、語氣、語調,以及停頓、斷句、全篇朗讀語速和流暢程度”,但在操作上實際仍以語音分值為主(前面用排除法計算的一個中等水平應試者的該項語音分值占74%),所以造成了語音考核項外延的擴大、朗讀考核項自身考核中心的不明。
朗讀形式介乎語音詞匯與表達之間,就其在普通話教學中的功能而言,它是詞語連讀向句子和說話過渡的橋梁,所以應當保證朗讀測試自身的測查中心,并在合理的分值權衡中予以落實。
朗讀的基本結構單位不再是詞語,而是句子,它由句子、句群、段落組成篇章。與一、二項詞語考察相比,它具備語義重音、語氣、語調、停頓、節奏(語速及流暢程度)等內容,這些都是說話必備的基本表達手段。與說話相比朗讀有文字憑依,內容是現成的,應試者只是以規范的表達手段再現文章,而說話是應試者個人即興能動的發揮。鑒于這些特點,朗讀應該是在規定的語流中對應試者的語音與必備的表達技術作綜合測查,顯然不應該與詞語試項重合。
2、改訂建議
為落實朗讀考核合理的測查目標,我們建議:
(1)、在語音測查的同時,保證語義重音、語調、語氣、停頓、節奏等普通話必備的基本表達成分測試分值的落實,并按語音與基本表達成分并重的計分原則予以合理規定。
(2)、測試實踐告訴我們,朗讀試項的語音計分方法不宜重復詞語項一詞一記的方法。朗讀已進入了語流階段,音節的流動速度大體是詞語項的三倍到四倍,即使是最優秀的測試員也難以在不停息的語流中作逐音節判斷。測試員若將主要精力集中于逐音節的判斷,那就根本無精力再顧及到其他,這是很簡單的道理。我們并不難想象目前測試員們在該試項實際操作中的無法超越的顧此失彼狀況,因此其測試結果也就不難理解了。
我們認為,在該項的活語流中測查應試者的語音情況是必要的,因前提與內容的變化,該項與詞語項的檢測角度也應有所不同。我們建議該項宜舍棄逐字測檢的方法,重點考察應試者在朗讀語流中存在的語音系統上的問題,按類別問題的輕重作出區分,并以適當的規定從總體上對朗讀語音加以把握。這一方法不但合理而且便于操作。
(3)、對朗讀的時限作重新規定。電臺播音員正常的播音速度平均每秒3.5個音節(包括停頓在內),如果平均語速慢于每秒2個音節就已經不是正常的語流。《大綱》規定400字的朗讀時限是4分鐘(合2400秒),平均每秒1.7個音節,顯然低于正常語速。朗讀項本身包括流利與否的考察,應試者起碼應該具備正常的語速。在我們測試的實踐中從未遇到過該項測查超時的現象,因此,該項的時限應改作3分鐘較為合理。
(4)、宜保證朗讀形式的相對完整。朗讀的開頭、過渡、結尾各部分是一個有機的組合體,相對完整是朗讀表達形式的特點,尤其是朗讀篇章的結尾,它一般都是全文內容的總結,文義往往集中體現在末段的句意與語氣上。《大綱》目前的規定是“以前400字為準”,翻閱50篇短文,其中的48篇由雙斜杠從句中將文章切開,兩篇從段落切開,這就從形式上破壞了朗讀內容的完整。試想,每一個應試者正讀到句子中間時,忽聽到測試員喊“停!”,這是什么滋味?不難理解,該項的設計從一開始就是以音節考核為出發點而不是朗讀測試本身,故而不得不犧牲朗讀的完整而以字數為限。維護朗讀內容的相對完整實際是維護該測試項面貌的完整。
我們認為,如果采用語音系統錯誤判別的記分方法,那就可以相對擺脫嚴格字限的困擾,再對現有朗讀篇章進行適度的加工節選,使我們能在較為完整的形式中判斷應試者的朗讀水平。
(5)、“漏讀增讀”的扣分不宜一概而論。50篇短文本身的文字就有明顯的高下之分,即使是當今的經典作品也有版本的不同。對于大部分不曾有朗讀實踐的應試者來說,鼓勵他們以流利的普通話朗讀才是目的,流利與一字不拉不增是矛盾的,即使優秀的播音員有時也難免不經意地增、漏。我們認為,如果應試者在不影響原句意的前提下漏、增個別字,應該是無礙大體的,可不予扣分;如果漏、增字明顯影響朗讀句義,那當然另當別論。
(6)、《大綱》后附的朗讀篇目宜作適當整理。目前所選的50篇短文朗讀難易度懸殊較大,有些選篇的文字并不規范,有些文章并不適宜朗讀。為維護《大綱》的權威性,我們建議對朗讀選篇作重新篩選,在考慮規范性、經典性、可朗讀性、難易適度的同時,一并考慮篇章的相對完整性。
(三)、“說話”試項設計的思考
1、存在的問題
“說話”試項的測查目標是應試者憑借自己的語言思維圍繞一個選定的命題作規范表達的水平,即普通話應用的能力。這里應該包含三個考查內容:一、語言(包括語音、詞匯、語法三方面)規范程度;二、對命題表達中心的把握程度;三、表達流利程度。無論從理論的角度還是從應用的角度分析,“說話”試項都不應該是前三項考核內容的重復,它應該是對應試者運用規范的現代漢語作命題達意能力的綜合考察,不但檢測應試者在隨機表達中的普通話面貌,更重要的是要測查應試者普通話的應用水平。語言說到底不過是工具,普通話亦如此。工具與技能并不是一回事,工具再精致,如果不能按一定目的付諸運用,當然也就不能體現工具的價值,“說話”試項規定各種命題的目的正是要求應試者圍繞某一個特定的中心作即興表述。如果我們忽略了普通話應用能力的考察,只注重普通話這一“工具”的形式,實際上是離開了“說話”試項的考察中心。
根據“說話”試項應該具備的考核目的,我們認為該項目前有以下幾個問題值得商討:
(1)、過分偏重于語音考察會忽略普通話應用能力的測試。目前“說話”項的分值規定是:語音標準度20分,占該項積分的67%;詞語、語法規范度5分,占16.5%;語言流暢度5分,占16.5%。如果將前兩項分值合并,“說話”規范度的積分是25分,占該項考核總分值的83.5%,屬于普通話應用能力考察的分值只占16.5%,對規定的命題內容(表達中心)沒有作任何要求。嚴格地說,這已不是普通話表達水平的考察,而是普通話形式的考察。大家都知道,說話是一種交際表達行為,其目的是為了傳遞語言信息,世界上沒有一種語言表達可以離開表達內容而能獨立呈現,脫離表達內容的“說話”是不存在的。也只有在規定的內容中,我們才有可能測查應試者實際的“說話”水平,“命題”說話正是對應試者能否圍繞一個指定中心作普通話應用的能力的檢測,以防止應試者憑依事先準備好的文字作背誦表述。如果對此沒有任何要求,《大綱》則完全不必作命題規定,聽任應試者隨意,這顯然脫離了“說話”試項的預定宗旨。
(2)、缺少雙向交際,應試者的“聽”話能力始終得不到檢測。目前“說話”的主要形式是單向表達,《大綱》雖提及“必要時輔以主試人和應試人雙向對話”,因未作任何硬性要求,“對話”在測試實踐中基本不用。因為是單向表達,且《大綱》對說話中心沒有任何要求,應試者完全有充裕的時間在應試前準備幾份機動的文字稿,考試時背誦或在背誦時稍加變化即可過關,即使“文”不對題,考官也沒有任何扣分的依據。
在近年的測試實踐中我們還奇怪地發現,很多應試者同一話題的內容幾乎千篇一律,開頭、結尾一模一樣。原來市面上如今出現了各種各樣的普通話水平測試指導書,《大綱》所列的所有話題在這些“指導書”中都有現成的文字答案,應試者完全可以照文背誦,以應付測試,可見僅憑單相交流已不再是考察說話能力的有效方法。
對于大多數人來說,雙向交際是他們日常生活中的常用表達形式,雙向交流有靈活多變的特點,聽、說相間,便于更真實地測查應試者的實際普通話水平。從科學的角度說,“說話”不但要包括述說能力的測試,而且也要包括聽話能力的測試,而聽話能力在應試者的單向表達中是永遠無從體現的,這也說明“說話”試項在設計上必須增加雙向交流的內容才具備科學的考察信度。當然,這就對測試員的業務能力提出了更高的要求。
2、改訂建議
依據上述原因,我們對該試項的設計提出如下建議:
(1)、在總體設計上將“說話”分為“單向表述”與“雙向交流”兩項,時限各為兩分鐘。兩項測試分值并重,在測查內容上兩項可相互參照。
(2)、單項表達不應只局限于命題表達一種形式,比如,在具備語音室或放音設備的條件下,可集中聽一段錄音,然后圍繞這段錄音分別從不同角度給應試者提出問題,讓他稍稍準備后,作兩分鐘的闡述。這樣不但有“說”,而且兼顧了“聽”的考察。
(3)、區別“說話”與一、二、三試項的測查重點,壓縮語音測查的分值比例,確定 “規范”內容檢測與普通話應用能力檢測并重的評分原則,并將“命題中心把握能力”的考核內容置于表達應用能力之中。
(4)、語音規范內容的測查同樣舍棄逐字判斷的方法,建議以系統錯誤與缺陷作為扣分的依據(參照“朗讀”項的計分建議)。
三、關于試行初級、高級兩步測試方案的建議
通過調查我們獲得這樣一組數據:廣東省現有中小學普通話應試教師約100萬,按現有測試速度計算,要完成100萬名中、小學教師的測試任務需要8年時間。如果將全省的國家機關工作人員、行業服務人員包括在內,測試任務起碼要增加10倍,這就不能不使我們思考目前的測試效率與測試進度,何年才能完成廣東省的測試任務?
這里還有另一組數據:廣東鶴山市2001年共測1241人,其中一乙1人(占0。08%),二甲80人,二乙464人,三甲614人,三乙82人。一乙以下共1240人,占總比例99.92%(其中三甲人數最多,614人,占總比例的49.4%)。惠州市2001年共測3248人,一乙1人(占0。03%),二甲142人,二乙1382人,三甲1667人,三乙56人。一乙以下共3247人,占總比例的99.97%(其中同樣是三甲人數最多,1667人,占總比例的51%)。廣州市2001年共測11652人,一乙31人(占0.27%),二甲2066人,二乙4864人,三甲4415人,三乙276人。一乙以下11621人,占總數的99.73%。即使是通過精心推選的廣東省測試員培訓班學員,2001年度一乙以上(包括一乙)的通過率也只有25.8%。測試實踐證明,廣東地區絕大多數被測者的普通話水平均在一乙以下。目前《大綱》只有一套測試方案,其測查的精密度以一甲為目標,而對于絕大多數被測人員來說并不需要這樣高的精密度,所有被測者不必一律要經歷“單音節字詞”、“雙音節詞語”、“朗讀”、“判斷”、“說話”5項測查程序。為節省人力資源、加快測試進度,我們建議宜將整個測試分成初級測試與高級測試兩個階段,以現有的測試程序為“高級測試”方案,然后再簡化內容,適當增刪“詞語”與“說話”兩個試項,重新設立“初級測試”方案。“初級測試”方案同樣以“三級六等”分級,按100分考計。每個被測者必須首先經歷“初級測試”階段,“初級測試”達到二甲以上者,方可有資格進入“高級測試”階段。這樣,總體測試進度可提高數倍。多年的測試實踐告訴我們,二甲以下的應試者往往通過詞語試項的考察即可有把握對其普通話所屬的等級作基本的鎖定,所以,我們提出增設“初級測試”方案的設想不但有實用的依據而且有可行的依據。如此不但可以大大提高整個測試的進度,而且兩次測查可以有效地保證二甲以上的測試質量。
(暨南大學中文系 伍 巍)