王暉:國家語委普通話培訓測試中心測試處副處長,講師,國家級普通話水平測試員。主要研究方向為近、現代漢語語法及現代漢語詞匯等。主要研究成果有部頒標準《普通話水平測試大綱》(主要研制人員),論文《1994年以來普通話水平測試研究概述》等。目前擔任國家語委語言文字應用“十五”規劃重點項目“普通話水平測試研究”課題統籌。
普通話水平測試研究是國家語委語言文字應用研究“十五”科研規劃重點資助項目,該課題是一個十分龐大的研究系統,具有特殊意義及政策性影響,國家語委普通話培訓測試中心組織全國近20個省(市、自治區)語言文字工作機構和20多所高校、科研機構聯合申報,目前已獲批準立項。本文擬就普通話水平測試研究的現狀談談我們的構想。
一、普通話水平測試研究現狀
1994年10月,國家語言文字工作委員會、原國家教育委員會、原廣播電影電視部聯合發出《關于開展普通話水平測試工作的決定》的通知,普通話水平測試(PSC)自此在全國正式開展起來。2000年10月頒布的《中華人民共和國國家通用語言文字法》又通過立法手段對普通話水平測試加以強調。近幾年全國各地(包括港澳地區)測試工作發展十分迅速,形成了比較科學規范的管理和運行體系,產生了廣泛的社會影響。普通話水平測試研究從論證到實施,從理論到實踐,經過廣大專家和業務人員的辛勤努力,也取得了很大成績。
1991年通過鑒定的由孫修章主持的國家社會科學基金項目“普通話水平測試標準”,奠定了普通話水平測試的基礎。劉照雄主編的《普通話水平測試大綱》(國家社會科學基金項目,1994)是目前為止普通話水平測試最重要的研究成果。據統計(王暉,2002),1994年至2001年,全國發表關于普通話水平測試的論文約110余篇。2002年5月國家語委普通話培訓測試中心主辦了首屆全國普通話水平測試學術研討會,從全國選送的100余篇論文中,精選31篇進行交流。可以說,普通話水平測試研究與工作實踐目前正處于互動狀態,形成了一個良性循環的發展態勢。但是,普通話水平測試畢竟是我國新興而且復雜的語言測試工程,與我國的漢語水平考試(HSK)及國內外其他一些著名的語言測試相比還顯得不很成熟,研究成果與語言學其他領域相比,也顯得不夠豐碩。在發展過程中,形勢和任務迫切要求全國有關領域的專家跨領域合作,共同攻關,采用新的研究手段和方法,解決一系列突出的理論問題與實踐問題。
(一)在理論研究方面,陳章太、仲哲明、劉照雄、孫修章、宋欣橋、毛世楨、王渝光、李宇明等進行了有益的探討。但總體而言,某些具體問題研究較多,系統的基本理論研究仍顯薄弱,普通話水平測試的理論框架體系尚未構建成熟。普通話水平測試作為一種獨特的語言測試,不僅涉及到普通話本體等語言學及應用語言學方面的內容,而且涉及到考試的方式、方法等教育測量學方面的內容。目前,普通話水平測試的教育測量學研究顯得滯后。教育測量學研究成果現在已普遍應用于一些著名的語言測試,如美國ETS的TOEFL、GRE,國內的HSK等,成為這些語言考試的重要理論支撐。張雷、楊志明、王渝光等運用當今國際心理與教育測量領域研究熱點之一的概化理論(GT),對普通話水平測試進行了研究,但仍屬于初步的探討。因此,引進先進的現代教育測量理論來深入研究普通話水平測試,不僅十分必要,而且十分緊迫。隨著普通話水平測試的不斷深入,測試過程中一些心理因素的影響也逐步凸顯,影響到測試的準確性和科學性。而該領域的有關研究,國內尚屬起步階段,相關研究很少,而且僅限于描述層面,涉及內容相對表淺和零散,未能深入而系統地揭示普通話水平測試的相關心理因素和調控策略,研究成果更談不上很好地應用到實際測試中去。普通話與方言的對比研究,目前國內取得了很多成果,但把這些成果運用于普通話水平測試的研究,則尚未出現有影響的著述。普通話水平測試還特別需要比較研究的成果,田小琳《中國內地與香港特區普通話測試之比較研究》作了有益的探索,但總體而言,這方面的研究太少。HSK及國內外其他一些有影響的語言測試在測試理論、試卷設計、題庫建設、統計分析、管理現代化、信息反饋、測試與培訓互動等方面都有可資借鑒之處,深入而廣泛地開展語言測試的比較研究亟需加強。
(二)在規范標準的研究方面,為了進一步規范普通話水平測試的規程,修訂考試的內容、評分方法、范圍,經國家語委批準,已于2002年初組成以姚喜雙、劉照雄為負責人,以國家語委普通話培訓測試中心業務人員為主要力量的課題組,在已有的研究基礎上,進行《普通話水平測試大綱》(部頒標準)和《普通話水平測試實施大綱》的修訂及研制,這是一個帶有全局性、指導性的重大課題。普通話水平測試題庫建設,是一項關乎普通話水平測試科學性、公平性、客觀性、權威性的基礎性工作。目前在上海市以及云南等其他一些省區做了實驗,取得了一定的經驗。但與“標準一致、難度等值、科學性強、數量足夠”的建庫目標尚有一定差距,甚至存在某些與現行《大綱》規定不一致之處,需要進一步改進。盡快開發與新《大綱》相匹配,適用于全國的高質量的普通話水平測試國家級題庫,是擺在我們面前的重要而緊迫的任務。
(三)在施測手段方面,普通話水平測試,目前主要采用主觀評測的方法,這使得測試成本很大,測試員勞動強度高,特別是測試信度受到一定局限。而目前無論在國內還是國際上,都還沒有一種描述普通話水平的客觀參數。近年來實驗語音學、語音識別技術和計算機技術的進步,在某些方面為計算機輔助普通話水平測試評分提供了可能。所以借鑒語音分析技術、語音識別技術、現代數理統計技術,利用計算機提供出應試者的參考評分和評分的可信度級別,并進一步研究語音質量的主觀評價和客觀評價方法,具有重要的開創性的意義。
(四)在測試的現代化管理方面,TOEFL、GRE、GAMT和HSK等著名的語言測試都已全面利用計算機進行考試管理,其系統涵蓋了考務信息管理、題庫管理等各方面,技術水平和成熟度都較高,產生了相當好的經濟效益和社會效益。而在我國,雖有上海、湖北、黑龍江等省市在普通話水平測試科研和管理工作中引入現代化信息技術,但出現各地獨立開發,重復建設、互不兼容、技術水平參差的不協調局面。因此急需提高信息管理的規范程度,開發研制出一套技術先進、全國通用的普通話水平測試信息管理系統。
在測試基礎性資源庫建設方面,普通話水平測試在許多方面還是空白。語音語料庫的建設,引起當今許多國家、組織和個人的密切關注,在國家高科技研究發展計劃(863計劃)的支持下,國內也建立了多個語音數據庫。但這些語音數據庫大多是面向信息處理領域。建立普通話培訓和水平測試用標準語音語料庫和“中介語”語音語料庫,盡快填補國內這方面的空白,并為深入開展測試研究提供一個技術平臺,具有特殊的重要意義。
(五)當今我們已處于一個迅速發展的信息化、網絡化的時代,在普通話培訓和測試中運用現代網絡技術、建設開發普通話水平測試網絡培訓課程和實現網上測試,已成為時代的需要和廣大學習者、應試者的迫切要求。這方面開發需要高額投入,但相關研究應盡快開展。計算機輔助教學(CAI)是一種嶄新的現代化教育手段,自上世紀60年代出現以來得到迅速發展,加上70年代中期以來語音合成、人工智能,以及光盤特別是互聯網技術的應用,更使這種新型的教學系統、教學方式日臻完善。國外語言教學注重利用多媒體手段進行教學,開發出不少適合于本國學生和外國人學習語言的教學課件。我國的外語教學在這方面做得較好,相比之下,漢語普通話教學多媒體課件的制作遠遠落在了后面。目前,對外漢語教學方面已有一些院校制作出版了適合于外國人學習漢語的課件產品,香港、、澳門、臺灣等地區也有一些漢語普通話教學訓練課件,但由于服務對象的不同和文化背景的差異,不能直接為我所用。研制和開發適用于普通話教學和涵蓋普通話水平測試大綱內容,有助于各方言區各行業人士進行普通話學習和測試的教學與訓練用課件,具有現實意義。
二、普通話水平測試研究的設想
針對以上狀況,普通話水平測試研究課題擬從以下五個方面開展:(一)普通話水平測試理論與實踐研究,(二)普通話水平測試規范標準研究,(三)計算機輔助普通話水平測試評分系統研究與開發,(四)普通話水平測試現代化管理及基礎性資源庫建設,(五)基于網絡的普通話培訓測試研究。
(一)普通話水平測試理論與實踐研究
本研究旨在通過某些具體理論與實踐問題的探討,豐富普通話水平測試理論,為構建普通話水平測試研究的基本理論框架體系,提供理論和實踐準備。包括以下內容:
1.普通話水平測試的概化理論研究。
(1)從教育測量學的角度研究普通話水平測試的性質和特點。包括常模參照性測試和標準參照性測試的異同、筆試和面試的異同、電腦測試及其相應的測量學問題等。
(2)從多元概化理論的角度研究普通話水平測試的誤差控制問題。包括測量誤差的來源及其影響程度的估計、隨機誤差與系統誤差的控制技術、評分者的信度估計問題、題目取樣的代表性問題等。
(3)從概化理論的角度研究測評工作的質量控制與成本控制問題。由于普通話測試涉及到評分者的培訓、現代化技術手段的應用等問題,所以在提高測試質量的同時,必須研究測試成本的控制問題。
本研究的重點是:如何把多元概化理論的思想和方法引入到普通話水平測試之中,以便在提高測試質量的同時,有效地控制測試成本。
本研究的難點是:計算測試成本的測量學方法在理論上需要有所突破。
2.普通話水平測試的心理學研究。
普通話水平測試從根本上講,是一種心理測量,它涉及到大量的心理學問題,本研究擬從以下幾個方面進行研究:
(1)主試人的語音心理定式對測試結果影響的研究。
(2)主試人與應試人在心理上的交互作用對測試結果影響的研究。
(3)應試人心理特點對測試結果影響的研究。
(4)測試過程控制變量(測試場地安排、試卷編排、測試的輔助用具等)與因變量(測試成績)的關系及干預策略的研究。
本研究的重點是:通過相關心理因素的分析,尋求相應的干預策略和解決途徑。
本研究的難點是:(1)主試人語音心理定式的類型、成因及調控對策。(2)控制變量的相關因素及干預的實施策略、干預效果的研究。
3.普通話-方言對比研究在普通話水平測試中的應用。
擬以某些省市為突破口,在有關方言研究的基礎上,通過調查其“中介語”在不同階段上的反映,將其運用于普通話水平測試實踐,以求解決以下問題:
(1)普通話水平測試在具體實施中的錯誤與缺陷的界定。
(2)為語調偏誤的確定提供較明確的理論依據。
(3)對地方評分細則進行糾偏和改進。
(4)尋求提高普通話水平測試培訓效率的有效途徑。
本研究的重點是:對“中介語”在不同階段上語言表征的描寫。
本研究的難點是:對“中介語”的實驗語音學分析。
4.普通話水平測試與其他的語言測試的比較研究。
本研究擬以普通話水平測試與HSK、CET、TOEFL等為比較對象,主要從以下幾個方面進行研究:
(1)發展概況與研究現狀,確立普通話水平測試與其他的語言測試比較研究的原則、范圍和理論基礎。
(2)設計原則與試卷結構對比研究。
(3)題型設計與命題技巧對比研究。
(4)統計分析比較研究。
(5)施測、管理與培訓的科學化對比研究。
本研究的重點是:在全面考察普通話水平測試與HSK、CET、TOEFL等語言測試的基礎上,探求其作為語言測試的普遍規律和自身特點,尋找對普通話水平測試具有借鑒價值的理論、
規律和方法。本研究的難點在于:國外語言測試理論與普通話水平測試研究的關系,確立普通話水平測試與其他的語言測試比較研究的可比參照性和理論框架。
5.其他方面的研究。除以上幾個方面的研究之外,我們還將組織力量進行普通話水平測試的社會評價研究、普通話水平測試“語調”評價研究、普通話水平測試語音、詞匯、語法評判原則研究等子課題。
(二)普通話水平測試規范標準研究
1.《普通話水平測試大綱》(部頒標準)和《普通話水平測試實施大綱》的研制。
貫徹《中華人民共和國國家通用語言文字法》的規定,在原有《大綱》基礎上,總結八年多來普通話水平測試的實踐經驗,對普通話水平測試的規程、標準、方法、范圍進行規范,并使之成為部頒標準。以新《大綱》為指導,研制全國通用的《普通話水平測試實施大綱》,保證新《大綱》的順利實施。
本研究的難點是:普通話水平測試政策性強,除了測試理論問題需深入研究外,如何把握好科學性與可操作性兼顧,連續性與前瞻性并重的原則也是個難點。
2.普通話水平測試國家級題庫建設。
普通話水平測試題庫的建立是實現測試工作規范化的關鍵技術措施。《普通話水平測試實施大綱》基本定稿以后,課題組將根據新《大綱》(部頒標準)和《實施大綱》的內容和要求,以地方經驗為基礎,整合目前省、市級題庫,編制實用程序,研制在統計語言學和教育測量學方面等值的規范試卷,建立普通話水平測試自動出題系統和數據查詢系統,創建普通話水平測試國家題庫。
本研究的重點是:題庫系統自動生成在統計語言學和教育測量學上均等值的試卷。
本研究的難點是:目前尚沒有完全適應普通話水平測試的教育測量理論和方法,題庫建設的理論基礎和數學模型,需要在實踐中進行深入探索。
(三)計算機輔助普通話水平測試評分系統研究與開發
限于目前國內外研究水平,本項目只作單音節字詞和雙音節詞語輔助評分系統的探索性研究與開發。
首先,建立各等級標準數字化音檔庫,通過不同等級樣本與應試者樣本的語音匹配、分析、比較,運用實驗語音學方法,客觀展現受試人的普通話語音面貌,借助語音識別技術,建立標準音、錯誤音、缺陷音的匹配模板,提供出應試者的參考評分。
本研究的重點是:普通話水平測試中錯誤音與缺陷音總體語圖模式的分析、識別。
本研究的難點是:普通話語音變化的復雜性和多樣性,使建立相應的匹配模板異常困難,技術路線也需在實驗中探索。
(四)普通話水平測試現代化管理及基礎性資源庫建設
1.普通話水平測試信息管理系統。
鑒于目前上海、湖北、黑龍江等省市已開發適用于當地的管理系統(上海已推出第5版),積累了一定經驗,本項目將以此為基礎,深入了解各省市使用需求,進一步吸收最新的計算機信息技術,開發出一套技術先進,全國通用的信息管理系統,該系統將在安全性、穩定性、功能性和方便性上達到國內先進軟件的標準,并依托Internet實現國家語委普通話培訓測試中心與各省市普通話培訓測試中心管理系統互聯。本系統將包括以下幾個方面:(1)報名管理(2)考試現場管理(3)證書管理(4)系統查詢(5)統計分析(6)數據管理(7)系統維護。
2.普通話水平測試基礎性資源庫建設。
本研究擬進行普通話培訓和測試用標準語音語料庫的開發和“中介語”語音語料庫的開發。
(1)建立覆蓋全面的普通話標準語音數據庫:選擇經國家語委普通話培訓測試中心審定的專業發音人,采用數字錄音設備,錄制標準語音樣本,利用實驗語音學方法,提取各種聲學參數,通過構筑語料庫技術平臺,建立語音數據庫。
(2)建立“中介語”語音語料庫:漢語普通話“中介語”語音語料庫如果全面展開必然是一個規模浩大的工程,本研究擬以上海話-普通話“中介語”語音為突破口,構筑一個技術平臺,探索一套研究模式,并為將來建立更大規模“中介語”語音料庫提供一個范本。
本研究的重點和難點是:設計覆蓋科學合理的文本,高質量錄制數據,進行語料分析和標記。
(五)基于網絡的普通話培訓測試研究
1.開發基于Internet的普通話多媒體教學系統。
依托中國語言文字網,嚴格按照教育部《現代遠程教育資源建設規范》和《網絡課程開發要求》,開發普通話多媒體網絡教學平臺(擬采用“站中站”模式),建立一個多媒體資源庫和一個基于規則的適用于普通話網絡教學的知識庫,以實現網上的個別化教學和一定程度的智能化教學。
本研究重點:(1)多媒體資源庫的建設。(2)腳本群模型(Hisc)的建立。
本研究難點:針對學習者不同情況、不同需求編寫和組建大規模普通話培訓腳本群。
2.多媒體普通話教學與訓練課件庫。
研制出一套適用于普通話教學和符合《普通話水平測試大綱》內容,有助于學習者進行普通話學習和測試的教學與訓練用課件。擬制作成普通軟件和CD-ROM光盤兩種版本,以適應不同用戶的需要。根據不同對象,擬將此研究內容分為兩個部分:
(1)普通話訓練課件庫,針對不同方言區學習者的不同層次,研制出適用于不同方言區及不同層次水平的輔助學習軟件。
(2)普通話水平測試員培訓課件,主要為國家級和省級測試員培訓,研制輔助教學軟件。
本研究重點和難點:腳本編寫和軟件編程。
普通話水平測試研究是一個十分龐大的研究體系,研究內容涉及到多學科、多領域,我們將根據各子課題的研究目標,綜合運用實驗研究、模擬研究、對比研究、調查研究(包括問卷調查、田野調查、座談調查)等多種研究方法,以及語音識別技術,現代數理統計技術、計算機技術、信息技術等各種技術手段,具有鮮明的理論研究與應用實踐相結合的研究特點。
普通話水平測試研究課題具有重大的理論價值和實踐意義。它把漢語言學基礎理論研究同教育測量學、數理統計學、心理學等相關領域研究相結合,綜合運用多種研究手段及先進技術,不僅會豐富普通話水平測試的理論基礎,而且也可以提高語言研究的廣度和深度,為漢語言學研究的現代化提供新思路和新方法。本課題研究的開展,將進一步加強普通話水平測試國家法定標準的客觀性、準確性和權威性,有力地促進普通話水平測試由經典型測試向現代型測試轉化。普通話標準語音語料庫、“中介語”語音語料庫等基礎性資源庫建設,對信息科學研究以及相關的應用也將產生一定的推動作用。課題研究的成果,對全國的普通話水平測試工作乃至整個推廣普通話工作將起到積極的促進作用,具有深遠的社會意義。
[參考文獻]
[1] 《中華人民共和國國家通用語言文字法》,2000年10月31日第九屆全國人民代表大會常務委員會第十八次會議通過.
[2] 香港中國語文學會普通話測試研究小組,普通話水平考試大綱(征求意見稿),1984。
[3] 中國對外漢語教學學會,《漢語水平等級標準和等級大綱》,1988.
[4] 劉導生,新時期的語言文字工作,1986.
[5] 孫修章,普通話水平測試標準的研制與實踐,語言文字應用,1992.(1).
[6] 劉照雄,推廣普通話的重要舉措——普通話水平測試簡論,語言文字應用,1997,(4).
[7] 陳章太,論普通話水平測試等級標準,語言文字應用,1997(3).
[8] 仲哲明,普通話水平測試若干問題的討論,語言文字應用,1997,(3).
[9] 許嘉璐,普通話水平測試研究序,語文出版社,1997.
[10] 李宇明,關于普通話水平測試的思考,普通話水平測試研究序,上海教育出版社,2002 .
[11] 王暉,1994年以來普通話水平測試研究概述,首屆全國普通話水平測試學術研討會論文,2002 .5(揚州).
[12] 劉照雄主編,普通話水平測試大綱,吉林人民出版社,1994 .
[13] 于根元,二十世紀的中國語言應用研究,書海出版社,1996 .
[14] 國家語委普通話培訓測試中心、《語言文字應用》編輯部合編,普通話水平測試的理論與實踐,商務印書館,1998 .
[15] 宋欣橋編,普通話水平測試員手冊,商務印書館,2000 .
[16] 劉鐮力主編,漢語水平測試研究,北京語言文化大學出版社,1997 .
[17] 謝小慶 魯新民主編,考試研究文集,經濟科學出版社,2002 .
[18] 各子課題項目申請書,恕不一一列出 .
(作者:普通話水平測試研究課題組 執筆人 王暉)