數據驅動學習

1. 數據驅動學習的涵義
數據驅動學習(Data-driven learning或者DDL)是一種基於語料庫數據的外語學習方法。該方法由Tim Johns(1991)提出,它的主要思想是學習者作為研究者,基於大量的語料庫數據觀察、歸納語言使用現象,自我發現詞語搭配、語法規則及語用特徵;教師作為引導者,為學習者提供學習資源,指引學習者探索、發現的學習過程,培養學習者自主學習的能力。
2. 數據驅動學習的特徵
同傳統外語教學相比,數據驅動學習主要具有如下特徵:
第一,通過語料庫索引,以真實的語料為語言輸入。
第二,以學習者為中心,以自主學習為主。
第三,從大量語料中總結語言現象,以歸納式學習為核心。
第四,藉助自下而上的學習過程,培養探索和發現的能力。
3. 數據驅動學習的發展
作為一種新型的外語學習方法,數據驅動學習受到了國內外教育和研究者的廣泛關注(e.g. Boulton, 2009, 2010; Franken, 2012; 屈典寧、鄧軍, 2010; 俞燕明, 2009),研究主要集中在檢索行為、學習效果和學習者態度三個方面。研究表明,相對傳統教學方法,數據驅動學習能夠發揮學習者的主觀能動性,有效地引導學生注意詞語的搭配和語境,得到了大多數不同層次學習者的認可。
4. 數據驅動學習的系統
數據驅動學習的有效開展離不開語料庫及其檢索系統,其中,FLAX語言學習系統、美國當代英語語料庫(COCA)和The Compleat Lexical Tutor(CLT)是三種比較常用的基於大型語料庫的免費線上檢索系統
FLAX語言學習系統(Flexible Language Learning System或FLAX)是新興的數據驅動語言學習系統,由紐西蘭Waikato University開發,主要用於詞語搭配學習、語言練習編輯和語料分析(詳見系統主頁左上角Book of FLAX)。其中,Learning Collocations Collection是輔助詞語搭配學習的有效工具,以三大語料庫——英國學術英語語料庫(The British AcademicWritten English或者BAWE)、英國國家語料庫(British National Corpus或者BNC)和維基百科語料庫(Wikipedia)——為支撐,以詞語搭配的語法結構(例如,動詞+名詞、形容詞+名詞、名詞+名詞、副詞+形容詞、副詞+動詞)和在語料庫中出現的頻率為分組顯示依據,克服了傳統索引方式“語境中的關鍵字(Key Word in Context或者KWIC)”檢索費時耗力的局限性,同時降低了對學習者英語水平以及語料庫語言學知識的要求。
美國當代英語語料庫(The Corpus of Contemporary American English或COCA)是迄今規模最大的平衡語料庫,由美國Brigham Young University開發,現有庫容4.5億詞,涵蓋美國1990-2012年口語、小說、流行雜誌、報紙和學術期刊五大類型的語料,並且每一年中這五方面的語料都是按比例均衡分布的。COCA常用於查詢字詞在不同文體或不同時段中的分布。
The Compleat Lexical Tutor(CLT),由加拿大University of Quebec開發,以多個語料庫為基礎(如,Brown語料庫、英國國家語料庫即British National Corpus或者BNC),提供多種語言(英語、法語、西班牙語和德語)的辭彙測試、研究和學習功能。其中比較常用的是語篇辭彙描述工具Vocabprofile和中心詞索引工具Concordance。Vocabprofile可以分析學習者輸入文本的類符、形符數目及比率,功能詞、實詞數目及比率,特別是根據1000、2000常用詞和學術英語詞族表測量語篇的用詞量。Concordance是中心詞索引工具,可以用來學習詞語的常見用法和搭配。

相關詞條

熱門詞條

聯絡我們