數據驅動學習(Data-driven learning或者DDL)是一種基於語料庫數據的外語學習方法。該方法由Tim Johns(1991)提出,它的主要思想是學習者作為研究者,基於大量的語料庫數據觀察、歸納語言使用現象,自我發現詞語搭配、語法規則及語用特徵;教師作為引導者,為學習者提供學習資源,指引學習者探索、發現的學習過程,培養學習者自主學習的能力。
2. 數據驅動學習的特徵
同傳統外語教學相比,數據驅動學習主要具有如下特徵:
第一,通過語料庫索引,以真實的語料為語言輸入。
第二,以學習者為中心,以自主學習為主。
第三,從大量語料中總結語言現象,以歸納式學習為核心。
第四,藉助自下而上的學習過程,培養探索和發現的能力。
3. 數據驅動學習的發展
作為一種新型的外語學習方法,數據驅動學習受到了國內外教育和研究者的廣泛關注(e.g. Boulton, 2009, 2010; Franken, 2012; 屈典寧、鄧軍, 2010; 俞燕明, 2009),研究主要集中在檢索行為、學習效果和學習者態度三個方面。研究表明,相對傳統教學方法,數據驅動學習能夠發揮學習者的主觀能動性,有效地引導學生注意詞語的搭配和語境,得到了大多數不同層次學習者的認可。
4. 數據驅動學習的系統
數據驅動學習的有效開展離不開語料庫及其檢索系統,其中,FLAX語言學習系統、美國當代英語語料庫(COCA)和The Compleat Lexical Tutor(CLT)是三種比較常用的基於大型語料庫的免費線上檢索系統。
FLAX語言學習系統(Flexible Language Learning System或FLAX)是新興的數據驅動語言學習系統,由紐西蘭Waikato University開發,主要用於詞語搭配學習、語言練習編輯和語料分析(詳見系統主頁左上角Book of FLAX)。其中,Learning Collocations Collection是輔助詞語搭配學習的有效工具,以三大語料庫——英國學術英語語料庫(The British AcademicWritten English或者BAWE)、英國國家語料庫(British National Corpus或者BNC)和維基百科語料庫(Wikipedia)——為支撐,以詞語搭配的語法結構(例如,動詞+名詞、形容詞+名詞、名詞+名詞、副詞+形容詞、副詞+動詞)和在語料庫中出現的頻率為分組顯示依據,克服了傳統索引方式“語境中的關鍵字(Key Word in Context或者KWIC)”檢索費時耗力的局限性,同時降低了對學習者英語水平以及語料庫語言學知識的要求。
美國當代英語語料庫(The Corpus of Contemporary American English或COCA)是迄今規模最大的平衡語料庫,由美國Brigham Young University開發,現有庫容4.5億詞,涵蓋美國1990-2012年口語、小說、流行雜誌、報紙和學術期刊五大類型的語料,並且每一年中這五方面的語料都是按比例均衡分布的。COCA常用於查詢字詞在不同文體或不同時段中的分布。
The Compleat Lexical Tutor(CLT),由加拿大University of Quebec開發,以多個語料庫為基礎(如,Brown語料庫、英國國家語料庫即British National Corpus或者BNC),提供多種語言(英語、法語、西班牙語和德語)的辭彙測試、研究和學習功能。其中比較常用的是語篇辭彙描述工具Vocabprofile和中心詞索引工具Concordance。Vocabprofile可以分析學習者輸入文本的類符、形符數目及比率,功能詞、實詞數目及比率,特別是根據1000、2000常用詞和學術英語詞族表測量語篇的用詞量。Concordance是中心詞索引工具,可以用來學習詞語的常見用法和搭配。
相關詞條
-
數據驅動:從方法到實踐
《數據驅動:從方法到實踐》 作者以實際經驗指導初創公司迅速搭建數據分析平台,減少時間投入,少走彎路 桑文鋒 著 ISBN 978-7-121-33451...
-
驅動學習之輪
《驅動學習之輪》是韓經綸所寫,由貴州人民出版社於2003年出版。所謂系統地解決問題,主要是指利用科學的方法收集數據,系統地分析問題產生的原因,把握不同因...
內容提要 編輯推薦 目錄 書摘 -
電商大數據――用數據驅動電商和商業案例解析
《電商大數據――用數據驅動電商和商業案例解析》是2014年3月電子工業出版社出版的圖書,作者是雪鷹傳奇。
內容簡介 作者簡介 編輯推薦 前言 目錄 -
驅動中國
驅動中國網站於2005年正式上線,提供各種驅動程式的更新、查詢和下載;以及科技新聞、科技視點、評論與測試、產品信息、產品新聞、硬體工具介紹等資訊。驅動中...
特色欄目 團隊 願景 大事記 客群分析 -
數據驅動運動控制系統設計與實現
《數據驅動運動控制系統設計與實現》,作者是曹榮敏,講述了數據驅動控制的歷史和現狀、數據驅動控制所包括的方法、基本思想以及發展;數據驅動控制理論及學習算法
-
數據融合驅動電氣設備故障的智慧型診斷
內容介紹《數據融合驅動電氣設備故障的智慧型診斷》主要介紹數據融合驅動...方法。《數據融合驅動電氣設備故障的智慧型診斷》適合高等學校電氣工程與電子信息等專業的研究生使用,亦可供有關工程技術人員學習參考。 ...
內容介紹 -
深入淺出windows驅動開發
《深入淺出windows驅動開發》是2011年3月電子工業出版社出版的圖書,作者是張佩、馬勇、董鑒源。
內容簡介 媒體推薦 作者簡介 推薦序一 推薦序二 -
數據湖
數據湖(Data Lake)的概念最早出現在2011年福布斯的一篇文章—Big Data Requires a big new Architecture...
定義 主要用途 套用的重要性 套用的五大特性 套用舉例 -
ActiveX數據對象
ActiveX Data Object(ADO——ActiveX數據對象)是一組基於對象的數據訪問接口。它為基於Internet的、以數據為中心的套用程...