時(shí)間:2022-12-29 14:53:46
序論:寫作是一種深度的自我表達(dá)。它要求我們深入探索自己的思想和情感,挖掘那些隱藏在內(nèi)心深處的真相,好投稿為您帶來了七篇高中生英語論文范文,愿它們成為您寫作過程中的靈感催化劑,助力您的創(chuàng)作。
【關(guān) 鍵 詞】英語寫作評估 自動評分系統(tǒng) 評分不一致性
一、研究背景
自動作文評分(AES,Automated Essay Scoring)是一項(xiàng)使用計(jì)算機(jī)對作文進(jìn)行評估與記分的新技術(shù),其實(shí)質(zhì)就是基于已準(zhǔn)確人工評分的訓(xùn)練作文集的自動文本分類,但其分類標(biāo)準(zhǔn)除內(nèi)容外,更要兼顧語言的運(yùn)用。該項(xiàng)技術(shù)的研究起始于20世紀(jì)60年代,采用了統(tǒng)計(jì)、自然語言處理(NLP)、及人工智能等方面的最新成果,并于1999年進(jìn)入實(shí)際應(yīng)用階段。至今已經(jīng)有多個(gè)國家開發(fā)出針對英文的作文自動評分系統(tǒng),如PEG(Project Essay Grader),IEA(Intelligent Essay Assessor),E-rater(Electronic Essay Rater), IntelliMetric 和最近的Writing Roadmap等等。
由于英語作文自動評分系統(tǒng)穩(wěn)定可靠,與人工評語作文比較,速度快、評價(jià)客觀,可以克服大規(guī)模人工評閱帶來的諸多弱點(diǎn)。可以使學(xué)生多練多寫,老師省時(shí)省力,在此前提下,有望促進(jìn)大學(xué)生和高中生英語寫作教學(xué)的改革,提高學(xué)生的英語寫作能力,激發(fā)他們進(jìn)行“自主性探究學(xué)習(xí)”和“創(chuàng)新學(xué)習(xí)”。該系統(tǒng)有以上優(yōu)點(diǎn),在一定程度上緩解了英語教師人工批閱作文的工作量,因而受到很多教師的青睞,也被許多院校采用。在目前,中國此方面正屬于研究與開發(fā)之中,其中,冰果英語智能作文評語系統(tǒng)(以下簡稱為“冰評”)是浙江大學(xué)外國語學(xué)院與杭州增慧網(wǎng)絡(luò)科技有限公司聯(lián)合研發(fā)的一套針對高等院校及高中生英語寫作教學(xué)的計(jì)算機(jī)自動評閱作文的教學(xué)服務(wù)產(chǎn)品;新視野大學(xué)英語在線學(xué)習(xí)作文自動評分系統(tǒng)(以下簡稱為“新評”)是有外研社研發(fā)并被許多高等院校普遍使用,該系統(tǒng)的功能是對作文自動評分、給出評語,并對作文中的單詞進(jìn)行拼寫檢測。然而,在使用的過程中,冰果英語智能作文評閱系統(tǒng)與新視野大學(xué)英語在線學(xué)習(xí)作文自動評分系統(tǒng)在信度與效度方面存在著不一致性的問題。針對此問題,對西南大學(xué)計(jì)算機(jī)與信息科學(xué)學(xué)院學(xué)生的英語作文進(jìn)行了教學(xué)實(shí)證研究。
二、研究設(shè)計(jì)
1.研究對象
西南大學(xué)計(jì)算機(jī)與信息科學(xué)學(xué)院大學(xué)一年級本科教育技術(shù)班43名學(xué)生參與了本次實(shí)驗(yàn)活動。參與實(shí)驗(yàn)活動的學(xué)生經(jīng)過接近一年的大學(xué)英語學(xué)習(xí),系統(tǒng)地學(xué)習(xí)了語篇知識和寫作組織結(jié)構(gòu),掌握了基本的英語段落行文方式。為了測出他們的真實(shí)水平,保證實(shí)驗(yàn)數(shù)據(jù)結(jié)果的有效性和可信度,引起學(xué)生對本次實(shí)驗(yàn)的重視,提前告知了學(xué)生本次寫作的成績將納入平時(shí)成績的評定范疇,按15%計(jì)算,且并未告知學(xué)生他們正在參與一項(xiàng)實(shí)驗(yàn)。
2.研究工具
此次實(shí)驗(yàn)研究所用的工具之一是兩個(gè)英語學(xué)習(xí)微機(jī)室。這次寫作規(guī)定了完成時(shí)間為30分鐘,學(xué)生有條件在統(tǒng)一的時(shí)間開始寫作,并在規(guī)定的時(shí)間之內(nèi)提交。另一個(gè)研究工具就是學(xué)生的作文樣本,該作文材料選自2011年大學(xué)英語四級考試。
3.研究方法
英語教師將布置的作文題目和要求輸入到冰果英語智能作文評分系統(tǒng)后,會有一個(gè)相應(yīng)的作文序列號。學(xué)生可根據(jù)序列號查到作文題目和要求,按要求完成作文后,學(xué)生將作文的電子版同時(shí)提交到冰評(在作文提交截止日期之后48小時(shí)之內(nèi),系統(tǒng)會對學(xué)生的作文進(jìn)行1分至15分的整體評分)與新評(作文提交之后,系統(tǒng)會立即對學(xué)生的作文進(jìn)行1分至15分的整體評分)中。
三、數(shù)據(jù)收集與分析
本研究最終采集到的有效樣本為37份(有6名學(xué)生的作文未能正確提交到系統(tǒng),不在統(tǒng)計(jì)之列),由冰評和新評分別以整體評分的方式進(jìn)行了評分。為得到這兩個(gè)英語寫作自動評分系統(tǒng)之間的相關(guān)系數(shù),采用了外語教學(xué)研究中常用的SPSS軟件進(jìn)行了數(shù)據(jù)統(tǒng)計(jì)分析。冰評與新評的對比分析結(jié)果如下:
從上表可知,冰評和新評評分的平均分分別是8.4811分和6.7027分。冰評和新評評出的最高分分別是12.00分和14.00分,差值為2分,然而,兩個(gè)評分系統(tǒng)最低分的差值為3.5分。表面上看起來冰評和新評的分均分差不多,但是,當(dāng)比較各自最小平均分和最大平均分差值的時(shí)候,幅度范圍卻是從6.50分到12.00分。這意味著冰評評分時(shí)比較嚴(yán),給出的評分差值幅度更小,而新評評分時(shí)比較松,給出的評分差值幅度更大。
表2、表3和表4顯示了雙尾t檢驗(yàn)的結(jié)果,在給出的平均分方面,冰評和新評都有顯著差異。由于df值為36,t值為3.190,查t值表可以得出df=36,t(0.05)=2.028,t(0.01)=2.719,3.190>2.719,所以雙尾t檢驗(yàn)的顯著性概率p
皮爾遜相關(guān)系數(shù)小于等于0.01,即為沒有相關(guān)性,數(shù)字越小,相關(guān)性越弱。冰評和新評的皮爾遜相關(guān)系數(shù)為0.001,小于0.1,顯然二者之間顯著不相關(guān),即具有不一致性。
F值為4.129,并當(dāng)df1為5,df2為31時(shí),可得到F值為3.65(a=0.01)。由于4.129大于3.65,可以得出p值小于0.01,就是說冰評和新評的評分結(jié)果顯著不同,這兩個(gè)評分系統(tǒng)的評分是不一致的。
四、結(jié)論
作為英語寫作自動評分系統(tǒng),冰果英語智能作文評閱系統(tǒng)和新視野大學(xué)英語在線學(xué)習(xí)作文自動評分系統(tǒng)確實(shí)有很多好處,不但可以應(yīng)用于日常的外語教學(xué)中,使評教作文的方式變得更加多樣化,而且學(xué)生還可以自由安排寫作練習(xí),能借鑒評分系統(tǒng)提供的修改意見,逐步提高寫作水平。但是,由于各個(gè)英語寫作自動評分系統(tǒng)所使用的核心技術(shù)不同,評閱出來的得分不一致,也會給學(xué)生造成困惑,不能夠很好地了解自己的真實(shí)水平。因此,教師應(yīng)該將這些英語寫作自動評分系統(tǒng)與人工評分結(jié)合起來使用,才能真正達(dá)到提高學(xué)生寫作水平的目的。
參考文獻(xiàn):
[1]Alderson,J.C.,Clapham,C.&Wall,D.(2000).Language test construction and evaluation.Beijing:Foreign Language Teaching and Research Press.
[2]Heaton,J.B.(2000).Writing English language tests(New edition).Beijing:Foreign Language Teaching and Research Press.
[3]葛詩利,陳瀟瀟.大學(xué)英語作文自動評分研究中的問題及對策[J],山東外語教學(xué),2009(3).
[4]韓寧.幾個(gè)英語作文自動評分系統(tǒng)的原理與評述[J].理論與實(shí)踐,2009.