前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的在线翻译句子主题范文,仅供参考,欢迎阅读并收藏。
关键词:LORANGE;BLEUS;ROUGE-L;ROUGE-S;自动元评价
中图分类号:TP18 文献标识码:A 文章编号:1009-3044(2017)05-0138-05
Abstract: This paper addressed an automatic meta-evaluation method of machine translation (MT) evaluation based on ORANGE-Limited ORANGE. It was adopted as the resources were limited, to evaluate the performances of the three metrics- BLEUS, ROUGE-L and ROUGE-S, which were based on n-gram and widely used in the domain of MT evaluation. Compared with the traditional method operated by human, this method can evaluate metrics automatically without extra human involvement other than using a set of reference translations. It only needed the average rank of the reference, and it was not influenced by the subjective factors. This method costed less and expended less time than the traditional one, which would have advantages to the parameter tuning and shortening system period. In this paper, we use this automatic meta-evaluation method to evaluate BLEUS, ROUGE-L and ROUGE-S on the Russian-Chinese dataset. The result shows that the ROUGE-L's performance is the best and that of BLEUS' is the worst, the ROUGE-S is worse than ROUGE-L but better than BLEUS. Also, the consistance and effectiveness of Limited ORANGE are verified through consistency test with human meta-evaluation results.
Key words: LORANGE; BLEUS; ROUGE-L; ROUGE-S; Automatic Meta-evaluation
1 概述
C器翻译系统评测在机器翻译领域起着重要的作用。它能够对系统性能进行评估,使系统开发者及时得知系统存在的问题并加以改进;同时可以为用户提供系统译文质量评估的依据。国家语言文字工作委员会的机器翻译系统评测规范[1]指出,机器翻译评测一般分为人工评测和自动评测两类。其中,人工评测主要由同时精通源语言和目标语言的专家主观地对系统输出译文的忠实度和流利度进行打分;主观性强,受外界因素影响比较大,代价高昂,评判周期长,无法适应机器翻译系统修改及参数调整的进度,无形中延长了系统研发周期,难以向研发者和用户提供高效的评测结果。于是,研究者更倾向于使用自动评测方法对系统译文进行量化评估。因此自动评测成为机器翻译领域的研究热点之一。
众多的自动评测方法性能孰优孰劣,如何进行评判也是一个值得研究的问题。比如BLEU只能在语料库级进行评测,平滑后的BLEU(BLEUS)可以应用于句子级评测;鉴于基于连续n元语法的BLEU没有考虑不连续子串之间的匹配,ROUGE基于不连续子串进行候选译文和参考译文匹配等等;这些自动评测方法的好坏,需要有一个统一的标准来衡量,即机器翻译评测元评价。
机器翻译评测元评价,即是运用一定的方法检测哪个机器翻译评测方法性能更优,主要分为人工元评价和自动元评价两类。人工元评价,就是通过对自动评测分数与人工评测的忠实度和流利度分数求得相关系数;花销大、主观因素导致结果经常不一致、忠实度和流利度测评很难达到一致;系数越大,评测方法的性能越好。自动元评价,就是采用计算机通过机械、自动的方法实现对评测方法的评价;这种方法客观、便捷、容易实现,不会受外界因素的影响而导致评价结果出现偏差。人工元评价由于人工的介入而存在许多不足,难以适应海量数据的信息处理需求,为此探究一种通用、客观的自动元评价方法非常重要。
本文基于ORANGE[2],提出一种LORANGE (Limited ORANGE)自动元评价方法,在语料受限的情况下,对目前主流的基于n元语法的三个自动评测方法BLEUS、ROUGE-L和ROUGE-S的性能进行自动评价。为与人工元评价保持一致性,拟采用译文的忠实度分数、流利度分数以及译文相似度表征译文信息,对候选译文和参考译文进行排序打分,来实现对自动评测方法性能的评估。整个过程除了人工提前翻译好的参考译文无需额外的人工介入,而且可以很好地应用于句子级评价。
2 几种主流的自动评测方法简介
2.1平滑BLEU
BLEU自2002年由Papineni等人[3]提出以来,被广泛应用到各种评测活动中。BLEU通过计算系统候选译文与人工参考译文中连续n元语法的匹配个数,求得n元语法的准确率,并将各元语法的准确率通过几何平均值将其融合,同时对比参考译文短的候选译文赋予定量的惩罚,如式(1)所示。
2.2 ROUGE-L
BLEU在对候选译文和参考译文之间的连续n元子串进行匹配时,并不能很好地描述远距离不连续词语之间的关系。为此,2004年,Lin提出基于不连续n元语法的ROUGE[4]方法,用以描述远距离的一元词汇之间的关系,比如ROUGE-L、ROUGE-S。
ROUGE-L基于最长公共子串(Longest Common Substring, LCS)计算候选译文和参考译文之间的相似度,同时考虑了准确率和召回率,并采用基于LCS的F-测度的方法来测量参考译文X(长度为m)和候选译文Y(长度为n)的相似度,如式(3)(4)(5)所示[5]。
2.3 ROUGE-S
ROUGE-L只记录了最长公共子串的长度,无法区分不同空间位置的最长公共子串,而且]有记录短于最长公共子串长度的相匹配的子串,对译文相似度的描述略欠妥当。ROUGE-S基于不连续二元语法(Skip-bigram)来计算候选译文和参考译文的相似度,允许有任意间隔的顺序二元语法进行匹配,类似于BLEU中的二元语法,但包含了不连续子串,因此ROUGE-S可以描述远距离信息。比如“我爱中国”分词后变为“我/爱/中国”,有C(3,2)=3个Skip-bigram (其中C为组合函数),分别为:“我/爱”、“我/中国”、“爱/中国”。假设参考译文X长度为m,候选译文Y长度为n,每个长度为len(针对汉语而言,译文分词后词语的个数)的句子有C(len,2)个Skip-bigram,则ROUGE-S的计算如式(6)(7)(8)所示[5]。
3 LORANGE自动元评价研究
3.1 LORANGE
由于某些针对特定任务标注的数据或者可以应用到受限领域的数据依然比较匮乏,统计机器翻译模型的训练仍然面临着严重的“数据稀疏”问题[6]。针对人工元评价方法的主观性强、周期长、一致性较弱等问题,在ORANGE[2]的基础上,本文提出LORANGE (Limited ORANGE)方法,在资源受限的情况下,对自动评测方法的性能进行评价。这种方法因为其客观、简洁、方便实现而使得自动元评价成为可能,缩减了人力资源的付出。
所谓LORANGE自动元评价,就是在语料资源比较有限,训练集的规模不足够大的情况下,输出n-best候选译文列表可读性比较差,从而利用有限的语料资源,借助网络在线翻译系统辅助实现对自动评测方法性能的自动评价。本文拟采用网络上比较成熟的俄汉在线翻译系统的输出汉语译文作为实验所需的候选译文列表,俄汉对齐语料库中的汉语句子作为参考译文,然后通过对参考译文和候选译文进行特征选取并打分,得到参考译文在译文列表中的排序,以此来计算LORANGE得分。
给定一个源语言句子S,选择目前国际国内主流的、性能比较稳定的4个在线翻译系统――谷歌、百度、必应、有道,辅助实现机器翻译评测元评价研究。本文基于俄汉双语新闻句对齐语料库,利用上述4个在线系统进行俄汉翻译,得到4个在线翻译系统对应的汉语输出译文形成候选译文,并将经过人工句对齐之后的汉语译文作为参考译文,以此构建LORANGE元评价方法的实验语料库。通过4个候选译文列表和对应的参考译文,对每个待评价的自动评测方法进行如下计算:
(1) 合理选择译文特征,计算候选译文列表和参考译文的自动分数;
(2) 根据译文得分对参考译文和候选译文进行排序,并且计算参考译文的平均排序;
3.2 译文排序关键技术研究
通过上述分析,最主要的问题是如何对译文进行综合排序?对于同一个源语言句子的译文可以用一组特征来表示,每一个特征描述译文的一个属性,特征权重表示该特征对译文的相对重要程度。任何与该译文相关的信息都可以编码为一个特征。为了与传统人工元评价保持一致性,本文拟选取译文忠实度分数ade、译文流利度分数flu以及基于待评价自动评测方法的译文相似度sim等3个特征来表征译文信息。这些特征必须借助语言学知识来获得。
统计机器翻译的原理就是通过翻译模型和语言模型建模、训练然后解码,如图1所示,在所有可能的目标语言T中寻找概率最大的句子作为源语言句子S的翻译结果[7]。根据贝叶斯公式,即为通过解码寻找一个最接近于真实的目标语言句子
3.2.1译文忠实度分数计算
通过上述分析,译文忠实度分数通过翻译模型概率来表示,即P(S|T),给定目标语言T的条件下源语言S的条件概率。概率值越高,译文的忠实度分值越高。本文采用Moses(摩西)系统对翻译模型进行训练,采用GIZA++词对齐工具来实现源语言与目标语言的词对齐。
由于实验语料来自4个不同在线俄汉翻译系统译文和人工参考译文,它们不同于来自同一个开源统计机器翻译系统的n-best候选译文列表,因此要想对实验中来自不同在线翻译系统的汉语译文和1个参考译文求得翻译模型的概率值,必须找到一个公共的“参考点”――本文选择Moses系统的1-best译文,并以此为基准,间接求得5个译文的忠实度分值。
3.2.2译文流利度分数计算
译文流利度通过语言模型概率P(T)来体现,它为每个给定目标语言的词语序列计算一个概率值,表示这个词语序列在目标语中被表达的可能性。目前应用最为广泛的是采用n元语法对语言模型建模,计算字符串W=w1,w2,…,wn的概率,如式(13)所示。
4 自动元评价方法性能分析
4.1 实验语料及环境
实验中,双语句子数据集采用某句库中包含新闻领域的52,892个俄汉双语对齐句对[8]。针对这些俄汉双语对齐语料,采用分层采样的方式将其分为训练集和测试集,其中测试集包括1,057个俄汉句对。同时在模型训练过程中引入俄汉词典共计247,075词条,优化所训练出的双语短语对齐模型。
本文选取目前主流的且俄汉翻译译文可读性较强的谷歌、百度、必应、有道等4个在线翻译系统对俄语句子进行俄汉在线翻译,得到其对应的汉语输出译文作为候选译文列表,俄汉双语对齐语料库中的人工对齐的汉语句子作为参考译文。
从图2中可以看出,ROUGE-L的LORANGE得分最低,为0.003112,ROUGE-S次之为0.003160,BLEUS最高,达到0.003234。根据上文分析可知,ORANGE分数越低,自动评测方法的性能越好,故可得到,ROUGE-L的评测性能最优,ROUGE-S性能次之,BLEUS性能最差。其主要原因在于,ROUGE-L在评测过程中,基于最长公共子串进行译文相似度比较,没有设定固定的n元语法的长度,匹配比较灵活,不拘泥于n元语法的长度而使得译文中匹配的n元语法数目受到限制;而ROUGE-S和BLEUS很好地体现了译文中不同阶n元语法的匹配情况,ROUGE-S融合了ROUGE-L和BLEUS的优点,既包括了BLEU的连续n元语法,又包括了ROUGE-L的不连续n元子串,在确保译文忠实度的情况下,捕捉了译文之间的远距离词语之间的关系,同时也确保了译文的流利度,其性能要优于BLEUS。
4.3 验结果一致性分析
为了验证LORANGE自动元评价方法的有效性与可行性,采用统一的标准对谷歌、百度、必应、有道4个在线翻译系统的俄汉在线翻译输出译文的忠实度和流利度进行人工打分。自动评测得分高的系统人工评测得分也高,这表明自动打分与人工打分有着较高的相关性,这是一个自动评测方法所期望得到的结果。
本文采用皮尔森相关系数rxy来计算自动评测方法与人工评测得分的相关性。对于包含变量自动打分x和人工打分y的测试集上的数据点为{(xi,yi)},则自动打分x和人工打分y之间的皮尔森相关系数为:
由此实验分析,横坐标表示基于不同自动评测方法的自动打分,纵坐标表示人工打分,ade表示人工忠实度分数,flu表示人工流利度分数,并分别对忠实度和流利度添加了线性趋势线,(1) BLEUS的忠实度和流利度的相关性都是三个评测方法中最差的。(2) ROUGE-L和ROUGE-S的流利度相关性基本相近,但是ROUGE-L的忠实度要优于ROUGE-S。(3) ROUGE-S的忠实度和流利度的相关性同样好。由此可以分析得出,ROUGE-L的性能要优于ROUGE-S和BLEUS,BLEUS性能最差,上述LORANGE自动元评价方法测得的实验结果与人工评价的结果是一致的。由此,LORANGE方法的一致性得以验证。但是同时也可以看到,人工评价涉及忠实度和流利度相关系数两项目标函数的最优化,其基于两个目标函数的综合评价结果与人的评分主观因素有很大关系,而LORANGE自动元评价方法的客观一致性使得机器翻译评测元评价可操作性得以完美体现,评判结果客观、清晰,能够更加有力、快速地验证评测方法性能的改善情况,能够在某些特定任务领域或者语料资源不足够丰富的语种研究上,增加自动化成分,解放部分人力资源。
5 结束语
本文主要基于ORANGE提出一种资源受限的LORANGE自动元评价方法,对自动评测方法的性能进行评价。这种方法除了需要人工提前准备好的参考译文之外,不需要额外的人工介入,通过参考译文的平均排序来实现对不同评测方法的自动元评价,参考译文排序靠前的评测方法性能优于参考译文排序靠后的评测方法。相比于传统的人工元评价方法,大大缩短了评价时间,节约了能源。且在评测过程中,为了与传统人工评测相一致,选取译文的忠实度分数、流利度分数与基于待评测指标的译文相似度三个特征来表征译文,从而进行打分。并将实验结果与人工元评价结果进行了一致性检验,LORANGE自动元评价方法的有效性得以验证。
后期工作中将同义词扩展等语义分析引入自动评测方法中,而且表征译文的三个特征的选取与计算还将进一步优化,从而将语义分析引入LORANGE自动元评价过程中。
参考文献:
[1] 机器翻译系统评测规范[S]. 中华人民共和国教育部国家语言文字工作委员会. 2006.
[2] Lin C. Y., Och F. J.. ORANGE: A Method for Evaluating Automatic Evaluation Metrics for Machine Translation [C]. In Proceedings of the International Committee on Computational Linguistics 2004 (COLING-2004), 2004.
[3] Papinen K., Roukos S., Ward T., et al. BLEU: a method for automatic evaluation of machine translation [C]. In Proceedings of the 40th Annual Meeting of the Association for Computational Linguistics 2003 (ACL 2003), 2002: 311-318.
[4] Lin C. Y.. ROUGE: A Package for Automatic Evaluation of Summaries [C]. In Proceedings of Workshop on Text Summarization Branches Out, Post-Conference Workshop of Association for Computational Linguistics 2004 (ACL 2004), 2004.
[5] Lin C. Y., Och F. J.. Automatic Evaluation of Machine Translation Quality Using Longest Common Subsequence and Skip-Bigram Statistics [C]. In Proceedings of Association for Computational Linguistics 2004 (ACL 2004), 2004.
[6] 张钹. 自然语言处理的计算模型[J]. 中文信息学报, 2007, 21(3): 3-7.
在线词典的另一个特点表现在词典读者和词典文本之间的及时交互,读者在使用在线词典的过程中可以及时和编者沟通,提出自己的观点和建议。不仅如此,读者还可以根据自己对词典的使用情况,把掌握或熟知的译法提供给词典网站,使更多的词典用户获得更新更完备的知识信息。因此,在线词典可提供较多的对译实例,从而减少译文错误。例如:合同中经常用到的一个词汇“预售”,有人可能根据构词法翻译成presale,而通过爱词霸我们可以搜索到以下例句:“Article10Apersonwhoisengagedinthebuildingpropertybusinessmaysellbuildingpropertyinad-vance.第十条:房产经营者可以预售房产。”这样我们就可以知道它确切的译法。
另外,通过在线词典的百科功能,可以查到法律英语词汇的专业翻译。像这样一句话:“mostjurisdictionsdonotdistinguishbetweenlibelperseandlibelperquod,holdingin-steadthatgeneraldamagesfromlibelarepresumed.”就是后面这部分“generaldamagesfromlibelarepresumed”如何翻译的问题。很多人会翻译成“诽谤造成一般损害是推定的”,而通过谷词的百科功能我们可以发现damages和damage这两个词的意思是不同的,所以正确的翻译应该是“受诽谤可获得一般损害赔偿金是推定的”。
搜索引擎
搜索引擎是网上的一种信息检索工具,用户在其索引库进行检索,就可以查询到所需信息所在的网址。关于其在法律英语翻译中的应用,以下分几个方面叙述:
1.查找法律术语
利用搜索引擎,可以方便地查出法律词汇的专业译法。例如:需要查询“infant”这个单词在不同法律词组中的词义,在www.google.com中输入“infant法律”便可以搜索到“therightsofinfants”和“LawofthePeople’sRepublicofChinaonMaternalandInfantHealthCare”的翻译分别为“未成年人的权利”和“中华人民共和国母婴保护法”。这只是一个最简单的例子,实际操作中应该挑选最相关也就是最合适的关键词辅助搜索,一次不对就试几次,这样对自己的联想能力、搜索信息的能力也是一种锻炼。如果在中文网页找不到,你可以通过查看英文网页上该词组出现的上下文来进一步推测它的意思。
2.搜索法律文书模板
翻译工作中,译者可能会碰到各种各样的法律文书。由于各国采取的法律体系不同,法律本身又具有很强的专业性,所以法律文书的翻译质量对涉法判决结果影响很大。法律文书具备功能性强、简洁性、格式规范这三个特点,即使是法律专业人士也难以全面掌握。译者可以通过搜索引擎找到相应的法律文书,参考其格式和术语的表达方式来翻译。比如要翻译一份英文劳动合同,就可以在百度搜索中输入关键词“合同范本”,搜索之后选择劳动合同范本来参考。像中国法律信用网和北大法律信息网以及百度文库上就可查到各种法律文书的模板。
3.检验译文的准确性
法律部门纷繁复杂,即使是法律专业人士,也会遇到自己不太熟悉的领域。这时,译员可能担心翻译出来的译文不够准确,或未能使用地道的法律专业术语。此时,利用搜索引擎来检验译文的准确性和规范性是一个不错的方法。可将自己不太有把握的译文关键词输入到Google、搜狐、百度等搜索引擎中去搜索。如果其在检索结果中被广泛使用,而且根据其结果中的上下文,可以判断其意思与原文一致,说明这是地道的译法;如果译文关键词在检索结果中没有出现,则说明这是错误的译法。所以,网络如同一个可以用来检验译文的准确与否的大型语料库。
下面简述搜索引擎在《合同法》翻译中的应用步骤。《合同法》的制订参照的主要海外立法包括《联合国贸易法委员会电子商业示范法》,《联合国国际货物销售合同公约》和《商事合同通则》。经过搜索,发现了三个有关的国际立法英文,还发现了一个ChineseCivilLawNetwork(中国民事法律网),网站里面就提供了《中华人民共和国合同法》草案的英译文,在很短的时间里找到如此多的资料是传统手段无法相比的了,剩下的工作就是对照修改了。
4.组织机构名称的翻译
组织机构名称的翻译也是译者在法律英语翻译中经常遇到的,它包括政府机构、国际组织、非政府组织、公司等机构名称的翻译。因为其名称的固定性,译者不能按字面意思翻译,查阅网络资源是一个有效的方法。译者可以通过搜索引擎找到该机构自己的官方网站,首页一般会有该机构的英文名称,有些网站还有自己的英文版。比如笔者在翻译“国家食品药品监督管理局”时,找到该机构的网站,首页英文译名为“StateFoodandDrugAdministration”。
5.搜索背景知识
法律英语翻译活动不仅是语言文字的转换活动,更是不同法律文化的交流和移植活动。所以我们在翻译时可以通过网络,尽可能地了解相关背景知识,在翻译时须顾及两种文化在历史沉积、思维方式等方面的内容,平时积累语言点滴,并对法学有关知识有一个较全面的了解,才能更准确有效地进行翻译,扫清法律英语翻译过程中的“外行话”障碍,使译文读者能领会原文确切涵义。
在线机器翻译
目前,网络上有很多专门提供在线机器翻译服务的网站。这些翻译软件的特点是将中文或者英文输入,马上就能得到它的译文,准确率约为60%,这些在线机器翻译的译文质量还不是很高,句子断断续续,表达方式也很拙劣,但是可以交流信息(冯志伟2004),这可以满足只要了解一下大致内容和信息的客户的需要。对于专业翻译而言,参考在线翻译可以使翻译速度提高一倍。笔者较常使用的有Google、worldlingo、雅虎、金桥、谷词、译海网等在线翻译。这些在线翻译各有千秋,但对于翻译工作来说,我认为还是Google更胜一筹,比如它没有字数限制,也不要先注册。但有时将几者结合起来对照参考可以起到事半功倍的结果。
翻译论坛和博客
随着网络技术的提高和社会生活的需要,论坛逐渐发展,成为网上交互联络的主要手段。利用网络论坛进行翻译可以有效利用论坛这一载体的各种优势。译者可以在论坛上获取最新的翻译资讯;还可以寻找翻译资料,比如法律专业词汇、常用句式、翻译心得、翻译技巧等;在碰到难题时可将问题提到网络论坛上供广大网友讨论,参考专家和其他网友的意见。许多专门的法律网站和翻译网站都设有翻译论坛,其中比较受欢迎的有以下一些:翻译中国的翻译论坛,主要侧重于英汉互译(王军礼2007);中国翻译网的翻译论坛,该论坛栏目比较全面,在线人数比较多;而中国法律信用网、法天下和尚华法律网上的论坛则更侧重于法律英语翻译。
1. season’s greetings and sincere wishes for a bright and happy mid-autumn day!
(献上节日的祝福与问候,愿你拥有一个充满生机和快乐的中秋节 )
2. please accept our wishes for you and yours for a happy mid-autumn day!
(请接受我们对你以及你全家的祝福,祝你们中秋快乐)
笔者发现 “n词酷”字典翻译功能与我们以往用到的翻译工具很不一样,比如搜索holy这个单词,有词义解释,例句,习语……资料真是全!而且具有单词联想输入的功能,我输入字母 g,后面就出现了giant、gift、give up、glass等相关单词。它还有一些其他的分类,情景会话,酷词公园,提问吧。而手写输入,语音播放,将单词制作成mp3功能也都很独特。而最让笔者惊喜的是它还有手机 版词酷小字典,只要手机支持 wap2.0,能够上网,就可以成为手机版n词酷的用户。(-每逢皓月当空时, 他就格外思念亲人。)whenever a bright moon hangs high in the sky, he m***isses his close relatives most. 方便,快捷,准确,对于学生一族,或者繁忙的外贸工作人员,
不失为一种很好的学习工具。 不过像“床前明月光 ”这样的诗词句子,靠翻译字典也不能解决了,怎么办?在笔者百思不得其解时,找到了这样的翻译:in the quiet night ,so bright a ***gleam on the foot of my bed! could there have been a frost already? 怎么样,是不是英文的表达里透出了浓浓的中国味?看来真是不虚此行 。
to wish you joy at this holy season. wishing every happiness will always be with you!
(恭祝吉祥,幸福和快乐与你同在)
please accept my season’s greetings.(请接受我节日的祝贺。)
may the season’s joy fill you all the year round. (愿节日的愉快伴你一生。)
on this special day i send you season’s greetings and hope that some day soon we
shall be together
关键词 语料库;机器翻译;译文质量;评估
1 语料库研究与机器翻译研究
1.1语料库研究与翻译研究
语料库是研究语言意义的有力工具。从一个语料库中检索词汇结(node),检索上下文或临近若干个词而组成的并置结构(collocates),并将出现这些结或并置结构的句子(concordance)进行比较分析,可以揭示用常规方法很难发现,或很难确定的语义特征。如果语料库还包括同一作者的若干作品,我们就可以利用语料库来研究作者的语言风格。每个作家有自己的语言习惯,总有反复使用某些词语的偏好,这些词语往往具有某些特殊意义,即作家的个人。
语义特征。而且,语料库还可向我们提供各种各样的语言信息・如语言冗余度的大小、词汇共现和规范程度、句法模式、用词特点等,使我们了解译语文本的文体特征和译者的风格。
除此之外,语料库还有助于探索翻译普遍规律,分析翻译文本的普遍文体特征,预测翻译发展趋势与走向,并对翻译理论家提出的假说与预测进行验证。
因此,自九十年代中期以来,就有一批翻译理论家开始将语料库运用于翻译研究,对翻译的性质和特征进行描述。英国曼彻斯特大学Mo.a Bake。教授还从翻译研究角度对语料库建设和语料库语言学研究提出了特殊的要求和设想。她认为与翻译研究有关的语料库有三类:平行语料库(parallelcorpus)、多语语料库(multilingual corpus)和可比语料库(com-parable corpus)。平行语料库收集某种语言的原创文本和相应的翻译成另一种文字的文本;多语语料库是根据类似设计标准建立起来的两个或多个不同语言单语种语料文本组成的复合语料库。其中的文本完全是原文文本,不收集翻译文本;可比语料库收集某种语言,比如说英语的原文文本,同时也收集从其他语言翻译成英语的文本。
1.2机器翻译研究与机译译文质量评估
机器翻译(machine translation,MT)是在计算语言学理论指导下,实现从一种自然语言(源语言)到另一种自然语言(目标语言)的翻译,又称自动翻译。如果源语言是英语,目标语言是汉语,则称英汉机器翻译。
最早的机器翻译起源于1933年,20世纪50年代后期及60年代前期,美国出现过机器翻译研究的第一次热潮。但1964年美国科学院语言自动处理咨询委员会发表的AI。PAC报告给机器翻译泼了一盆冷水,此后,语言信息处理有过一段沉寂期。从70年代后期开始,由于计算机技术的发展和语言学理论的进步,特别是由于社会日益信息化对自动翻译的需求,在世界范围内,机器翻译研究与实用系统的开发再次得到蓬勃的发展。现在机器翻译已成为在高技术领域进行竞争的热点之一。目前,迅猛发展的网络技术,通过为需要翻译服务的客户提供理想的传递平台(platform for delivering),在各种翻译技术形成连续统一体方面起了重要作用。许多网站现在可为在线浏览(online browsing)和文件摘要(docu-merit gisting)提供翻译服务。作为翻译提供者的网站或许很快会提出运用翻译储存技术来建立在线翻译工厂(onlinetranslation factories),以满足上网顾客的翻译需求。
但是由于自然语言固有的复杂性以及计算机的智能尚未充分发展等多种原因,机器翻译要达到真正的实用目的,还需要攻克一系列的理论与技术难关。
机器翻译评价是对机器翻译系统性能机器译文质量的评价。机器翻译评价对机器翻译的研究开发和推广应用有举足轻重的影响。机器翻译评价也是机器翻译领域的一个重要研究课题。其中关于机器翻译的译文质量的评估是机器翻译评价中最重要也是最有特色的内容。译文质量评估对人来说也是一项十分棘手的任务,“编制一个适当的测试例句集是译文质量评估,甚至也是其它性能指标(如翻译速度)测评的基础。测试集既独立于具体的机器翻译系统,又独立于具体的测试方法。测试集除了包含源语言例句外,也需要附上正确的至少是可供参考的译文。”
2 机译译文质量评估标准
翻译的标准之争由来已久。“信达雅”者有之,“信顺”者有之,“等值论”者有之……不一而足。而对于自然语言的机器翻译而言,情况就很不一样。
只要以数据库文件的形式在计算机系统中建立一部英汉对照的词典,就可以在词汇级上实现英语和汉语的互译,市售的电子词典往往也包含了一些常用的固定短语的对译。不过,任何一种自然语言的句子都是无限集,只有有限资源的计算机无论如何不可能将两种语言的语句都以一一对应的形式存入系统。
曾经有人提出机器翻译译文质量忠实度七项和可懂度五项的评估意见。所谓“忠实度”是指译文传达原文意义所表达的程度以及两者问差异的总的度量。这是由专门从事翻译相应自然语言的源语专家们来测评的。“可懂度”是指一般使用译文语言的人在不参看原文的条件下,对译文所能理解的程度的一种测评。但这仍然是一种很抽象的概念,依然很难用来作为具体评估疑问质量的标准。
其实,机器翻译的中心任务是解决词序问题,即逻辑语义问题。逻辑语义是一种语义关系。在特定的交际环境下,某一语言片段的各个基本单元之间必然存在着某种逻辑关系,这些逻辑关系称为逻辑语义。逻辑语义的集合称为逻辑语义结构。译文质量的评估标准说穿了就是“逻辑语义及其层次的正确与否。”当然,机译文和其它译文一样也应该有自己的风格和文体。各种语言在表达同一种逻辑语义结构时的表层结构有所不同,甚至在同一语言中也可以用不同的表层结构表示同一种逻辑语义结构。但只要我们能够求出它们是“施事一动作一受事”逻辑语义结构及所处的层次,这就可以转换为汉语表层结构:N1对N2的V。由此可见,逻辑语义是语言转换的基础。求解逻辑语义的一个十分重要的前提是对英语词汇进行科学语义分类,即为英语词汇提供足够的语义信息。为此,我们必须对英语词汇进行语义分解,研究语义因子的搭配关系。
3 结语
[论文摘要] 对高校环境工程专业英语教学现状和存在的问题进行了剖析,探索了环境工程专业英语教学改革的新思路、新方法,提出了在调动学生学习积极性、教材建设、改进教学方法和课程考核方式、加强师资队伍建设等方面可尝试的一些方法。
环境工程开设专业英语课程的主要目的在于通过教学使得学生掌握环境工程专业术语的英文表达,学会撰写英文摘要,提高英文写作能力,掌握阅读和翻译环境工程英文文献的基本技能。一方面,为毕业论文服务;另一方面,为适应学生将来从事实际工作和专业研究的需要。结合本专业教学的实际情况,对环境工程专业英语教学进行了一些改革和尝试。
一、环境工程专业英语教学现状及存在的问题
1.专业英语课程设置不合理,学时少,任务重
环境工程专业英语课程设置不太合理,课程学时安排少。很多学校往往把专业英语开设在大三第一学期,与专业课程的开设基本上是同步的。由于此时学生的专业课程刚刚开始,学生对专业知识的了解和理解不够深入和全面。此外,环境工程专业英语专业词汇量大,长句多,知识性强,要通过短短的20~30学时掌握相应外文文献的阅读、翻译和写作技巧难度较大,学生在学习过程中很容易产生畏难情绪,学习缺乏主动性。
2.教材种类少,教学内容不明确
目前,环境工程专业英语教材公开出版的很少,很多学校采用的教材均是自行编写的,选文大多来源于欧美大学相关专业的一些教材、硕(博)士论文、相关的书籍和杂志、国际会议发表的论文、从网站下载的材料、报刊科技评论等,有的是全文选用,有的是节选部分章节或段落,难度深浅不一,随意性强,缺乏明确的教学目标。此外,由于学时少,很多任课教师往往会选择自己熟悉和擅长的领域筛选相应的内容,存在较大的主观随意性。
3.教学方法单一,教学手段落后
专业英语课堂教学多以教师和课本为中心,采用翻译和阅读相结合的方式,“一言堂”、“满堂灌”,形式单一,课堂气氛沉闷,学生只是被动的接受知识,没有机会发挥其积极性和主动性。与此同时,教学手段也相对落后,多采用教师讲授和板书的形式,很少采用多媒体教学。即使使用多媒体教学,也只有枯燥的词句翻译,没有图示讲解,也没有相配套的语音辅助资料,直接导致了学生学习兴趣的下降,甚至产生厌倦情绪,不利于教学的顺利进行,影响了教学效果和教学质量。
4.师资力量薄弱,教学水平不高
目前,很多高校的环境工程专业英语教学一般都是由专业教师担任的,很多专业教师的专业学术水平较高,但是没有经过专门的英语教学训练和口语训练,缺乏用英语授课的能力,对英语教学的方法不熟悉,直接导致教学质量的下降。而且,由于对专业英语课程不够重视,任课老师队伍不稳定,教学质量难以保证。
5.课程考核方式
专业英语的考核主要采取开卷笔试的形式,考试内容侧重对词汇掌握、阅读翻译能力的考核,对听、说、写能力缺乏具体的考核内容。而且很多内容都是课文中讲解过的,这样主观上给学生一种消极应对的态度,无法真正地检验教师的教学水平和学生的学习效果。
二、环境工程专业英语教学方法探索
1.明确教学目标,重视教材建设
专业英语注重实用性,不仅包括本科毕业论文中的英文摘要,还包括进入社会后的诸如英语面试、基本专业资料的阅读等应用。因此,文章难度选择应该在能够清楚地介绍专业知识的基础上,难度适中,篇幅不宜太长,有代表性的专业词汇出现频率要高些。在课堂讲授过程中注意专业知识的导入,减轻学生学习的难度。文体的选择也应注意形式的多样性,除了专业文献,还应增加广告、产品说明书、设计说明书等文体。
2.改革授课形式,加强师生互动
(1)教学内容与教学方式多样化,
环境工程专业英语的学习本身是枯燥的,再加上专业课程的滞后,畏难情绪导致学生的积极性不高。这就要求尽可能采用趣味性和多样化的教学手段,来提高学生学习的积极性和主动性。环境工程专业英语涉及很多水、气、土壤等介质中的环境现象与过程的描述以及污染控制工程流程等内容。在教学过程中,可以将学生已经熟悉的知识或较抽象、学习起来较困难的内容借助多媒体、录像、图片、电影、动画等工具,以此来提高学习兴趣。这种教学手段形象、生动、直观、信息量大,使学生在视觉和听觉上受到直接的刺激,提高学习热情。例如,在讲解各类除尘器(precipitator)的教学过程中,可以结合各类除尘器的内部结构剖面图和工作原理的仿真动画,使之生动易懂。
(2)课前预习,课后复习
环境工程专业英语是一门实践性很强的课程,需要大量的听、说、读、写、译训练,要想在短短的每周2~3学时的课堂上完成是不现实的。笔者在进行专业英语教学实践的过程中,对学生首先要做到课前预习,就下次课即将讲授的新词汇短语、新课文、背景等进行预习,并采取课堂随机点名检查的方式进行考核,计入平时成绩。其次,课后给学生布置适量的写译练习,要求用英文回答每个单元后的问答题,既巩固了专业知识,又复习了英语。
(3)课堂注重听、说、读、写、译全方位训练
与基础英语相比,专业英语有自身的特点,除了专业词汇、术语及特定的构词方法外,还有科技文体、句法结构、语态、时态等方面的特点,这些是专业英语课程需要重点传授给学生的知识。当然,考虑到专业英语的实用性,也不能忽略听说能力的培养。
听。听力训练可以穿插在整个课堂教学过程中。如教师用双语讲课,通过给学生提供一个语言环境,养成英语思维的习惯,激发学习的积极性。当然,也可以采用多种多样的教学形式和教学内容,如利用多媒体播放一些科教光盘,如Discovery中关于温室效应、全球变暖、臭氧层空洞、酸雨等科普类的环保小短片。在锻炼专业英语听力的同时,也极大地提高了学生学习的兴趣。
说。要让每个同学都有开口锻炼的机会。正式上课前,可以开展“3分钟演讲”之类的英语口语练习。在课堂教学中,可以轮流安排让每位同学朗读3~4个句子,或者就课堂提问要求学生尽量用英文回答。这样做提高了学生的自信和表达能力,能让每个同学都参与到教学活动中来。
读。要提高专业英语的阅读和翻译能力,首先要掌握一定数量的专业词汇和专业术语。环境工程专业词汇很多都是复合词、缩略词及利用前后缀构成的派生词。因此在每个单元的词汇教学中,应注重构词法的分析,介绍一些常见的前后缀和词根以及词性的变化规律,帮助学生理解和记忆。如硝酸盐(nitrate)、亚硝酸盐(nitrite)、硫酸盐(sulphate)、硫化物(sulfide),等等。在课堂上要多采用启发式的提问,学习一个词根后,立刻给出一个含有该词根的新词让学生进行联想学习。
专业英语注重行文连贯、简洁,力求客观和准确,句子以长句和被动语态居多,大量使用名词化结构、非限定动词和后主定语。因此,在教学过程中要穿插科技英语文体的介绍和翻译技巧的传授,注重培养学生分析句子结构尤其是复杂长句句子结构能力。通过典型句子分析,结合专业知识背景,训练学生分清句子种类、找句子主干的能力。教学过程中,可以利用多媒体将每个句子中的主句以不同颜色和字体与修饰成分区分开,将谓语以粗体字显示,并让学生共同参与朗读,使他们在读句和断句的同时了解句子的语法构成。
写译。对于很多高校,大三学生开设专业英语的一个主要目的是为毕业论文服务。这一点直接表现为毕业论文的外文翻译任务和正文中英文标题、英文摘要和图表的英文翻译。根据笔者多年指导本科毕业论文的体会,很多学生往往借助电子工具或在线翻译软件来完成,结果驴唇不对马嘴。因此,除了加强课堂讲解训练,课后布置适当的汉英和英汉翻译作业是非常有必要的,尤其是要让学生充分利用图书馆的数字资源,根据毕业论文课题的要求查阅相关外文文献,在阅读文献的同时,掌握英文摘要的撰写。
3.更新考核方式,注重课堂考核
考核是检查教学效果、督促学生学习的有效手段之一。为了提高学生学习的积极性,应加大平时成绩的比重,考核方式也应该多样化,如在每次课堂教学结束后安排适当的测试,综合课堂表现、课后作业、出勤等方面。期末考试试题题型尽量多样化,可以增加口试、摘要写作等内容。
4.加强师资队伍建设
环境工程专业英语既是一门语言课,又具有专业课的特点。专业英语任课教师既要熟悉本专业的课程体系,掌握各专业主干课程的内容,了解学科的前沿动态,还需要较高的听、说、读、写、译水平,同时具备一定的英语课堂教学组织能力。因此,学校应充分利用现有资源,多方式、多渠道的加强师资队伍建设。首先要稳定教师队伍,不能随意指定。其次,对专业英语任课教师进行培训或者提供出国或访学的机会,开阔眼界,提高英语口语授课的能力和水平。
“授之以鱼,不如授之以渔”。只有学生真正掌握了环境工程专业英语学习的方法和技巧,才能真正发挥专业英语的重要意义和作用。
参考文献
[1]李月生,夏祥翔.论化学化工专业英语教学改革[J].广东化工,2007,34(10):119-123.
[2]徐进.环境工程专业英语教学浅析[J].中国电力教育,2008,(10):227-228.
[3]俞乐.互动式教学法在生物专业英语教学中的应用[J].西江教育论坛,2010,(1):56-57.
关键词:网络;商务英语写作;模式
中图分类号:G632文献标识码:A文章编号:1003-2851(2010)05-0173-01
随着世界经济一体化进程的迅速推进,国际间商务活动交往日益频繁,对书面英语特别是商务文件质量的要求也越来越高,提高国际商务人员的英语文书写作水平已成当务之急。商务英语写作水平作为英语综合应用能力的一个重要指标,其作用日益突显。
一、利用电子邮件强化师生互动
(一)基于邮件实施个性化教学。写作是个性化活动,需要教师对学生进行因人而异的辅导。大学课堂班容量普遍较大,教师难以顾及到每个学生,师生间互动与交流的机会也较少。通过电子邮件的方式,可打破课堂时间受限这一瓶颈,师生随时都能保持联系,便于教师针对性地处理每个学生的问题,也利于下一步的因情施教。外贸英文函电课程中,信函单证任务就是以邮件的形式完成,其本身就会提高写作课的效率。教师可利用邮件对每个学生或每组学生从起草、修改、编辑到最后截稿的整个过程实行电子监控,既省时又省力。使用电子邮件来交作业,既节省空间,减少纸张和笔墨;教师还可通过电子邮箱系统对作业快捷地审查和进行管理,为更加准确地了解每个学生的情况提供了高效的保障,还可为尔后进一步分析留下素材提供参考。
(二)利用邮件组加强教学互动。邮件组就是专门用来扩充E-mail用途的,也有人称之为邮件清单或电子论坛。它可以就某一普遍感兴趣的问题借助电子邮件进行广泛的交互式的研讨,使具有共同兴趣爱好的人凭藉E-mail找到属于自己的网际家园。用户加入了某个邮件组之后,每一封参与讨论的信件都将由系统程序自动复制一份,以电子邮件的形式寄给邮件组的其他用户。这样便于学生之间沟通思想、互相帮助、共同提高。在外贸英文函电课上,通过邮件组功能,教师不仅可将一些优秀范文或有关写作参考资料等传递给学生;还可以把下次写作题目及写作要求传达给学生,以便学生做好课前准备。学生根据自身情况可独立完成写作,也可以小组形式先讨论问题,尔后集体完成作业。教师应规定学生提交作业的时间,并全程监控写作过程,以便及时获得学生的反馈,进而对出现的问题给予指导和帮助。学生通过邮件组可随时与教师或其他同学保持联系和交流。这一切都可以在课外进行,从而大大地扩展了课堂时间,加强了师生间的互动。
二、利用网上写作中心拓宽视野
(一)弥补教师自身不足。商务英语特有的课程性质决定了教师不仅要具备深厚的英语写作能力,而且应精通商务活动。然而,教英语老师不懂商务知识,教商贸的老师又不精通英语教学的现象,普遍存在于我国的高校中,这是一对短时期内不可调和的矛盾。若教师利用网上写作中心,就可与外籍教师加强联系,探讨教法,交流心得;同时还可以参考他们的材料备课。外教的写作讲义分很多专题,如提纲写法、编辑校对文章方法以及各类文体的写法等,还配有相应的练习及答案。学生借助网上写作中心可与国外大学进行联系,从而获得外籍教师的帮助,并通过邮件组把交流心得介绍给其他学生。互联网上有名的网上写作中心包括Purdue University's On-line Writing Lab(珀杜大学在线写作实验室)、Toronto University’s Writing Center(多伦多大学写作中心)等。它们还提供供教师备课和学生写作时随时查阅的电子词典和电子书籍。
(二)弥补教材容量不足。目前,许多高校使用的商务英语写作教材内容相对陈旧,沿袭普通英语写作教材的特点严重,大多存在着重英语而轻商务的现象,难以与时俱进。网上写作中心则可以实现信息资源共享,实时更新最优秀的教材和教法,教师在网上可以获取最新的知识,也为学生提供了一个良好的学习环境,以充分调动学生的首创精神。其作文载体通常都是商务英语写作中常见的描述、说明和议论,这些内容贴近学生生活与现代社会实际,很容易引起学生的兴趣。在这种条件下写作,学生能有更多的机会在不同情景下去运用他们的所学,并根据自身行动的反馈来形成对客观事物的认识和解决实际问题的方案,从而提高商务英语写作的自主创新能力。
三、利用相关软件提高写作效率
(一)利用模板软件降低商务英语写作门槛。模板及写作软件包括了各种类别的大量范文,并且还能提供相关的基础知识、语法、语义等多方面内容。对范文的赏析正是英语写作教学中最常用的方法,但在课上教师经常根据大多数学生的接受水平展开讲解,这种方式往往不能满足个性需要。模板及写作软件可有效解决这个问题。商务英语写作的内容通常对读者都具有较强的针对性,写作用语必须语言简洁,条理清楚。因此,利用模板书写商务文件时,除了词语选用正确、得体外,还要避免过分依赖,否则导致索赔与被索赔一个语气,讨价与还价一个模式。
(二)利用翻译软件提高专业术语的准确度。商务英语在长期的使用过程中为了表达方便,节约时间,形成了一系列的商业术语(如FOB 、CIF等)。专业术语是写好商务英语文章的必备条件之一,仅靠教师课上讲解容量有限且涉猎范围不宽泛。例如商务英语写作中常用到营销学、经济学、金融学、会计学甚至法律学等各种边缘学科的专业词汇,还会涉及到对外贸易、招商引资、商务谈判等多方面内容。词典虽然很好,但它的更新速度显然逊色于网络上每天都在更新的词典。网络上的各种在线翻译资源比起翻字典一个词一个词地查单词省时省力。当然,大多数翻译软件对中文或英文都是词对词的翻译,很少会顾及到整个句子的结构、语法等方面的问题。所以,教师在教学中应该加强学生的语言建构能力。
教无定法。任何教学方法都不能满足所有的学习者。同样,学也无定法,它因人因地而异。本文只是就利用网络辅助商务英语写作模式作了些粗略的探讨,还有很多没有论及,例如电子论坛,电子投稿等等。这些都将会有益于学习者商务英语写作水平的提高。
参考文献
[1] 陈红 校本大学英语写作教研辅助平台的设计构想与理论基础[J].外语界,2009
把多媒体引入英语课堂教学中在高校形成了普遍现象。上个世纪70年代,西方写作理论研究出现了过程写作及新近的社会认知写作理论,国内的写作教学也出现了有关成果法、过程法和体裁法等诸多理论的讨论和研究。
随着对写作本质的认识加深,人们趋向主张在写作教学中从以教为主转向以学为主,从写作成果的教学转向写作过程的教学,鼓励学生在写作过程中不断对自己的作品进行反思和修改。同时大力加强教师对学生写作全过程的技能训练和指导,充分利用高科技手段实施个性化的教学和测评,激励学生与教师、学生与同伴之间的协作学习,特别是师生协作共同参与教学设计、实施和测评的整个过程,以提高学生学习的积极性和主动性。
二、理论依据
语言学习策略是指学习者为了提高自己学习和运用语言的能力而有意识采取的行为和步骤。语言教学策略是教师为了提高学习者学习和运用语言的能力在语言教学中所采取的方法和手段。两者相辅相成,密不可分。积极有效的学习策略和教学策略都会对语言习得产生重要的影响。因此在研究语言学习策略的基础上研究教学策略,具有理论和实践意义。一方面,实际研究可以充实应用语言学理论,使其得到发展。另一方面,对实际外语教学起到启发和指导作用,指导教师使用与学生学习策略相适应的教学策略,同时对学生的学习策略的使用给予积极的指导和训练,使他们更有效地进行语言学习。
元认知属于认知心理学的概念,是由美国心理学家J.H.Flavell(1971)在元记忆的基础上提出的,指学习者以自身的认知系统为认知对象,对认知过程的自我意识、自我控制、自我评价和自我调节。元认知包括元认知知识和元认知策略两方面。元认知知识是指人对于影响自身认知活动的因素及这些因素之间的互动关系等问题的自我认识,即“对认知的认知”。元认知策略是指主体在进行认知活动的全过程中将自己正在进行的认知活动作为认知和意识对象,不断地对其进行积极的、自觉的监控和调节。它主要包括规定策略、监控策略、评价策略和矫治策略(武和平,2002)。在英语课堂教学中掌握元认知知识和元认知策略是教授者实施行之有效的课堂教学策略的关键。
行动研究又叫行为研究,它将理论和实践联系在一起。这是个螺旋式自我反思的行为过程,大体可以分为四步:计划、行动、观察和反思。元认知具有很强的主观性,元认知知识来源于个体体验,是元认知主体本人认为正确、有效的东西。其主观性显著的特征必然影响教授者在课堂教学中所采用的教学策略,因此教授者必须在“行动研究”的引导下不断反思设计出有效的课堂教学策略。
三、研究结果
(一)项目中期工作及阶段成果
研究工作主要集中在利用网络资源促进学生英语写作能力的提高。写作是学生认识能力、思考能力和文字运用能力的综合反映,需要一定的写作技巧和熟练运用语言的能力。从学生英语学习的现状看,写作是最薄弱的环节。该研究意在促进英语教学工作,提高英语的教学质量,其作用和意义在于分析大学生英语写作能力滞后的原因,并制定出提高大学生英语写作能力的措施;探讨体裁教学法、目标教学法、错误分析法等不同教学法在英语写作教学中的应用;利用网络现代化高科技手段不但能快速加深学生对理论知识的接收和理解,通过多媒体激发学生学习、参与的兴趣,同时能扩大学生写作的思维面,让学生体验信息使用的全过程,包括从搜索、分类到加工、创造的一系列活动;在现代化的高科技手段别是利用电子辞海、在线翻译、谷歌、句库网、wiki、博客、电子邮件、短信等手段,使得学生在信息获取和交流中英语写作变得轻松而有乐趣,作文批改减轻了教师的劳动强度;在英语写作教学中以行动为导向强调师生不仅是教育实践者,更是教育研究的主体。研究的问题具有直接性、特殊性、微观性。教师发起的课堂研究,目的是加深教师对课堂教学的理解,改进课堂教学实践,提高教育教学质量和效率,改进教育教学工作。
阶段性成果是:(1)根据以往所做的教改立项所得的调研结果制定该调研的设想,即对利用网络等高科技手段提高本科学生英语课堂写作能力的课堂教学策略进行调查和研究,并按入校分级测试成绩分班并进行分班教学。(2)针对提高学生英语的写作技能进行教学策略的调查工作。调查为期半年,对调研收集的数据进行统计和分析,根据分析的结果找出问题所在。(3)根据出现的问题查阅相关文献,研究改进措施,同时教师要运用理论系统地反思自己的实践,并及时提供反馈信息。(4)根据反馈的信息不断改进教学策略,制定有效的教学策略,并对有效的和改进的教学策略进行试应用和推广。
(二)项目后期工作及研究成果
该研究是个实证研究,有前期实证研究的理论和实践基础。根据以往所做的教改立项所得的调研结果制定该调研的设想,即对利用网络等高科技手段提高本科学生英语课堂写作能力的课堂教学策略进行调查和研究。首先调研学生英语的写作策略。制定调查问卷,对调研收集的数据进行统计和分析,根据分析的结果制定出有效的英语写作的教学策略。即制定了以网络教学为辅助手段进行写作的三个基本步骤:写作包括写作前、写作中和修改三个步骤。写作前利用模仿策略,学生首先确定主题,利用图书馆特别是网络尽可能多地收集素材、触发灵感、拓宽思路。写作中利用语块策略和注意策略,学生可注意词汇的正确使用、中心句子的设置、长句的应用和逻辑关系的表达等,依靠电子字典和在线翻译规避句子的语法和句式结构的错误。最后在修改的过程中利用TRP系统的检测功能和句库网的自我检测功能自行修改作文,也可利用同仁反馈策略向老师寻求良好的建议并认真对待老师对文章的批语。随后整理调研数据,并做出分析,以动态和发展的评价观对整个研究工作进行总结和评价。
四、结语
1 充分的理论依据
建构主义学习理论和学习环境理论强调学习过程要以学生为中心,要求学生由外部刺激的被动接受者和知识的灌输对象转变为信息加工的主体、知识意义的主动建构者;其教学理论则要求教师由知识的传授者、灌输者转变为学生主动建构意义的帮助者、促进者。可见,建构主义的学习理论与教学理论是以学生为中心的教学模式的主要理论基础。这就要求教师在教学过程中采用全新的教育思想与教学模式。建构主义所倡导的学习环境是一种支持学习者进行建构性学习的各种学习资源的组合。多媒体和网络技术由于能提供界面友好、形象直观的交互式学习环境,有利于激发学生的自主学习兴趣和进行协商会话和协作学习;又由于它能提供图、文、声、像并茂的多种感官综合刺激,有利于情景创设和大量知识的获取和保持,为实现建构主义所要求的学习环境提供理想的条件。利用这种环境,在学生的英语学习中可以实现“引趣式”主动学习的模式。
2 基于网络环境的英语教学为英语教学提供了无
限的资源优势
网络环境具有资源丰富,信息量大,交互性强,知识更新快,生动有趣,实用性强等特点,而且可以利用网络环境来引导思维,确定目标。这样教师就可以引导学生阅读引言及课文,学生试着思考教师布置的内容和本课学习要点,然后师生通过这种活动共同商议,确定教学目标。教师还可以创设情景,以趣引疑。教师通过网络环境来呈现图片资料,播放探索、国家地理杂志、CNN、VOA、NPR等广播、电视和录像片段,然后围绕教学目标、教学情境、教材内容设计问题让学生思考探究。
教师还可以让学生自主学习,提要钩玄。当学生接触问题后,在教师牵引下展开自主学习。具体做法:学生通过快速阅读和听课本录音等方式,来培养学习自主性,对教材有一个提要钩玄的了解,初步掌握学习课本知识的基本方法。
教师可在学生进行自学的基础上,打开自制的、事先放在服务器上的课件,让学生比较彼此的差距,以逐步引导和培养学生进行思考、回答问题和复述课文大意。
师生还可以在网上探究,拓展延伸。通过自主学习,学生对教材知识结构已有初步的、必要的了解,但是要对每一知识点特别是对一些重、难点问题,鼓励学生通过自学思考而对产生的新问题进行进一步的消化与把握,进行网上探索。此时教师可引导学生上网,找出相关网站(或网页),围绕相应问题进行独立探究。
教师在此过程中主要是引导学生上网及拨正思维方向,调整他们解决问题的思路,启发、帮助学生沿着正确的途径逐步攀升。通过这一步骤,学生可巩固自学成果,还可拓展延伸自己的知识外延,了解与此相关的其他东西,同时对一些疑惑问题可能会有自己的独到看法。教师和学生可以在网上协作,共渡难关。当学生进行网上探索后,有的疑惑问题可能解决了,有的疑惑问题可能解决不了,甚至还可能又产生一些新的问题,这时,教师就可以组织学生进行网上协作。
3 环境为英语教学创设了语言教学环境
语言环境在语言教学中扮演着十分重要的角色。只有在适合外语学习环境中,学生的外语知识、外语运用能力以及自主外语学习能力才会得到充分、自由的发展。具体来说,理想的语言教学环境包含语言环境及心理环境两方面的内容。
从语言上,为学生提供足够量的、多渠道的、有意义的及可理解性的言语输入,为学生提供接触大量真实语言的机会,让学生能感受到美丽、鲜活、生动的语言材料。不管语言学习者的背景是什么,他们的天资如何,以前是否有过语言学习经历,他们的学习结果在很大程度上依赖于对所学语言的接触量和内容。与此同时,这种环境还要为学生提供充分的、有意义的语言交际机会,组织互动、合作的语言教学活动。也就是说,学生参与有丰富语言资源的社会交际有利于语言的学习。同时语言学习是多重感官协同作用的结果,所以要从多种渠道给学生提供听觉和视觉上的语言刺激。
从心理上,为学生创造一个人性化的语言学习环境,让语言学习成为学生一段愉快的体验。为不同的学生设计不同的语言学习活动,提供表现自我的机会,选择适合自己的学习方式,体验自己成功的喜悦,并有机会展现自己,欣赏自己的学习成就,提高他们的语言学习自信心。这个条件的关键在于能够提供一种友好、合作的群体学习气氛。
4 有效的辅助工具的推荐和利用的必要性
(关键词]多语言信息获取 数字图书馆用 户调查 信息需求
[分类号]G250.76
1 引言
多语言信息获取(Multilingual informaiton Access,MLIA)即在多语言环境下研究信息的贮存、描述和检索,它对信息在全人类和全球范围内的进一步整合至关重要。多语言信息获取的一个重要应用领域是数字图书馆。数字图书馆拥有大量数字化资源,在媒体丰富的社会生活中扮演了重要角色。多媒体、多语言和多元文化是数字图书馆最主要的三个特征。作为信息资源与信息技术的融合,数字图书馆中涵盖了多项与多语言信息获取相关的应用领域。如多语言信息资源管理、多语言数字图书馆门户、多语言信息检索、多语言元数据描述、多语言问答系统和多语言文本挖掘等等。越来越多的数字图书馆意识到获取多语言信息资源的重要性,例如,欧盟委员会发起了"i2010数字图书馆倡议”,提出了有关数字图书馆中多语言信息获取的议案,目的是方便用户对欧洲国家图书馆里的信息资源进行多种语言获取。
然而目前除极少数网站,如谷歌翻译等外,多语言信息获取技术并未被广泛应用。出现这种情形在一定程度上是因为市场缺乏需求,但更主要是因为多语言信息获取的特殊要求并未真正被明确阐述和评估。例如,在多语言信息获取系统中,终端用户对检索到的信息的翻译和概括有着比普通检索系统更高的要求,而这些要求并未被系统开发者所认设。
因此,为了实现未来数字图书馆的多语言信息获取功能,我们应该关注数字图书馆用户的真实需求。本文将以问卷调研的方式进行调查研究,分析调查结果,以期了解用户对数字图书馆提供多语言信息服务的期望。
2 多语言信息获取在数字图书馆中的应用
多语言信息获取既包括多语言信息处理技术的研究,如跨语言信息检索、机器翻译、多语言问答等,也包括对用户的研究,如用户行为、用户需求、用户评价等。数字图书馆中存在大量的多种语言数字资源,因此是多语言信息获取的重要应用阵地。目前,国内外很多研究者也认识到多语言信息获取在数字图书馆中的重要性,开展了很多理论与实践研究,主要集中在以下三个方面:
2.1 提出数字图书馆和多语言信息获取的集成框架
Oard指出,用一种语言去检索大量多语言馆藏文献的方法提高了数字图书馆用户搜索信息的能力,同时叙词表能够帮助解决使用不同语言中的词汇对受控词汇进行检索的挑战。Maybury与Griffith L描述了一种集成的、能鉴别大量多语言文献的信息分析环境。Chen以台湾故宫数字博物馆为例,对数字图书馆中的多语言信息获取进行了综述。Liu等提出了Are――一种与开放信息存取相互兼容的联合数字图书馆,并探讨了Arc如何与现有的跨语言检索组件相集成。Pavani研究了Maxwell数字图书馆系统的一些特定功能,指出多语言数字图书馆应具备的基本功能与组成部分。
2.2 开发构建多语言数字图书馆的技术
Bian与Chen探讨了使用跨语言信息检索技术来获取互联网上的多语言文献。Wang等调查了利用网络作为语料源翻译未知检索词以解决数字图书馆跨语言信息检索的可行性。Richardson与Fox提出了使用概念图作为数字图书馆大量文献的跨语言资源发现工具的方法。
2.3 实现多语言数字图书馆的应用项目
马里兰大学的一个研究小组设计了国际儿童数字图书馆,该图书馆选择和整理来自不同国家的图书,并将它们以不同语言同时呈现出来。伯克利公共数字图书馆提供了8种语言的信息资源,并配备了多语言目录检索以及多语言参考咨询服务。与世界其他地区相比,欧洲国家更加关注数字图书馆领域的多语言问题。在欧盟第五期架构计划资助下的14个包含多语言文献的项目中:ETRDL项目提供了包含6种语言的多语言界面以及多语言文本处理技术;SCHOLNET作为ETRDL的延伸,包含了跨语言检索功能;ECHO是包含4种语言的电影档案项目,它能通过受控词汇进行跨语言检索;MUCHMORE是跨语言信息检索在医学领域的应用项目。MultiMatcht项目是用于检索文化遗产的多语言与多媒体搜索引擎,它包括对文档以及查询进行翻译的组件。欧洲数字图书馆、博物馆、档案馆是欧洲多语言文化遗产的整合检索点。
综观文献表明,许多数字图书馆是不同国家在生成双语或者多语言文献过程中合作的产物。这些数字图书馆服务了更广阔的、甚至全球使用不同语言的用户群体,然而,他们中的许多人并不具备多语言信息检索能力。更重要的是,很少有研究从用户的视角去评估数字图书馆的多语言馆藏。在数字图书馆研究热情不断高涨的情况下,对用户研究的缺乏着实令人意外。我国也存在相同的境况。数字图书馆在中国的发展历史不长,许多数字图书馆尚没有提供多语言信息服务。随着中国愈来愈面向世界,国内研究者能够更方便地获取外语资源,并将中国的文献资料传播给世界显得愈发必要。
3 调研设计
3.1 研究问题与方法
本文的研究目标是调查了解中国的数字图书馆用户对多语言信息获取服务的真实需求和期望,包括用户是否有获取多语言信息资源的需求、用户获取多语言信息资源的动机何在、用户需要怎样的多语言信息资源、用户对多语言信息获取技术的理解如何及用户期望怎样的多语言信息获取系统等。
我们采用问卷调查的方法来探寻上述研究问题,收集不同学科背景的用户对数字图书馆的多语言信息资源获取与服务的认识。
3.2 问卷设计和数据收集
为了研究用户对数字图书馆多语言信息服务的需求,我们以不同专业的潜在数字图书馆用户为调查对象,开展了问卷调查。
调查问卷共分为7个部分,包括99个问题,其中前面11个问题是关于调查对象的个人基本信息,其余88个问题则涵盖了用户行为、多语言信息获取需求动机、多语言信息资源、多语言信息服务、多语言信息检索和多语言系统用户界面六大方面(见表1)。除了问卷第一部分“个人基本信息”采用的是单选题和多选题的方式外,其余88个主要问题均采用量表的方法进行调查,其中“1分”代表“完全不同意”,“2分”代表“基本不同意”,“3分”代表“不能确定”,“4分”代表“基本同意”,“5分”代表“完全同意”。
我们调查的目标用户主要是来自武汉大学各个专业的本科生,研究生、教师和图书馆馆员。总共有79
个人填写了问卷,他们来自不同的专业,包括图书馆学、情报学、计算机、生物、电子通信、电子工程、能源、环境、文学、外语等。
4 结果分析
4.1 问卷的信度和效度分析
我们使用的统计分析软件是SPSS 16.0。反映内部一致性信度采用的是克朗巴哈系数(Cronbach’s Al-pha),测量效度用KMO(Kaiser-Meyer-Olkin)指数和巴特利特(Bartlett)检验。各项指标的数值如表2所示:
从表2中我们看到,问卷整体Alpha值是0.924,即问卷的信度非常高。而类1和类5的Alpha值只在0.35~0.7之间,中等水平;另外四个大类的Alpha值则都在0.7以上。效度方面,六个大类的KMO值都大于0.5,表明问卷是有效的。受篇幅限制,在接下来的各小节中,我们不可能把99个问题的所有选项一一分析,而是有选择性地讨论那些最有价值的调查发现。
4.2 用户背景分析
在79份有效问卷中,用户的性别比例基本平衡;用户的年龄主要分布在20~40岁年龄段;研究生学位以上的用户占大多数(63%);用户以学生为主;用户的学科背景丰富,涉及人文社会科学和理工科等各方面;用户全部都掌握英语为其外语,但能掌握两门以上外语(包括英语)的用户只有9%左右。
此外,几乎所有受访者对网络数据库。数字图书馆、搜索引擎、图书馆的公共书目系统都不陌生,他们绝大多数均使用过一些常见的系统;用户对翻译工具的使用也较为熟悉。按照使用频率由高到低依次是;①网上数据库:中国期刊网(CNKI)、万方数据库、重庆维普科技期刊数据库、SCI、Springer、EI、人大复印报刊资料数据库等;②数字图书馆:超星数字图书馆、国家数字图书馆,国家科技图书文献中心NSTL、ACM Digit-al Library、中国高等教育文献保障系统CALIS、ProquestResearch Library等;③搜索引擎:百度、谷歌、搜狗、雅虎、天网、腾讯搜搜、必应等;④图书馆公共目录系统:本校的图书馆目录、国家图书馆目录等;⑤翻译工具:金山词霸、谷歌在线翻译、灵格斯、yadao翻译、金桥翻译等。
4.3 用户行为分析
问题1~15是调查用户获取多语言信息资源方面的行为。我们按照量表计算了这15题的平均分为3.13分,说明用户对于这部分问题的认同度是皋本中立的。在这一部分调查中,我们的主要发现如下:①对于多语言的图书和期刊,其传统纸质版与数字版相比,用户更愿意阅读数字资源;②对于检索那些用户可以识别的语言的信息资源时,用户对自己的检索往往感到满意;③用户在查找自己不懂语言的信息资源叫存在困难,但希望可以获取这些信息资源;④当检索到不懂语言的信息资源时,用户会借助翻译1具,但对翻译质量并不满意;⑤当检索到不懂语言的信息资源时,用户更可能选择放弃而不是向朋友或图书馆员求助。
上述发现说明,用户希望且需要获取多语言信息资源,但当检索他们不懂的语言的信息资源时又会遇到困难。翻译工具非常有帮助,但翻译结果不尽人意。
4.4 用户需求动机分析
问题16~30是调查用户获取多语言信息的动机。我们按照量表计算了这15题的平均分为2.92分,说明用户对于这部分问题的认同度是趋于中立的。平均得分在3.0以上的需求动机说明大部分用户对其是基本认同或认同的,按照分值从高到低排列如表3所示:
以上结果表明,驱使用户去获取多语言信息资源的主要动机更多地与工作、研究相关,而不是日常生活需要。
4.5 多语言信息来源分析
问题31~52是研究用户如何利用和评价多语言信息源。我们按照量表计算了这22题的平均分为3.61分,说明用户对于这部分问题的认同度是趋于同意的。在这一部分调查中,我们的主要发现如下:①用户获得学术信息的主要来源是搜索引擎,其次是数字图书馆,再次是传统图书馆;②用户在检索搜索引擎、数字图书馆和传统图书馆时曾使用过多语言信息资源;③在检索中文学术资源时,用户使用中文的数字图书馆和搜索引擎;而检索外文学术资源时,则使用相应语言的数字图书馆和搜索引擎;④多数用户在过去曾使用过Google跨语言搜索引擎,反映普遍较好,但却很少人使用过Yahoo Babel Fish跨语言检索系统;⑤用户并不满意目前数字图书馆、搜索引擎和传统图书馆提供的多语言信息资源;⑥用户并没有明确表示他们对多语言信息资源获取方式的不满意;⑦用户非常期待整合的多语言数字图书馆,因为它容许用熟悉的语言检索不熟悉语言的资源。
4.6 多语言信息服务分析
问题53~69是研究数字图书馆应该提供的多语言信息服务。我们按照量表计算了这17题的平均分为3.98分,说明用户对于这部分问题的认同度是基本同意的。平均得分在4.0以上问题说明用户对其认同度较高,按照分值从高到低排列如表4所示:
可以看出,用户确实需要数字图书馆的多语言信息服务,其中最期望的是专业词汇翻译和摘要翻译,而不是以全文翻译。同时,他们也希望数字图书馆提供聚类功能以组织多语言信息资源,以及一些互动服务功能。
4.7 多语言信息检索分析
问题70~74揭示了数字图书馆应有的一些多语言检索功能。我们按照量表计算了这5题的平均分为3.90分,说明用户对于这部分问题的认同度是基本同意的。平均得分在4.0以上问题说明用户对其认同度较高,按照分值从高到低排列如表5所示:
因此,跨语言信息检索对于用户来说是十分必要的,也是十分期待的。用户同时也非常希望检索系统能将检索结果翻译成他们可以识别的语言或者母语,当然,这种结果的翻译如果能在摘要层面就可以了。此外,系统最好还能够提供一些帮助用户对查询翻译进行歧义消除或者帮助用户选择查询翻译的辅助功能。
4.8 多语言信息系统界面分析
问题75~88是询问用户心中理想的多语言系统界面是怎样的。我们按照量表计算了这14题的平均分为3.89分,说明用户对于这部分问题的认同度是基本同意的。平均得分在4.0以上问题说明用户对其认同度较高,按照分值从高到低排列如表6所示:
这些调查结果表明用户倾向于数字图书馆界面能够在翻译方面提供更多的帮助。
4.9 用户的其他建议
除了选择和打分以外,我们还设置了一个开放问题让受访者对此次调查提出任何意见或建议。我们也收到了一些问卷中未涉及的建议,总结如下:①提供句子,全文翻译不应该是重点,毕竟真正的理解还在阅读者,但是提供专业词汇的准确翻译确实很有必要的,因为准确的专业翻译可以帮助研究人员迅速找到问题所在。重点应该在关键词同义词的搜罗和相互启发,用一个关键词检索时,其他相似或同类的关键词的结果也应该显示,可以帮助研究者更全面地掌握世界研究情况。②数字图书馆的多语言问题对不同领域可能有不同的需求,如对理工科影响较小,因为绝大多数的工作都是用英文发表的。而有些专业领域研究人员多语言需求明显些,比如植物动物研究等,这些自然资源分布在不同语言的区域。另外,文化领域多语言需求也会比较明显。③数字图书馆的系统界面最好能够根据用户需要来定制界面所显示信息的语言。
5 结论