论文发表 | 论文范文 | 公文范文
最新公告:目前,本站已经取得了出版物经营许可证 、音像制品许可证,协助杂志社进行初步审稿、征稿工作。咨询:400-675-1600
您现在的位置: 新晨范文网 >> 社科杂志 >> 社会科学杂志 >> 黑龙江社会科学杂志 >> 正文

外汉语教材词汇的定量研究

定制服务

定制原创材料,由写作老师24小时内创作完成,仅供客户你一人参考学习,无后顾之忧。

发表论文

根据客户的需要,将论文发表在指定类别的期刊,只收50%定金,确定发表通过后再付余款。

加入会员

申请成为本站会员,可以享受经理回访等更17项优惠服务,更可以固定你喜欢的写作老师。

《黑龙江社会科学杂志》2014年第三期

1.词频统计

词频统计是在语言学等领域中普遍运用的一种词汇分析研究方法,其统计的对象是一定文本材料中词汇出现的次数。基于已经分词和词性标注的教材课文文本,我们用Antconc语料库检索统计软件统计出《登攀》中5928个词种的词频,按照出现频次从高到低的顺序制成频率词表。根据对频率词表的观察,我们发现:出现频次在100以上的词语有33个,占总词种数的0.56%;出现频次在10以上的词语有427个,占总词种数的7.2%;出现频次为1的词语有3234个,占总词种数的54.55%。可以看出,课文中出现频次较高的词在总词种数中的占比较低,而课文中一半左右的词仅出现了1次。教材词汇体现出“高频词数量少,低频词数量多”的特点。我们根据频率词表,提取出了前十个高频词语,制成了高频词表。从中可以看出结构助词“的”的使用频率最高,出现频次为1730;其次是人称代词“我”,出现频次为1126;然后是动态助词“了”,出现频次为919。

2.句长统计

平均句长是测量语料难易程度的重要指标。哥伦比亚大学的弗勒施认为想要测量一个语料的难易程度,应该包含每一百个词的音节数与平均每句的词数[3]。后来,国外有学者提出新的测量标准,即以每个单位空间中的平均词数和句子的平均词数这两个要素,作为衡量语料难易程度的标准[4]。我们基于国内外学者的研究,对《登攀》每篇课文的平均句长等进行了考察。首先,以随机形式对该系列教材的36篇课文逐课地进行段落抽取,然后对每篇课文抽取的一个段落进行统计分析,得出每百字段落所包含的平均句子数,又对每句所包含的词数进行了统计,得出了平均句长。通过统计,我们计算出教材每百字句数和句长的平均值分别为3.37和31.06,即教材课文文本每百字平均包含3.37个句子,课文中句子平均包含31.06个词。每课的平均句数和平均句长的统计数据,如下图所示:从图中可以看出:第3、13、18、21、30、31、33课共有7篇课文的平均句长明显高于平均值,这些课文的难度较大。而第1、2、9、12、24、29、32、34、35课共有9篇课文的平均句长明显低于平均值,这些课文的难度较小。其他20篇课文的平均句长都比较接近整套教材课文句长的平均值。如果将整套教材的难度分为高、中、低三个等级的话,由统计可以看出难度为中等水平的课文所占的比重是最大的,而难度为高等、低等水平的课文占比大致相同。总体来讲,教材《登攀》在课文难度的设置与安排上还是比较合理的。以上这些究结论,应该引起对外汉语教师和学习者的注意。难度较大的课文,教师教学和学习者学习都较困难;难度较小的课文,教师教学和学习者学习都容易些。

3.新大纲词汇对教材词汇的覆盖率

新HSK是国家汉办/孔子学院总部2009年推出的一项国际汉语能力标准化考试,是在吸收了旧HSK的优点,借鉴近年来国际语言测试研究的热点成果的基础上研制出来的[5]。《新汉语水平考试大纲》(以下简称“新大纲”)于2010年初由商务印书馆全部出齐。新大纲公布了词汇等级表,该词表共收录词语5000个,是根据考生参加不同等级考试需要而制定的一个具有标准化、规范性的词表。《登攀》系列教材课文所包含的词语有5928个,新大纲词汇等级表收录的词语有5000个,所包含的词语数量大致相当。两者在数据规模上虽有差距,但相差不大,所以,具有一定的可比性。我们统计发现,《登攀》课文词表与新大纲词表中,共现词有2056个。从词语的音节数上来看,单音节词有406个,占共现词的19.75%。双音节和多音节词有1650个,占共现词的80.25%。从词性上来看,共现词中名词和动词占比较大。为了考察《登攀》词汇选择的科学性、合理性,我们计算了新大纲词汇对教材词汇的覆盖率。我们参照前辈时贤的研究方法,用程序将新大纲词表与分词后的语料进行了处理,对大纲词表中有,而语料中没有的词语进行改写,保留新大纲词表和语料中共现的词语[6]。为计算得出新大纲词汇对教材词汇的覆盖率,我们使用了范凤祥提出的某数量词汇对长度为N任意一语篇的单词覆盖率C的公式[7]。公式中:C为覆盖率;Fwj为被覆盖的第j个词汇在语篇出现的频次;s为被覆盖的词汇数;N为语篇总单词数。利用公式,我们计算得出新大纲词汇对教材词汇的覆盖率为55.85%,该值距离95%的参考值还有很大差距。由此可以看出,即使学习者掌握了新大纲一级到六级的全部词汇,也很难读懂《登攀》这套教材的课文。因为在平均句长为31.06的教材文本中,平均每句仍有13.7个词语不能识读,这会使学习者对课文的理解产生障碍。通过对《登攀》这套教材词汇的定量分析,我们可以看出,该教材在课文难度设置上比较合理,难度为中等水平的课文占比最大,难度高和难度低的课文占比相近,教材课文整体难度水平设置得较为合理,较适合学习者学习。同时,我们计算得出了新大纲词汇对教材词汇的覆盖率55.85%,这个值是偏低的,不利于学习者对中级汉语教材的学习。对外汉语教学主要以教材为载体,学习者对教材词汇的掌握程度直接影响他们对汉语的运用能力。对《登攀》这套教材词汇进行定量的分析,可为今后该教材的修订提供数据上的参考,也可为其他中级水平对外汉语教材的编写提供借鉴和帮助。

作者:高松邱爽单位:黑龙江大学文学院

黑龙江社会科学杂志责任编辑:田老师    阅读:人次
社科杂志相关文章