浅议中文信息处理技术在外汉语教学中的运用.pdf
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
2 0人已下载
| 下载 | 加入VIP,免费下载 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 中文信息处理 技术 在外 汉语 教学 中的 运用
- 资源描述:
-
1、浅议中文信息处理技术在外汉语教学中的运用摘 要:20 世纪 80 年代以来,随着现代通讯技术的迅速发展和普及,以计算机为工具的语言信息处理成为计算机科学与语言学交叉领域研究的热点。近十几年来,对外汉语教学发展迅速,汉语在世界范围内逐渐成为继英语之后的强势语言,中文信息处理在对外汉语教学中日渐发挥重要作用。本文对中文信息处理和中文信息处理的其他工作对对外汉语教学产生的作用予以归纳阐述,并对这一领域的科研成果以及学术活动情况做简要介绍,最后对在对外汉语教学实践中中文信息处理所面临的挑战给予展望。关键词:对外汉语教学 中文信息处理 研究综述一、中文信息处理理论中文信息处理就是用计算机来加工处理中文的
2、信息,这是一门涉及计算机科学、认知科学、语言学、信息学、数学、声学等多种学科的一门综合性交叉学科。本文所涉及的“中文信息处理”首先特指对中华人民共和国国家通用语言文字法所规定的普通话和规范汉字的信息处理,同时也包括对汉字承载的传统文化的处理。根据中华人民共和国国家标准汉语信息处理词汇 01 部分:基本词汇1的规定:语言信息处理是指:“用计算机对自然语言的音、形、义等信息进行处理。即对字、词、句、篇章的输入、输出、识别、分析、理解、生成等的造作与加工。”汉语信息合理和其他各民族的语言信息处理都属于语言信息处理。汉语信息处理是指用计算机对汉语的音、形、义等信息进行处理,有时又称中文信息处理。汉字信
3、息处理是指用计算机对汉字表示的信息进行操作与加工,如汉字的输入、输出、识别等。本文中的“中文”与“汉字”指称同一概念,特指汉语。计算机技术应用于对外汉语教学与研究最基本的条件是中文信息处理环境,也就是中文信息平台。中文信息平台是指具有对汉字进行编码、处理、传输的能力并且具有中文输入、输出界面的操作系统。多文种平台,是指能同时处理两种或两种以上语文的操作系统。2中文信息平台极为重要的指标是支持什么样的汉字编码标准,编码系统混淆必定会产生乱码。汉字编码,本质上是把无须的、开放的汉字集合变成相对封闭的有序集合,以数字化形态实现汉字信息的处理、储存和传输。1981 年国家标准局公布的信息交换用汉字编码
4、字符集基本集收录了 6763 个汉字和 682 个非汉字图形字符,目前大量的对外汉语教学软件和电子资料都建立在这个基础之上。其后陆续出台的几个国际标准,最多包含了 27000 个汉字,为汉语教学、双语处理提供了方便。在对外汉语教学中建设现代汉语语料库是一项基础的工程。汉代汉语语料库可以辅助制定教学大纲、编写教材、查找例句、编写教案、编出试题等等,为对外汉语教学工作提供极大的帮助。现代汉语语料库的建立要经历原始预料收集、提取粗语料、提取精语料几个过程。二、中文信息处理与对外汉语教学中文信息处理技术的大力发展对对外汉学教学也有积极的作用。中文信息处理技术在技术资源建设、理论方法研究和具体技术应用开
5、发方面对对外汉语教学的发展都起到了积极的作用。1.基础资源建设语言资料库在是对外汉语教学的一个重要工具,它包括语料库、词汇知识库和语法语义辞典等。语言资料库构成了不同层面上的自然语言处理得以实现的基础。1979 年,武汉大学建设了 527 万字的汉语现代文学作品语料库;1983 年,2000 万字的现代汉语语料库在北京航空航天大学建成;同时在北京师范大学还建成了 106 万字的中学语文教材语料库,北京语言大学建成了 182 万字的现代汉语词频统计语料库。近 20 多年来,北京大学、清华大学、教育部语言文学应用研究所、山西大学、哈尔滨工业大学、北京语言大学、东北大学、中科院自动化所、科技部中信所
6、、中国传媒大学、台湾中央研究院和香港城市大学等相当一批的大学和研究机构都对汉语资源库建设做了大量工作。其中,北京大学计算语言学院研究所开发的“综合型语言知识库”、董振东等开发的“知网”(HowNet)是两项有代表性的成果,而中文语言资源联盟(Chinese Language DataConsortium,缩写:Chinese LDC)则是为推动我国语言资源共享所建立的第一个联盟性学术组织。(1)综合型语言知识库北京大学计算语言学研究所的语言资源建设工作始于 1986 年,从研制现代汉语语法信息词典起步。该词典曾获 1998 年度教育部科技进步奖二等奖。在此成果的基础上,于 1995 年提出建立
7、综合型语言知识库的规划,经过十多年的努力,综合型语言知识库取得了阶段性成果,并于 2007 年获教育部科技进步奖一等奖。申报奖励之前,综合型语言知识库通过了教育部组织的技术鉴定:“其规模、深度、质量和应用效果在我国语言工程实践中是前所未有的。该成果是以汉语为核心的多语言知识库建设中最全面、最重要的研究成果,总体上达到了国际领先水平。”该项成果为推动以汉语为核心的多语言信息处理技术的发展做出了重要的贡献,并取得了显著的经济效益。作为单项技术成果,在北京大学创下了转让次数最多的记录。综合型语言知识库在汉语计算语言学理论、汉语语言知识形式化描述、语言知识库构建技术以及多语言知识融合技术等方面都有所创
8、新。目前它包含的语言资源包括现代汉语语法信息词典、现代汉语语义词典、中英文概念词典、汉语短语结构知识库、现代汉语大规模基本标注语料库、汉英双语对齐语料库以及多个专业领域的术语库。在对外汉语教学实践中,综合型语言知识库以其完整的语言知识网络、快捷的信息处理技术发挥着不可替代的作用。同时,综合型语言知识库仍在继续发展,研制中的综合型语言知识库系统不仅把现有的语言知识资源集成为一个有机的整体,各个成员知识库可以互相参照,互相印证,而且进一步挖掘深层的语言知识,发展概率型汉语词汇知识库,让语言知识库建设更上一层楼。(2)知网知网(HowNet)是董振东教授提出并创建的语言知识库,是一个以汉语和英语的词
展开阅读全文
课堂库(九科星学科网)所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。


2019届人教A版数学必修二同步课后篇巩固探究:2-1-1 平面 WORD版含解析.docx
2022春七年级数学下册 第2章 二元一次方程组2.pptx
