计算语言学隐藏在北语的一座金矿.pdf
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
7 0人已下载
| 下载 | 加入VIP,免费下载 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计算 语言学 隐藏 金矿
- 资源描述:
-
1、计算语言学,隐藏在北语的一座金矿地处“宇宙中心”北京五道口,与清华相邻不远,人称“小联合国”的北京语言大学有两个王牌专业。一个是名满天下的汉语国际教育(俗称对外汉语教学),还有一个专业知道的人不多,因为它是北语这所文科为主的学校里唯一一个理工专业,该专业学术大拿云集,某些研究领域甚至位列世界前列,它就是隐藏在北语的一座金矿语言智能与技术(俗称计算语言学)。计算语言学到底研究啥北语的计算语言学开设于全校唯一理工科学院信息科学学院(简称信科)。北语信科的历史有三十二年了,前身是计算机科学与技术系,成立于 2000 年,再之前,是 1987 年成立的中国第一个以汉语信息处理为主要研究方向的“语言信息
2、处理研究所”。2014 年,北语进行了大部制改革,信科在原有的语言信息处理研究所基础上,成立了另外三个研究所,分别是:大数据与语言教学研究所、语言监测与社会计算研究所(国家语言监测与研究平面媒体中心)和管理科学与工程研究所。几个研究所基本上都与计算语言学学科直接相关,分别对语言的教学、研究和应用开展深入的研究。信科的主要任务是培养外语水平出色,具有信息处理基本素养的通用人才,在信息領域开展一些前沿性的研究。计算语言学就是利用计算机对语言进行计算处理,比如要提出某个语言现象,若没有语言数据的支持,就不能成为一个语言规律。而发现规律一般有两种方法:一种基于规则,如语法专家经过研究,发现语言规律;另
3、一种基于统计,根据大规模数据提炼规则。后一种就是计算语言学主要做的事。在这门融合了计算机科学、语言学和数学的计算语言学中,计算机科学是研究工具,语言学是处理对象,数学是建模工具,此外还会用到物理学等知识。计算语言学,是从字、词、句、篇章、语音等各个维度去研究语言,比如让计算机自动评判一个留学生写汉字写得对不对、好不好,这项技术的核心是数学曲线在二维平面的变换;再比如研究日本人说汉语,计算机可以判断他们说得对不对、准不准,这项技术就利用了物理学中的声学理论,通过发音的波形进行判断。计算语言学的应用还有很多,最常见的比如在拼音输入法中,有一项功能是“拼写和语法错误”,一旦判定有错误嫌疑,系统就会用
4、红色波浪线划出。还有让计算机评判一篇论文写得好不好,对不对等。资源优势独一无二除了北语,国内开展计算语言研究的还有清华大学、北京大学、中国科技大学、哈尔滨工业大学、复旦大学等名校。每所大学的研究各有侧重,比如中国科技大学的科大讯飞主攻语音信息处理,特别是语音识别。语音识别的应用也很多,比如语音输入法,又比如语音考试,在口语考试中,有一种题型是模仿原声读句子,计算机会给考生自动评分。传统牛校的计算语言研究规模大,相比之下,北语更像是小团队作战,但在某些领域有得天独厚的优势。这优势就是在语言资源方面,尤其是搜集外国人的语言资源上面。比如需要收集各国人书写的汉字样本做研究,在北语,随便推开一间教室的
展开阅读全文
课堂库(九科星学科网)所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。


2019届人教A版数学必修二同步课后篇巩固探究:2-1-1 平面 WORD版含解析.docx
2018幼升小计算第129天.pdf
