语言信息处理辨析在语言信息处理领域,不同的时期和不同的使用场合,有几个内涵类似的术语被用于指称大致相同的内容
在各种文献和媒体中,我们经常可以看到“自然语言处理(Natural Language Processing) ”、“自然语言理解(Natural Language Understanding)”、“计算语言学 (ComputationalLinguistics) ”、 “语言信息处理(LanguageInformationProcessing)”这几个术语,它们常常被混用
事实上这几个概念虽然内涵大致相近,使用上却各有侧重
自然语言处理是力图使计算机理解和运用自然语言,从而实现用自然语言直接进行人 机通信的技术
计算机直接处理自然语言,无需人去适应机器,这将是一个更自然且消除 了异化的人机环境,计算机将能帮助人类完成更多的工作
简而言之,它是研究如何利用计算来理解和生成自然语言的
自然语言处理也称为计算语言学,二者常被当成同义词,它们所指的是同一个研究领域,只是在使用时稍有不同
通常的使用习惯是,在偏重于说明理论时,使用计算语言学这一术语;而偏重于说明方法时,常使用自然语言处理
有的学者认为自然语言处理和自然语言理解也是同义词
我们认为自然语言处理的外延要更广一些,是后者的上位概念,因为它不但包括自然语言理解,还应包括自然语言生成
语言信息处理有广义和狭义的不同理解
广义的语言信息处理,是指对人类语言听、说、读、写、贮存、复制、教学、传播等应用方面所运用的技术、手段和方法
从这个意义上说,语言信息处理技术的发展经历了四个阶段:以雕刻作为记录技术的“甲骨石木” 阶段、以书写作为记录技术的“笔墨纸砚”阶段、以打字机和印刷技术为标志的机械与机器阶段以及以计算机技术为基础的信息化阶段
狭义的语言信息处理是指用计算机对自然语言的音、形、义等信息进行处理,即对字、词、句、篇章的输入、输出、识别、分析、 理解、生成等的操作与加工
从字面上看,“语言信息处理”这个短语可以有两种结构切分方式: “语言信息|处理”和“语言|信息处理”
前者指的是对各种语言信息进行处理, 对应广义的理解;后者指对语言本身进行信息化的处理,对应狭义的理解
在实际运用中,语言信息处理涉及到多个应用领域,比如语言教学、语言传播与交际等,所以这个术语偏重于指应用
因此,“计算语言学”、“自然语言处理”、“语言信息处理”这组内涵相近的术语,分别侧重于指同一学科对象的理论、方法和应用三个方面
以上内容由大学时代综合整理自互联网,实际情况请以官方资料为准。