自然语言处理未来展望自然语言处理领域一直是基于规则和基于统计2种研究方法交替占据主导地位,2种研究都先后遇到瓶颈,基于规则和传统机器学习的方法到达一定阶段后就很难再取得更大的突破,直到计算能力和数据存储的提升才极大地促进了自然语言处理的发展
语音识别的突破使得深度学习技术变得非常普及
取得较大进展的还有机器翻译,谷歌翻译目前用深度神经网络技术将机器翻译提升到了新的高度,即使达不到人工翻译标准也足以应对大部分的需求
信息抽取也变得更加智能,能更好地理解复杂句子结构和实体间关系,抽取出正确的事实
深度学习推动了自然语言处理任务的进步,同时自然语言处理任务也为深度学习提供了广阔的应用前景,使得人们在算法设计上投入得更多
人工智能的进步会继续促进自然语言处理的发展,也使得自然语言处理面临着如下挑战: 1)更优的算法
人工智能发展的三要素(数据、计算能力和算法)中,与自然语言处理研究者最相关的就是算法设计
深度学习已经在很多任务中表现出了强大的优势,但后向传播方式的合理性近期受到质疑
深度学习是通过大数据完成小任务的方法,重点在做归纳,学习效率是比较低的,而能否从小数据出发,分析出其蕴含的原理,从演绎的角度出发来完成多任务,是未来非常值得研究的方向
2)语言的深度分析
尽管深度学习很大程度上提升了自然语言处理的效果,但该领域是关于语言技术的科学,而不是寻找最好的机器学习方法,核心仍然是语言学问题
未来语言中的难题还需要关注语义理解,从大规模网络数据中,通过深入的语义分析,结合语言学理论,发现语义产生与理解的规律,研究数据背后隐藏的模式,扩充和完善已有的知识模型,使语义表示更加准确.语言理解需要理性与经验的结合,理性是先验的,而经验可以扩充知识,因此需要充分利用世界知识和语言学理论指导先进技术来理解语义
分布式词向量中隐含了部分语义信息,通过词向量的不同组合方式,能够表达出更丰富的语义,但词向量的语义作用仍未完全发挥,挖掘语言中的语义表示模式,并将语义用形式化语言完整准确地表示出来让计算机理解,是将来研究的重点任务
3)多学科的交叉
在理解语义的问题上,需要寻找一个合适的模型
在模型的探索中,需要充分借鉴语言哲学、认知科学和脑科学领域的研究成果,从认知的角度去发现语义的产生与理解,有可能会为语言理解建立更好的模型
在科技创新的今天,多学科的交叉可以更好地促进自然语言处理的发展
深度学习为自然语言处理带来了重大技术突破,它的广泛应用极大地改变了人们的日常生活
当深度学习和其他认知科学、语言学结合时,或许可以发挥出更大的威力,解决语义理解问题,带来真正的“智能”
尽管深度学习在NLP 各个任务中取得了巨大成功,但若大规模投入使用,仍然有许多研究难点需要克服
深度神经网络模型越大,使得模型训练时间延长,如何减小模型体积但同时保持模型性能不变是未来研究的一个方向
此外深度神经网络模型可解释性较差,在自然语言生成任务研究进展不大
但是,随着深度学习的不断研究深入,在不久的将来,NLP 领域将会取得更多研究成果和发展
以上内容由大学时代综合整理自互联网,实际情况请以官方资料为准。