NLP即自然语言处理(Natural Language Processing),是计算机科学领域与人工智能领域中的一个重要方向,其最终目的是希望人可以通过人的语言来与机器交流,是实现完整的人工智能必经的一步。

自然语言处理大体包括了“自然语言理解”和“自然语言生成”两个部分,前者意味着要使计算机既能理解自然语言文本的意义,后者意味着以自然语言文本来表达给定的意图、思想等。本教程主要集中在“自然语言理解”这部分内容。

显然,自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,希望能够通过普通的语言,而不是编程的代码,来跟计算机进行交流,所以它与语言学的研究有着密切的联系。当然,自然语言处理跟语言文学不同,自然语言处理更在乎语言背后所包含的数学原理,并且通过计算机来实现它。如同样是创作诗词,诗人会寻求文学灵感来创作,而自然语言则会挖掘诗词背后的数学规律,并且最后实现计算机作诗、作词。

本教程主要探讨中文自然语言处理的相关内容,当然同样的理论和模型都可以应用到其他语言中去,因为一般来说模型是无国界的。从任务上来看,中文自然语言处理大概包含中文分词、新词发现、词性标注、命名实体识别、句法分析、关键词提取、文本分类、问答匹配等基础任务,而诸多上层应用基本都是这些基础任务的组合,因此本教程主要围绕着这些基础任务进行展开。

标签: nlp, 背景

添加新评论