技术教育社区
www.teccses.org

汉语最长名词短语识别研究

封面

作者:钱小飞

页数:223

出版社:上海大学出版社

出版日期:2023

ISBN:9787567146549

电子书格式:pdf/epub/txt

内容简介

  人类语言具有结构性,非常明显的体现是句法结构。理解语言离不开对句法结构的分析。因此,自动句法分析作为自然语言处理的基础性工作,是通往语言理解的基石,很多复杂的自然语言处理任务都需要建立在一定程度的句法分析基础之上。  自然语言处理研究认为两种名词短语有重要价值,一种是基本名词短语,一种是第一名词短语。相比较而言,后者不仅长度大,所合成分与结构也更复杂多样。作为名词短语的一种动态类型,汉语第一名词短语占据了一半以上的句长比例,识别出它们就可以快速地掌握句子的基本骨架,不仅有助于完全句法分析,也对机器翻译、信息抽取等多种任务具有很高的应用价值。  第一名词短语识别工作虽然取得了一定的进展,但距离令人满意的效果还有不小的差距,从而对各种应用系统的支持也受到限制。目前主流的第一名词短语识别方法是统计机器学习方法,通过词语位置分类和序列标注实现短语识别,大大提高了正确率和召回率,但也遇到了增长瓶颈。打破这一瓶颈,需要我们深入研究第一名词短语的结构和分布规律,提出新的识别策略、方法和有效特征。  《汉语第一名词短语识别研究》从理论定义、分布描写、识别方法等角度对第一名词短语识别工作进行系统的探讨。首先,通过层次构造、长度约束、名词性认定和外延范围的认定,界定了一种新的多层级第一名词短语。其次,从句法功能、句法结构和线性特征等角度细致地描写第一名词短语的分布规律,分析了其复杂性构造和识别难点问题。最后,基于分布规律制定合适的识别策略和方法,选取有效的识别特征,并分类进行识别实验。

目录

第一章 面向应用的最长名词短语研究
第一节 汉语自动句法分析的难点问题
第二节 多视域下的最长名词短语研究
第三节 最长名词短语研究的方法与资源
第四节 本书的主要内容与特色

第二章 名词短语识别的相关研究综述
第一节 名词短语研究
第二节 组块分析研究
第三节 搭配获取研究

第三章 理论基础与最长名词短语的界定
第一节 汉语短语的分类框架
第二节 语言组块理论
第三节 最长名词短语的界定

第四章 最长名词短语的分布调查与分析
第一节 最长名词短语的抽取
第二节 句法功能与外部邻接
第三节 句法结构与内部构成
第四节 复杂性与MNP构造
第五节 识别策略的确定

第五章 表层最长名词短语的识别
第一节 统计机器学习模型及其选用
第二节 基于基本名词短语归约的识别
第三节 基于分类器集成的识别

第六章 内层最长名词短语的识别
第一节 层级构造
第二节 识别难点分析
第三节 识别策略的确定
第四节 多层级的iMNP识别
第五节 基于规则的修正

第七章 最长名词短语识别工作的反思与展望
第一节 研究工作的反思
第二节 进一步的研究计划

参考文献

附录
附录1 清华汉语树库(TCT)词类标记集
附录2 清华汉语树库(TCT)句法功能标记集
附录3 清华汉语树库(TCT)句法结构标记集
附录4 CRF特征模板
附录5 动词配价词典示例
附录6 基本名词短语提升规则

下载地址

立即下载

(解压密码:www.teccses.org)

Article Title:《汉语最长名词短语识别研究》
Article link:https://www.teccses.org/1435829.html