文学
类型
可以朗读
语音朗读
100千字
字数
2021-05-01
发行日期
展开全部
主编推荐语
本书主要以《孟子》及《孟子注疏》《孟子集注》《孟子正义》等《孟子》相关注疏文献为资源,对比《论语》《左传》等先秦文献的研究
内容简介
书中对《孟子》进行了较深层次的加工和处理,尝试探索出一条基于注疏文献的《孟子》自动分词、词性标注等信息处理的新方法、新思路,研究了《孟子》及其注疏文献的句子对齐和词语对齐,《孟子》的自动分词、词性标注、词义消歧,《孟子》及其注疏的文本特征和语言风格统计,《孟子》中的排比句自动识别等问题。
目录
- 版权信息
- 序
- 引言
- 一、《孟子》及其注疏信息处理研究现状
- (一)传统的《孟子》及其注疏的研究
- (二)句子对齐技术研究
- (三)自动分词研究
- (四)词性标注研究
- (五)词义消歧研究
- (六)风格计算研究
- (七)修辞格的识别
- (八)余论
- 二、研究思路和研究内容
- (一)研究思路
- (二)研究内容
- 三、本书的结构安排
- 第一章 注疏对齐
- 一、注疏结构和注疏文献的作用
- (一)注疏结构
- (二)注疏文献的作用
- 二、注疏文献的平行对齐
- (一)原文与引文句子对齐
- (二)原文与引文注释对齐
- 三、本章小结
- 第二章 自动分词
- 一、先秦汉语分词规范
- 二、基于规则的自动分词方法
- (一)最大匹配法简介
- (二)词表介绍
- (三)实验结果
- 三、基于统计模型的自动分词方法
- (一)条件随机场模型
- (二)CRFs分词原理
- (三)基于CRFs的分词实验
- 四、利用注疏文献的自动分词方法
- (一)利用注疏文献自动分词方法概述
- (二)利用注疏文献自动分词实验
- 五、本章小结
- 第三章 词性标注
- 一、词性标记集的构建
- (一)名词作状语
- (二)其他词类活用作动词
- (三)使动用法
- (四)意动用法
- (五)为动用法
- 二、基于条件随机场模型的词性标注
- (一)CRFs自动词性标注原理
- (二)基于CRFs的词性标注实验
- (三)标注错误分析
- 三、利用注疏信息自动校正词性
- (一)注疏文献中的词性提示信息
- (二)利用去声信息的词性自动校正方法
- (三)实验和分析
- 四、本章小结
- 第四章 词义消歧
- 一、词义消歧的概念和难点
- (一)词义消歧的概念
- (二)词义消歧的难点
- 二、词义消歧树算法消歧
- (一)义项的划分
- (二)上下文的有效范围
- (三)消歧方法的设计
- 三、CRFs模型词义消歧
- (一)特征的选择提取
- (二)特征模板的构造
- 四、实验结果与分析
- (一)实验的语料
- (二)实验环境与测评指标
- (三)两种消歧算法比较
- 五、本章小结
- 第五章 风格计算
- 一、文本特征及语言风格分析
- (一)基于字的文本特征及语言风格统计
- (二)基于词的文本特征及语言风格统计
- (三)基于句子的文本特征及语言风格统计
- 二、排比句的自动识别
- (一)排比句自动识别的算法设计
- (二)实验及结果分析
- 三、本章小结
- 结语
- 一、本研究的主要工作
- 二、进一步的研究计划
- 附录
- 附录A:注疏文献中抽取出的去声字表
- 附录B:注疏文献中抽取出的反切字表
- 附录C:人工标注的《孟子》排比句
- 附录D:人工标注的《论语》排比句
- 参考文献
- 后记
展开全部
出版方
北京大学出版社
北京大学出版社是在1979年,经国家出版事业管理局同意,教育部批准成立的,恢复了北京大学出版社建制。北京大学出版社依靠北大雄厚的教学、科研力量,同时积极争取国内外专家学者的合作支持,出版了大量高水平、高质量、适应多层次需要的优秀高等教育教材。 北大出版社注意对教材进行全面追踪,捕捉信息,及时修订,以跟上各学科的最新发展,反映该学科研究的最新成果,保持北大版教材的领先地位。