展开全部

主编推荐语

基于元数据的文献聚类新算法研究

内容简介

针对文本挖掘和信息检索中的文本或文献聚类与分类等问题,学术界基于VSM(向量空间模型)主要有两方面的研究,一者是文献表示模型的改进,二者是算法的改进。然而传统的算法对高维稀疏的向量聚类存在不足,一些新的算法也不尽完美,更主要的是聚类算法的效果与数据本身的特征以及信息提取和表示密切相关,特别是在信息有限的情况下,聚类算法的优势也不能得到完美发挥,相比之下,信息的挖掘、提取和文献向量表示就尤为重要。在本文仅限于元数据甚至只有关键词的前提下,文献的表示向量相比一般文本表示就表现得非常稀疏,面对这种情形聚类算法即使是“巧妇”也“难为无米之炊”,因此,本书的重点突破是文献主题语义信息的提取、度量和文献高维向量的新表示方法。基于以上问题和现象,本书以数字文献资源为对象,本着在信息资源聚合中减少对背景知识的依赖,便于推广应用的宗旨,提出了基于文献集本身或者相关领域的共现信息而实现文献聚合的共现潜在语义向量空间模型(CLSVSM)。而且通过实验证实基于CLSVSM的文献聚类表现比基于VSM和GVSM(广义向量空间模型)显著地好。

目录

  • 封面
  • 书名页
  • 版权页
  • 内容简介
  • 作者简介
  • 目录
  • 引言
  • 一 研究背景和意义
  • 二 国内外研究综述
  • 三 研究目的、方法与创新
  • 第一章 数字文献资源聚合的概念与理论基础
  • 一 数字文献资源的范畴
  • 二 数字文献资源聚合的内涵与外延
  • 三 数字文献资源聚合研究的形式和内容
  • 四 数字文献资源聚合研究的理论基础
  • 五 数字文献资源聚合的应用方法研究
  • 六 数字文献资源基于元数据聚合的探索
  • 七 本章小结
  • 第二章 数字文献资源的高维向量表示与语义相关性研究
  • 一 数字文献资源的多元和高维特征
  • 二 文献主题的特征选择与评价方法
  • 三 文献特征的高维表示与文献相似性测度方法
  • 四 向量空间模型及其衍生模型
  • 五 语义向量空间模型
  • 六 本章小结
  • 第三章 共现潜在语义向量空间模型(CLSVSM)
  • 一 共现潜在语义的概念
  • 二 基于共现潜在语义的文献高维向量表示模型
  • 三 语义信息的增强与约简探讨
  • 四 基于CLSVSM的数字文献资源聚合
  • 五 CLSVSM模型与VSM衍生模型的类比
  • 六 本章小结
  • 第四章 CLSVSM模型的实验检验与评价
  • 一 文献聚类实验的基本设计
  • 二 文献聚类评价方法
  • 三 高维向量聚类工具:gCLUTO
  • 四 实验文献集的来源与描述
  • 五 文献聚类实验内容与方案
  • 六 文献聚类实验结果与分析
  • 七 本章小结
  • 第五章 CLSVSM模型的应用与实证
  • 一 CLSVSM模型的应用范围
  • 二 实证准备
  • 三 基于CLSVSM模型的聚合实证研究
  • 四 本章小结
  • 第六章 CLSVSM模型的进一步研究
  • 一 共现潜在语义的不同估计量对比研究
  • 二 CLSVSM对英文文献的适应性研究
  • 三 共现矩阵的约简研究
  • 四 共现潜在语义核研究
  • 五 三元共现的挖掘与利用研究
  • 六 本章小结
  • 第七章 总结与展望
  • 一 总结与启示
  • 二 不足与展望
  • 参考文献
  • 致谢
展开全部

评分及书评

尚无评分
目前还没人评分

出版方

中国社会科学出版社

中国社会科学出版社成立于1978年6月,是由中国社会科学院创办并主管的以出版人文社会科学学术著作为主的国家级出版社。1993年和1998年先后荣获中共中央宣传部和国家新闻出版总署授予的全国优秀出版社称号。1993年第一批荣获中共中央宣传部和国家新闻出版署授予的全国优秀出版社称号。