《文本挖掘：基于R语言的整洁工具》电子书在线阅读-【美】茱莉亚·斯拉格；戴维·罗宾逊-得到APP

互联网类型

可以朗读语音朗读

150千字字数

2018-04-01 发行日期

展开全部

主编推荐语

本书介绍了如何使用tidytext包以及其他基于R语言的tidy工具来进行文本挖掘。

内容简介

当前很多数据都是非结构化的大规模文本，这给分析和可视化带来了挑战。本书使用实用的tidytext软件包来介绍文本挖掘技术，该包是由Julia Silge和David Robinson共同开发的R软件包（类似于ggplot2和dplyr软件包），开发时采用了整洁原则。本书将会介绍如何利用tidytext以及其他整洁工具使文本分析变得更容易、更有效。

本书展示如何将文本转换为数据框，然后提取和可视化文本的特征；并介绍如何将自然语言处理（NLP）融入有效的工作流程中；实用的代码示例和数据分析将帮助你了解文学作品、新闻和社交媒体中的有用信息。

评分及书评

尚无评分

目前还没人评分

出版方

机械工业出版社有限公司

机械工业出版社是全国优秀出版社，自1952年成立以来，坚持为科技、为教育服务，以向行业、向学校提供优质、权威的精神产品为宗旨，以“服务社会和人民群众需求，传播社会主义先进文化”为己任，产业结构不断完善，已由传统的图书出版向着图书、期刊、电子出版物、音像制品、电子商务一体化延伸，现已发展为多领域、多学科的大型综合性出版社，涉及机械、电工电子、汽车、计算机、经济管理、建筑、ELT、科普以及教材、教辅等领域。