展开全部

主编推荐语

用流行的Python库scikitlearn解决机器学习问题。

内容简介

本书主要内容包括:机器学习算法以及如何算法如何用于评估实际问题;预测模型及其实战场景剖析;如何用无监督模型做市场分割;探索多种数据可视化技术;如何构建推荐引擎;文本数据交互以及分析文本数据的模型的搭建;用隐藏马尔可夫模型识别语音数据等等。

目录

  • 版权信息
  • 译者序
  • 前言
  • 第1章 监督学习
  • 1.1 简介
  • 1.2 数据预处理技术
  • 1.2.1 准备工作
  • 1.2.2 详细步骤
  • 1.3 标记编码方法
  • 1.4 创建线性回归器
  • 1.4.1 准备工作
  • 1.4.2 详细步骤
  • 1.5 计算回归准确性
  • 1.5.1 准备工作
  • 1.5.2 详细步骤
  • 1.6 保存模型数据
  • 1.7 创建岭回归器
  • 1.7.1 准备工作
  • 1.7.2 详细步骤
  • 1.8 创建多项式回归器
  • 1.8.1 准备工作
  • 1.8.2 详细步骤
  • 1.9 估算房屋价格
  • 1.9.1 准备工作
  • 1.9.2 详细步骤
  • 1.10 计算特征的相对重要性
  • 1.11 评估共享单车的需求分布
  • 1.11.1 准备工作
  • 1.11.2 详细步骤
  • 1.11.3 更多内容
  • 第2章 创建分类器
  • 2.1 简介
  • 2.2 建立简单分类器
  • 2.2.1 详细步骤
  • 2.2.2 更多内容
  • 2.3 建立逻辑回归分类器
  • 2.4 建立朴素贝叶斯分类器
  • 2.5 将数据集分割成训练集和测试集
  • 2.6 用交叉验证检验模型准确性
  • 2.6.1 准备工作
  • 2.6.2 详细步骤
  • 2.7 混淆矩阵可视化
  • 2.8 提取性能报告
  • 2.9 根据汽车特征评估质量
  • 2.9.1 准备工作
  • 2.9.2 详细步骤
  • 2.10 生成验证曲线
  • 2.11 生成学习曲线
  • 2.12 估算收入阶层
  • 第3章 预测建模
  • 3.1 简介
  • 3.2 用SVM建立线性分类器
  • 3.2.1 准备工作
  • 3.2.2 详细步骤
  • 3.3 用SVM建立非线性分类器
  • 3.4 解决类型数量不平衡问题
  • 3.5 提取置信度
  • 3.6 寻找最优超参数
  • 3.7 建立事件预测器
  • 3.7.1 准备工作
  • 3.7.2 详细步骤
  • 3.8 估算交通流量
  • 3.8.1 准备工作
  • 3.8.2 详细步骤
  • 第4章 无监督学习——聚类
  • 4.1 简介
  • 4.2 用k-means算法聚类数据
  • 4.3 用矢量量化压缩图片
  • 4.4 建立均值漂移聚类模型
  • 4.5 用凝聚层次聚类进行数据分组
  • 4.6 评价聚类算法的聚类效果
  • 4.7 用DBSCAN算法自动估算集群数量
  • 4.8 探索股票数据的模式
  • 4.9 建立客户细分模型
  • 第5章 构建推荐引擎
  • 5.1 简介
  • 5.2 为数据处理构建函数组合
  • 5.3 构建机器学习流水线
  • 5.3.1 详细步骤
  • 5.3.2 工作原理
  • 5.4 寻找最近邻
  • 5.5 构建一个KNN分类器
  • 5.5.1 详细步骤
  • 5.5.2 工作原理
  • 5.6 构建一个KNN回归器
  • 5.6.1 详细步骤
  • 5.6.2 工作原理
  • 5.7 计算欧氏距离分数
  • 5.8 计算皮尔逊相关系数
  • 5.9 寻找数据集中的相似用户
  • 5.10 生成电影推荐
  • 第6章 分析文本数据
  • 6.1 简介
  • 6.2 用标记解析的方法预处理数据
  • 6.3 提取文本数据的词干
  • 6.3.1 详细步骤
  • 6.3.2 工作原理
  • 6.4 用词形还原的方法还原文本的基本形式
  • 6.5 用分块的方法划分文本
  • 6.6 创建词袋模型
  • 6.6.1 详细步骤
  • 6.6.2 工作原理
  • 6.7 创建文本分类器
  • 6.7.1 详细步骤
  • 6.7.2 工作原理
  • 6.8 识别性别
  • 6.9 分析句子的情感
  • 6.9.1 详细步骤
  • 6.9.2 工作原理
  • 6.10 用主题建模识别文本的模式
  • 6.10.1 详细步骤
  • 6.10.2 工作原理
  • 第7章 语音识别
  • 7.1 简介
  • 7.2 读取和绘制音频数据
  • 7.3 将音频信号转换为频域
  • 7.4 自定义参数生成音频信号
  • 7.5 合成音乐
  • 7.6 提取频域特征
  • 7.7 创建隐马尔科夫模型
  • 7.8 创建一个语音识别器
  • 第8章 解剖时间序列和时序数据
  • 8.1 简介
  • 8.2 将数据转换为时间序列格式
  • 8.3 切分时间序列数据
  • 8.4 操作时间序列数据
  • 8.5 从时间序列数据中提取统计数字
  • 8.6 针对序列数据创建隐马尔科夫模型
  • 8.6.1 准备工作
  • 8.6.2 详细步骤
  • 8.7 针对序列文本数据创建条件随机场
  • 8.7.1 准备工作
  • 8.7.2 详细步骤
  • 8.8 用隐马尔科夫模型分析股票市场数据
  • 第9章 图像内容分析
  • 9.1 简介
  • 9.2 用OpenCV-Pyhon操作图像
  • 9.3 检测边
  • 9.4 直方图均衡化
  • 9.5 检测棱角
  • 9.6 检测SIFT特征点
  • 9.7 创建Star特征检测器
  • 9.8 利用视觉码本和向量量化创建特征
  • 9.9 用极端随机森林训练图像分类器
  • 9.10 创建一个对象识别器
  • 第10章 人脸识别
  • 10.1 简介
  • 10.2 从网络摄像头采集和处理视频信息
  • 10.3 用Haar级联创建一个人脸识别器
  • 10.4 创建一个眼睛和鼻子检测器
  • 10.5 做主成分分析
  • 10.6 做核主成分分析
  • 10.7 做盲源分离
  • 10.8 用局部二值模式直方图创建一个人脸识别器
  • 第11章 深度神经网络
  • 11.1 简介
  • 11.2 创建一个感知器
  • 11.3 创建一个单层神经网络
  • 11.4 创建一个深度神经网络
  • 11.5 创建一个向量量化器
  • 11.6 为序列数据分析创建一个递归神经网络
  • 11.7 在光学字符识别数据库中将字符可视化
  • 11.8 用神经网络创建一个光学字符识别器
  • 第12章 可视化数据
  • 12.1 简介
  • 12.2 画3D散点图
  • 12.3 画气泡图
  • 12.4 画动态气泡图
  • 12.5 画饼图
  • 12.6 画日期格式的时间序列数据
  • 12.7 画直方图
  • 12.8 可视化热力图
  • 12.9 动态信号的可视化模拟
展开全部

评分及书评

评分不足
1个评分

出版方

人民邮电出版社·图灵出品

图灵社区成立于2005年6月,由人民邮电出版社投资控股,以策划出版高质量的科技书籍为核心业务,主要出版领域包括计算机、电子电气、数学统计、科普等,通过引进国际高水平的教材、专著,以及发掘国内优秀原创作品等途径,为目标读者提供一流的内容。