计算机
类型
可以朗读
语音朗读
421千字
字数
2020-11-01
发行日期
展开全部
主编推荐语
入门Python及其在数据处理和机器学习领域的实战应用。
内容简介
本书系统介绍了如何入门Python并利用Python进行数据处理与机器学习实战。本书从Python的基础安装开始介绍,系统梳理了Python的入门语法知识,归纳介绍了图像处理、数据文件读写、数据库操作等Python基本技能;然后详细讲解了NumPy、Matplotlib、Pandas、Scipy、Scikit-learn等在数据处理、机器学习领域的应用。代码实例涵盖网络爬虫、数据处理、视觉识别、机器学习等应用领域。作者还精心创作了语感训练100题、Python内置函数(类)手册、从新手到高手的100个模块等内容,以帮助读者更好地学习并掌握Python这一工具。
目录
- 扉页
- 版权页
- 目录
- 内容提要
- 序1 术至极致,几近于道
- 专家简介
- 序2
- 前言
- 第1章 零基础必读
- 1.1 安装Python
- 1.1.1 Python的各种发行版
- 1.1.2 安装与运行
- 1.1.3 重新安装
- 1.2 以交互方式运行Python代码
- 1.2.1 使用Python IDLE交互操作
- 1.2.2 使用IPython交互操作
- 1.3 以脚本方式运行Python程序
- 1.3.1 运行
- 1.3.2 调试
- 1.4 使用pip安装和管理模块
- 1.4.1 使用pip的两种方式
- 1.4.2 安装模块
- 1.4.3 卸载模块
- 1.4.4 查看模块列表和模块信息
- 第2章 Python入门
- 2.1 基础语法
- 2.1.1 一条绝对原则—缩进
- 2.1.2 两个顶级定义—函数和类
- 2.1.3 三种语句结构—顺序、分支和循环
- 2.1.4 四种数据类型—整型、浮点型、布尔型、字符串
- 2.1.5 五大内置类—列表、字典、元组、集合、字符串
- 2.1.6 十组最常用的内置函数
- 2.2 进阶语法
- 2.2.1 函数的参数
- 2.2.2 异常捕获与处理
- 2.2.3 三元表达式
- 2.2.4 列表推导式
- 2.2.5 断言
- 2.2.6 with-as
- 2.2.7 lambda函数
- 2.2.8 迭代器和生成器
- 2.2.9 装饰器
- 2.2.10 闭包
- 2.3 面向对象编程
- 2.3.1 类和对象
- 2.3.2 类的成员
- 2.3.3 静态变量和实例变量
- 2.3.4 面向对象三要素
- 2.3.5 抽象类
- 2.3.6 单实例模式
- 2.4 编码规范
- 2.4.1 编码格式声明
- 2.4.2 文档字符串
- 2.4.3 导入模块
- 2.4.4 常量和全局变量定义
- 2.4.5 当前脚本代码执行
- 2.4.6 命名规范
- 2.4.7 缩进
- 2.4.8 注释
- 2.4.9 引号
- 2.4.10 空行和空格
- 2.5 语感训练100题
- 第3章 Python基本技能
- 3.1 时间和日期处理
- 3.1.1 time模块
- 3.1.2 datetime模块
- 3.2 图像处理
- 3.2.1 PIL和pillow模块
- 3.2.2 PyOpenCV模块
- 3.3 数据文件读写
- 3.3.1 读写Excel文件
- 3.3.2 读写CSV文件
- 3.3.3 读写HDF文件
- 3.3.4 读写netCDF文件
- 3.4 数据库操作
- 3.4.1 使用SQLite数据库
- 3.4.2 使用MySQL数据库
- 3.4.3 使用MongoDB数据库
- 3.5 数据抓取
- 3.5.1 urllib模块
- 3.5.2 requests模块
- 3.6 数据解析
- 3.6.1 使用Beautifulsoup模块解析html/xml数据
- 3.6.2 使用正则表达式解析文本数据
- 3.7 系统相关操作
- 3.7.1 os模块
- 3.7.2 sys模块
- 3.8 线程技术
- 3.8.1 戏说线程和进程
- 3.8.2 创建、启动和管理线程
- 3.8.3 线程同步
- 3.8.4 线程池
- 3.9 进程技术
- 3.9.1 再论线程和进程
- 3.9.2 创建、启动和管理进程
- 3.9.3 进程间通信
- 3.9.4 进程池
- 3.9.5 MapReduce模型
- 3.10 源码打包
- 3.10.1 打包成可执行文件
- 3.10.2 打包成模块安装文件
- 第4章 科学计算基础软件包NumPy
- 4.1 NumPy概览
- 4.1.1 安装和导入
- 4.1.2 列表VS数组
- 4.1.3 数组的数据类型
- 4.1.4 数组的属性
- 4.1.5 数组的方法
- 4.1.6 维、秩、轴
- 4.1.7 广播和矢量化
- 4.2 创建数组
- 4.2.1 蛮力构造法
- 4.2.2 特殊数值法
- 4.2.3 随机数值法
- 4.2.4 定长分割法
- 4.2.5 重复构造法
- 4.2.6 网格构造法
- 4.2.7 自定义数据类型
- 4.3 操作数组
- 4.3.1 索引和切片
- 4.3.2 改变数组结构
- 4.3.3 合并
- 4.3.4 拆分
- 4.3.5 复制
- 4.3.6 排序
- 4.3.7 查找
- 4.3.8 筛选
- 4.3.9 数组I/O
- 4.4 常用函数
- 4.4.1 常量
- 4.4.2 命名空间
- 4.4.3 数学函数
- 4.4.4 统计函数
- 4.4.5 插值函数
- 4.4.6 多项式拟合函数
- 4.4.7 自定义广播函数
- 4.5 掩码数组
- 4.5.1 创建掩码数组
- 4.5.2 访问掩码数组
- 4.6 矩阵对象
- 4.6.1 创建矩阵
- 4.6.2 矩阵特有属性
- 4.6.3 矩阵乘法
- 4.7 随机抽样子模块
- 4.7.1 随机数
- 4.7.2 随机抽样
- 4.7.3 正态分布
- 4.7.4 伪随机数的深度思考
- 第5章 应用最广泛的绘图库Matplotlib
- 5.1 快速入门
- 5.1.1 画布
- 5.1.2 子图与子图布局
- 5.1.3 坐标轴与刻度的名称
- 5.1.4 图例和文本标注
- 5.1.5 显示和保存
- 5.1.6 两种使用风格
- 5.2 丰富多样的图形
- 5.2.1 曲线图
- 5.2.2 散点图
- 5.2.3 等值线图
- 5.2.4 矢量合成图
- 5.2.5 直方图
- 5.2.6 饼图
- 5.2.7 箱线图
- 5.2.8 绘制图像
- 5.2.9 极坐标绘图
- 5.3 风格和样式
- 5.3.1 画布设置
- 5.3.2 子图布局
- 5.3.3 颜色
- 5.3.4 线条和点的样式
- 5.3.5 坐标轴
- 5.3.6 刻度
- 5.3.7 文本
- 5.3.8 图例
- 5.3.9 网格设置
- 5.4 Matplotlib扩展
- 5.4.1 使用Basemap绘制地图
- 5.4.2 3D绘图工具包
- 第6章 结构化数据分析工具Pandas
- 6.1 Pandas概览
- 6.1.1 安装和使用
- 6.1.2 Pandas的特点
- 6.2 Pandas的数据结构
- 6.2.1 索引Index
- 6.2.2 带标签的一维同构数组Series
- 6.2.3 带标签的二维异构表格DataFrame
- 6.3 基本操作
- 6.3.1 数据预览
- 6.3.2 数据选择
- 6.3.3 改变数据结构
- 6.3.4 改变数据类型
- 6.3.5 广播与矢量化运算
- 6.3.6 行列级广播函数
- 6.4 高级应用
- 6.4.1 分组
- 6.4.2 聚合
- 6.4.3 层次化索引
- 6.4.4 表级广播函数
- 6.4.5 日期时间索引
- 6.4.6 数据可视化
- 6.4.7 数据I/O
- 6.5 Pandas扩展
- 6.5.1 统计扩展模块Statsmodels
- 6.5.2 可视化扩展Seaborn
- 第7章 科学计算工具包SciPy
- 7.1 SciPy概览
- 7.1.1 SciPy的组成
- 7.1.2 安装和导入
- 7.2 数据插值
- 7.2.1 一维插值
- 7.2.2 二维插值
- 7.2.3 离散数据插值到网格
- 7.3 曲线拟合
- 7.3.1 最小二乘法拟合
- 7.3.2 使用curve_fit( )函数拟合
- 7.3.3 多项式拟合
- 7.4 傅里叶变换
- 7.4.1 时域到频域的转换
- 7.4.2 一维傅里叶变换的应用
- 7.4.3 二维傅里叶变换的应用
- 7.5 图像处理
- 7.5.1 图像卷积
- 7.5.2 边缘检测
- 7.5.3 侵蚀和膨胀
- 7.5.4 图像测量
- 7.6 积分
- 7.6.1 对给定函数的定积分
- 7.6.2 对给定样本的定积分
- 7.6.3 二重定积分
- 7.7 非线性方程求解
- 7.7.1 非线性方程
- 7.7.2 非线性方程组
- 7.8 线性代数
- 7.8.1 计算矩阵的行列式
- 7.8.2 求解逆矩阵
- 7.8.3 计算特征向量和特征值
- 7.8.4 矩阵的奇异值分解
- 7.8.5 求解线性方程组
- 7.9 聚类
- 7.9.1 k-means聚类
- 7.9.2 层次聚类
- 7.10 空间计算
- 7.10.1 空间旋转的表述
- 7.10.2 三维旋转
- 第8章 机器学习工具包Scikit-learn
- 8.1 Scikit-learn概览
- 8.1.1 Scikit-learn的子模块
- 8.1.2 安装和导入
- 8.2 数据集
- 8.2.1 Scikit-learn自带的数据集
- 8.2.2 样本生成器
- 8.2.3 加载其他数据集
- 8.3 数据预处理
- 8.3.1 标准化
- 8.3.2 归一化
- 8.3.3 正则化
- 8.3.4 离散化
- 8.3.5 特征编码
- 8.3.6 缺失值补全
- 8.4 分类
- 8.4.1 k-近邻分类
- 8.4.2 贝叶斯分类
- 8.4.3 决策树分类
- 8.4.4 随机森林分类
- 8.4.5 支持向量机分类
- 8.5 回归
- 8.5.1 线性回归
- 8.5.2 支持向量机回归
- 8.5.3 k-近邻回归
- 8.5.4 决策树回归
- 8.5.5 随机森林回归
- 8.6 聚类
- 8.6.1 k均值聚类
- 8.6.2 均值漂移聚类
- 8.6.3 基于密度的空间聚类
- 8.6.4 谱聚类
- 8.6.5 层次聚类
- 8.7 成分分解与降维
- 8.7.1 主成分分析
- 8.7.2 因子分析
- 8.7.3 截断奇异值分解
- 8.7.4 独立成分分析(ICA)
- 8.8 模型评估与参数调优
- 8.8.1 估计器得分
- 8.8.2 交叉验证
- 8.8.3 评价指标
- 8.8.4 参数调优
- 8.8.5 模型持久化
- 附录A Python内置函数(类)手册
- A.1 输入输出功能
- A.2 数据类型功能
- A.3 参数辅助功能
- A.4 数学运算功能
- A.5 条件判断功能
- A.6 进制转义功能
- A.7 编码转义功能
- A.8 字符串相关功能
- A.9 迭代相关功能
- A.10 系统相关功能
- A.11 终止程序功能
- A.12 属性相关功能
- A.13 查看对象信息功能
- A.14 类相关功能
- A.15 装饰器相关功能
- A.16 Python声明
- 附录B 从新手到高手的100个模块
展开全部
出版方
人民邮电出版社
人民邮电出版社是工业和信息化部主管的大型专业出版社,成立于1953年10月1日。人民邮电出版社坚持“立足信息产业、面向现代社会、传播科学知识、服务科教兴国”,致力于通信、计算机、电子技术、教材、少儿、经管、摄影、集邮、旅游、心理学等领域的专业图书出版。