展开全部

主编推荐语

展示了如何用Python程序将不同格式的数据处理和分析任务规模化和自动化。

内容简介

本书主要内容包括:Python基础知识以及分析任意数量的文本文件、CSV文件、Excel文件和数据库中数据的方法;如何从这些数据源中选择特定的行与列,如何聚合数据并计算基本统计量,以及如何将结果写入输出文件;常见的商业分析应用;如何通过一些扩展模块创建最常用的统计图表,如何通过StatsModels包来估计回归模型和分类模型;如何按计划自动定期运行脚本。

目录

  • 版权信息
  • O'Reilly Media, Inc. 介绍
  • 业界评论
  • 前言
  • 为什么要读这本书,为什么要学习这些技能
  • 目标读者
  • 为什么使用Windows
  • 为什么使用Python
  • 基础Python和pandas
  • Anaconda Python
  • 安装Anaconda Python(Windows或Mac)
  • 文本编辑器
  • 下载本书资料
  • 各章内容简介
  • 排版约定
  • 使用示例代码
  • Safari® Books Online
  • 联系我们
  • 致谢
  • 电子书
  • 第1章 Python基础
  • 1.1 创建Python脚本
  • 1.2 运行Python脚本
  • 1.3 与命令行进行交互的几项技巧
  • 1.4 Python语言基础要素
  • 1.4.1 数值
  • 1.4.2 字符串
  • 1.4.3 正则表达式与模式匹配
  • 1.4.4 日期
  • 1.4.5 列表
  • 1.4.6 元组
  • 1.4.7 字典
  • 1.4.8 控制流
  • 1.5 读取文本文件
  • 1.5.1 创建文本文件
  • 1.5.2 脚本和输入文件在同一位置
  • 1.5.3 读取文件的新型语法
  • 1.6 使用glob读取多个文本文件
  • 创建另一个文本文件
  • 1.7 写入文本文件
  • 1.7.1 向first_script.py添加代码
  • 1.7.2 写入CSV文件
  • 1.8 print语句
  • 1.9 本章练习
  • 第2章 CSV文件
  • 2.1 基础Python与pandas
  • 2.1.1 读写CSV文件(第1部分)
  • 2.1.2 基本字符串分析是如何失败的
  • 2.1.3 读写CSV文件(第2部分)
  • 2.2 筛选特定的行
  • 2.2.1 行中的值满足某个条件
  • 2.2.2 行中的值属于某个集合
  • 2.2.3 行中的值匹配于某个模式/正则表达式
  • 2.3 选取特定的列
  • 2.3.1 列索引值
  • 2.3.2 列标题
  • 2.4 选取连续的行
  • 2.5 添加标题行
  • 2.6 读取多个CSV文件
  • 文件计数与文件中的行列计数
  • 2.7 从多个文件中连接数据
  • 2.8 计算每个文件中值的总和与均值
  • 2.9 本章练习
  • 第3章 Excel文件
  • 3.1 内省Excel工作簿
  • 3.2 处理单个工作表
  • 3.2.1 读写Excel文件
  • 3.2.2 筛选特定行
  • 3.2.3 选取特定列
  • 3.3 读取工作簿中的所有工作表
  • 3.3.1 在所有工作表中筛选特定行
  • 3.3.2 在所有工作表中选取特定列
  • 3.4 在Excel工作簿中读取一组工作表
  • 在一组工作表中筛选特定行
  • 3.5 处理多个工作簿
  • 3.5.1 工作表计数以及每个工作表中的行列计数
  • 3.5.2 从多个工作簿中连接数据
  • 3.5.3 为每个工作簿和工作表计算总数和均值
  • 3.6 本章练习
  • 第4章 数据库
  • 4.1 Python内置的sqlite3模块
  • 4.1.1 向表中插入新记录
  • 4.1.2 更新表中记录
  • 4.2 MySQL数据库
  • 4.2.1 向表中插入新记录
  • 4.2.2 查询一个表并将输出写入CSV文件
  • 4.2.3 更新表中记录
  • 4.3 本章练习
  • 第5章 应用程序
  • 5.1 在一个大文件集合中查找一组项目
  • 5.2 为CSV文件中数据的任意数目分类计算统计量
  • 5.3 为文本文件中数据的任意数目分类计算统计量
  • 5.4 本章练习
  • 第6章 图与图表
  • 6.1 matplotlib
  • 6.1.1 条形图
  • 6.1.2 直方图
  • 6.1.3 折线图
  • 6.1.4 散点图
  • 6.1.5 箱线图
  • 6.2 pandas
  • 6.3 ggplot
  • 6.4 seaborn
  • 第7章 描述性统计与建模
  • 7.1 数据集
  • 7.1.1 葡萄酒质量
  • 7.1.2 客户流失
  • 7.2 葡萄酒质量
  • 7.2.1 描述性统计
  • 7.2.2 分组、直方图与t 检验
  • 7.2.3 成对变量之间的关系和相关性
  • 7.2.4 使用最小二乘估计进行线性回归
  • 7.2.5 系数解释
  • 7.2.6 自变量标准化
  • 7.2.7 预测
  • 7.3 客户流失
  • 7.3.1 逻辑斯蒂回归
  • 7.3.2 系数解释
  • 7.3.3 预测
  • 第8章 按计划自动运行脚本
  • 8.1 任务计划程序(Windows系统)
  • 8.2 cron工具(macOS系统和Unix系统)
  • 8.2.1 cron表文件:一次性设置
  • 8.2.2 向cron表文件中添加cron任务
  • 第9章 从这里启航
  • 9.1 更多的标准库模块和内置函数
  • 9.1.1 Python标准库(PSL):更多的标准模块
  • 9.1.2 内置函数
  • 9.2 Python包索引(PyPI):更多的扩展模块
  • 9.2.1 NumPy
  • 9.2.2 SciPy
  • 9.2.3 Scikit-Learn
  • 9.2.4 更多的扩展包
  • 9.3 更多的数据结构
  • 9.3.1 栈
  • 9.3.2 队列
  • 9.3.3 图
  • 9.3.4 树
  • 9.4 从这里启航
  • 附录A 下载指南
  • A.1 下载Python 3
  • A.1.1 Windows
  • A.1.2 macOS
  • A.2 下载xlrd扩展包
  • A.2.1 Windows
  • A.2.2 macOS
  • A.3 下载MySQL数据库服务器
  • A.3.1 Windows
  • A.3.2 macOS
  • A.3.3 启动MySQL
  • A.4 下载mysqlclient(Python 3.x)/MySQLpython(Python 2.x)
  • A.4.1 Windows
  • A.4.2 macOS
  • 附录B 练习答案
  • 第1章
  • 练习1
  • 练习2
  • 练习3
  • 作者介绍
  • 封面介绍
  • 看完了
展开全部

评分及书评

尚无评分
目前还没人评分

出版方

人民邮电出版社·图灵出品

图灵社区成立于2005年6月,由人民邮电出版社投资控股,以策划出版高质量的科技书籍为核心业务,主要出版领域包括计算机、电子电气、数学统计、科普等,通过引进国际高水平的教材、专著,以及发掘国内优秀原创作品等途径,为目标读者提供一流的内容。