互联网
类型
6.8
豆瓣评分
可以朗读
语音朗读
284千字
字数
2017-08-01
发行日期
展开全部
主编推荐语
展示了如何用Python程序将不同格式的数据处理和分析任务规模化和自动化。
内容简介
本书主要内容包括:Python基础知识以及分析任意数量的文本文件、CSV文件、Excel文件和数据库中数据的方法;如何从这些数据源中选择特定的行与列,如何聚合数据并计算基本统计量,以及如何将结果写入输出文件;常见的商业分析应用;如何通过一些扩展模块创建最常用的统计图表,如何通过StatsModels包来估计回归模型和分类模型;如何按计划自动定期运行脚本。
目录
- 版权信息
- O'Reilly Media, Inc. 介绍
- 业界评论
- 前言
- 为什么要读这本书,为什么要学习这些技能
- 目标读者
- 为什么使用Windows
- 为什么使用Python
- 基础Python和pandas
- Anaconda Python
- 安装Anaconda Python(Windows或Mac)
- 文本编辑器
- 下载本书资料
- 各章内容简介
- 排版约定
- 使用示例代码
- Safari® Books Online
- 联系我们
- 致谢
- 电子书
- 第1章 Python基础
- 1.1 创建Python脚本
- 1.2 运行Python脚本
- 1.3 与命令行进行交互的几项技巧
- 1.4 Python语言基础要素
- 1.4.1 数值
- 1.4.2 字符串
- 1.4.3 正则表达式与模式匹配
- 1.4.4 日期
- 1.4.5 列表
- 1.4.6 元组
- 1.4.7 字典
- 1.4.8 控制流
- 1.5 读取文本文件
- 1.5.1 创建文本文件
- 1.5.2 脚本和输入文件在同一位置
- 1.5.3 读取文件的新型语法
- 1.6 使用glob读取多个文本文件
- 创建另一个文本文件
- 1.7 写入文本文件
- 1.7.1 向first_script.py添加代码
- 1.7.2 写入CSV文件
- 1.8 print语句
- 1.9 本章练习
- 第2章 CSV文件
- 2.1 基础Python与pandas
- 2.1.1 读写CSV文件(第1部分)
- 2.1.2 基本字符串分析是如何失败的
- 2.1.3 读写CSV文件(第2部分)
- 2.2 筛选特定的行
- 2.2.1 行中的值满足某个条件
- 2.2.2 行中的值属于某个集合
- 2.2.3 行中的值匹配于某个模式/正则表达式
- 2.3 选取特定的列
- 2.3.1 列索引值
- 2.3.2 列标题
- 2.4 选取连续的行
- 2.5 添加标题行
- 2.6 读取多个CSV文件
- 文件计数与文件中的行列计数
- 2.7 从多个文件中连接数据
- 2.8 计算每个文件中值的总和与均值
- 2.9 本章练习
- 第3章 Excel文件
- 3.1 内省Excel工作簿
- 3.2 处理单个工作表
- 3.2.1 读写Excel文件
- 3.2.2 筛选特定行
- 3.2.3 选取特定列
- 3.3 读取工作簿中的所有工作表
- 3.3.1 在所有工作表中筛选特定行
- 3.3.2 在所有工作表中选取特定列
- 3.4 在Excel工作簿中读取一组工作表
- 在一组工作表中筛选特定行
- 3.5 处理多个工作簿
- 3.5.1 工作表计数以及每个工作表中的行列计数
- 3.5.2 从多个工作簿中连接数据
- 3.5.3 为每个工作簿和工作表计算总数和均值
- 3.6 本章练习
- 第4章 数据库
- 4.1 Python内置的sqlite3模块
- 4.1.1 向表中插入新记录
- 4.1.2 更新表中记录
- 4.2 MySQL数据库
- 4.2.1 向表中插入新记录
- 4.2.2 查询一个表并将输出写入CSV文件
- 4.2.3 更新表中记录
- 4.3 本章练习
- 第5章 应用程序
- 5.1 在一个大文件集合中查找一组项目
- 5.2 为CSV文件中数据的任意数目分类计算统计量
- 5.3 为文本文件中数据的任意数目分类计算统计量
- 5.4 本章练习
- 第6章 图与图表
- 6.1 matplotlib
- 6.1.1 条形图
- 6.1.2 直方图
- 6.1.3 折线图
- 6.1.4 散点图
- 6.1.5 箱线图
- 6.2 pandas
- 6.3 ggplot
- 6.4 seaborn
- 第7章 描述性统计与建模
- 7.1 数据集
- 7.1.1 葡萄酒质量
- 7.1.2 客户流失
- 7.2 葡萄酒质量
- 7.2.1 描述性统计
- 7.2.2 分组、直方图与t 检验
- 7.2.3 成对变量之间的关系和相关性
- 7.2.4 使用最小二乘估计进行线性回归
- 7.2.5 系数解释
- 7.2.6 自变量标准化
- 7.2.7 预测
- 7.3 客户流失
- 7.3.1 逻辑斯蒂回归
- 7.3.2 系数解释
- 7.3.3 预测
- 第8章 按计划自动运行脚本
- 8.1 任务计划程序(Windows系统)
- 8.2 cron工具(macOS系统和Unix系统)
- 8.2.1 cron表文件:一次性设置
- 8.2.2 向cron表文件中添加cron任务
- 第9章 从这里启航
- 9.1 更多的标准库模块和内置函数
- 9.1.1 Python标准库(PSL):更多的标准模块
- 9.1.2 内置函数
- 9.2 Python包索引(PyPI):更多的扩展模块
- 9.2.1 NumPy
- 9.2.2 SciPy
- 9.2.3 Scikit-Learn
- 9.2.4 更多的扩展包
- 9.3 更多的数据结构
- 9.3.1 栈
- 9.3.2 队列
- 9.3.3 图
- 9.3.4 树
- 9.4 从这里启航
- 附录A 下载指南
- A.1 下载Python 3
- A.1.1 Windows
- A.1.2 macOS
- A.2 下载xlrd扩展包
- A.2.1 Windows
- A.2.2 macOS
- A.3 下载MySQL数据库服务器
- A.3.1 Windows
- A.3.2 macOS
- A.3.3 启动MySQL
- A.4 下载mysqlclient(Python 3.x)/MySQLpython(Python 2.x)
- A.4.1 Windows
- A.4.2 macOS
- 附录B 练习答案
- 第1章
- 练习1
- 练习2
- 练习3
- 作者介绍
- 封面介绍
- 看完了
展开全部
出版方
人民邮电出版社·图灵出品
图灵社区成立于2005年6月,由人民邮电出版社投资控股,以策划出版高质量的科技书籍为核心业务,主要出版领域包括计算机、电子电气、数学统计、科普等,通过引进国际高水平的教材、专著,以及发掘国内优秀原创作品等途径,为目标读者提供一流的内容。