计算机
类型
可以朗读
语音朗读
36千字
字数
2019-01-01
发行日期
展开全部
主编推荐语
数据科学与大数据技术中的Python基础知识和技能。
内容简介
结合数据科学与大数据技术专业(本科)和大数据技术与应用专业(专科)的教学需要以及大数据分析爱好者的自学需要,从大数据和数据科学视角讲解Python编程的基础知识和基本技能,内容包括:数据科学实践和大数据分析中常用的知识点,数据科学实践和大数据分析中常用的编程技巧。
目录
- 封面
- 版权页
- 前言
- 目录
- 第一篇 准备工作
- 1 为什么要学习Python?学习Python的什么
- 2 学习Python之前需要准备的工作有哪些
- 3 如何看懂和运行本书代码
- 3.1 输入部分
- 3.2 输出部分
- 3.3 错误与异常信息
- 3.4 外部数据文件
- 3.5 注意事项
- 第二篇 Python基础
- 4 数据类型
- 4.1 查看数据类型的方法
- 4.2 判断数据类型的方法
- 4.3 转换数据类型的方法
- 4.4 特殊数据类型
- 4.5 序列类型
- 5 变量
- 5.1 变量的定义方法
- 5.2 Python是动态类型语言
- 5.3 Python是强类型语言
- 5.4 Python中的变量名是引用
- 5.5 Python中区分大小写
- 5.6 变量命名规范
- 5.7 iPython的特殊变量
- 5.8 查看Python关键字的方法
- 5.9 查看已定义的所有变量
- 5.10 删除变量
- 6 语句书写规范
- 6.1 一行一句
- 6.2 一行多句
- 6.3 一句多行
- 6.4 复合语句
- 6.5 空语句
- 7 赋值语句
- 7.1 赋值语句在Python中的重要地位
- 7.2 链式赋值语句
- 7.3 复合赋值语句
- 7.4 序列的拆包式赋值
- 7.5 两个变量值的调换
- 8 注释语句
- 8.1 注释方法
- 8.2 注意事项
- 9 运算符
- 9.1 特殊运算符
- 9.2 内置函数
- 9.3 math模块
- 9.4 优先级与结合方向
- 10 if语句
- 10.1 基本语法
- 10.2 elif语句
- 10.3 if与三元运算
- 10.4 注意事项
- 11 for语句
- 11.1 基本语法
- 11.2 range()函数
- 11.3 注意事项
- 12 while语句
- 12.1 基本语法
- 12.2 注意事项
- 13 pass语句
- 13.1 含义
- 13.2 作用
- 14 列表
- 14.1 定义方法
- 14.2 切片操作
- 14.3 反向遍历
- 14.4 类型转换
- 14.5 extend与append的区别
- 14.6 列表推导式
- 14.7 插入与删除
- 14.8 常用操作函数
- 15 元组
- 15.1 定义方法
- 15.2 主要特征
- 15.3 基本用法
- 15.4 应用场景
- 16 字符串
- 16.1 定义方法
- 16.2 主要特征
- 16.3 字符串的操作
- 17 序列
- 17.1 支持索引
- 17.2 支持切片
- 17.3 支持迭代
- 17.4 支持拆包
- 17.5 支持*运算
- 17.6 通用函数
- 18 集合
- 18.1 定义方法
- 18.2 主要特征
- 18.3 基本运算
- 18.4 应用场景
- 19 字典
- 19.1 定义方法
- 19.2 字典的主要特征
- 19.3 字典的应用场景
- 20 迭代器与生成器
- 20.1 可迭代对象与迭代器
- 20.2 生成器与迭代器
- 21 函数
- 21.1 内置函数
- 21.2 模块函数
- 21.3 用户自定义函数
- 22 内置函数
- 22.1 内置函数的主要特点
- 22.2 数学函数
- 22.3 类型函数
- 22.4 其他功能函数
- 23 模块函数
- 23.1 import模块名
- 23.2 import模块名as别名
- 23.3 from模块名import函数名
- 24 自定义函数
- 24.1 定义方法
- 24.2 函数中的docString
- 24.3 调用方法
- 24.4 返回值
- 24.5 自定义函数的形参与实参
- 24.6 变量的可见性
- 24.7 值传递与地址传递
- 24.8 自定义函数时的注意事项
- 25 lambda函数
- 25.1 lambda函数的定义方法
- 25.2 lambda函数的调用方法
- 26 模块
- 26.1 导入与调用用法
- 26.2 查看内置模块清单的方法
- 27 包
- 27.1 相关术语
- 27.2 安装包
- 27.3 查看已安装包
- 27.4 更新(或删除)已安装包
- 27.5 导入包
- 27.6 查看包的帮助
- 27.7 常用包
- 28 帮助文档
- 28.1 help函数
- 28.2 docString
- 28.3 查看源代码
- 28.4 doc属性
- 28.5 dir()函数
- 28.6 其他方法
- 第三篇 Python进阶
- 29 异常与错误
- 29.1 try/except/finally
- 29.2 异常信息的显示模式
- 29.3 断言
- 30 程序调试方法
- 30.1 调试程序的基本方法
- 30.2 设置错误信息的显示方式
- 30.3 设置断言的方法
- 31 面向对象编程
- 31.1 类的定义方法
- 31.2 类中的特殊方法
- 31.3 类之间的继承关系
- 31.4 私有属性及@property装饰器
- 31.5 self和cls
- 31.6 new与init的区别和联系
- 32 魔术命令
- 32.1 运行.py文件:%run
- 32.2 统计运行时间:%timeit与%%timeit
- 32.3 查看历史In和Out变量:%history
- 32.4 更改异常信息的显示模式:%xmode
- 32.5 调试程序:%debug
- 32.6 程序运行的逐行统计:%prun与%lprun
- 32.7 内存使用情况的统计:%memit
- 33 搜索路径
- 33.1 变量搜索路径
- 33.2 模块搜索路径
- 34 当前工作目录
- 34.1 显示当前工作目录的方法
- 34.2 更改当前工作目录的方法
- 34.3 读、写当前工作目录的方法
- 第四篇 数据加工
- 35 随机数
- 35.1 一次生成一个数
- 35.2 一次生成一个随机数组
- 36 数组
- 36.1 创建方法
- 36.2 主要特征
- 36.3 切片/读取
- 36.4 浅拷贝和深拷贝
- 36.5 形状与重构
- 36.6 属性计算
- 36.7 ndarray的计算
- 36.8 ndarray的元素类型
- 36.9 插入与删除
- 36.10 缺失值处理
- 36.11 ndarray的广播规则
- 36.12 ndarray的排序
- 37 Series
- 37.1 Series的主要特点
- 37.2 Series的定义方法
- 37.3 Series的操作方法
- 38 DataFrame
- 38.1 DataFrame的创建方法
- 38.2 查看行或列
- 38.3 引用行或列
- 38.4 index操作
- 38.5 删除或过滤行/列
- 38.6 算术运算
- 38.7 大小比较运算
- 38.8 统计信息
- 38.9 排序
- 38.10 导入/导出
- 38.11 缺失数据处理
- 38.12 分组统计
- 39 日期与时间
- 39.1 常用包与模块
- 39.2 时间和日期类型的定义
- 39.3 转换方法
- 39.4 显示系统当前时间
- 39.5 计算时差
- 39.6 时间索引
- 39.7 period_range()函数
- 40 可视化
- 40.1 Matplotlib可视化
- 40.2 改变图的属性
- 40.3 改变图的类型
- 40.4 改变图的坐标轴的取值范围
- 40.5 去掉边界的空白
- 40.6 在同一个坐标上画两个图
- 40.7 多图显示
- 40.8 图的保存
- 40.9 散点图的画法
- 40.10 Pandas可视化
- 40.11 Seaborn可视化
- 40.12 数据可视化实战
- 41 自然语言处理
- 41.1 自然语言处理的常用包
- 41.2 自然语言处理的包导入及设置
- 41.3 数据读入
- 41.4 分词处理
- 41.5 自定义词汇
- 41.6 停用词处理
- 41.7 词性分布分析
- 41.8 高频词分析
- 41.9 词频统计
- 41.10 关键词分析
- 41.11 生成词云
- 42 Web爬取
- 42.1 Scrapy的下载与安装
- 42.2 Scrapy Shell的基本原理
- 42.3 Scrapy Shell的应用
- 42.4 自定义Spider类
- 42.5 综合运用
- 第五篇 数据分析
- 43 统计分析
- 43.1 业务理解
- 43.2 数据读入
- 43.3 数据理解
- 43.4 数据准备
- 43.5 模型类型的选择与超级参数的设置
- 43.6 训练具体模型及查看其统计量
- 43.7 拟合优度评价
- 43.8 建模前提假定的讨论
- 43.9 模型的优化与重新选择
- 43.10 模型的应用
- 44 机器学习
- 44.1 机器学习的业务理解
- 44.2 数据读入
- 44.3 数据理解
- 44.4 数据准备
- 44.5 算法选择及其超级参数的设置
- 44.6 具体模型的训练
- 44.7 用模型进行预测
- 44.8 模型评价
- 44.9 模型的应用与优化
- 第六篇 大数据处理
- 45 Spark编程
- 45.1 导入pyspark包
- 45.2 SparkSession及其创建
- 45.3 Spark数据抽象类型
- 45.4 Spark DataFrame操作
- 45.5 SQL编程
- 45.6 DataFrame的可视化
- 45.7 Spark机器学习
- 46 Spark Python开发环境的搭建
- 46.1 安装Anaconda
- 46.2 安装和配置Java
- 46.3 安装和配置Spark
- 46.4 安装和配置Hadoop
- 46.5 测试Spark
- 47 NoSQL数据库
- 47.1 下载Memcached
- 47.2 安装Memcached
- 47.3 安装和导入包pymemcache
- 47.4 准备试验数据
- 47.5 定义Client并进行数据读写
- 47.6 Memcached的更多操作
- 第七篇 继续学习
- 48 Python初学者常见错误及纠正方法
- 48.1 NameError:name ′xxxx′ is not defined
- 48.2 IndentationError:unexpected indent
- 48.3 SyntaxError:invalid character in identifier
- 48.4 TypeError:′XXXX′ object does not support item assignment
- 48.5 TypeError:unsupported operand type(s) for XXXX
- 48.6 IndexError:list index out of range
- 48.7 TypeError:type() takes XXXX arguments
- 48.8 SyntaxError:unexpected EOF while parsing
- 48.9 ModuleNotFoundError:No module named XXXX
- 48.10 TypeError:′list′ object is not callable
- 48.11 SyntaxError:invalid syntax
- 48.12 AttributeError:XXXX object has no attribute XXXX
- 48.13 TypeError:XXXX object is not an iterator
- 48.14 FileNotFoundError:File XXXX does not exist
- 48.15 IndexError:too many indices for array
- 48.16 TypeError:Required argument XXXX not found
- 48.17 TypeError:an XXXX is required (got type YYYY)
- 48.18 ValueError:Wrong number of items passed XXXX,placement implies YYYY
- 49 Python数据分析和数据科学面试题
- 50 继续学习本书内容的推荐资源
- 50.1 重要网站
- 50.2 重点图书
- 50.3 常用模块与工具包
- 50.4 常用统计模型
- 50.5 核心机器学习算法
- 50.6 继续学习数据科学的建议路线图
- 参考文献
- 反侵权盗版声明
展开全部
出版方
电子工业出版社
电子工业出版社成立于1982年10月,是国务院独资、工信部直属的中央级科技与教育出版社,是专业的信息技术知识集成和服务提供商。经过三十多年的建设与发展,已成为一家以科技和教育出版、期刊、网络、行业支撑服务、数字出版、软件研发、软科学研究、职业培训和教育为核心业务的现代知识服务集团。出版物内容涵盖了电子信息技术的各个分支及工业技术、经济管理、科普与少儿、社科人文等领域,综合出版能力位居全国出版行业前列。