展开全部

主编推荐语

数据科学与大数据技术中的Python基础知识和技能。

内容简介

结合数据科学与大数据技术专业(本科)和大数据技术与应用专业(专科)的教学需要以及大数据分析爱好者的自学需要,从大数据和数据科学视角讲解Python编程的基础知识和基本技能,内容包括:数据科学实践和大数据分析中常用的知识点,数据科学实践和大数据分析中常用的编程技巧。

目录

  • 封面
  • 版权页
  • 前言
  • 目录
  • 第一篇 准备工作
  • 1 为什么要学习Python?学习Python的什么
  • 2 学习Python之前需要准备的工作有哪些
  • 3 如何看懂和运行本书代码
  • 3.1 输入部分
  • 3.2 输出部分
  • 3.3 错误与异常信息
  • 3.4 外部数据文件
  • 3.5 注意事项
  • 第二篇 Python基础
  • 4 数据类型
  • 4.1 查看数据类型的方法
  • 4.2 判断数据类型的方法
  • 4.3 转换数据类型的方法
  • 4.4 特殊数据类型
  • 4.5 序列类型
  • 5 变量
  • 5.1 变量的定义方法
  • 5.2 Python是动态类型语言
  • 5.3 Python是强类型语言
  • 5.4 Python中的变量名是引用
  • 5.5 Python中区分大小写
  • 5.6 变量命名规范
  • 5.7 iPython的特殊变量
  • 5.8 查看Python关键字的方法
  • 5.9 查看已定义的所有变量
  • 5.10 删除变量
  • 6 语句书写规范
  • 6.1 一行一句
  • 6.2 一行多句
  • 6.3 一句多行
  • 6.4 复合语句
  • 6.5 空语句
  • 7 赋值语句
  • 7.1 赋值语句在Python中的重要地位
  • 7.2 链式赋值语句
  • 7.3 复合赋值语句
  • 7.4 序列的拆包式赋值
  • 7.5 两个变量值的调换
  • 8 注释语句
  • 8.1 注释方法
  • 8.2 注意事项
  • 9 运算符
  • 9.1 特殊运算符
  • 9.2 内置函数
  • 9.3 math模块
  • 9.4 优先级与结合方向
  • 10 if语句
  • 10.1 基本语法
  • 10.2 elif语句
  • 10.3 if与三元运算
  • 10.4 注意事项
  • 11 for语句
  • 11.1 基本语法
  • 11.2 range()函数
  • 11.3 注意事项
  • 12 while语句
  • 12.1 基本语法
  • 12.2 注意事项
  • 13 pass语句
  • 13.1 含义
  • 13.2 作用
  • 14 列表
  • 14.1 定义方法
  • 14.2 切片操作
  • 14.3 反向遍历
  • 14.4 类型转换
  • 14.5 extend与append的区别
  • 14.6 列表推导式
  • 14.7 插入与删除
  • 14.8 常用操作函数
  • 15 元组
  • 15.1 定义方法
  • 15.2 主要特征
  • 15.3 基本用法
  • 15.4 应用场景
  • 16 字符串
  • 16.1 定义方法
  • 16.2 主要特征
  • 16.3 字符串的操作
  • 17 序列
  • 17.1 支持索引
  • 17.2 支持切片
  • 17.3 支持迭代
  • 17.4 支持拆包
  • 17.5 支持*运算
  • 17.6 通用函数
  • 18 集合
  • 18.1 定义方法
  • 18.2 主要特征
  • 18.3 基本运算
  • 18.4 应用场景
  • 19 字典
  • 19.1 定义方法
  • 19.2 字典的主要特征
  • 19.3 字典的应用场景
  • 20 迭代器与生成器
  • 20.1 可迭代对象与迭代器
  • 20.2 生成器与迭代器
  • 21 函数
  • 21.1 内置函数
  • 21.2 模块函数
  • 21.3 用户自定义函数
  • 22 内置函数
  • 22.1 内置函数的主要特点
  • 22.2 数学函数
  • 22.3 类型函数
  • 22.4 其他功能函数
  • 23 模块函数
  • 23.1 import模块名
  • 23.2 import模块名as别名
  • 23.3 from模块名import函数名
  • 24 自定义函数
  • 24.1 定义方法
  • 24.2 函数中的docString
  • 24.3 调用方法
  • 24.4 返回值
  • 24.5 自定义函数的形参与实参
  • 24.6 变量的可见性
  • 24.7 值传递与地址传递
  • 24.8 自定义函数时的注意事项
  • 25 lambda函数
  • 25.1 lambda函数的定义方法
  • 25.2 lambda函数的调用方法
  • 26 模块
  • 26.1 导入与调用用法
  • 26.2 查看内置模块清单的方法
  • 27 包
  • 27.1 相关术语
  • 27.2 安装包
  • 27.3 查看已安装包
  • 27.4 更新(或删除)已安装包
  • 27.5 导入包
  • 27.6 查看包的帮助
  • 27.7 常用包
  • 28 帮助文档
  • 28.1 help函数
  • 28.2 docString
  • 28.3 查看源代码
  • 28.4 doc属性
  • 28.5 dir()函数
  • 28.6 其他方法
  • 第三篇 Python进阶
  • 29 异常与错误
  • 29.1 try/except/finally
  • 29.2 异常信息的显示模式
  • 29.3 断言
  • 30 程序调试方法
  • 30.1 调试程序的基本方法
  • 30.2 设置错误信息的显示方式
  • 30.3 设置断言的方法
  • 31 面向对象编程
  • 31.1 类的定义方法
  • 31.2 类中的特殊方法
  • 31.3 类之间的继承关系
  • 31.4 私有属性及@property装饰器
  • 31.5 self和cls
  • 31.6 new与init的区别和联系
  • 32 魔术命令
  • 32.1 运行.py文件:%run
  • 32.2 统计运行时间:%timeit与%%timeit
  • 32.3 查看历史In和Out变量:%history
  • 32.4 更改异常信息的显示模式:%xmode
  • 32.5 调试程序:%debug
  • 32.6 程序运行的逐行统计:%prun与%lprun
  • 32.7 内存使用情况的统计:%memit
  • 33 搜索路径
  • 33.1 变量搜索路径
  • 33.2 模块搜索路径
  • 34 当前工作目录
  • 34.1 显示当前工作目录的方法
  • 34.2 更改当前工作目录的方法
  • 34.3 读、写当前工作目录的方法
  • 第四篇 数据加工
  • 35 随机数
  • 35.1 一次生成一个数
  • 35.2 一次生成一个随机数组
  • 36 数组
  • 36.1 创建方法
  • 36.2 主要特征
  • 36.3 切片/读取
  • 36.4 浅拷贝和深拷贝
  • 36.5 形状与重构
  • 36.6 属性计算
  • 36.7 ndarray的计算
  • 36.8 ndarray的元素类型
  • 36.9 插入与删除
  • 36.10 缺失值处理
  • 36.11 ndarray的广播规则
  • 36.12 ndarray的排序
  • 37 Series
  • 37.1 Series的主要特点
  • 37.2 Series的定义方法
  • 37.3 Series的操作方法
  • 38 DataFrame
  • 38.1 DataFrame的创建方法
  • 38.2 查看行或列
  • 38.3 引用行或列
  • 38.4 index操作
  • 38.5 删除或过滤行/列
  • 38.6 算术运算
  • 38.7 大小比较运算
  • 38.8 统计信息
  • 38.9 排序
  • 38.10 导入/导出
  • 38.11 缺失数据处理
  • 38.12 分组统计
  • 39 日期与时间
  • 39.1 常用包与模块
  • 39.2 时间和日期类型的定义
  • 39.3 转换方法
  • 39.4 显示系统当前时间
  • 39.5 计算时差
  • 39.6 时间索引
  • 39.7 period_range()函数
  • 40 可视化
  • 40.1 Matplotlib可视化
  • 40.2 改变图的属性
  • 40.3 改变图的类型
  • 40.4 改变图的坐标轴的取值范围
  • 40.5 去掉边界的空白
  • 40.6 在同一个坐标上画两个图
  • 40.7 多图显示
  • 40.8 图的保存
  • 40.9 散点图的画法
  • 40.10 Pandas可视化
  • 40.11 Seaborn可视化
  • 40.12 数据可视化实战
  • 41 自然语言处理
  • 41.1 自然语言处理的常用包
  • 41.2 自然语言处理的包导入及设置
  • 41.3 数据读入
  • 41.4 分词处理
  • 41.5 自定义词汇
  • 41.6 停用词处理
  • 41.7 词性分布分析
  • 41.8 高频词分析
  • 41.9 词频统计
  • 41.10 关键词分析
  • 41.11 生成词云
  • 42 Web爬取
  • 42.1 Scrapy的下载与安装
  • 42.2 Scrapy Shell的基本原理
  • 42.3 Scrapy Shell的应用
  • 42.4 自定义Spider类
  • 42.5 综合运用
  • 第五篇 数据分析
  • 43 统计分析
  • 43.1 业务理解
  • 43.2 数据读入
  • 43.3 数据理解
  • 43.4 数据准备
  • 43.5 模型类型的选择与超级参数的设置
  • 43.6 训练具体模型及查看其统计量
  • 43.7 拟合优度评价
  • 43.8 建模前提假定的讨论
  • 43.9 模型的优化与重新选择
  • 43.10 模型的应用
  • 44 机器学习
  • 44.1 机器学习的业务理解
  • 44.2 数据读入
  • 44.3 数据理解
  • 44.4 数据准备
  • 44.5 算法选择及其超级参数的设置
  • 44.6 具体模型的训练
  • 44.7 用模型进行预测
  • 44.8 模型评价
  • 44.9 模型的应用与优化
  • 第六篇 大数据处理
  • 45 Spark编程
  • 45.1 导入pyspark包
  • 45.2 SparkSession及其创建
  • 45.3 Spark数据抽象类型
  • 45.4 Spark DataFrame操作
  • 45.5 SQL编程
  • 45.6 DataFrame的可视化
  • 45.7 Spark机器学习
  • 46 Spark Python开发环境的搭建
  • 46.1 安装Anaconda
  • 46.2 安装和配置Java
  • 46.3 安装和配置Spark
  • 46.4 安装和配置Hadoop
  • 46.5 测试Spark
  • 47 NoSQL数据库
  • 47.1 下载Memcached
  • 47.2 安装Memcached
  • 47.3 安装和导入包pymemcache
  • 47.4 准备试验数据
  • 47.5 定义Client并进行数据读写
  • 47.6 Memcached的更多操作
  • 第七篇 继续学习
  • 48 Python初学者常见错误及纠正方法
  • 48.1 NameError:name ′xxxx′ is not defined
  • 48.2 IndentationError:unexpected indent
  • 48.3 SyntaxError:invalid character in identifier
  • 48.4 TypeError:′XXXX′ object does not support item assignment
  • 48.5 TypeError:unsupported operand type(s) for XXXX
  • 48.6 IndexError:list index out of range
  • 48.7 TypeError:type() takes XXXX arguments
  • 48.8 SyntaxError:unexpected EOF while parsing
  • 48.9 ModuleNotFoundError:No module named XXXX
  • 48.10 TypeError:′list′ object is not callable
  • 48.11 SyntaxError:invalid syntax
  • 48.12 AttributeError:XXXX object has no attribute XXXX
  • 48.13 TypeError:XXXX object is not an iterator
  • 48.14 FileNotFoundError:File XXXX does not exist
  • 48.15 IndexError:too many indices for array
  • 48.16 TypeError:Required argument XXXX not found
  • 48.17 TypeError:an XXXX is required (got type YYYY)
  • 48.18 ValueError:Wrong number of items passed XXXX,placement implies YYYY
  • 49 Python数据分析和数据科学面试题
  • 50 继续学习本书内容的推荐资源
  • 50.1 重要网站
  • 50.2 重点图书
  • 50.3 常用模块与工具包
  • 50.4 常用统计模型
  • 50.5 核心机器学习算法
  • 50.6 继续学习数据科学的建议路线图
  • 参考文献
  • 反侵权盗版声明
展开全部

评分及书评

尚无评分
目前还没人评分

出版方

电子工业出版社

电子工业出版社成立于1982年10月,是国务院独资、工信部直属的中央级科技与教育出版社,是专业的信息技术知识集成和服务提供商。经过三十多年的建设与发展,已成为一家以科技和教育出版、期刊、网络、行业支撑服务、数字出版、软件研发、软科学研究、职业培训和教育为核心业务的现代知识服务集团。出版物内容涵盖了电子信息技术的各个分支及工业技术、经济管理、科普与少儿、社科人文等领域,综合出版能力位居全国出版行业前列。