展开全部

主编推荐语

股票大数据挖掘技术与实战应用

内容简介

本书围绕股票大数据挖掘技术展开,主要介绍数据挖掘的方法及其在股票大数据上的实战应用。在1~3章中首先介绍数据挖掘的基本概念、常用算法和工具、大数据炒股、股票时间序列、量化投资、股票数据的获取等;在4~10章中,每一章根据股票挖掘的不同目标,介绍相关的数据挖掘算法,同时基于对基础算法的优劣势分析,提出适用于股票场内实盘交易全景数据分析的新方法,结合新方法在股票挖掘平台上的实现对股票的操作进行实战解析。具体包括:分类方法及股票买卖点的判断;相似/相关匹配方法及股票走势的预测;动态时间规整相似股票判断与投资组。

目录

  • 封面页
  • 书名页
  • 版权页
  • 内容简介
  • 作者简介
  • 前言
  • 目录
  • 第1章 数据挖掘基础
  • 1.1 数据挖掘概述
  • 1.1.1 数据挖掘的过程
  • 1.1.2 数据挖掘的任务
  • 1.1.3 数据挖掘的应用
  • 1.1.4 数据挖掘的存在问题、未来发展和挑战
  • 1.2 常用的数据挖掘算法
  • 1.3 数据挖掘工具
  • 1.3.1 MATLAB
  • 1.3.2 SAS
  • 1.3.3 SPSS
  • 1.3.4 WEKA
  • 1.3.5 R
  • 1.3.6 工具的比较与选择
  • 1.4 数据挖掘与云计算
  • 1.5 Mahout分布式框架
  • 1.5.1 Mahout简介
  • 1.5.2 Mahout算法集
  • 1.5.3 Mahout系统架构
  • 1.5.4 Mahout的优缺点
  • 第2章 股票大数据挖掘
  • 2.1 股票大数据
  • 2.1.1 大数据概述
  • 2.1.2 大数据的处理
  • 2.1.3 大数据炒股
  • 2.2 股票预测
  • 2.2.1 预测基础知识
  • 2.2.2 股票预测的结构
  • 2.2.3 股票预测技术
  • 2.3 量化投资
  • 2.3.1 什么是量化投资
  • 2.3.2 量化投资的特点
  • 2.3.3 量化投资的方法
  • 2.3.4 量化投资选股模型
  • 2.3.5 多因子选股模型
  • 2.3.6 量化模型的建立
  • 第3章 股票数据的准备
  • 3.1 股票相关数据
  • 3.2 数据的获取源
  • 3.2.1 从雅虎获取历史交易数据
  • 3.2.2 从腾讯获取实时交易数据
  • 3.2.3 从新浪获取交易数据
  • 3.2.4 从网易获取成交明细数据
  • 3.2.5 从巨潮资讯获取基础数据
  • 3.2.6 多源获取UGC数据
  • 3.3 数据获取技术
  • 3.3.1 网络爬虫技术
  • 3.3.2 HTML解析
  • 3.3.3 XML解析
  • 3.3.4 JSON解析
  • 3.4 数据预处理
  • 3.4.1 数据清理
  • 3.4.2 数据集成
  • 3.4.3 数据变换
  • 3.4.4 数据归约
  • 第4章 分类方法与股票买卖点判断
  • 4.1 分类概述
  • 4.2 朴素贝叶斯
  • 4.2.1 朴素贝叶斯分类算法的概念
  • 4.2.2 朴素贝叶斯分类器模型
  • 4.2.3 朴素贝叶斯分类器的优缺点
  • 4.2.4 朴素贝叶斯分类器的应用
  • 4.2.5 扩展的分类器
  • 4.3 决策树
  • 4.3.1 决策树方法介绍
  • 4.3.2 属性选择的度量方法
  • 4.3.3 剪枝技术
  • 4.3.4 常用的决策树分类算法
  • 4.3.5 ID3算法
  • 4.3.6 C4.5算法
  • 4.3.7 CART算法
  • 4.3.8 SLIQ算法
  • 4.3.9 SPRINT算法
  • 4.3.10 PUBLIC算法
  • 4.3.11 算法比较
  • 4.4 支持向量机
  • 4.4.1 最优分类面
  • 4.4.2 广义的最优分类面
  • 4.4.3 序列最小最优化算法
  • 4.4.4 核函数
  • 4.4.5 SVM参数优化问题
  • 4.4.6 SVM分类器
  • 4.5 评价指标
  • 4.6 基于SVM算法的股票买卖点判断
  • 4.6.1 数据预处理
  • 4.6.2 买卖点定义
  • 4.6.3 买卖点判断
  • 第5章 匹配方法与股票走势的预测
  • 5.1 目标概述
  • 5.2 模式匹配
  • 5.2.1 模式匹配概述
  • 5.2.2 模式匹配的定义
  • 5.2.3 BF算法
  • 5.2.4 KMP算法
  • 5.2.5 BM算法
  • 5.2.6 BMH算法
  • 5.2.7 AC算法
  • 5.2.8 模式匹配算法总结
  • 5.3 常用的相似性度量方法
  • 5.3.1 基于距离的度量
  • 5.3.2 基于相似/相关的度量
  • 5.3.3 其他度量方式
  • 5.4 新方法:相似走势匹配在股票预测中的应用
  • 5.4.1 方法思想
  • 5.4.2 相似匹配的计算步骤
  • 5.4.3 基于最相似走势的股票短期走势预测方法
  • 5.4.4 基于多相似股票投票统计的近期涨跌预测方法
  • 5.4.5 基于近期预测涨跌幅及其一致性统计的股票推荐方法
  • 5.4.6 基于同匹配日期相似走势的股票预测方法
  • 5.4.7 基于强匹配排序的股票趋势分析与选股方法
  • 5.4.8 基于股票预测走势进行分类和推荐的方法
  • 5.5 新方法:自身历史相关在股票预测中的应用
  • 5.5.1 基于自身历史相关时间点的股票趋势预测方法
  • 5.5.2 基于自相关排序的股票趋势分析与选股方法
  • 5.6 新方法:正负相关走势在股票预测中的应用
  • 5.6.1 主要思想
  • 5.6.2 计算步骤
  • 5.6.3 方法步骤与创新特征
  • 5.6.4 输出结果示例
  • 5.7 新方法:自定义模式匹配在股票预测中的应用
  • 5.7.1 主要思想
  • 5.7.2 计算步骤
  • 5.7.3 方法步骤与创新特征
  • 5.7.4 输出结果示例
  • 5.8 平台实战解析:搜索相似历史走势以替代老司机经验
  • 第6章 相似股票判断与投资组合
  • 6.1 目标概述
  • 6.2 DTW动态时间规整算法
  • 6.2.1 匹配模式
  • 6.2.2 DTW算法原理
  • 6.2.3 DTW算法改进
  • 6.3 KNN算法
  • 6.3.1 KNN算法简介
  • 6.3.2 k值的选择
  • 6.3.3 KNN算法的改进
  • 6.3.4 KNN算法的实现
  • 6.4 相似股票的判断和应用
  • 6.4.1 新方法:用于辅助选股的股票分级活跃度计算方法
  • 6.4.2 新方法:基于股票强相关分析的选股推荐方法
  • 6.4.3 平台实战解析
  • 第7章 股票盘面强弱状态的判断
  • 7.1 目标概述
  • 7.2 马尔可夫模型
  • 7.2.1 马尔可夫模型概述
  • 7.2.2 马尔可夫过程
  • 7.2.3 马尔可夫链
  • 7.2.4 状态转移概率
  • 7.2.5 马尔可夫链在天气预报中的应用
  • 7.2.6 马尔可夫链在人民币汇率上的实证分析
  • 7.3 隐马尔可夫模型
  • 7.3.1 隐马尔可夫模型概述
  • 7.3.2 隐马尔可夫的数学模型
  • 7.3.3 评估问题与前向算法
  • 7.3.4 解码问题与Viterbi算法
  • 7.3.5 观察序列最大概率问题与Baum-Welch算法
  • 7.3.6 隐马尔可夫模型在输入法中的应用
  • 7.4 新方法:基于状态转移的股票长期走势预测与推荐方法
  • 7.4.1 主要思想
  • 7.4.2 计算步骤
  • 7.4.3 方法步骤与创新特征
  • 7.4.4 平台实战解析
  • 第8章 股票间的延时联动涨跌规则
  • 8.1 目标概述
  • 8.2 贝叶斯
  • 8.2.1 贝叶斯公式
  • 8.2.2 贝叶斯推断
  • 8.2.3 贝叶斯应用
  • 8.3 关联规则挖掘
  • 8.3.1 基本概念和模型
  • 8.3.2 Apriori算法
  • 8.3.3 FP-tree频集算法
  • 8.3.4 关联规则的应用
  • 8.4 关联规则在股票预测中的应用
  • 8.4.1 新方法:基于时态联动挖掘的股票预测方法
  • 8.4.2 新方法:基于股票间同现统计的股票推荐方法
  • 8.4.3 平台实战解析
  • 第9章 股票涨跌的幅值组合关系
  • 9.1 目标概述
  • 9.2 n-gram模型
  • 9.2.1 自然语言处理
  • 9.2.2 统计语言模型
  • 9.2.3 n-gram模型简介
  • 9.2.4 n-gram模型的数据平滑
  • 9.2.5 n-gram模型的解码算法
  • 9.2.6 利用n-gram纠正中文文本错误
  • 9.3 新方法:个股涨跌的幅值组合关系挖掘
  • 9.3.1 基于类似n元语法统计的股票预测方法
  • 9.3.2 基于类似关联规则统计的股票预测方法
  • 9.3.3 基于局部及全局语法统计的股票推荐方法
  • 9.3.4 用于股市运行逻辑理解的强关联规则挖掘方法
  • 9.3.5 平台实战解析
  • 第10章 股票的循环滚动预测方法
  • 10.1 目标概述
  • 10.2 回归分析与股票预测
  • 10.2.1 回归分析概述
  • 10.2.2 一元线性回归模型
  • 10.2.3 多元线性回归分析模型
  • 10.2.4 线性相关程度测定
  • 10.2.5 非线性回归分析
  • 10.2.6 用回归分析进行股票预测
  • 10.3 神经网络与股票预测
  • 10.3.1 神经网络的基本原理
  • 10.3.2 BP神经网络算法
  • 10.3.3 用BP神经网络进行股票预测
  • 10.4 深度学习与股票预测
  • 10.4.1 深度学习介绍
  • 10.4.2 深度学习的理论基础
  • 10.4.3 典型的深度学习模型
  • 10.4.4 LSTM递归神经网络
  • 10.4.5 新方法:用LSTM网络进行股票预测
  • 参考文献
展开全部

评分及书评

评分不足
1个评分

出版方

清华大学出版社

清华大学出版社成立于1980年6月,是由教育部主管、清华大学主办的综合出版单位。植根于“清华”这座久负盛名的高等学府,秉承清华人“自强不息,厚德载物”的人文精神,清华大学出版社在短短二十多年的时间里,迅速成长起来。清华大学出版社始终坚持弘扬科技文化产业、服务科教兴国战略的出版方向,把出版高等学校教学用书和科技图书作为主要任务,并为促进学术交流、繁荣出版事业设立了多项出版基金,逐渐形成了以出版高水平的教材和学术专著为主的鲜明特色,在教育出版领域树立了强势品牌。