前言
创建知识星球《玩转股票量化交易》的初心是为了建立一个可以深入学习和交流的私有量化圈子,和志同道合的小伙伴们一起搭建私有的量化交易系统,并且不断迭代完善这个系统,从而能够帮助我们更高效地分析股票、获得更大的盈利机会。
关于星球的学习路线导览可以参考这篇文章:《玩转股票量化交易》学习路线导览
股票数据量化分析的第一环节就是股票数据的获取,其中包括了各式各样的数据,比如每天的个股行情数据、北向资金的交易数据,每季度的基金持仓数据、财务报表数据等等。
为了降低大家获取股票数据的成本,我们在星球中提供了一些数据的爬虫源码,如下所示:
大家可以下载源码在本地搭建自己的数据库。
有的时候,星友们可能因为各种原因忘记了下载当天的数据,从而缺了某天的数据,要知道缺失一天的数据对回测及分析都是会有不小影响的。
另外一方面,考虑到有些爬虫过程实在耗时太长,比如基金持仓前十名单,爬完一个季度的基金持仓起码要1小时。我们觉得没必要大家都重复地下载一遍,只要一个人下载完了分享一下就好了。
于是我们为星友们开启了股票数据的下载服务,我们搭建了一台云服务器,在云服务器上建立了FTP站点,供星友们在需要的时候远程下载数据。
目前我们增加了A股全市场个股涨停板明细,数据内容更丰富啦!请看下面的详细介绍!
目前我们总共提供了以下8类数据,分别为:
每日A股涨停明细
季度A股个股财报
季度基金持仓前十
每日A股个股行情
每日A股板块行情
每日北向资金持仓
每日A股热门概念
A股市场实盘行情
大家有需要的数据,以及有好的数据源可以call,我可以放到云服务器上自动管理,大家一起共享!
每日A 股涨停明细
关于涨停板的明细数据,要感谢星球会员(昵称:地瓜)的分享,最主要的是他在星球上传了爬虫源码,需要的小伙伴可以自行获取。
我把这份爬虫代码放在服务器上定时运行,大家有遗忘下载的可以到服务器上取。
内容包括:股票代码、股票名称、最新价、涨跌幅、成交额(亿)、流通市值(亿)、流通市值(亿)、换手(%)、连板天数、首次封板时间、最终封板时间、封板资金(亿)、炸板次数、所属行业、涨停统计、封成比。
季度A 股个股财报
升级后的内容包括:
股票代码、股票名称、所属地域、行业、上市日期、发布日期、统计截止日
【盈利能力】净资产收益率(平均)(%)、销售净利率(%)、销售毛利率(%)、净利润(元)、每股收益、总股本、流通股本
【运营能力】应收账款周转率(次)、应收账款周转天数(天)、存货周转率(次)、存货周转天数(天)、流动资产周转率(次)、总资产周转率
【成长能力】净资产同比增长率、总资产同比增长率、净利润同比增长率、基本每股收益同比增长率、归属母公司股东净利润同比增长率、流动比率、速动比率、现金比率、总负债同比增长率、资产负债率、权益乘数
【现金流量】流动资产除以总资产、非流动资产除以总资产、有形资产除以总资产、已获利息倍数、经营活动产生的现金流量净额除以营业收入、经营性现金净流量除以净利润、经营性现金净流量除以营业总收入"
季度基金持仓前十
内容包括:
基金名称、基金代码、类型(混合型、债券型、指数型等)、基金规模、成立日期、发布日期、机构名称、管理人、持仓第一位的信息【股票名称、股票代码、持仓比例】……持仓第十位的信息。
每日A股个股行情
该数据可以获取全部股票每日重要的基本面指标,用于选股分析。使用tushare pro的每日指标daily_basic接口要求用户需要至少600积分才可以调取,对于积分不足的小伙伴可以用这个接口去替换。
我们找到的是替换数据源是【东方财富网 > 行情中心 > 沪深个股】页面,它包含了各个股票的行情信息, 有沪深A股、新股、中小板、创业板、科创板、风险警示板、两网及退市等,数据类型有最新价、最高、最低、涨跌幅、成交量、成交额、换手率、市盈率……而且是实时更新的哦!用于后期实盘做在线监测,也比较合适。
最主要的是星球上传了爬虫源码,需要的小伙伴可以自行获取。
内容包括:
股票代码、股票名称、最新价格、涨跌额、涨跌幅、成交量、成交额、振幅、最高、最低、今开、昨收、量比、换手率、市盈率(动态)、市净率、总市值、流通市值
每日A股板块行情
内容包括:
板块名称、板块最新价、板块涨跌额、板块涨跌幅、板块总市值、板块换手率、上涨家数、下跌家数、领涨股票、领涨幅、领跌股票、领跌幅
每日北上资金持仓
这份数据内容中分别包含了个股在今日/3日/5日/10日/1月/1季/1年期间北上资金的持仓情况,比如:
当期增持股数(股)
当期增持市值(元)
当期市值增减幅
当期流通股占比变动
当期总占比变动
同时也提示了个股所属的行业板块、地区板块、当日收盘价(元)、当日涨跌幅(%)、当日持股数(股)、当日持股市值(元)、当日持股总占比、当日流通市值(元)、当日总市值(元)。
每日A股热门概念
内容包括:
概念名称、最新价、涨跌额、涨跌幅、总市值、换手率、上涨家数、下跌家数、领涨股票、涨幅、领跌股票、跌幅、当前时间
A股市场实盘行情
实时行情数据对短线量化交易者来说非常重要,涉及到买卖点的选择。
此处提及的A股实时行情数据获取,是类似于Level1级别的更新,最快可以达到每间隔3秒以爬虫的方式从财经网站上实时采样获取到的。
注:源码的SCAN_TIME变量可以配置实时数据更新的周期。
如下图所示,数据类型有“最新价”、“最高”(当前)、“最低”(当前)、“涨跌幅”(当前)、“成交量(当天累加)”、“成交额(当天累加)”、“换手率”、“市盈率”,然后我们增加一列“当前时间”,表示获取实时数据的时间。因为这些数据在财经网站上是实时更新的,所以有必要增加这一列。
我们获取数据的交易时段是9:29至11.31,12:59至15:01,每间隔3秒获取一次数据,并且以csv文件格式存储。
重点是我们会把源码上传到知识星球《玩转股票量化交易》,大家可以在本地获取数据,不过数据量有点大,一天的数据在3G左右,估计存一年的数据要留800G的硬盘空间。
我一般只会移动地留一个月左右的实时数据,再早期的会转换为分钟线存储,降低空间的占用。
同时,我们在搭建的云服务器上保存了一周内的实时行情数据,如果大家平时只是需要数据做分析的话,可以在收盘后通过FTP方式获取。
如果大家需要在当天跟踪股价的变动,从而执行买卖操作的话,可以在自己的电脑上执行这个脚本,并添加自己的判断逻辑,当出现操作信号时候就通过邮箱、钉钉等即时工具发给你,这部分的demo源码可以查看星球主题《适合上班族的量化炒股场景——来自量化机器人的实时行情盯盘服务》。
于是我们搭建了一台云服务器,在云服务器上建立了FTP站点,供星友们在需要的时候自行下载数据。
FTP下载股票数据
对于每日更新的数据,由服务器已经持续数月自动更新。
大家可以在浏览器上输入网ftp://101.34.186.232/访问。也可以在本地下载并安装开源软件 FileZilla。
在 FileZilla 窗口中,填写主机、用户名、密码和端口等信息,单击【快速连接】。如下图所示:
配置信息的主机IP、用户名、密码、端口,以及 FileZilla 软件我们会上传至知识星球置顶主题中。
同时,我们也会上传一些与数据相对应的可视化Web,帮助大家一目了然地获悉行情的动态。
说明
想要加入知识星球《玩转股票量化交易》的小伙伴记得先微信call我获取福利!
元宵大师的量化交易书籍开售!!
京东、当当、天猫有售!!