一种股票行情分析预测方法、系统、装置及存储介质与流程

未命名 08-13 阅读:135 评论:0


1.本发明涉及人工智能技术领域,具体为一种股票行情分析预测方法、系统、装置及存储介质。


背景技术:

2.价值分析与技术分析通常被认为是两种不同的股票行情预测分析方法。华尔街教父(格雷厄姆)及其信徒们坚持价值投资,通过发现价格与价值的偏离,以寻求长期稳定的价值投资收益;技术分析派热衷于各种技术分析工具的创造与应用,以找到短期介入市场的机会。两种方法的共同点是都须基于各类基本面或技术面、市场等信息,做大量的数据分析。
3.随着分析工具的技术进步和交易数据的膨胀,计算技术应用必不可少。现今ai的发展更为该领域带来了一场分析与交易新的革命。从之前的随机森林、支持向量机到今日的反向传播、长短时神经网络,让股票机器辅助预测或交易有了前所未有的发展。
4.ai应用的成功与否取决于神经网络架构和训练两个方面,再好的神经网络如没有足量适宜的训练数据,也只是一个毛坯,发挥不了效果。数据的质量与数量决定着网络的优劣和生命力。
5.考虑到真实交易数据本身固有的时距敏感性和模型效能衰减特性,幻想应用这个数据规模训练出一个强大的预测神经网络模型是不太现实的。令人担忧的是,至今行业内更多的探讨与尝试集中在神经网络架构层面,交易本身是非常复杂的交易者行为,训练样本数量不足、特征输入不全面都极大影响着网络的训练与应用性能。


技术实现要素:

6.(一)解决的技术问题
7.针对现有技术的不足,本发明提供了一种股票行情分析预测方法、系统、装置及存储介质,解决了上述背景技术中提出的目前基于ai的预测办法探讨与尝试集中在神经网络架构层面,交易本身是非常复杂的交易者行为,训练样本数量不足、特征输入不全面都极大影响着网络的训练与应用性能问题。
8.(二)技术方案
9.为实现以上目的,本发明通过以下技术方案予以实现:
10.一种股票行情分析预测方法,包括:
11.利用遗传算法基于股票交易数据对股票进行簇化;
12.基于簇内股票真实数据构建lstm神经网络gnet;
13.利用簇内所有股票的历史交易数据训练gnet;
14.基于网络迁移技术,将gnet迁移并构建成适用于簇内个股的神经网络snet并训练及应用。
15.优选地,所述利用遗传算法基于股票交易数据对股票进行簇化,包括:
16.选取沪深市场交易的正常股票股票数为ss,设置种群大小为s,dna尺寸大小为l,l=ss;设置交叉率r和突变率为1,迭代次数为r=100;
17.二进制编码染色体,以表示问题的潜在解,染色体长度为l,随机生成s条染色体初始化种群;染色体二进制编码[0,1,0,0,1,

,0],1代表在该簇内选择该股票,0代表不选;
[0018]
计算每条染色体的适应度函数:cs=[a,b,

x,y];a,b,x,y为任意染色体为1的代表的股票,用i代表cs内的某只股票;
[0019]
ntui为i股票交易时间周期(tu)的数据量;
[0020]
ltu为一定时间周期个数长度;
[0021]
vtui为i股票交易时间周期内的主要行情数据,如收盘价,vtui=[cp];
[0022]
r为cs内所有选择股票ltu时长内相关系数,可有两两相关系数的最小值可得,即
[0023]
k为交易数据的时距敏感系数,t为ltu内的数据序数;
[0024]
令ntu
i-1=sn,ltu-1=s0,i0=t-ltu+1,则:
[0025][0026]
设置最小值r
must_min
,则r
min
≥r
must_min

[0027]
r=r
min
=r(cs);且取簇内每只股票的有效数据量为rn,则簇cs内的总数据量为s=n
·
rn,n为簇的大小,即染色体内被选中的股票;
[0028]
最终,cs簇的s与r共同决定其适应性,令x为s的权重,则r的权重为(1-x),则:
[0029]
适应度函数a=s
·
x+(1-x)
·
r,显然,a反映了股票簇内可用以训练gnet的有效数据量大小,隐含了质量(相关系数)和数量,越大则代表染色体所承载的gnet训练样本越大,使遗传到下一代的可能性也更大;
[0030]
基于适应度a、交叉率和突变率对种群进行选择,交叉率和突变率对种群进行选择、交叉、变异工作,迭代100次后终止;
[0031]
选取种群内a最高的簇,基本上参数设置合理的情况下,可获得训练gnet网络的样本数是单只股票的10~100倍之间。
[0032]
优选地,所述基于簇内股票真实数据构建lstm神经网络gnet;包括:基于3d
+
mps理论,将价值、趋势与行为三类特征指标作为步长输入中一个值的构成;
[0033]
在应用ltsm即长短时神经网络架构,并确定与snet一致的时距与偏好矩阵;
[0034]
输出采用模糊精确分类,采用交叉熵为目标函数;
[0035]
根据得到的股票簇g,含有股票只数sn,取第k只为snet的训练与应用目标股,sn-1只股票即g(0,1,

,i,k+1,sn-1)为gnet网络训练数据样本集,共有数据分sn-1组,每组取前80%为训练集,后20%为测试集;
[0036]
每组数据在同一时间周期序数享有同一时距敏感矩阵参数,即t为样本时间序数。
[0037]
优选地,所述利用簇内所有股票的历史交易数据训练gnet,包括:
[0038]
根据数据量n的规模设计训练轮数,batch_size设为8,数据batch内与batch之间确保数据的时序不可在数上作shuffle处理;
[0039]
假设每组样本有rn/ts个batch,则阵列划分从(bs,rn/ts)

(bs
·
rn/ts,ts)顺序分割,ts为时间步长参数;
[0040]
训练验证后,保存网络的各类元数据,参数以及相应的网络性能数据,确保参数的命名规则,以确保在迁移时能够装载不同层或名称参数。
[0041]
优选地,所述基于网络迁移技术,将gnet迁移并构建成适用于簇内个股的神经网络snet并训练及应用,包括:
[0042]
基于gnet神经网络的元数据、参数信息,剔除掉lstm单节点rnn层后的全联接层的参数,以此生成神经网络snet,snet除了各lstm节点全联接层的参数外,其他参数与元信息全部继承自gnet;
[0043]
snet与gnet拥有同样的目标函数、时距系数和偏好敏感矩阵,rnn层数、各节点的激活函数等统统保持一致;
[0044]
根据股票簇g,取第k只股票交易历史数据,划分前80%为训练样本,后20%为测试样本;
[0045]
对得到数据进行batch划分,确保batch之间以及batch内各数据之间序列保持原始时序一致;
[0046]
训练snet,确定rnn全联结层的参数,得到适用于股票k的snet,可将snet重命名为sknet,以示该网络只针对股票k;
[0047]
将sknet应用预测r股票的日交易情况;
[0048]
当训练gnet的簇内股票有了更新数据,gnet依然可以被创建为针对某只股票的snet,即sinet,当某只股票数据更新,依然可以重新训练snet,以应对因为数据时距敏感时而不能导数的网络参数变化。
[0049]
本发明还提供一种股票行情分析预测系统,包括:
[0050]
股票簇化模块:用于利用遗传算法基于股票交易数据对股票进行簇化;
[0051]
gnet构建与训练模块:用于基于簇内股票真实数据构建lstm神经网络gnet;
[0052]
利用簇内所有股票的历史交易数据训练gnet;
[0053]
模型迁移与snet创建、训练模块:用于基于网络迁移技术,将gnet迁移并构建成适用于簇内个股的神经网络snet并训练及应用。
[0054]
本发明还提供一种股票行情分析预测装置,包括:存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行如前任一项所述的方法。
[0055]
本发明还提供一种计算机可读的存储介质,所述计算机可读的存储介质包括存储的程序,其中,所述程序运行时执行如前任一项所述的方法。
[0056]
(三)有益效果
[0057]
本发明提供了一种股票行情分析预测方法、系统、装置及存储介质。具备以下有益效果:
[0058]
本发明技术方案目的在于大规模提高神经网络的真实训练数据规模从而提升网
络的预测性能,遗传算法在海量交易数据上对股票进行了簇化,以将在主要行情数据相关性高的股票做归类处理,构建应用于簇内股票真实数据的lstm神经网络gnet,利用簇内所有股票的历史交易数据训练gnet,以训练出针对簇内所有股票数据的高性能网络,然后,基于网络迁移技术,将gnet迁移并构建成适用于簇内个股的神经网络snet,并利用个股的交易数据重新训练snet的少部分参数,以将针对于个股的模型参数作优化,从而使得snet更适用于个股的预测。gnet与snet是1:n的关系,n为簇内股票的个数,gnet是同一簇内股票的抽象网络,snet是应用于簇内个股的具化网络;gnet应用成倍扩大的且有较多共性特性的数据挖掘出更多的具有相似预测结果的共性特征,snet专门具化到个股以调试优化,从而提升snet应用于个股的效果。
附图说明
[0059]
图1为本发明提供的一种股票行情分析预测方法流程图;
[0060]
图2为本发明提供的一种股票行情分析预测方法的逻辑结构示意图;
[0061]
图3为本发明提供的一种股票行情分析预测系统结构示意图。
具体实施方式
[0062]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
[0063]
如图1和图2所示,一种股票行情分析预测方法,包括:
[0064]
s1利用遗传算法基于股票交易数据对股票进行簇化;
[0065]
s2基于簇内股票真实数据构建lstm神经网络gnet;
[0066]
s3利用簇内所有股票的历史交易数据训练gnet;
[0067]
s4基于网络迁移技术,将gnet迁移并构建成适用于簇内个股的神经网络snet并训练及应用。
[0068]
优选地,所述利用遗传算法基于股票交易数据对股票进行簇化,包括:
[0069]
选取沪深市场交易的正常股票数为ss(剔除掉如停牌等),设置种群大小为s,dna尺寸大小为l,l=ss;设置交叉率r和突变率为1,迭代次数为r=100;
[0070]
二进制编码染色体,以表示问题的潜在解,染色体长度为l,随机生成s条染色体初始化种群;染色体二进制编码[0,1,0,0,1,

,0],1代表在该簇内选择该股票,0代表不选;
[0071]
计算每条染色体的适应度函数:cs=[a,b,

x,y];a,b,x,y为任意染色体为1的代表的股票,用i代表cs内的某只股票;
[0072]
ntui为i股票交易时间周期(tu)的数据量;
[0073]
ltu为一定时间周期个数长度;
[0074]
vtui为i股票交易时间周期内的主要行情数据,如收盘价,vtui=[cp];
[0075]
r为cs内所有选择股票ltu时长内相关系数,可有两两相关系数的最小值可得,即
[0076]
k为交易数据的时距敏感系数,t为ltu内的数据序数;
[0077]
令ntu
i-1=sn,ltu-1=s0,i0=t-ltu+1,则:
[0078]
r=r
min

[0079]
设置最小值r
must_min
,则r
min
≥r
must_min

[0080]
r=r
min
=r(cs);且取簇内每只股票的有效数据量为rn,则簇cs内的总数据量为s=n
·
rn,n为簇的大小,即染色体内被选中的股票;
[0081]
最终,cs簇的s与r共同决定其适应性,令x为s的权重,则r的权重为(1-x),则:
[0082]
适应度函数a=s
·
x+(1-x)
·
r,显然,a反映了股票簇内可用以训练gnet的有效数据量大小,隐含了质量(相关系数)和数量,越大则代表染色体所承载的gnet训练样本越大,使遗传到下一代的可能性也更大。
[0083]
基于适应度a、交叉率和突变率对种群进行选择,交叉率和突变率对种群进行选择、交叉、变异工作,迭代100次后终止;
[0084]
选取种群内a最高的簇,基本上参数设置合理的情况下,可获得训练gnet网络的样本数是单只股票的10~100倍之间。
[0085]
股票簇化的目的是找到行情数据变化相关性强的股票,簇内更多的股票意味着更多的训练数据以训练gnet网络,通过gn即遗传算法创建股票簇,有效扩展了神经网络真实训练样本数量,一般情况下,样本数量扩充至少10倍以上;
[0086]
优选地,所述基于簇内股票真实数据构建lstm神经网络gnet;包括:
[0087]
基于3d
+
mps理论,将价值、趋势与行为三类特征指标作为步长输入中一个值的构成;
[0088]
在应用ltsm即长短时神经网络架构,并确定与snet一致的时距与偏好矩阵;
[0089]
输出采用模糊精确分类,采用交叉熵为目标函数;
[0090]
根据得到的股票簇g,含有股票只数sn,取第k只为snet的训练与应用目标股,sn-1只股票即g(0,1,

,i,k+1,sn-1)为gnet网络训练数据样本集,共有数据分sn-1组,每组取前80%为训练集,后20%为测试集;
[0091]
每组数据在同一时间周期序数享有同一时距敏感矩阵参数,即t为样本时间序数。
[0092]
优选地,所述利用簇内所有股票的历史交易数据训练gnet,包括:
[0093]
根据数据量n的规模设计训练轮数,batch_size设为8,数据batch内与batch之间确保数据的时序不可在数上作shuffle处理;
[0094]
假设每组样本有rn/ts个batch,则阵列划分从(bs,rn/ts)

(bs
·
rn/ts,ts)顺序分割,ts为时间步长参数;
[0095]
训练验证后,保存网络的各类元数据,参数以及相应的网络性能数据,确保参数的命名规则,以确保在迁移时能够装载不同层或名称参数。
[0096]
优选地,所述基于网络迁移技术,将gnet迁移并构建成适用于簇内个股的神经网络snet并训练及应用,包括:
[0097]
基于gnet神经网络的元数据、参数信息,剔除掉lstm单节点rnn层后的全联接层的参数,以此生成神经网络snet,snet除了各lstm节点全联接层的参数外,其他参数与元信息全部继承自gnet;
[0098]
snet与gnet拥有同样的目标函数、时距系数和偏好敏感矩阵,rnn层数、各节点的激活函数等统统保持一致;
[0099]
根据股票簇g,取第k只股票交易历史数据,划分前80%为训练样本,后20%为测试样本;
[0100]
对得到数据进行batch划分,确保batch之间以及batch内各数据之间序列保持原始时序一致;
[0101]
训练snet,确定rnn全联结层的参数,得到适用于股票k的snet,可将snet重命名为sknet,以示该网络只针对股票k;
[0102]
将sknet应用预测r股票的日交易情况;
[0103]
当训练gnet的簇内股票有了更新数据,gnet依然可以被创建为针对某只股票的snet,即sinet,当某只股票数据更新,依然可以重新训练snet,以应对因为数据时距敏感时而不能导数的网络参数变化。
[0104]
如图3所示,本发明还提供一种股票行情分析预测系统,包括:
[0105]
股票簇化模块:用于利用遗传算法基于股票交易数据对股票进行簇化;
[0106]
gnet构建与训练模块:用于基于簇内股票真实数据构建lstm神经网络gnet;
[0107]
利用簇内所有股票的历史交易数据训练gnet;
[0108]
模型迁移与snet创建、训练模块:用于基于网络迁移技术,将gnet迁移并构建成适用于簇内个股的神经网络snet并训练及应用。
[0109]
本发明还提供一种股票行情分析预测装置,包括:存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行如前任一项所述的方法。
[0110]
本发明还提供一种计算机可读的存储介质,所述计算机可读的存储介质包括存储的程序,其中,所述程序运行时执行如前任一项所述的方法。
[0111]
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

技术特征:
1.一种股票行情分析预测方法,其特征在于,包括:利用遗传算法基于股票交易数据对股票进行簇化;基于簇内股票真实数据构建lstm神经网络gnet;利用簇内所有股票的历史交易数据训练gnet;基于网络迁移技术,将gnet迁移并构建成适用于簇内个股的神经网络snet并训练及应用。2.根据权利要求1所述的一种股票行情分析预测方法,其特征在于,所述利用遗传算法基于股票交易数据对股票进行簇化,包括:选取沪深市场交易的正常股票股票数为ss,设置种群大小为s,dna尺寸大小为l,l=ss;设置交叉率r和突变率为1,迭代次数为r=100;二进制编码染色体,以表示问题的潜在解,染色体长度为l,随机生成s条染色体初始化种群;染色体二进制编码[0,1,0,0,1,

,0],1代表在该簇内选择该股票,0代表不选;计算每条染色体的适应度函数:cs=[a,b,

x,y];a,b,x,y为任意染色体为1的代表的股票,用i代表cs内的某只股票;ntu
i
为i股票交易时间周期(tu)的数据量;ltu为一定时间周期个数长度;vtu
i
为i股票交易时间周期内的主要行情数据,如收盘价,vtu
i
=[cp];r为cs内所有选择股票ltu时长内相关系数,可有两两相关系数的最小值可得,即k为交易数据的时距敏感系数,t为ltu内的数据序数;令ntu
i-1=s
n
,ltu-1=s0,i0=t-ltu+1,则:r=r
min
设置最小值r
must-min
,则r
min
≥r
must_min
;r=r
min
=r(cs);且取簇内每只股票的有效数据量为rn,则簇cs内的总数据量为s=n
·
rn,n为簇的大小,即染色体内被选中的股票;最终,cs簇的s与r共同决定其适应性,令x为s的权重,则r的权重为(1-x),则:适应度函数a=s
·
x+
(
1-x)
·
r,显然,a反映了股票簇内可用以训练gnet的有效数据量大小,隐含了质量(相关系数)和数量,越大则代表染色体所承载的gnet训练样本越大,使遗传到下一代的可能性也更大;基于适应度a、交叉率和突变率对种群进行选择,交叉率和突变率对种群进行选择、交叉、变异工作,迭代100次后终止;选取种群内a最高的簇,基本上参数设置合理的情况下,可获得训练gnet网络的样本数是单只股票的10~100倍之间。3.根据权利要求2所述的一种股票行情分析预测方法,其特征在于,所述基于簇内股票真实数据构建lstm神经网络gnet;包括:基于3d+mps理论,将价值、趋势与行为三类特征指标作为步长输入中一个值的构成;
在应用ltsm即长短时神经网络架构,并确定与snet一致的时距与偏好矩阵;输出采用模糊精确分类,采用交叉熵为目标函数;根据得到的股票簇g,含有股票只数sn,取第k只为snet的训练与应用目标股,sn-1只股票即g(0,1,

,i,k+1,sn-1)为gnet网络训练数据样本集,共有数据分sn-1组,每组取前80%为训练集,后20%为测试集;每组数据在同一时间周期序数享有同一时距敏感矩阵参数,即t为样本时间序数。4.根据权利要求3所述的一种股票行情分析预测方法,其特征在于,所述利用簇内所有股票的历史交易数据训练gnet,包括:根据数据量n的规模设计训练轮数,batch_size设为8,数据batch内与batch之间确保数据的时序不可在数上作shuffle处理;假设每组样本有rn/ts个batch,则阵列划分从(bs,rn/ts)

(bs rn/ts,ts)顺序分割,ts为时间步长参数;训练验证后,保存网络的各类元数据,参数以及相应的网络性能数据,确保参数的命名规则,以确保在迁移时能够装载不同层或名称参数。5.根据权利要求4所述的一种股票行情分析预测方法,其特征在于,所述基于网络迁移技术,将gnet迁移并构建成适用于簇内个股的神经网络snet并训练及应用,包括:基于gnet神经网络的元数据、参数信息,剔除掉lstm单节点rnn层后的全联接层的参数,以此生成神经网络snet,snet除了各lstm节点全联接层的参数外,其他参数与元信息全部继承自gnet;snet与gnet拥有同样的目标函数、时距系数和偏好敏感矩阵,rnn层数、各节点的激活函数等统统保持一致;根据股票簇g,取第k只股票交易历史数据,划分前80%为训练样本,后20%为测试样本;对得到数据进行batch划分,确保batch之间以及batch内各数据之间序列保持原始时序一致;训练snet,确定rnn全联结层的参数,得到适用于股票k的snet,可将snet重命名为sknet,以示该网络只针对股票k;将sknet应用预测r股票的日交易情况;当训练gnet的簇内股票有了更新数据,gnet依然可以被创建为针对某只股票的snet,即sinet,当某只股票数据更新,依然可以重新训练snet,以应对因为数据时距敏感时而不能导数的网络参数变化。6.一种股票行情分析预测系统,其特征在于,包括:股票簇化模块:用于利用遗传算法基于股票交易数据对股票进行簇化;gnet构建与训练模块:用于基于簇内股票真实数据构建lstm神经网络gnet;利用簇内所有股票的历史交易数据训练gnet;
模型迁移与snet创建、训练模块:用于基于网络迁移技术,将gnet迁移并构建成适用于簇内个股的神经网络snet并训练及应用。7.一种股票行情分析预测装置,其特征在于,包括:存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行权利要求1至5中任一项所述的方法。8.一种计算机可读的存储介质,其特征在于,所述计算机可读的存储介质包括存储的程序,其中,所述程序运行时执行权利要求1至5中任一项所述的方法。

技术总结
本发明提供一种股票行情分析预测方法、系统、装置及存储介质,包括:利用遗传算法基于股票交易数据对股票进行簇化;基于簇内股票真实数据构建LSTM神经网络GNet;利用簇内所有股票的历史交易数据训练GNet;基于网络迁移技术,将GNet迁移并构建成适用于簇内个股的神经网络SNet并训练及应用,解决了目前基于AI的预测办法探讨与尝试集中在神经网络架构层面,交易本身是非常复杂的交易者行为,训练样本数量不足、特征输入不全面都极大影响着网络的训练与应用性能问题。应用性能问题。应用性能问题。


技术研发人员:胡德华
受保护的技术使用者:杭州以新电子科技有限公司
技术研发日:2023.04.21
技术公布日:2023/8/9
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐