基于资讯数据的预警方法、计算机设备及存储介质与流程
未命名
08-05
阅读:84
评论:0

1.本技术涉及数据处理技术领域,尤其涉及一种基于资讯数据的预警方法、计算机设备及计算机可读存储介质。
背景技术:
2.金融资讯数据在证券行业有着广泛的应用,但金融资讯数据使用的过程当中也面临着诸多挑战。如果多源异构的金融数据源没有经过整合,每日更新的金融资讯数据内容数量庞大,在缺少系统策略级支持下,仅能通过人工进行每篇阅读,再进行人为经验判定该内容属于哪些标签属性,需要耗费大量的人力进行内容分析判断,工作效率低下且缺乏科学判定标准,很多时候同一属性的文章,由于不同的运营人员进行判定,会出现标签不一致的情况。
3.现有券商交易软件中的预警方法没有基于整合后的数据源进行并且预警功能单一,存在及时性及准确性差的问题,导致用户的体验效果较差。
技术实现要素:
4.本技术提供了一种基于资讯数据的预警方法及系统,以解决现有预警方法准确性低、体验效果差的技术问题。
5.第一方面,本技术实施方式提供了一种基于资讯数据的预警方法,所述预警方法包括:
6.获取资讯数据源并对所述资讯数据源进行整合处理得到目标资讯数据;
7.将所述目标资讯数据输入语义识别模型进行识别,得到所述目标资讯数据中的语义信息;
8.根据所述语义信息对所述目标资讯数据进行标签分类,得到所述目标资讯数据的标签信息;
9.利用所述标签信息以及预设标签告警条件对所述目标资讯数据进行预警,在所述目标资讯数据达到所述预设标签告警条件时,生成告警提示,并将所述告警提示发送至用户终端。
10.进一步地,所述获取资讯数据源并对所述资讯数据源进行整合处理得到目标资讯数据,包括:
11.获取资讯数据源,所述资讯数据源包括结构化数据源、非结构化数据源及半结构化数据源;
12.将所述结构化数据源、非结构化数据源及半结构化数据源输入元数据库;
13.利用etl数据处理模型中的kettle执行器访问所述元数据库,以对所述资讯数据源进行数据清洗及转换,得到目标资讯数据。
14.进一步地,所述元数据库包括数据源配置模块、数据字典模块和数据血缘管理模块。
15.进一步地,所述利用etl数据处理模型中的kettle执行器访问所述元数据库,以对所述资讯数据源进行数据清洗及转换,得到目标资讯数据之前,还包括:
16.基于quartz方法建立集群调度中心模块;
17.根据所述集群调度中心模块中的负载均衡机制对多个所述kettle执行器进行打分,得到多个kettle执行器分数信息;
18.利用所述集群调度中心模块读取多个所述etl数据处理模型的定时任务信息,根据所述定时任务信息和所述kettle执行器分数信息生成调度任务以及待使用kettle执行器;
19.向所述待使用kettle执行器发送所述调度任务。
20.进一步地,所述获取资讯数据源并对所述资讯数据源进行整合处理得到目标资讯数据之后,还包括:
21.利用数据校验模型对所述目标资讯数据进行字段校验、记录行校验及三方校验,得到校验信息,根据所述校验信息生成校验不通过推送信息,所述校验信息包括校验不通过数据量信息、通过率信息及异常数据明细信息;
22.将所述目标资讯数据存储在数据存储模块,所述数据存储模块包括存储模型设计机制以及数据分层设计机制。
23.进一步地,所述根据所述语义信息对所述目标资讯数据进行标签分类,得到所述目标资讯数据的标签信息,包括:
24.提取所述语义信息中的至少一个关键词信息,并将所述关键词信息与标签库的标签词匹配,得到相关标签词,所述标签词包括股票、债券、基金、行业、概念、板块或风险事件;
25.对所述相关标签词进行排序,并将排序最靠前的所述相关标签词作为所述目标资讯的标签信息。
26.进一步地,所述预设告警条件包括股票告警条件、债券告警条件、基金告警条件、行业告警条件、概念告警条件、板块告警条件或风险事件告警条件;所述告警提示包括股票告警提示、债券告警提示、基金告警提示、行业告警提示、概念告警提示、板块告警提示或风险事件告警提示。
27.第二方面,本技术还提供了一种基于资讯数据的预警装置,其特征在于,所述基于资讯数据的预警装置包括:
28.获取整合模块,用于获取资讯数据源并对所述资讯数据源进行整合处理得到目标资讯数据;
29.语义识别模块,用于将所述目标资讯数据输入语义识别模型进行识别,得到所述目标资讯数据中的语义信息;
30.标签分类模块,用于根据所述语义信息对所述目标资讯数据进行标签分类,得到所述目标资讯数据的标签信息;
31.告警提示模块,用于利用所述标签信息以及预设标签告警条件对所述目标资讯数据进行预警,在所述目标资讯数据达到所述预设标签告警条件时,生成告警提示,并将所述告警提示发送至用户终端。
32.进一步地,所述获取整合模块包括:
33.数据获取单元,用于获取资讯数据源,所述资讯数据源包括结构化数据源、非结构化数据源及半结构化数据源;将所述结构化数据源、非结构化数据源及半结构化数据源输入元数据库;利用etl数据处理模型中的kettle执行器访问所述元数据库,以对所述资讯数据源进行数据清洗及转换,得到目标资讯数据。所述元数据库包括数据源配置模块、数据字典模块和数据血缘管理模块。
34.集群调度单元,用于基于quartz方法建立集群调度中心模块;根据所述集群调度中心模块中的负载均衡机制对多个所述kettle执行器进行打分,得到多个kettle执行器分数信息;利用所述集群调度中心模块读取多个所述etl数据处理模型的定时任务信息,根据所述定时任务信息和所述kettle执行器分数信息生成调度任务以及待使用kettle执行器;向所述待使用kettle执行器发送所述调度任务。
35.数据校验单元,用于利用数据校验模型对所述目标资讯数据进行字段校验、记录行校验及三方校验,得到校验信息,根据所述校验信息生成校验不通过推送信息,所述校验信息包括校验不通过数据量信息、通过率信息及异常数据明细信息;将所述目标资讯数据存储在数据存储模块,所述数据存储模块包括存储模型设计机制以及数据分层设计机制。
36.进一步地,标签分类模块包括:
37.标签匹配单元,用于提取所述语义信息中的至少一个关键词信息,并将所述关键词信息与标签库的标签词匹配,得到相关标签词,所述标签词包括股票、债券、基金、行业、概念、板块或风险事件;对所述相关标签词进行排序,并将排序最靠前的所述相关标签词作为所述目标资讯的标签信息。
38.第三方面,本技术还提供了一种计算机设备,所述计算机设备包括存储器和处理器;
39.所述存储器,用于存储计算机程序;
40.所述处理器,用于执行所述计算机程序并在执行所述计算机程序时实现如上所述的基于资讯数据的预警方法。
41.第四方面,本技术还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器实现如上所述的基于资讯数据的预警方法。
42.相比于现有技术,本技术实施方式提供的一种基于资讯数据的预警方法,通过获取资讯数据源并对所述资讯数据源进行整合处理得到目标资讯数据;将所述目标资讯数据输入语义识别模型进行识别,得到所述目标资讯数据中的语义信息;根据所述语义信息对所述目标资讯数据进行标签分类,得到所述目标资讯数据的标签信息;利用所述标签信息以及预设标签告警条件对所述目标资讯数据进行预警,在所述目标资讯数据达到所述预设标签告警条件时,生成告警提示,并将所述告警提示发送至用户终端。通过上述方式,本发明对规范后多源异构的资讯数据源进行标签化处理,设置预设标签告警条件对目标资讯数据进行告警提示,并将告警提示发送给指定用户,解决了资讯数据预警过程准确性低、体验效果差等问题。
43.应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本技术。
附图说明
44.为了更清楚地说明本技术实施方式技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
45.图1为本技术实施方式提供的基于资讯数据的预警方法流程示意图;
46.图2为本技术实施方式提供的基于资讯数据的预警模型的示意性框图;
47.图3为本技术实施方式提供的一种计算机设备的结构示意性框图。
具体实施方式
48.下面将结合本技术实施方式中的附图,对本技术实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
49.下面结合附图,对本技术的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
50.应当理解,在此本技术说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本技术。如在本技术说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
51.应当理解,为了便于清楚描述本技术实施方式的技术方案,在本技术的实施例中,采用了“第一”、“第二”等字样对功能和作用基本相同的相同项或相似项进行区分。本领域技术人员可以理解“第一”、“第二”等字样并不对数量和执行次序进行限定,并且“第一”、“第二”等字样也并不限定一定不同。
52.还应当进一步理解,在本技术说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
53.本技术发明人发现,现有的技术方案不能将多源异构的金融数据源进行整合,而且每日更新的金融资讯数据内容数量庞大,在缺少系统策略级支持下,仅能通过人工进行每篇阅读工作效率低下且缺乏科学判定标准,很多时候同一属性的文章,由于不同的运营人员进行判定,会出现标签不一致的情况。并且现有券商交易软件中的预警方法没有基于整合后的数据源进行并且预警功能单一,存在及时性及准确性差的问题,导致用户的体验效果较差。
54.为了解决上述问题,本技术提供了一种基于资讯数据的预警方法。
55.参阅图1,图1为本技术实施方式提供的基于资讯数据的预警方法流程示意图,包括步骤s101-s104。
56.步骤s101、获取资讯数据源并对所述资讯数据源进行整合处理得到目标资讯数据。
57.本实施例中,该资讯数据源包括:中国资本市场主要金融品种的交易数据、财务数据及各类公开披露的信息(上海证券交易所和深圳证券交易所全部上市公司的基本资料、发行资料、交易数据、分红数据、股本结构、财务数据、公司公告及其它重要信息);公募基金、券商集合理财及信托等产品的发行上市资料、净值、投资组合、收益和分红数据、定期报
告、财务数据等;国债、企债、金融债、可转债、央行票据等债券的基本资料、计息和兑付数据、交易数据等,以及各类收益率曲线等衍生数据,并提供支撑债券定价计算的数据结构;中国证券市场指数(沪深交易所指数、银行间债券市场指数、msci中国指数、新华富时指数、中信指数、申银万国指数等)和海外市场指数的基本资料和交易数据;国内各期货交易所期货合约资料及交易数据,可支持套利计算、程序化交易的数据结构;自有数据,包括研究所报告、理财产品等。获取以上类型的资讯数据源。涵盖股票、公司、债券、基金、货币、指数、理财、期货现货、期权、资讯等多个类别,并且不断引入特色资讯数据,进一步提升数据质量和数据全面性。
58.进一步地,步骤s101包括:
59.获取资讯数据源,所述资讯数据源包括结构化数据源、非结构化数据源及半结构化数据源。
60.本实施例中,该资讯数据源为各类内部以及外部数据源,主要包括结构化数据源、非结构化数据源、半结构化数据源。结构化数据源包括基础数据、行情数据、宏观数据、企业数据、财务数据、舆情数据等;非结构化数据源包括公告、研报、金融文档、音视频资料等;半结构化数据源包括数据文件和日志文件。
61.进一步地,步骤s101还包括:
62.获取资讯数据源,所述资讯数据源包括结构化数据源、非结构化数据源及半结构化数据源;
63.将所述结构化数据源、非结构化数据源及半结构化数据源输入元数据库;
64.利用etl数据处理模型中的kettle执行器访问所述元数据库,以对所述资讯数据源进行数据清洗及转换,得到目标资讯数据。
65.本实施例中,该资讯数据源为各类内部以及外部数据源,主要包括结构化数据源、非结构化数据源、半结构化数据源。结构化数据源包括基础数据、行情数据、宏观数据、企业数据、财务数据、舆情数据等;非结构化数据源包括公告、研报、金融文档、音视频资料等;半结构化数据源包括数据文件和日志文件。
66.将该资讯数据源输入元数据库,元数据库是用来存储数据处理模型需要用到的基础数据;
67.利用etl数据处理模型中的kettle执行器访问元数据库,kettle执行器是基于kettle扩展的,在管理界面的etl模型配置菜单中可支持新建kettle执行器、上传/下载/发布脚本、调试运行、查看操作日志和报错日志等,最终利用kettle执行器对所述资讯数据源进行数据清洗及转换得到目标资讯数据。
68.本实施例中,步骤s101还包括:
69.所述元数据库包括数据源配置模块、数据字典模块和数据血缘管理模块。
70.本实施例中,将所述资讯数据源输入元数据库,该元数据库包括数据源配置模块、数据字典模块和数据血缘管理模块。同时在元数据库中建立不同类别的数据建立统一的命名规范,从而起到“见名知义”的效果,下游使用数据的时候,根据数据表的名称就能大致定位表的用途,减少数据查找和数据定位耗费的人力成本。
71.本实施例中,步骤s101还包括:
72.基于quartz方法建立集群调度中心模块;
73.根据所述集群调度中心模块中的负载均衡机制对多个所述kettle执行器进行打分,得到多个kettle执行器分数信息;
74.利用所述集群调度中心模块读取多个所述etl数据处理模型的定时任务信息,根据所述定时任务信息和所述kettle执行器分数信息生成调度任务以及待使用kettle执行器;
75.向所述待使用kettle执行器发送所述调度任务。
76.本实施例中,集群调度中心是基于quartz实现的,该集群调度中心的架构支持调度服务的水平扩展,实现调度服务的高可用性;
77.由于etl数据处理模型的任务调度执行过程具有内存及cpu消耗密集型的特点,传统负载均衡策略(分发、随机、hash等)在此场景效果较差,往往容易造成单台执行器负载过高而宕机。通过完善该集群调度中心中的负载均衡机制,结合服务器实时的cpu、内存、并发任务数、线程数、服务延迟等指标对各kettle执行器进行打分,调度时选择得分高的kettle执行器执行,实现准实时特性的负载均衡,kettle执行器支持任务节点弹性扩容缩容,一旦有新执行器机器上线或者下线,下次调度时将会重新分配任务,配合完善的kettle执行器自检、熔断、重启策略,达到调度执行器集群高可靠性与可用性的目的;
78.调度中心通过读取etl(数据抽取转换加载)数据处理模型配置的定时任务信息,定时启动调度任务。一次调度任务包含多个数据处理模型,数据处理模型是整个调度中的最小单位。每个数据处理模型的调度执行均由负载均衡机制计算后选择负载最优也就是打分最高的kettle执行器执行。
79.另外地,可采用分组调度策略,即一个调度任务配置一种定时策略,但该调度任务下涵盖多个etl数据处理模型,当某个调度任务发起时,该任务组下的所有etl数据处理模型均会被调度执行。该调度方式的优势在于降低了系统定时器的数量,避免操作人员频繁配置重复定时任务,节省操作成本,且可降低调度服务定时线程开销。
80.为了避免任务调度过于集中造成执行器集群压力过大问题,在进行定时任务配置时对定时策略进行末位随机算法,使任务执行尽量离散,避免在同一时刻有大量定时任务触发。在任务组内也采用了随机延迟调度的策略,极大的保证了调度集群的稳定性,提高了系统并发调度负载上限,使服务器实现最大化利用。
81.进一步地,步骤s101还包括:
82.利用数据校验模型对所述目标资讯数据进行字段校验、记录行校验及三方校验,得到校验信息,根据所述校验信息生成校验不通过推送信息,所述校验信息包括校验不通过数据量信息、通过率信息及异常数据明细信息;
83.将所述目标资讯数据存储在数据存储模块,所述数据存储模块包括存储模型设计机制以及数据分层设计机制。
84.本实施例中,数据校验在整个资讯数据服务平台建设过程中是尤为重要的一个环节,主要功能包括有校验规则管理、任务管理、通知中心等,该数据校验模型三类核心规则的配置包括字段校验、记录行校验与三方校验,该数据校验模型校验执行结果提供校验不通过数据量、通过率、异常数据明细等信息,提供校验不通过消息推送,便于业务人员及时发现并处理异常数据,所有校验规则均可灵活配置定时执行策略。
85.业务规则的调度周期同模型同步的调度周期,依据业务需求,如行情类数据,一般
使用分段变时配置收盘后每隔半小时调度;证券主表、机构主表等重要的基础数据,源库不定时推送数据的表,一般使用相等间隔调度,配置每5~10分钟调度一次;某些不常更新的表,如常量、行业分类等,一般使用固定时间调度,配置一天调度一次或更久。
86.数据存储层存放经过采集、转换、清洗和整理后产生的各类数据,除了出于系统的效率和应用的支持等目的而产生的少量冗余外,中心数据库中的数据是原始的、精炼的,也不会产生各类二次加工数据。在数据存储层,从技术上主要考虑数据针对业务或数据应用的存储模型设计机制,以及针对数据应用效率的数据分层设计机制。
87.为了保证对异常情况进行及时、准确地预警,通知相关人员第一时间处理,设计了资讯监控终端,对数据清洗转换、数据同步及校验系统进行实时监控。监控维度主要有数据清洗转换同步总量及报警提示、校验系统校验数据总量及异常数量、数据同步实时增量等。
88.步骤s102、将所述目标资讯数据输入语义识别模型进行识别,得到所述目标资讯数据中的语义信息。
89.本实施例中,通过资讯数据结合自然语言处理方面的能力建立语义识别模型,将该目标资讯数据输入语义识别模型进行识别,得到语义信息,主要为文档中出现的各类实体,包括公司、人名、行业、板块等。
90.步骤s103、根据所述语义信息对所述目标资讯数据进行标签分类,得到所述目标资讯数据的标签信息。
91.本实施例中,根据公司、人名、行业、板块等语义信息对该目标资讯数据进行标签分类,得到目标资讯数据的标签信息。
92.进一步地,步骤s103还包括:
93.提取所述语义信息中的至少一个关键词信息,并将所述关键词信息与标签库的标签词匹配,得到相关标签词,所述标签词包括股票、债券、基金、行业、概念、板块或风险事件;
94.对所述相关标签词进行排序,并将排序最靠前的所述相关标签词作为所述目标资讯的标签信息。
95.本实施例中,工作人员在根据当前语义信息中的文本(包含标题、正文)调用,通过云端关键词提取api,进行内容关键词提取,当关键词提取成功后得到该关键词信息,根据关键词与标签库的多级标签词(标签词包括但不限于股票、债券、基金、行业、概念、板块或风险事件)进行从精确到模糊的匹配规则,精确匹配分数翻倍,匹配成功后按照关键词的得分计算每个匹配出来的标签词的总分,进行得分排序,根据排序的结果,将排名最靠前的标签词作为该目标资讯数据的关键词信息。
96.步骤s104、利用所述标签信息以及预设标签告警条件对所述目标资讯数据进行预警,在所述目标资讯数据达到所述预设标签告警条件时,生成告警提示,并将所述告警提示发送至用户终端。
97.本实施例中,利用该标签信息以及用户预设标签告警条件对该目标资讯数据进行预警,在该目标资讯数据达到预设标签告警条件时,生成告警提示,并将所述告警提示发送至对应的用户终端。
98.进一步地,步骤s104还包括:
99.所述预设告警条件包括股票告警条件、债券告警条件、基金告警条件、行业告警条
件、概念告警条件、板块告警条件或风险事件告警条件;所述告警提示包括股票告警提示、债券告警提示、基金告警提示、行业告警提示、概念告警提示、板块告警提示或风险事件告警提示。
100.本实施例中,用户预设告警条件可以预设包括但不限于股票告警条件、债券告警条件、基金告警条件、行业告警条件、概念告警条件、板块告警条件或风险事件告警条件;该告警提示包括股票告警提示、债券告警提示、基金告警提示、行业告警提示、概念告警提示、板块告警提示或风险事件告警提示。
101.本发明通过对各种投资类资讯、产品资讯、服务资讯的整合,实现资讯数据的统一管理。同时,通过对数据的自动采集、抽取、校验,将第三方数据按照统一的数据模型和规范转换为有用的、可靠的信息。能够消除数据孤岛并实现集中化的数据管理。在数据资产化的基础之上,借鉴专业的投资研究、运营管理、风险管理、舆情风控理论,对数据进行深入挖掘,建立特有的资讯数据分析模型,提供风险监控、机会发现、投资决策等多元化的服务支持。资讯整合处理之后进行标签化处理,通过预设告警条件向指定用户发送告警提示,以能够达到个性化定制资讯预警的目的。对规范后多源异构的资讯数据源进行标签化处理,设置预设标签告警条件对目标资讯数据进行告警提示,并将告警提示发送给指定用户,解决了资讯数据预警过程准确性低、体验效果差等问题。
102.请参阅图2,图2是本技术的实施例提供一种基于资讯数据的预警模型的示意性框图。
103.如图所示,该基于资讯数据的预警装置包括:
104.获取整合模块10,用于获取资讯数据源并对所述资讯数据源进行整合处理得到目标资讯数据;
105.语义识别模块20,用于将所述目标资讯数据输入语义识别模型进行识别,得到所述目标资讯数据中的语义信息;
106.标签分类模块30,用于根据所述语义信息对所述目标资讯数据进行标签分类,得到所述目标资讯数据的标签信息;
107.告警提示模块40,用于利用所述标签信息以及预设标签告警条件对所述目标资讯数据进行预警,在所述目标资讯数据达到所述预设标签告警条件时,生成告警提示,并将所述告警提示发送至用户终端。
108.进一步地,所述获取整合模块10包括:
109.数据获取单元,用于获取资讯数据源,所述资讯数据源包括结构化数据源、非结构化数据源及半结构化数据源;将所述结构化数据源、非结构化数据源及半结构化数据源输入元数据库;利用etl数据处理模型中的kettle执行器访问所述元数据库,以对所述资讯数据源进行数据清洗及转换,得到目标资讯数据。所述元数据库包括数据源配置模块、数据字典模块和数据血缘管理模块。
110.集群调度单元,用于基于quartz方法建立集群调度中心模块;根据所述集群调度中心模块中的负载均衡机制对多个所述kettle执行器进行打分,得到多个kettle执行器分数信息;利用所述集群调度中心模块读取多个所述etl数据处理模型的定时任务信息,根据所述定时任务信息和所述kettle执行器分数信息生成调度任务以及待使用kettle执行器;向所述待使用kettle执行器发送所述调度任务。
111.数据校验单元,用于利用数据校验模型对所述目标资讯数据进行字段校验、记录行校验及三方校验,得到校验信息,根据所述校验信息生成校验不通过推送信息,所述校验信息包括校验不通过数据量信息、通过率信息及异常数据明细信息;将所述目标资讯数据存储在数据存储模块,所述数据存储模块包括存储模型设计机制以及数据分层设计机制。
112.进一步地,标签分类模块30包括:
113.标签匹配单元,用于提取所述语义信息中的至少一个关键词信息,并将所述关键词信息与标签库的标签词匹配,得到相关标签词,所述标签词包括股票、债券、基金、行业、概念、板块或风险事件;对所述相关标签词进行排序,并将排序最靠前的所述相关标签词作为所述目标资讯的标签信息。
114.请参阅图3,图3是本技术的实施例提供的一种计算机设备的结构示意性框图。该计算机设备可以是服务器。
115.参阅图3,该计算机设备包括通过模型总线连接的处理器、存储器和网络接口,其中,存储器可以包括非易失性存储介质和内存储器。
116.非易失性存储介质可存储操作模型和计算机程序。该计算机程序包括程序指令,该程序指令被执行时,可使得处理器执行任意一种基于资讯数据的预警方法。
117.处理器用于提供计算和控制能力,支撑整个计算机设备的运行。
118.内存储器为非易失性存储介质中的计算机程序的运行提供环境,该计算机程序被处理器执行时,可使得处理器执行任意一种基于资讯数据的预警方法。
119.该网络接口用于进行网络通信,如发送分配的任务等。本领域技术人员可以理解,图3中示出的结构,仅仅是与本技术方案相关的部分结构的框图,并不构成对本技术方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
120.应当理解的是,处理器可以是中央处理单元(central processing unit,cpu),该处理器还可以是其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现场可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
121.本技术的实施例中还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序中包括程序指令,所述处理器执行所述程序指令,实现本技术实施例提供的任一项基于资讯数据的预警方法。
122.其中,所述计算机可读存储介质可以是前述实施例所述的计算机设备的内部存储单元,例如所述计算机设备的硬盘或内存。所述计算机可读存储介质也可以是所述计算机设备的外部存储设备,例如所述计算机设备上配备的插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)等。
123.以上所述,仅为本技术的具体实施方式,但本技术的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本技术揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本技术的保护范围之内。因此,本技术的保护范围应以权利要求的保护范围为准。
技术特征:
1.一种基于资讯数据的预警方法,其特征在于,所述基于资讯数据的预警方法包括:获取资讯数据源并对所述资讯数据源进行整合处理得到目标资讯数据;将所述目标资讯数据输入语义识别模型进行识别,得到所述目标资讯数据中的语义信息;根据所述语义信息对所述目标资讯数据进行标签分类,得到所述目标资讯数据的标签信息;利用所述标签信息以及预设标签告警条件对所述目标资讯数据进行预警,在所述目标资讯数据达到所述预设标签告警条件时,生成告警提示,并将所述告警提示发送至用户终端。2.根据权利要求1所述的基于资讯数据的预警方法,其特征在于,所述获取资讯数据源并对所述资讯数据源进行整合处理得到目标资讯数据,包括:获取资讯数据源,所述资讯数据源包括结构化数据源、非结构化数据源及半结构化数据源;将所述结构化数据源、非结构化数据源及半结构化数据源输入元数据库;利用etl数据处理模型中的kettle执行器访问所述元数据库,以对所述资讯数据源进行数据清洗及转换,得到目标资讯数据。3.根据权利要求2所述的基于资讯数据的预警方法,其特征在于,所述元数据库包括数据源配置模块、数据字典模块和数据血缘管理模块。4.根据权利要求2所述的基于资讯数据的预警方法,其特征在于,所述利用etl数据处理模型中的kettle执行器访问所述元数据库,以对所述资讯数据源进行数据清洗及转换,得到目标资讯数据之前,还包括:基于quartz方法建立集群调度中心模块;根据所述集群调度中心模块中的负载均衡机制对多个所述kettle执行器进行打分,得到多个kettle执行器分数信息;利用所述集群调度中心模块读取多个所述etl数据处理模型的定时任务信息,根据所述定时任务信息和所述kettle执行器分数信息生成调度任务以及待使用kettle执行器;向所述待使用kettle执行器发送所述调度任务。5.根据权利要求1所述的基于资讯数据的预警方法,其特征在于,所述获取资讯数据源并对所述资讯数据源进行整合处理得到目标资讯数据之后,还包括:利用数据校验模型对所述目标资讯数据进行字段校验、记录行校验及三方校验,得到校验信息,根据所述校验信息生成校验不通过推送信息,所述校验信息包括校验不通过数据量信息、通过率信息及异常数据明细信息;将所述目标资讯数据存储在数据存储模块,所述数据存储模块包括存储模型设计机制以及数据分层设计机制。6.根据权利要求1所述的基于资讯数据的预警方法,其特征在于,所述根据所述语义信息对所述目标资讯数据进行标签分类,得到所述目标资讯数据的标签信息,包括:提取所述语义信息中的至少一个关键词信息,并将所述关键词信息与标签库的标签词匹配,得到相关标签词,所述标签词包括股票、债券、基金、行业、概念、板块或风险事件;对所述相关标签词进行排序,并将排序最靠前的所述相关标签词作为所述目标资讯的
标签信息。7.根据权利要求1所述的基于资讯数据的预警方法,其特征在于,所述预设告警条件包括股票告警条件、债券告警条件、基金告警条件、行业告警条件、概念告警条件、板块告警条件或风险事件告警条件;所述告警提示包括股票告警提示、债券告警提示、基金告警提示、行业告警提示、概念告警提示、板块告警提示或风险事件告警提示。8.一种基于资讯数据的预警装置,其特征在于,所述基于资讯数据的预警装置包括:获取整合模块,用于获取资讯数据源并对所述资讯数据源进行整合处理得到目标资讯数据;语义识别模块,用于将所述目标资讯数据输入语义识别模型进行识别,得到所述目标资讯数据中的语义信息;标签分类模块,用于根据所述语义信息对所述目标资讯数据进行标签分类,得到所述目标资讯数据的标签信息;告警提示模块,用于利用所述标签信息以及预设标签告警条件对所述目标资讯数据进行预警,在所述目标资讯数据达到所述预设标签告警条件时,生成告警提示,并将所述告警提示发送至用户终端。9.一种计算机设备,其特征在于,所述计算机设备包括存储器和处理器;所述存储器,用于存储计算机程序;所述处理器,用于执行所述计算机程序并在执行所述计算机程序时实现如权利要求1至8中任一项所述的基于资讯数据的预警方法。10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器实现如权利要求1至7中任一项所述的基于资讯数据的预警方法。
技术总结
本申请提供了一种基于资讯数据的预警方法,通过获取资讯数据源并对所述资讯数据源进行整合处理得到目标资讯数据;将所述目标资讯数据输入语义识别模型进行识别,得到所述目标资讯数据中的语义信息;根据所述语义信息对所述目标资讯数据进行标签分类,得到所述目标资讯数据的标签信息;利用所述标签信息以及预设标签告警条件对所述目标资讯数据进行预警,在所述目标资讯数据达到所述预设标签告警条件时,生成告警提示,并将所述告警提示发送至用户终端。本发明对规范后多源异构的资讯数据源进行标签化处理,设置预设标签告警条件对目标资讯数据进行告警提示,并将告警提示发送给指定用户,解决了资讯数据预警过程准确性低、体验效果差等问题。验效果差等问题。验效果差等问题。
技术研发人员:张欢 魏甜甜
受保护的技术使用者:深圳智通财经信息科技服务有限公司
技术研发日:2023.04.27
技术公布日:2023/8/4
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/