一种基于多源数据识别园区内重点产业链节点的方法、存储介质及系统与流程

未命名 10-09 阅读:85 评论:0


1.本发明涉及数据处理技术领域,特别涉及一种基于多源数据识别园区内重点产业链节点的方法、存储介质及系统。


背景技术:

2.产业集群是以中心产品为主导,以区域为聚集地,企业按产业链条的联系成群聚集在一起的现象,如何通过发展产业集群来提升区域经济竞争力是经济发展的战略性问题。园区是发展产业集群的重要环节之一,企业以产业链形式在园区中聚集,提升区域经济竞争力。园区招商作为园区建设发展的主要途径,对园区内的产业集聚和产业最终发展导向具有重要作用,但现阶段缺乏为园区招商过程中的企业筛选引入提供参考的手段,难以识别园区内需引入企业的重点产业链节点,导致园区招商目标与园区内的产业链适配度低,难以实现园区稳定有序的长期发展。


技术实现要素:

3.本发明要解决的技术问题是如何识别园区内需引入企业的重点产业链节点。
4.为解决上述技术问题,本发明提供一种基于多源数据识别园区内重点产业链节点的方法,包括如下步骤:
5.s1.从不同数据系统获取园区内各个企业的多源数据,对园区内各个企业的多源数据分别进行融合对齐处理,其中,所述多源数据包括园区企业清单、企业基础信息数据和电力合同数据;
6.s2.根据所述多源数据分析园区内各个企业所属的产业链及在产业链中所处的产业链节点;
7.s3.根据所述多源数据计算园区内各个企业的多项重点识别指标,所述重点识别指标包括园区内各个企业的竞争水平度数、月均用电量超容值、用电业扩报装需求得分以及新入园企业的日均用电量超容值,具体包括如下步骤s31、s32、s33和s34;
8.s31.基于复杂网络模型,根据园区企业清单生成对应园区内各个企业的网络节点,然后根据网络节点和园区内各个企业之间的相似度构建企业相似网络,再根据所述企业相似网络分析出园区内各个企业的竞争水平度数,其中,园区内各个企业之间的相似度具体根据园区内各个企业的企业基础信息数据计算得出;
9.s32.根据园区内各个企业的电力合同数据计算园区内各个企业的理论月均用电量,获取园区内各个企业的实际月均用电量,将园区内各个企业的实际月均用电量与理论月均用电量进行比较得到园区内各个企业的月均用电量超容值;
10.s33.根据园区内各个企业在一定时间范围内的用电量或年最大负荷量,预测园区内各个企业在未来预设时间内的预计用电量和预计年最大负荷量,将预测结果分别与当前年用电量、当前年最大负荷量进行比较,根据比较结果分析园区中各个企业的用电业扩报
装需求得分;
11.s34.根据园区企业清单和园区内各个企业的电力合同数据识别新入园企业,并根据电力合同数据计算新入园企业的理论日均用电量,获取新入园企业的实际日均用电量,将新入园企业的实际日均用电量与理论日均用电量进行比较得到新入园企业的日均用电量超容值;
12.s4.根据园区内各个企业的各项重点识别指标,对园区内各个企业所处的产业链节点进行聚类分析及重点产业链节点识别,具体包括如下步骤s41、s42和s43;
13.s41.计算各个产业链节点的各项重点识别指标均值;
14.s42.根据园区内各个企业的各项重点识别指标均值对园区内各个企业所属的产业链节点进行聚类分析,从而将所有产业链节点划分为预设数量的不同类别;
15.s43.获取聚类分析后每个类别中的所有产业链节点的各项重点识别指标均值,根据获取结果对每个类别进行重点产业链节点识别并生成对应的可视化标签。
16.优选地,所述步骤s42包括:
17.s421.根据业务需求先初拟最终需要对所有产业链节点进行聚类的类别个数;
18.s422.将各个类别的簇心随机定义在不同的产业链节点上;
19.s423.计算非簇心产业链节点到各个簇心的连续型分类因子距离;
20.s424.计算非簇心产业链节点到各个簇心的离散型分类因子距离;
21.s425.根据所述连续型分类因子距离和所述离散型分类因子距离计算非簇心产业链节点到各个簇心的距离;
22.s426.找出每个非簇心产业链节点到各个簇心的距离当中的最小值,然后将每个非簇心产业链节点关联到距离最近的簇心所属的类别上;
23.s427.将全部非簇心产业链节点关联到距离最近的簇心所属的类别上之后,将每个簇心与其所关联的所有非簇心产业链节点形成一个簇;
24.s428.不断重复上述步骤s423至s427,直至在确定所有簇的新簇心时,所有新簇心的变化距离都不小于预设阈值,再以所有新簇心及其所关联的非簇心产业链节点作为最终聚类结果,形成对应的类别。
25.优选地,所述步骤s31中,运用余弦相似度算法计算得出园区内各个企业之间的相似度,具体计算公式如下:
[0026][0027]
其中,cos(θ)表示不同企业之间的相似度;d表示对应企业基础信息数据的维度数;xi、yi分别表示不同企业的第i个维度数据。
[0028]
优选地,所述步骤s31中,若两个企业之间的相似度超过一定阈值,则在这两个企业分别对应的两个网络节点之间建立起一条连接边,使得所有网络节点及网络节点之间建立起的连接边构建成为企业相似网络。
[0029]
优选地,所述步骤s31中,根据企业相似网络中每个网络节点的连接边数量分析出园区内各个企业的竞争水平度数。
[0030]
优选地,所述步骤s43中,根据每个类别中的所有产业链节点的重点产业链节点综
合评价指数、企业月均用电量超容值均值、企业用电业扩报装需求得分均值、新入园企业日均用电量超容值均值计算重点产业链节点综合评价指数,其中,企业竞争水平度数均值越小、企业月均用电量超容值均值越大、企业用电业扩报装需求得分均值越大、新入园企业的日均用电量超容值均值越小,则对应类别的重点产业链节点综合评价指数越大,越要将该类别中的产业链节点识别为重点产业链节点。
[0031]
本发明还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行是,实现如上所述的基于多源数据识别园区内重点产业链节点的方法中的步骤。
[0032]
本发明还提供一种基于多源数据识别园区内重点产业链节点的系统,包括相互连接的处理器和如上所述的计算机可读存储介质。
[0033]
本发明具有以下有益效果:本发明根据融合对齐处理后的多源数据计算园区内各个企业的多项重点识别指标,然后根据园区内各个企业的各项重点识别指标对园区内各个企业对应的产业链节点进行聚类分析及重点产业链节点识别,这样就可识别出园区内需引入企业的重点产业链节点,为园区招商过程中的企业筛选引入提供参考,提高园区招商目标与园区内的产业链适配度,以实现园区稳定有序的长期发展。
附图说明
[0034]
图1是基于多源数据识别园区内重点产业链节点的方法流程示意图。
具体实施方式
[0035]
以下结合具体实施方式对本发明创造作进一步详细说明。
[0036]
本实施例提供一种基于多源数据识别园区内重点产业链节点的系统,该系统包括相互连接的计算机可读存储介质和处理器,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现如图1所示的基于多源数据识别园区重点产业链节点的方法,该方法包括如下步骤s1、s2、s3、s4。
[0037]
s1.从不同数据系统获取园区内各个企业的多源数据,对园区内各个企业的多源数据分别进行融合对齐处理,其中,多源数据包括园区企业清单、企业基础信息数据和电力合同数据。
[0038]
本实施例中,利用信息采集技术从不同数据系统获取园区内各个企业的多源数据,多源数据包括来自园区管理系统的园区企业清单、来自企业信息查询平台的企业基础信息数据和来自电力系统的电力合同数据,其中,园区企业清单是指记录有园区内所有企业名称的清单,企业基础信息数据包括企业名称、统一社会信用代码、经营范围以及能反映企业性质的年均用电量、企业规模、注册金额、参保人数等,电力合同数据包括用电户档案、电费电量、业扩报装数据等。需要说明的是,业扩报装是指电网系统受理用电户申请,依据用电户的用电需求并结合供电网络的状况指定安全、经济、合理的供电方案,业扩报装数据包含有电网额定功率、用电户申请的用电时长、用电户申请的用电合同容量。
[0039]
需要说明的是,在不同数据系统中,同一个企业的相同数据在记录方式上可能会存在差异,导致出现不同数据系统之间的相数据无法匹配的情况,例如某个企业在企业信息查询平台上的企业名称与其在电力系统上的企业名称有所差异,这样就无法将该企业的
企业基础信息数据与电力合同数据相互匹配。因此,从不同数据系统获取园区内各个企业的多源数据之后,运用语义识别技术对园区内各个企业的多源数据分别进行融合对齐处理,使同一个企业的来自不同数据系统的相同数据能够相互匹配。
[0040]
s2.根据多源数据分析园区内各个企业所属的产业链及在产业链中所处的产业链节点。
[0041]
在对获取到的多源数据进行融合对齐处理后,由于多源数据当中包括企业基础信息数据,而企业基础信息数据包括经营范围信息,故系统可根据园区内各个企业的经营范围信息,运用语义识别技术分析园区内各个企业所属的产业链及在产业链中所处的产业链节点。例如,企业甲的经营范围信息中包含有“手机销售”字眼,则运用语义识别技术可分析出企业甲属于手机产业链,且企业甲在手机产业链中处于对应“手机销售”的产业链节点;企业乙的经营范围信息中包含有“汽车制造、销售”字眼,则运用语义识别技术可分析出企业乙属于汽车产业链,且企业乙在汽车产业链中处于对应“汽车制造”及“汽车销售”的产业链节点。
[0042]
s3.根据多源数据计算园区内各个企业的多项重点识别指标,重点识别指标包括园区内各个企业的竞争水平度数、月均用电量超容值、用电业扩报装需求得分以及新入园企业的日均用电量超容值。
[0043]
在对获取到的多源数据进行融合对齐处理后,根据多源数据计算园区内各个企业的多项重点识别指标,其中,重点识别指标是指用于识别需引入企业的重点产业链节点的指标,具体包括园区内各个企业的竞争水平度数、月均用电量超容值、用电业务报装需求得分以及新入园企业的日均用电量超容值。计算园区内各个企业的多项重点识别指标具体包括如下步骤s31、s32、s33和s34。
[0044]
s31.基于复杂网络模型,根据园区企业清单生成对应园区内各个企业的网络节点,然后根据网络节点和园区内各个企业之间的相似度构建企业相似网络,再根据企业相似网络分析出园区内各个企业的竞争水平度数,其中,园区内各个企业之间的相似度具体根据园区内各个企业的企业基础信息数据计算得出。
[0045]
复杂网络理论提出自然界和人类社会存在着各种各样的复杂网络,复杂网络是指具有自组织、自相似、吸引子、小世界、无标度当中的部分或全部性质的网络,复杂网络模型是指能够基于复杂网络理论构建出复杂网络的模型。本实施例基于复杂网络模型,根据园区企业清单和园区内各个企业之间的相似度构建出企业相似网络,用以分析园区内各个企业的竞争水平度数,具体包括如下步骤s311、s312和s313。
[0046]
s311.根据园区企业清单生成企业相似网络中分别对应园区内各个企业的多个网络节点,这样企业相似网络中的网络节点数量等于园区内的企业数量。
[0047]
s312.根据网络节点和园区内各个企业之间的相似度构建企业相似网络。
[0048]
本实施例中,园区内各个企业之间的相似度具体根据园区内各个企业的企业基础信息数据计算得出。由于园区内各个企业的企业基础信息数据包括企业名称、统一社会信用代码以及能反映企业性质的年均用电量、企业规模、注册金额、参保人数等,故系统可根据园区内各个企业的企业基础信息数据当中能反映企业性质的年均用电量、企业规模、注册金额和参保人数,运用余弦相似度算法计算得出园区内各个企业之间的相似度,具体计算公式如下:
[0049][0050]
其中,cos(θ)表示不同企业之间的相似度,相似度越大,意味着不同企业之间竞争越大;d表示对应企业基础信息数据的维度数,本实施例具体为4;xi、yi分别表示不同企业的第i个维度数据,其中维度数据是指年均用电量、企业规模、注册金额或参保人数,例如,xi表示企业甲的第i个维度数据,yi表示企业乙的第i个维度数据,对应地,企业甲的第1个维度数据x1是指企业甲的年均用电量,企业乙的第1个维度数据y1是指企业乙的年均用电量,企业甲的第2个维度数据x2是指企业甲的企业规模,企业乙的第2个维度数据y2是指企业乙的企业规模,企业甲的第3个维度数据x3是指企业甲的注册金额,企业乙的第3个维度数据y3是指企业乙的注册金额,企业甲的第4个维度数据x4是指企业甲的参保人数,企业乙的第4个维度数据y4是指企业乙的参保人数。
[0051]
在计算出园区内各个企业之间的相似度之后,若两个企业之间的相似度超过一定阈值(例如0.7),则表示这两个企业为相似企业,由此可在这两个企业分别对应的两个网络节点之间建立起一条连接边,这样按照园区内各个企业之间的相似度,在相似度超过一定阈值的网络节点之间都建立起连接边之后,所有网络节点及网络节点之间建立起的连接边就构建成为企业相似网络。
[0052]
s313.根据企业相似网络分析出园区内各个企业的竞争水平度数。
[0053]
在企业相似网络中,由于网络节点之间的连接边反映了企业之间的相似度超过一定阈值,故每个网络节点所拥有的连接边数量反映了网络节点所对应的企业在园区中存在的竞争企业数量,即每个网络节点所拥有的连接边数量反映了其在园区中的竞争水平度数,因此,可根据企业相似网络中每个网络节点的连接边数量分析出园区内各个企业的竞争水平度数。企业的竞争水平度数越大,意味着该企业所处的产业链节点在园区内的竞争程度越高,越不需要引入企业。
[0054]
s32.根据园区内各个企业的电力合同数据计算园区内各个企业的理论月均用电量,获取园区内各个企业的实际月均用电量,将园区内各个企业的实际月均用电量与理论月均用电量进行比较得到园区内各个企业的月均用电量超容值。
[0055]
由于园区内各个企业的电力合同数据包括用电户档案、电费电量、业扩报装数据等,而业扩报装数据包含有电网额定功率、用电户申请的用电时长、用电户申请的用电合同容量,故根据园区内各个企业的电力合同数据可计算园区内各个企业的理论月均用电量,计算公式具体如下:
[0056][0057]
其中,w

表示企业按照电力合同数据计算的理论月均用电量;p为电力合同数据当中的电网额定功率;t为电力合同数据当中的用电户申请的用电时长,计算单位为月;p
max
为电力合同数据当中的用电户申请的用电合同容量;为功率因数,取决于电网功率因数标准,工业用电的功率因数一般为0.85~0.9,本实施例具体取值为0.9。
[0058]
然后系统根据园区内各个企业的电力合同数据当中的电费电量获取园区内各个企业的实际用电量,并结合园区内各个企业的实际用电时长计算园区内各个企业的实际月
均用电量w,例如实际用电量为w0,实际用电时长为t0,则实际月均用电量再将园区内各个企业的实际月均用电量w与理论月均用电量w

进行比较得到园区内各个企业的月均用电量超容值η,具体公式为
[0059]
月均用电量超容值η反映了园区内各个企业的用电量使用状态,企业的月均用电量超容值η越大,意味着该企业所处的产业链节点在园区内的市场空间越大,越需要引入企业。
[0060]
s33.根据园区内各个企业在一定时间范围内的用电量与年最大负荷量,预测园区内各个企业在未来预设时间内的预计用电量和预计年最大负荷量,将预测结果分别与当前年用电量、当前年最大负荷量进行比较,根据比较结果分析园区中各个企业的用电业扩报装需求得分。
[0061]
企业的用电业扩报装需求是衡量企业未来用电需求的重要衡量指标,而园区内各个企业的未来用电需求可以很好地反映企业的生产需求,因此本实施例通过对园区内各个企业的用电业扩报装需求进行预测来分析园区的发展前景,具体包括如下步骤s331和s332。
[0062]
s331.基于灰色verhulst模型预测园区内各个企业在未来预设时间内(例如未来3年)的预计用电量和预计年最大负荷量。
[0063]
第一步,先获取园区内各个企业在一定时间范围内(例如近20年来)的用电量与年最大负荷量,然后以园区内各个企业在一定时间范围内的用电量与年最大负荷量为基础分别建立原始数据序列,需要说明的是,以用电量为基础所建立的原始数据序列与以年最大负荷量为基础所建立的原始数据序列相同,具体如下:
[0064]
x0={x0(1),x0(2),x0(3),...,x0(u)};
[0065]
其中,x0表示以园区内各个企业在一定时间范围内的用电量或年最大负荷量为基础所建立的原始数据序列;x0(1)表示第1年前的用电量或年最大负荷量,x0(2)表示第2年前的用电量或年最大负荷量,x0(3)表示第3年前的用电量或年最大负荷量,

,x0(u)表示第u年前的用电量或年最大负荷量,本实施例中,u具体为20。
[0066]
第二步,对原始数据序列中的数据进行累加处理并生成紧邻均值序列。
[0067]
对原始数据序列中的数据进行累加处理的公式如下:
[0068][0069]
其中,x0(t

)表示园区内各个企业在第t

年前的用电量或年最大负荷量;x
(1)
(t)表示园区内各个企业在第t年前的用电量或年最大负荷量的累加,t=1,2,3,

,u,例如:
[0070]
t=1时,
[0071]
t=2时,
[0072]
t=3时,
[0073]
……
[0074]
t=u时,
[0075]
然后根据上述累加处理后的结果生成累加序列x
(1)
,具体如下:
[0076][0077]
然后生成累加序列x
(1)
的紧邻均值序列z
(1)
,具体如下:
[0078]z(1)
={z
(1)
(2),z
(1)
(3),z
(1)
(4),...,z
(1)
(t)};
[0079]
其中:
[0080]
表示第2年的用电量或年最大负荷量通过累加计算之后,相邻2个年份数据的平均值;
[0081]
表示第3年的用电量或年最大负荷量通过累加计算之后,相邻2个年份数据的平均值;
[0082]
表示第4年的用电量或年最大负荷量通过累加计算之后,相邻2个年份数据的平均值;
[0083]
……
[0084]
表示第t年的用电量或年最大负荷量通过累加计算之后,相邻2个年份数据的平均值。
[0085]
第三步,建立灰色verhulst模型,基于灰色verhulst模型预测园区内各个企业在未来预设时间内的预计用电量或预计年最大负荷量。
[0086]
利用原始数据序列中的数据和紧邻均值序列z
(1)
中的数据生成灰色verhulst模型函数,具体为:
[0087]
x
(0)
(t)+αz
(1)
(t)=β(z
(1)
(t))2;
[0088]
其中,α,β是待定参数。
[0089]
灰色verhulst模型函数的微分方程为:
[0090]
其中,t为时间。
[0091]
微分方程的解为:
[0092][0093]
根据微分方程的解,得到灰色verhulst模型的时间响应序列为:
[0094][0095]
由于x
(1)
是由x
(0)
累加得到的,因此可以通过对x
(1)
(t+1)进行累减得到x
(0)
的预测值,即得到灰色verhulst模型为:
[0096]
x
(0)
(t+1)=x
(1)
(t+1)-x
(1)
(t)。
[0097]
然后就可利用灰色verhulst模型预测园区内各个企业在未来预设时间内(例如未来3年)的预计用电量和预计年最大负荷量。
[0098]
需要说明的是,待定参数α,β具体利用最小二乘法计算得到,具体地,将t=2,3,

,u的数据代入上述灰色verhulst模型函数中,得到:
[0099][0100]
将灰色verhulst模型写成矩阵的形式,具体地:
[0101]
令数据向量y=(x
(0)
(2),x
(0)
(3),...,x
(0)
(u))
t

[0102]
令数据矩阵
[0103]
令参数向量μ=(αβ)
t

[0104]
则灰色verhulst模型可以表示为y=bμ,利用最小二乘法求解待定参数α,β为:
[0105]
[α,β]=(b
t
b)-1bt
y。
[0106]
s332.将灰色verhulst模型的预测结果分别与当前年用电量、当前年最大负荷量进行比较,根据比较结果分析园区中各个企业的用电业扩报装需求得分。
[0107]
本实施例中,用于评价企业的业扩报装需求程度的主要指标是年均用电增长率和年均最大负荷增长率,其中,年均用电增长率由灰色verhulst模型预测得到的预计用电量与当前年用电量进行比较得到,年均最大负荷增长率由灰色verhulst模型预测得到的预计年最大负荷量与当前年最大负荷量进行比较得到。其中,系统根据园区内各个企业的电力合同数据当中的电费电量就能获取园区内各个企业的当前年用电量和当前年最大负荷量。此外,用于评价企业的业扩报装需求程度的指标还有另外两个,分别是当前负载率与未来3年预计负载率,其中当前负载率由企业的年最大负荷量与企业的用电合同容量进行比较得到,未来3年预计负载率由企业未来1、2、3年的预计年最大负荷量与企业的用电合同容量进行比较得到。这四项指标的计算公式具体如下:
[0108][0109]
其中,g
rate1
是企业的年均用电增长率,g
rate2
是企业的年均最大负荷增长率;l
rate1
是企业的当前负载率,l
rate2
是企业未来3年预计负载率;q0是企业的当前年用电量,q1、q2、q3分别是由灰色verhulst模型预测得到的企业未来1、2、3年的预计用电量;p0是企业的当前年最大负荷量,p1、p2、p3分别是由灰色verhulst模型预测得到的企业未来1、2、3年的预计年最大负荷量;p
max
是企业当前的用电合同容量。
[0110]
在计算得到企业的年均用电增长率g
rate1
、年均最大负荷增长率g
rate2
、当前负载率l
rate1
、未来3年预计负载率l
rate2
这四项指标之后,利用熵权法对这四项指标进行加权综合计算,得到企业的用电业扩报装需求得分,具体步骤如下:
[0111]
第一步,对年均用电增长率g
rate1
、年均最大负荷增长率g
rate2
、当前负载率l
rate1
、未来3年预计负载率l
rate2
这四项指标进行标准化处理,具体先以这四项指标的具体值生成指标值序列x={x1,x2,x3,x4};其中,x1,x2,x3,x4分别表示年均用电增长率g
rate1
、年均最大负荷增长率g
rate2
、当前负载率l
rate1
、未来3年预计负载率l
rate2
的指标值。
[0112]
然后进行标准化处理,具体公式如下:
[0113][0114]
其中,zj表示对各项指标值进行标准化处理的结果;xj表示指标值序列x中的第j项指标值,j=1,2,3,4;min{x}表示指标值序列x中的最小指标值,max{x}表示指标值序列x中的最大指标值。
[0115]
第二步,计算各项指标值的比重pj,具体公式为
[0116]
第三步,计算各项指标值的标准信息熵ej,具体公式为
[0117]
第四步,计算各项指标值的信息效用值dj,具体公式为dj=1-ej。
[0118]
第五步,将各项指标值的信息效用值归一化,得到各项指标的熵权wj,具体公式为
[0119]
将j=1,2,3,4分别代入第五步的公式后,可计算得到第1项指标年均用电增长率g
rate1
的熵权w1,第2项指标年均最大负荷增长率g
rate2
的熵权w2,第3项指标当前负载率l
rate1
的熵权w3,第4项指标未来3年预计负载率l
rate2
的熵权w4,然后进行加权计算可得到企业的用电业扩报装需求得分f=w1×grate1
+w2×grate2
+w3×
l
rate1
+w4×
l
rate2

[0120]
企业的用电业扩报装需求得分反映了园区内各个企业的未来发展前景,企业的业扩报装需求得分越高,意味着该企业所处的产业链节点在园区内的未来发展前景越好,越需要引入企业。
[0121]
s34.根据园区企业清单和园区内各个企业的电力合同数据识别新入园企业,并根据电力合同数据计算新入园企业的理论日均用电量,获取新入园企业的实际日均用电量,将新入园企业的实际日均用电量与理论日均用电量进行比较得到新入园企业的日均用电量超容值,具体包括如下步骤s341、s342和343。
[0122]
s341.先根据园区企业清单对接园区内各个企业的电力合同数据,获取电网系统向园区内各个企业的起始送电时间,将该起始送电时间视为企业的入园时间,并把入园时间在最近3个月内的企业识别为新入园企业。
[0123]
s342.根据园区内各个企业的电力合同数据计算新入园企业的理论日均用电量,计算公式具体如下:
[0124][0125]
其中,w

表示新入园企业按照电力合同数据计算的理论日均用电量;p为电力合同数据当中的电网额定功率;t

为电力合同数据当中的用电户申请的用电时长,计算单位为日;p
max
为电力合同数据当中的用电户申请的用电合同容量;为功率因数,取决于电网功率因数标准,工业用电的功率因数一般为0.85~0.9,本实施例具体取值为0.9。
[0126]
s343.系统根据新入园企业的电力合同数据当中的电费电量获取新入园企业的实际用电量,并结合新入园企业的入园时间计算新入园企业的实际日均用电量w,例如实际用电量为w0,实际用电时长为t0′
,则实际月均用电量再将园区内各个企业的实际月均用电量w与理论月均用电量w

进行比较得到新入园企业的日均用电量超容值λ,具体公式为
[0127]
新入园企业的日均用电量超容值λ反映了新入园企业所处的产业链节点的进入难度,新入园企业的日均用电量超容值λ越小,意味着新入园企业所处的产业链节点在园区内的进入难度越小,越需要引入企业。
[0128]
s4.根据园区内各个企业的各项重点识别指标,对园区内各个企业所处的产业链节点进行聚类分析及重点产业链节点识别。
[0129]
在计算得到园区内各个企业的竞争水平度数、月均用电量超容值、用电业扩报装需求得分以及新入园企业的日均用电量超容值之后,系统根据这些重点识别指标对园区内各个企业所处的产业链节点进行聚类分析及重点产业链节点识别,具体包括如下步骤s41、s42和s43。
[0130]
s41.计算园区内各个产业链节点的各项重点识别指标均值,具体包括如下步骤s411、s412、s413和s414。
[0131]
s411.计算园区内各个产业链节点各自对应的全部企业的竞争水平度数均值,计算公式具体如下:
[0132][0133]
其中,表示园区内属于第m个产业链节点的全部企业的竞争水平度数均值,m=1,2,3,

,k;k表示园区内产业链节点的数量;c
mi
表示园区内第m个产业链节点中的第i个企业的竞争水平度数,i=1,2,3,

,n;n表示园区内属于第m个产业链节点的企业数量。
[0134]
s412.计算园区内各个产业链节点各自对应的全部企业的月均用电量超容值均值,计算公式具体如下:
[0135][0136]
其中,表示园区内属于第m个产业链节点的全部企业的月均用电量超容值均值,m=1,2,3,

,k;k表示园区内产业链节点的数量;η
mi
表示园区内第m个产业链节点中的第i个企业的月均用电量超容值,i=1,2,3,

,n;n表示园区内属于第m个产业链节点的企业数量。
[0137]
s413.计算园区内各个产业链节点各自对应的全部企业的用电业扩报装需求得分均值,计算公式具体如下:
[0138][0139]
其中,表示园区内属于第m个产业链节点的全部企业的用电业扩报装需求得分均值,m=1,2,3,

,k;k表示园区内产业链节点的数量;f
mi
表示园区内第m个产业链节点中的第i个企业的用电业扩报装需求得分,i=1,2,3,

,n;n表示园区内属于第m个产业链节点的企业数量。
[0140]
s414.计算园区内各个产业链节点各自对应的新入园企业的日均用电量超容值均值,计算公式具体如下:
[0141][0142]
其中,表示园区内属于第m个产业链节点的新入园企业的日均用电量超容值均值,m=1,2,3,

,k;k表示园区内产业链节点的数量;λ
mi
表示园区内第m个产业链节点中的第i个新入园企业的日均用电量超容值,i=1,2,3,

,h;h表示园区内属于第m个产业链节点的新入园企业数量。
[0143]
s42.根据园区内各个企业的各项重点识别指标均值对园区内各个企业所属的产业链节点进行聚类分析,从而将所有产业链节点划分为预设数量的不同类别,具体包括如下步骤s421、s422、s423、s424、s425、s426、s427和s428。
[0144]
s421.根据业务需求先初拟最终需要对所有产业链节点进行聚类的类别个数,本实施例具体为4个。每个类别对应一个由产业链节点形成的簇。
[0145]
s422.将4个类别的簇心随机定义在4个不同的产业链节点上,将每个簇心命名为om,根据每个簇心的各项重点识别指标,将每个簇心的数据坐标设为
其中,m的取值为1,2,3,

,k当中的随机4项,具体取决于4个类别的簇心随机定义的4个不同的产业链节点,k表示园区内产业链节点的数量。例如,将4个类别的簇心随机定义的结果为定义在第1个产业链节点、第5个产业链节点、第8个产业链节点和第10个产业链节点,则m的取值为1,5,8,10,那么4个簇心的数据坐标分别是的取值为1,5,8,10,那么4个簇心的数据坐标分别是
[0146]
将每个非簇心产业链节点命名为qr,根据每个非簇心产业链节点的各项重点识别指标,将每个非簇心产业链节点的数据坐标设为其中,r的取值为1,2,3,

,k当中排除4个簇心的项数之后的任意项,k表示园区内产业链节点的数量。
[0147]
s423.定义非簇心产业链节点到各个簇心的连续型分类因子距离为d(qr,om),具体使用欧式距离算法来计算具体值,计算公式具体为
[0148]
如上文所述随机定义第1个、第5个、第8个、第10个产业链节点为4个簇心之后,作为非簇心的第r个产业链节点,其到作为簇心的第1个产业链节点的连续型分类因子距离为到作为簇心的第5个产业链节点的连续型分类因子距离为到作为簇心的第8个产业链节点的连续型分类因子距离为到作为簇心的第10个产业链节点的连续型分类因子距离为
[0149]
例如:
[0150]
作为非簇心的第2个产业链节点,其到作为簇心的第1个产业链节点的连续型分类因子距离为到作为簇心的第5个产业链节点的连续型分类因子距离为到作为簇心的第8个产业链节点的连续型分类因子距离为到作为簇心的第10个产业链节点的连续型分类因子距离为
[0151]
作为非簇心的第3个产业链节点,其到作为簇心的第1个产业链节点的连续型分类因子距离为到作为簇心的第5个产业链节点的连续型分类因子距离为到作为簇心的第8个产业链节点的连续型分类因子距离为到作为簇心的第10个产业链节点的连续型分类因子距离为
[0152]
……
[0153]
作为非簇心的第k个产业链节点,其到作为簇心的第1个产业链节点的连续型分类
因子距离为到作为簇心的第5个产业链节点的连续型分类因子距离为到作为簇心的第8个产业链节点的连续型分类因子距离为到作为簇心的第10个产业链节点的连续型分类因子距离为
[0154]
s424.定义非簇心产业链节点到各个簇心的离散型分类因子距离为b(qr,om),具体使用差异度来表示离散型分类因子距离,差异度越小,则表示离散型分类因子距离越小,其计算原理是统计非簇心产业链节点与簇心之间重点识别指标不相同的个数,该个数就是差异度,表示非簇心产业链节点到簇心的离散型分类因子距离。
[0155]
s425.根据连续型分类因子距离和离散型分类因子距离计算非簇心产业链节点qr到各个簇心om的距离z
r,m
,具体计算公式为z
r,m
=d(qr,om)+b(qr,om)。
[0156]
例如:
[0157]
作为非簇心的第2个产业链节点,其到作为簇心的第1个产业链节点的距离为z
r,m
=z
2,1
=d(q2,o1)+b(q2,o1),到作为簇心的第5个产业链节点的连续型分类因子距离为z
r,m
=z
2,5
=d(q2,o5)+b(q2,o5),到作为簇心的第8个产业链节点的连续型分类因子距离为z
r,m
=z
2,8
=d(q2,o8)+b(q2,o8),到作为簇心的第10个产业链节点的连续型分类因子距离为z
r,m
=z
2,10
=d(q2,o
10
)+b(q2,o
10
)。
[0158]
作为非簇心的第3个产业链节点,其到作为簇心的第1个产业链节点的距离为z
r,m
=z
3,1
=d(q3,o1)+b(q3,o1),到作为簇心的第5个产业链节点的连续型分类因子距离为z
r,m
=z
3,5
=d(q3,o5)+b(q3,o5),到作为簇心的第8个产业链节点的连续型分类因子距离为z
r,m
=z
3,8
=d(q3,o8)+b(q3,o8),到作为簇心的第10个产业链节点的连续型分类因子距离为z
r,m
=z
3,10
=d(q3,o
10
)+b(q3,o
10
)。
[0159]
……
[0160]
作为非簇心的第k个产业链节点,其到作为簇心的第1个产业链节点的距离为z
r,m
=z
k,1
=d(qk,o1)+b(qk,o1),到作为簇心的第5个产业链节点的连续型分类因子距离为z
r,m
=z
k,5
=d(qk,o5)+b(qk,o5),到作为簇心的第8个产业链节点的连续型分类因子距离为z
r,m
=z
k,8
=d(qk,o8)+b(qk,o8),到作为簇心的第10个产业链节点的连续型分类因子距离为z
r,m
=z
k,10
=d(qk,o
10
)+b(qk,o
10
)。
[0161]
s426.找出每个非簇心产业链节点qr到各个簇心om的距离z
r,m
当中的最小值,然后将每个非簇心产业链节点qr关联到距离最近的簇心om所属的类别上。
[0162]
例如:
[0163]
对作为非簇心的第2个产业链节点,在计算出其到作为簇心的第1个产业链节点的距离z
2,1
,到作为簇心的第5个产业链节点的连续型分类因子距离z
2,5
,到作为簇心的第8个产业链节点的连续型分类因子距离为z
2,8
,到作为簇心的第10个产业链节点的连续型分类因子距离z
2,10
之后,找出作为非簇心的第2个产业链节点到各个簇心的距离z
2,1
、z
2,5
、z
2,8
、z
2,10
当中的最小值min{z
2,1
,z
2,5
,z
2,8
,z
2,10
},假设最小值为z
2,8
,即与第2个产业链节点距离最近的簇心是第8个产业链节点,然后将作为非簇心的第2个产业链节点关联到距离最近的簇心第8个产业链节点所属的类别上。
[0164]
对作为非簇心的第3个产业链节点,在计算出其到作为簇心的第1个产业链节点的距离z
3,1
,到作为簇心的第5个产业链节点的连续型分类因子距离z
3,5
,到作为簇心的第8个产业链节点的连续型分类因子距离为z
3,8
,到作为簇心的第10个产业链节点的连续型分类因子距离z
3,10
之后,找出作为非簇心的第2个产业链节点到各个簇心的距离z
3,1
、z
3,5
、z
3,8
、z
3,10
当中的最小值min{z
3,1
,z
3,5
,z
3,8
,z
3,10
},假设最小值为z
3,10
,即与第3个产业链节点距离最近的簇心是第10个产业链节点,然后将作为非簇心的第3个产业链节点关联到距离最近的簇心第10个产业链节点所属的类别上。
[0165]
……
[0166]
对作为非簇心的第k个产业链节点,在计算出其到作为簇心的第1个产业链节点的距离z
k,1
,到作为簇心的第5个产业链节点的连续型分类因子距离z
k,5
,到作为簇心的第8个产业链节点的连续型分类因子距离为z
k,8
,到作为簇心的第10个产业链节点的连续型分类因子距离z
k,10
之后,找出作为非簇心的第2个产业链节点到各个簇心的距离z
k,1
、z
k,5
、z
k,8
、z
k,10
当中的最小值min{z
k,1
,z
k,5
,z
k,8
,z
k,10
},假设最小值为z
k,1
,即与第k个产业链节点距离最近的簇心是第1个产业链节点,然后将作为非簇心的第k个产业链节点关联到距离最近的簇心第1个产业链节点所属的类别上。
[0167]
s427.将全部非簇心产业链节点关联到距离最近的簇心所属的类别上之后,将每个簇心与其所关联的所有非簇心产业链节点形成一个簇,由于有4个簇心,故会形成4个簇,然后根据每个簇中的所有产业链节点寻找新簇心,具体地,先计算每个簇中所有产业链节点的数据坐标平均值,具体为其中,l=1,2,3,4,表示第l个簇中所有产业链节点的企业竞争水平度数均值的平均值,表示第l个簇中所有产业链节点的企业月均用电量超容值均值的平均值,表示第l个簇中所有产业链节点的企业用电业扩报装需求得分均值的平均值,表示第l个簇中所有产业链节点的新入园企业日均用电量超容值均值的平均值;然后计算簇中每个产业链节点的数据坐标到该数据坐标平均值的变化距离,计算公式为其中,q
gl
为第l个簇中的产业链节点的数据坐标;然后以变化距离最小的产业链节点作为簇中的新簇心。
[0168]
例如:
[0169]
第一个簇中,簇心为第1个产业链节点,与其关联的非簇心产业链节点有第4个、第7个、第9个、

、第k个产业链节点,先计算第一个簇中所有产业链节点的数据坐标平均值其中,表示第一个簇中的第4个、第7个、第9个、

、第k个产业链节点对应的企业竞争水平度数均值的平均值,表示第一个簇中的第4个、第7个、第9个、

、第k个产业链节点对应的企业月均用电量超容值均值的平均值,表示第一个簇中的第4个、第7个、第9个、

、第k个产业链节点对应的企业用电业扩报装需求得分均值的平均值,表示第一个簇中的第4个、第7个、第9个、

、第k个产业链节点对应的新入园企业日均用电量超容值均值的平均值。然后采用欧式距离算法来计算第一个簇中每个产业链节
点的数据坐标到该数据坐标平均值的变化距离,计算公式为其中,q
g1
为第一个簇中的产业链节点的数据坐标,g1的取值为1、4、7、9、

、k。然后以变化距离最小的产业链节点作为第一个簇中的新簇心,假设变化距离最小的产业链节点为第9个产业链节点,则以第9个产业链节点作为第一个簇中的新簇心。
[0170]
第二个簇中,簇心为第5个产业链节点,与其关联的非簇心产业链节点有第6个、第11个、第12个

产业链节点,先计算第二个簇中所有产业链节点的数据坐标平均值其中,表示第二个簇中的第6个、第11个、第12个

产业链节点对应的企业竞争水平度数均值的平均值,表示第二个簇中的第6个、第11个、第12个

产业链节点对应的企业月均用电量超容值均值的平均值,表示第二个簇中的第6个、第11个、第12个

产业链节点对应的企业用电业扩报装需求得分均值的平均值,表示第二个簇中的第6个、第11个、第12个

产业链节点对应的新入园企业日均用电量超容值均值的平均值。然后采用欧式距离算法来计算第二个簇中每个产业链节点的数据坐标到该数据坐标平均值的变化距离,计算公式为其中,q
g2
为第二个簇中的产业链节点的数据坐标,g2的取值为5、6、11、12

。然后以变化距离最小的产业链节点作为第二个簇中的新簇心,假设变化距离最小的产业链节点为第12个产业链节点,则以第12个产业链节点作为第二个簇中的新簇心。
[0171]
第三个簇中,簇心为第8个产业链节点,与其关联的非簇心产业链节点有第2个、第13个、第14个

产业链节点,先计算第三个簇中所有产业链节点的数据坐标平均值其中,表示第三个簇中的第2个、第8个、第13个、第14个

产业链节点对应的企业竞争水平度数均值的平均值,表示第三个簇中的第2个、第8个、第13个、第14个

产业链节点对应的企业月均用电量超容值均值的平均值,表示第三个簇中的第2个、第8个、第13个、第14个

产业链节点对应的企业用电业扩报装需求得分均值的平均值,表示第三个簇中的第2个、第8个、第13个、第14个

产业链节点对应的新入园企业日均用电量超容值均值的平均值。然后采用欧式距离算法来计算第三个簇中每个产业链节点的数据坐标到该数据坐标平均值的变化距离,计算公式为其中,q
g3
为第三个簇中的产业链节点的数据坐标,g3的取值为2、8、13、14

。然后以变化距离最小的产业链节点作为第三个簇中的新簇心,假设变化距离最小的产业链节点为第2个产业链节点,则以第2个产业链节点作为第三个簇中的新簇心。
[0172]
第四个簇中,簇心为第10个产业链节点,与其关联的非簇心产业链节点有第3个、第15个、第16个

产业链节点,先计算第四个簇中所有产业链节点的数据坐标平均值其中,表示第四个簇中的第3个、第10个、第15个、第16个


业链节点对应的企业竞争水平度数均值的平均值,表示第四个簇中的第3个、第10个、第15个、第16个

产业链节点对应的企业月均用电量超容值均值的平均值,表示第四个簇中的第3个、第10个、第15个、第16个

产业链节点对应的企业用电业扩报装需求得分均值的平均值,表示第四个簇中的第3个、第10个、第15个、第16个

产业链节点对应的新入园企业日均用电量超容值均值的平均值。然后采用欧式距离算法来计算第四个簇中每个产业链节点的数据坐标到该数据坐标平均值的变化距离,计算公式为其中,q
g4
为第四个簇中的产业链节点的数据坐标,g4的取值为3、10、15、16

。然后以变化距离最小的产业链节点作为第四个簇中的新簇心,假设变化距离最小的产业链节点为第10个产业链节点,则仍以第10个产业链节点作为第四个簇中的新簇心。
[0173]
s428.不断重复上述步骤s423至s427,直至在确定四个簇的新簇心时,四个新簇心的变化距离都不小于预设阈值(例如0.2),再以四个新簇心及其所关联的非簇心产业链节点作为最终聚类结果,形成四个类别。
[0174]
s43.获取聚类分析后每个类别中的所有产业链节点的各项重点识别指标均值,根据获取结果对每个类别进行重点产业链节点识别并生成对应的可视化标签。
[0175]
在对园区内的产业链节点进行聚类分析得到四个类别之后,获取每个类别中的所有产业链节点的各项重点识别指标均值,再根据获取结果对每个类别进行重点产业链节点识别,需要说明的是,某个类别中的产业链节点的竞争水平度数均值越小、月均用电量超容值均值越大、用电业扩报装需求得分均值越大、新入园企业的日均用电量超容值均值越小,则该类别中的产业链节点需引入企业的程度越高,越要将该类别中的产业链节点识别为重点产业链节点。具体地,在上文步骤s427中,已计算出由簇心与其所关联的所有非簇心产业链节点形成的簇中所有产业链节点的数据坐标平均值,而该数据坐标平均值对应簇中所有产业链节点的各项重点识别指标均值,因此,在确定四个簇的新簇心,并以四个新簇心及其所关联的非簇心产业链节点作为最终聚类结果形成四个类别之后,可以获取每个簇中所有产业链节点的数据坐标平均值作为每个类别中的所有产业链节点的各项重点识别指标均值,具体为企业月均用电量超容值均值企业月均用电量超容值均值企业用电业扩报装需求得分均值新入园企业日均用电量超容值均值对第一个类别,获取各项重点识别指标均值分别为对第二个类别,获取各项重点识别指标均值分别为均值分别为对第三个类别,获取各项重点识别指标均值分别为对第四个类别,获取各项重点识别指标均值分别为
[0176]
然后按照产业链节点的企业竞争水平度数均值越小、企业月均用电量超容值均值越大、企业用电业扩报装需求得分均值越大、新入园企业的日均用电量超容值均值越小,则该类别中的产业链节点需引入企业的程度越高,越要将该类别中的产业链节点识别为重点产业链节点的原则,基于各个类别的所有产业链节点的各项重点识别指标均值进行重点产
业链节点的综合评价,具体公式例如是:
[0177][0178]
其中,l=1,2,3,4;f
l
表示重点产业链节点综合评价指数,其值越大,则意味着第l个类别中的产业链节点需引入企业的程度越高,越要将第l个类别中的产业链节点识别为重点产业链节点。
[0179]
在计算出各个类别的重点产业链节点综合评价指数f
l
之后,就可识别出需引入企业的重点产业链节点,然后根据重点产业链节点的识别结果生成对应的可视化标签供人查看,从而为园区招商过程中的企业筛选引入提供参考,提高园区招商目标与园区内的产业链适配度,以实现园区稳定有序的长期发展。
[0180]
如上所述仅为本发明创造的实施方式,不以此限定专利保护范围。本领域技术人员在本发明创造的基础上作出非实质性的变化或替换,仍落入专利保护范围。

技术特征:
1.一种基于多源数据识别园区内重点产业链节点的方法,其特征是,包括如下步骤:s1.从不同数据系统获取园区内各个企业的多源数据,对园区内各个企业的多源数据分别进行融合对齐处理,其中,所述多源数据包括园区企业清单、企业基础信息数据和电力合同数据;s2.根据所述多源数据分析园区内各个企业所属的产业链及在产业链中所处的产业链节点;s3.根据所述多源数据计算园区内各个企业的多项重点识别指标,所述重点识别指标包括园区内各个企业的竞争水平度数、月均用电量超容值、用电业扩报装需求得分以及新入园企业的日均用电量超容值,具体包括如下步骤s31、s32、s33和s34;s31.基于复杂网络模型,根据园区企业清单生成对应园区内各个企业的网络节点,然后根据网络节点和园区内各个企业之间的相似度构建企业相似网络,再根据所述企业相似网络分析出园区内各个企业的竞争水平度数,其中,园区内各个企业之间的相似度具体根据园区内各个企业的企业基础信息数据计算得出;s32.根据园区内各个企业的电力合同数据计算园区内各个企业的理论月均用电量,获取园区内各个企业的实际月均用电量,将园区内各个企业的实际月均用电量与理论月均用电量进行比较得到园区内各个企业的月均用电量超容值;s33.根据园区内各个企业在一定时间范围内的用电量或年最大负荷量,预测园区内各个企业在未来预设时间内的预计用电量和预计年最大负荷量,将预测结果分别与当前年用电量、当前年最大负荷量进行比较,根据比较结果分析园区中各个企业的用电业扩报装需求得分;s34.根据园区企业清单和园区内各个企业的电力合同数据识别新入园企业,并根据电力合同数据计算新入园企业的理论日均用电量,获取新入园企业的实际日均用电量,将新入园企业的实际日均用电量与理论日均用电量进行比较得到新入园企业的日均用电量超容值;s4.根据园区内各个企业的各项重点识别指标,对园区内各个企业所处的产业链节点进行聚类分析及重点产业链节点识别,具体包括如下步骤s41、s42和s43;s41.计算各个产业链节点的各项重点识别指标均值;s42.根据园区内各个企业的各项重点识别指标均值对园区内各个企业所属的产业链节点进行聚类分析,从而将所有产业链节点划分为预设数量的不同类别;s43.获取聚类分析后每个类别中的所有产业链节点的各项重点识别指标均值,根据获取结果对每个类别进行重点产业链节点识别并生成对应的可视化标签。2.根据权利要求1所述的基于多源数据识别园区内重点产业链节点的方法,其特征是,所述步骤s42包括:s421.根据业务需求先初拟最终需要对所有产业链节点进行聚类的类别个数;s422.将各个类别的簇心随机定义在不同的产业链节点上;s423.计算非簇心产业链节点到各个簇心的连续型分类因子距离;s424.计算非簇心产业链节点到各个簇心的离散型分类因子距离;s425.根据所述连续型分类因子距离和所述离散型分类因子距离计算非簇心产业链节点到各个簇心的距离;
s426.找出每个非簇心产业链节点到各个簇心的距离当中的最小值,然后将每个非簇心产业链节点关联到距离最近的簇心所属的类别上;s427.将全部非簇心产业链节点关联到距离最近的簇心所属的类别上之后,将每个簇心与其所关联的所有非簇心产业链节点形成一个簇;s428.不断重复上述步骤s423至s427,直至在确定所有簇的新簇心时,所有新簇心的变化距离都不小于预设阈值,再以所有新簇心及其所关联的非簇心产业链节点作为最终聚类结果,形成对应的类别。3.根据权利要求1所述的基于多源数据识别园区内重点产业链节点的方法,其特征是,所述步骤s31中,运用余弦相似度算法计算得出园区内各个企业之间的相似度,具体计算公式如下:其中,cos(θ)表示不同企业之间的相似度;d表示对应企业基础信息数据的维度数;x
i
、y
i
分别表示不同企业的第i个维度数据。4.根据权利要求1所述的基于多源数据识别园区内重点产业链节点的方法,其特征是,所述步骤s31中,若两个企业之间的相似度超过一定阈值,则在这两个企业分别对应的两个网络节点之间建立起一条连接边,使得所有网络节点及网络节点之间建立起的连接边构建成为企业相似网络。5.根据权利要求4所述的基于多源数据识别园区内重点产业链节点的方法,其特征是,所述步骤s31中,根据企业相似网络中每个网络节点的连接边数量分析出园区内各个企业的竞争水平度数。6.根据权利要求1所述的基于多源数据识别园区内重点产业链节点的方法,其特征是,所述步骤s43中,根据每个类别中的所有产业链节点的重点产业链节点综合评价指数、企业月均用电量超容值均值、企业用电业扩报装需求得分均值、新入园企业日均用电量超容值均值计算重点产业链节点综合评价指数,其中,企业竞争水平度数均值越小、企业月均用电量超容值均值越大、企业用电业扩报装需求得分均值越大、新入园企业的日均用电量超容值均值越小,则对应类别的重点产业链节点综合评价指数越大,越要将该类别中的产业链节点识别为重点产业链节点。7.一种计算机可读存储介质,其上存储有计算机程序,其特征是,所述计算机程序被处理器执行是,实现如权利要求1至6任一项所述的基于多源数据识别园区内重点产业链节点的方法中的步骤。8.一种基于多源数据识别园区内重点产业链节点的系统,其特征是,包括相互连接的处理器和如权利要求7所述的计算机可读存储介质。

技术总结
本发明提供一种基于多源数据识别园区内重点产业链节点的方法、存储介质及系统,该方法包括:从不同数据系统获取园区内各个企业的多源数据,对园区内各个企业的多源数据分别进行融合对齐处理;根据多源数据分析园区内各个企业所属的产业链及在产业链中所处的产业链节点;根据多源数据计算园区内各个企业的多项重点识别指标;根据园区内各个企业的各项重点识别指标,对园区内各个企业所处的产业链节点进行聚类分析及重点产业链节点识别。这样就可识别出园区内需引入企业的重点产业链节点,为园区招商过程中的企业筛选引入提供参考,提高园区招商目标与园区内的产业链适配度,以实现园区稳定有序的长期发展。园区稳定有序的长期发展。园区稳定有序的长期发展。


技术研发人员:曹熙 赵永国 蔡露 程菊花 余建纯 李文杰 曾祥清 胡彩倩 倪沛权 王雪纯 韩庭钰 戴渝卓
受保护的技术使用者:南方电网大数据服务有限公司
技术研发日:2023.06.30
技术公布日:2023/10/7
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐