一种城市更新发展指标分析方法、装置、电子设备及介质与流程

未命名 08-18 阅读:99 评论:0


1.本技术涉及数据处理领域,具体涉及一种城市更新发展指标分析方法、装置、电子设备及介质。


背景技术:

2.在过去的半个世纪里,全球城市化深刻地改变了建筑环境。快速的增长和发展导致环境和生态学的复杂性增加。在城市地区,一些建筑物的老化消耗了全球约78%的能源,温室气体排放量占60%。鉴于热岛威胁、环境污染和可再生能源使用等紧迫挑战,城市更新和可持续发展变得越来越重要。对于城市规划和管理而言,跨学科的城市研究迅速融合,需要进一步深入研究。这些融合领域包括地理信息系统(geographic information system,简称gis)技术、市政组织和城市社区的规划和发展、社会大数据和人工智能解决方案。
3.市政组织和城市社区最近设计并促进了城市更新和再生,这对实现城市可持续发展至关重要。从某种意义上说,规划者如何看待和规划世界将塑造我们的世界。由于城市是由其定义的特征来表达的,城市特征由“地方”表示,通过城市规划,这些地方制定了城市再生和城市更新的规则。城市的这些特征和指标可以定义为城市发展指标,例如2016年全球人居环境论坛发布的《国际绿色范例新城标准3.0》、欧洲环境委员会推出的“欧洲绿色城市”指标选择、纽约的年度监测报告以及英国伦敦的年度规划监测报告。这些研究从社会科学的角度为城市更新发展奠定了良好的基础。
4.通过建模和分析不同的数据类型,社会大数据在城市规划和管理中变得越来越重要。各地的研究团队已经开始研究,将城市设计和政策制定与上述数字孪生技术相结合。在以色列,一个研究团队建立了一个多参数框架来分析城市更新质量,并提出了不同的社区更新方案。提出并分析了地中海历史城市中心的过程驱动框架。在布达佩斯,数字规划被评估为对碎片化、异质性城市结构环境的城市再生做出有意义的贡献。智能城市使命于2015年在印度100个城市启动,这些城市特别重视信息通信技术和数字技术。在德国德累斯顿,50米网格的人口加权无障碍数字指数用于四项城市区域再生研究。此外,里加、考纳斯和台北等几个城市也在探索旅游景点的数字场所制作。在北京,城市更新计划提出了保护千年历史的方法,并重点关注北京关键地区的城市更新和关键位置的改善。
5.尽管城市更新和再生活动取得了重大进展,但城市使用的数字规划和管理相对较新,处于技术开发周期的早期阶段。以下需求仍未满足:
6.(1)由于城市多样性和社会结构复杂性,建立高维数字模型和积累历史数据需要大量的数据处理工作。而现有技术的数据来源是有限的,且城市社区的参数模型规模相对较小,这限制了大量数据所代表的数据容量;
7.(2)现有参数模型仅限于特定的城市社区和项目,缺乏跨城市和区域的城市更新可比性分析;(3)数字城市规划框架通过其定义的指标或城市发展指标体系来量化城市发展目标。这些指标相对简单,且在大多数情况下,指标的创建和规范是特定于项目的,而没有系统地分析所选择的指标及其相关性。
8.本背景技术描述的内容仅为了便于了解本领域的相关技术,不视作对现有技术的承认。


技术实现要素:

9.为了解决上述技术问题,本技术提供了一种城市更新发展指标分析方法、装置、电子设备及介质,具体方案如下:
10.第一方面,本技术实施例提供了一种城市更新发展指标分析方法,所述城市更新发展指标分析方法包括:
11.将预设城市集合对应的原始数据进行第一umap降维处理,并将第一umap降维处理后的原始数据分类为至少两个数据组,其中,所述原始数据为高维数据,所述原始数据包括预设数量个预设类型的城市更新发展指标;
12.分别对各所述数据组进行主成分降维分析,得到各所述数据组对应的主成分以及各所述数据组之间的指标相关性;
13.基于各所述数据组对应的主成分分别进行第二umap降维处理,并将第二umap降维处理后的主成分进行聚类分析,得到同类城市子组;
14.输出各所述数据组对应的主成分、各所述数据组之间的指标相关性以及所述同类城市子组。
15.根据本技术公开的一种具体实施方式,将预设城市集合对应的原始数据进行第一umap降维处理,并将第一umap降维处理后的原始数据分类为至少两个数据组的步骤,包括:
16.将预设城市集合对应的原始数据进行第一预处理,得到初始数据,其中,所述第一预处理包括缺失值和标准化处理;
17.基于umap分析将高维的初始数据映射到二维空间;
18.将映射到二维空间内的初始数据分类为至少两个数据组。
19.根据本技术公开的一种具体实施方式,分别对各所述数据组进行主成分降维分析,得到各所述数据组对应的主成分以及各所述数据组之间的指标相关性的步骤,包括:
20.将各数据组中第一umap降维处理后的原始数据进行第二预处理,得到参考数据,其中,所述第二预处理包括缺失值和标准化处理;
21.基于所述参考数据计算协方差矩阵,得到特征值、特征向量以及各所述特征向量对应的方差;
22.根据特征值确定主成分的个数;
23.选择各主成分对应的特征向量,形成荷载矩阵,并计算主成分线性组合系数矩阵;
24.基于各所述特征向量对应的方差以及所述主成分线性组合系数矩阵计算指标权重。
25.将指标权重从大到小排列为目标序列,得到各所述数据组之间的指标相关性。
26.根据本技术公开的一种具体实施方式,基于各所述数据组对应的主成分分别进行第二umap降维处理,并将第二umap降维处理后的主成分进行聚类分析,得到同类城市子组的步骤,包括:
27.通过umap分析分别将各所述数据组对应的主成分映射到三维空间;
28.对于任一数据组,在所述三维空间中进行目标类型的聚类分析,得到多个所述同
类城市子组,其中,所述目标类型的聚类分析包括k-means聚类分析。
29.第二方面,本技术实施例提供了一种城市更新发展指标体系的数据分析装置,所述城市更新发展指标体系的数据分析装置包括:
30.第一umap降维模块,用于将预设城市集合对应的原始数据进行第一umap降维处理,并将第一umap降维处理后的原始数据分类为至少两个数据组,其中,所述原始数据为高维数据,所述原始数据包括预设数量个预设类型的城市更新发展指标;
31.主成分降维模块,用于分别对各所述数据组进行主成分降维分析,得到各所述数据组对应的主成分以及各所述数据组之间的指标相关性;
32.第二umap降维模块,用于基于各所述数据组对应的主成分分别进行第二umap降维处理,并将第二umap降维处理后的主成分进行聚类分析,得到同类城市子组;
33.输出模块,用于输出各所述数据组对应的主成分、各所述数据组之间的指标相关性以及所述同类城市子组。
34.根据本技术公开的一种具体实施方式,所述第一umap降维模块具体用于:
35.将预设城市集合对应的原始数据进行第一预处理,得到初始数据,其中,所述第一预处理包括缺失值和标准化处理;
36.基于umap分析将高维的初始数据映射到二维空间;
37.将映射到二维空间内的初始数据分类为至少两个数据组。
38.根据本技术公开的一种具体实施方式,所述主成分降维模块具体用于:
39.将各数据组中第一umap降维处理后的原始数据进行第二预处理,得到参考数据,其中,所述第二预处理包括缺失值和标准化处理;
40.基于所述参考数据计算协方差矩阵,得到特征值、特征向量以及各所述特征向量对应的方差;
41.根据特征值确定主成分的个数;
42.选择各主成分对应的特征向量,形成荷载矩阵,并计算主成分线性组合系数矩阵;
43.基于各所述特征向量对应的方差以及所述主成分线性组合系数矩阵计算指标权重。
44.将指标权重从大到小排列为目标序列,得到各所述数据组之间的指标相关性。
45.根据本技术公开的一种具体实施方式,所述第二umap降维模块具体用于:
46.通过umap分析分别将各所述数据组对应的主成分映射到三维空间;
47.对于任一数据组,在所述三维空间中进行目标类型的聚类分析,得到多个所述同类城市子组,其中,所述目标类型的聚类分析包括k-means聚类分析。
48.第三方面,本技术实施例提供了一种电子设备,所述电子设备包括处理器和存储器,所述存储器存储有计算机程序,所述计算机程序在所述处理器上执行时实现第一方面中任一项所述的城市更新发展指标分析方法。
49.第四方面,本技术实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序在处理器上执行时实现第一方面中任一项所述的城市更新发展指标分析方法。
50.相对于现有技术而言,本技术具有以下有益效果:
51.本技术公开一种城市更新发展指标分析方法、装置、电子设备及介质,该方法包
括:将预设城市集合对应的高维原始数据进行第一umap降维处理,并将第一umap降维处理后的原始数据分类为至少两个数据组;分别对各数据组进行主成分降维分析,得到各数据组对应的主成分以及各数据组之间的指标相关性;基于各数据组对应的主成分分别进行第二umap降维处理,并将第二umap降维处理后的主成分进行聚类分析,得到同类城市子组;输出各数据组对应的主成分、各数据组之间的指标相关性以及同类城市子组。本技术通过对高维数据进行多重降维分析,将城市群量化为更精细的类别,能够准确分析指标的重要性以及城市间的相关性。
52.本技术实施例的其他可选特征和技术效果一部分在下文描述,一部分可通过阅读本文而明白。
附图说明
53.为了更清楚地说明本公开实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
54.图1为本技术实施例提供的一种城市更新发展指标分析方法的流程示意图之一;
55.图2为本技术实施例提供的一种城市更新发展指标分析方法的流程示意图之二;
56.图3为本技术实施例提供的一种城市更新发展指标分析方法所涉及的数据组分类的示意图之一;
57.图4为本技术实施例提供的一种城市更新发展指标分析方法所涉及的数据组分类的示意图之二;
58.图5为本技术实施例提供的一种城市更新发展指标分析方法所涉及的第一组数据组指标排名的示意图;
59.图6为本技术实施例提供的一种城市更新发展指标分析方法所涉及的第二组数据组指标排名的示意图;
60.图7为为本技术实施例提供的一种城市更新发展指标分析方法所涉及的聚类分析的示意图;
61.图8为本技术实施例提供的一种城市更新发展指标分析装置的模块示意图;
62.图9为能实施根据本技术实施例的方法的电子设备的示例性结构示意图。
具体实施方式
63.下面将结合本技术实施例中附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。
64.通常在此处附图中描述和示出的本技术实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本技术的实施例的详细描述并非旨在限制要求保护的本技术的范围,而是仅仅表示本技术的选定实施例。基于本技术的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本技术保护的范围。
65.在下文中,可在本技术的各种实施例中使用的术语“包括”、“具有”及其同源词仅意在表示特定特征、数字、步骤、操作、元件、组件或前述项的组合,并且不应被理解为首先
排除一个或更多个其它特征、数字、步骤、操作、元件、组件或前述项的组合的存在或增加一个或更多个特征、数字、步骤、操作、元件、组件或前述项的组合的可能性。
66.此外,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
67.除非另有限定,否则在这里使用的所有术语(包括技术术语和科学术语)具有与本技术的各种实施例所属领域普通技术人员通常理解的含义相同的含义。所述术语(诸如在一般使用的词典中限定的术语)将被解释为具有与在相关技术领域中的语境含义相同的含义并且将不被解释为具有理想化的含义或过于正式的含义,除非在本技术的各种实施例中被清楚地限定。
68.下面结合附图,对本技术的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互结合。
69.参见图1和图2,图1为本技术实施例提供的一种城市更新发展指标分析方法的流程示意图之一,图2为本技术实施例提供的一种城市更新发展指标分析方法的流程示意图之二。如图1所示,所述城市更新发展指标分析方法主要包括:
70.步骤s101,将预设城市集合对应的原始数据进行第一umap降维处理,并将第一umap降维处理后的原始数据分类为至少两个数据组,其中,所述原始数据为高维数据,所述原始数据包括预设数量个预设类型的城市更新发展指标。
71.城市更新发展指标可以由用户根据实际使用需求和具体应用场景自定义,该指标用于量化和评估城市更新进展状况。指标数据可以是来源于互联网上的开放社交数据,这里不做进一步限定。优选地,本技术采用自定义的指标体系,可以包括八大类:城市活力、绿色生态、城市特色、交通便捷、城市口碑、安全韧性、多元包容、生活舒适。以城市活力类别为例,其指标定义如下表1所示。
72.表1城市更新发展指标(以城市活力为例)
[0073][0074][0075]
统一流形逼近和投影(uniform manifold approximation and projection,简称umap)是一种降维和表示方法,它起源于基于黎曼几何和代数拓扑的理论框架。假设可用的数据样本均匀分布在拓扑空间(流形)中,可以从这些有限的数据样本中进行近似,并将其映射到低维空间(投影)。umap可以分为两个主要步骤:
[0076]
(1)学习高维空间中的各种结构;
[0077]
(2)将高维空间中的近似流形映射到低维空间。
[0078]
umap算法旨在显示高维空间中的样本簇以及低维图像上样本点之间的关系。
[0079]
具体实施时,将预设城市集合对应的原始数据进行第一umap降维处理,并将第一umap降维处理后的原始数据分类为至少两个数据组的步骤,包括:
[0080]
将预设城市集合对应的原始数据进行第一预处理,得到初始数据,其中,所述第一预处理包括缺失值和标准化处理;
[0081]
基于umap分析将高维的初始数据映射到二维空间;
[0082]
将映射到二维空间内的初始数据分类为至少两个数据组。
[0083]
步骤s102,分别对各所述数据组进行主成分降维分析,得到各所述数据组对应的主成分以及各所述数据组之间的指标相关性。
[0084]
主成分分析(principal component analysis,简称pca)是一种常用的降维方法。主成分分析将特征变量转换为主要成分,从而产生在信息损失最小的情况下进行降维。
[0085]
分别对各所述数据组进行主成分降维分析,得到各所述数据组对应的主成分以及各所述数据组之间的指标相关性的步骤,包括:
[0086]
将各数据组中第一umap降维处理后的原始数据进行第二预处理,得到参考数据,其中,所述第二预处理包括缺失值和标准化处理;
[0087]
基于所述参考数据计算协方差矩阵,得到特征值、特征向量以及各所述特征向量对应的方差;
[0088]
根据特征值确定主成分的个数;
[0089]
选择各主成分对应的特征向量,形成荷载矩阵,并计算主成分线性组合系数矩阵;
[0090]
基于各所述特征向量对应的方差以及所述主成分线性组合系数矩阵计算指标权重。
[0091]
将指标权重从大到小排列为目标序列,得到各所述数据组之间的指标相关性。
[0092]
具体地,根据步骤s101的umap降维分析的结果,选择分类得到至少两个城市组,即所述数据组。然后使用pca降维算法对数据进行分析。具体步骤如下:
[0093]
(1)对原始数据进行缺失值和标准化处理,并将处理后的数据记录为z;
[0094]
(2)根据z计算协方差矩阵r,得到特征值λ和特征向量;
[0095]
(3)计算每个特征向量的方差v,根据λ是否大于1确定主成分的个数;
[0096]
(4)选择主成分对应的特征向量,形成荷载矩阵u,计算主成分线性组合系数矩阵y=u/sqrt(λ);
[0097]
(5)根据y和v计算指标权重w,其中w=yv;
[0098]
(6)将指标权重从高到低排序,然后比较分析各城市组,例如第一组城市和第二组城市之间城市更新发展指标的重要性。
[0099]
步骤s103,基于各所述数据组对应的主成分分别进行第二umap降维处理,并将第二umap降维处理后的主成分进行聚类分析,得到同类城市子组。
[0100]
本技术将pca和umap相结合来分析参数相关性,并使城市更新发展指标易于直观理解。步骤s102采用pca算法进行降维之后。可以将pca降维的主要成分作为umap的输入,以进一步降到3d低维空间。然后用聚类方法计算相似度得分,以可视化低维空间中样本点之
间的接近度,从而可以更直观地理解pca的降维结果。
[0101]
基于各所述数据组对应的主成分分别进行第二umap降维处理,并将第二umap降维处理后的主成分进行聚类分析,得到同类城市子组的步骤,包括:
[0102]
通过umap分析分别将各所述数据组对应的主成分映射到三维空间;
[0103]
对于任一数据组,在所述三维空间中进行目标类型的聚类分析,得到多个所述同类城市子组,其中,所述目标类型的聚类分析包括k-means聚类分析。
[0104]
具体实施时,以步骤s102中降维后第一组和第二组城市组为例,对步骤s103中的umap分析进行进一步说明。该步骤中,对两组城市pca降维后的主成分再次使用umap进行分析。具体步骤如下:
[0105]
(1)将pca降维后的主成分作为umap的输入数据;
[0106]
(2)使用umap方法将主成分进一步映射到3d空间中;
[0107]
(3)在3d空间中进行k-means聚类分析,以将城市群即前文所述数据组进一步量化为更精细的类别。具体地,目标类型的聚类分析包括但不限于k-means聚类分析,用户可以根据具体应用场景或者实际使用需求选择其他能达到相同或近似聚类分析结果的聚类方法,这里不做进一步限定。
[0108]
步骤s104,输出各所述数据组对应的主成分、各所述数据组之间的指标相关性以及所述同类城市子组。
[0109]
具体实施时,步骤s103之后,可以将各数据组对应的主成分、各数据组之间的指标相关性以及同类城市子组输出至各类显示终端或者上位机等进行可视化显示。
[0110]
下面,结合一个具体实验示例对步骤s101-s104进一步解释说明。
[0111]
参见图3,图3为本技术实施例提供的一种城市更新发展指标分析方法所涉及的数据组分类的示意图之一。其中,图3中的两个圆圈代表两个分类后的数据组,各圆圈中的黑点表示该数据组中的城市。
[0112]
参见图4,图4为本技术实施例提供的一种城市更新发展指标分析方法所涉及的数据组分类的示意图之二。具体实施时,可以根据用户需求和具体应用场景从各数据组中选取目标数量个城市组成容量更小的数据组。图4所示数据组均是从图3所示数据组中选取的由34个城市组成的新的数据组或者城市组。例如,根据实验结果,第一组城市组可以包括:北京、天津、上海、重庆、石家庄、太原、哈尔滨、长春、沈阳、大连、济南、青岛、南京、合肥、杭州、宁波、福州、厦门、郑州、武汉、长沙、广州、深圳、南宁、昆明、成都、西安、乌鲁木齐、南昌、贵阳、无锡、苏州、佛山、东莞,第一组城市组在行政能力、人口规模、建成区面积、经济水平等方面较为先进;第二组城市组可以包括:唐山、晋城、呼和浩特、包头、大庆、四平、东营、徐州、亳州、衢州、景德镇、赣州、洛阳、黄石、常德、海口、三亚、柳州、临沧、安顺、遂宁、延安、兰州、白银市、银川、吴忠、克拉玛依、西宁、拉萨、牡丹江、舟山、丽江、酒泉、土鲁番,第二组城市组在前文所述行政能力、人口规模、建成区面积、经济水平等方面相对落后于第一组城市组。
[0113]
pca算法分别用于分析两个城市组城市更新发展指标的主成分和相关性。首先,对34个第一组城市进行pca降维分析。根据特征值大于1,提取18个主成分。其中,第一主成分贡献最大,其方差达到24.14%。根据提取的主成分计算指标权重,从高到低进行排序,可以得到第一组城市最重要的前15个指标。参见图5,图5为本技术实施例提供的一种城市更新
发展指标分析方法所涉及的第一组数据组指标排名的示意图。
[0114]
同理,对34个第组组城市进行pca降维分析。根据特征值大于1,提取19个主分量。其中,第一主成分贡献最大,其方差达到26.79%。根据提取的主成分计算指标权重,从高到低进行排序,得到第二组城市最重要的前15个指标。参见图6,图6为本技术实施例提供的一种城市更新发展指标分析方法所涉及的第二组数据组指标排名的示意图。
[0115]
对于第一组城市,重要的指标包括环境污染事件的互联网排名、绿色经济、开放性、资源保护、基础设施协调、数字经济指数等。对于第二组城市,重要的指标包括服务业增加值占比、第三产业增加值占比、行业包容性、绿色经济,道路净密度指数、基础设施协调等。
[0116]
在第一组和第二组城市的前15个重要指数中,共同出现的指标是绿色经济、基础设施协调、生活水平、服务业增加值占比、第三产业增加值占比等。这些重要指标反映了绿色生态、多元包容以及生活舒适。此外,这两类城市也有各自突出的特定指标。例如,第一组城市的开放能力是反映城市特色的重要指标,第二组城市的道路净密度指数是反映交通便捷的重要指标。
[0117]
第一组城市和第二组城市强调的城市更新发展指标既有相似之处,也有不同之处。这是因为主成分是各种指数变量的线性组合,这充分说明了指标之间的相关性。需要说明的是,可以进一步分析指数相关性来探索数据分布,这有助于理解主成分分析的指数权重结果。第一组和第二组城市在人口规模、建成区面积、经济发展水平等方面存在明显差异,因此在城市发展中发挥重要作用的指标不同。通过上述方法可以深入对城市发展的评估、城市问题的发现等。
[0118]
在pca降维的基础上,再次利用umap算法将剩余的主成分进一步降维到3d空间。参见图7,图7为为本技术实施例提供的一种城市更新发展指标分析方法所涉及的聚类分析的示意图。通过k-means聚类算法计算三维空间中样本点之间的距离相似度,得到4个聚类。因此,第一组城市和第二组城市可以被分类为更精细的类别。这种方法可以减少数据处理时间和资源,并简化对复杂数据结构和样本的理解。具体实施时,可以通过不同颜色标注不同类别的城市,以进行城市类别的可视化。
[0119]
通过对同类城市特征的深入分析,可以发现选定城市之间存在更多的内在相关性。行政级别相似或地理空间相近的城市更有可能被归为同一类。例如,根据实验结果,在第一组城市组中,北京、上海、广州和深圳属于同一类别,它们都是中国的一线城市;长春、大连、哈尔滨和沈阳属于同一类,位于中国东北地区;宁波、杭州、无锡和苏州属于同一类;它们都位于中国东部的长江三角洲。在第二组城市组中,银川、兰州和西宁属于同一类别,位于中国西北部;临沧、拉萨和丽江属于同一类,位于中国西南部。同一类别的城市在经济条件、政策、资源条件等方面更有可能处于相似的发展阶段。这些城市对应的城市更新发展指标的特征存在一些相关性,可以供后续进一步研究和讨论。
[0120]
本技术提供的一种城市更新发展指标分析方法,通过将pca和umap算法相结合,可以实现对高维原始数据的二次降维分析,简化并强调关键降维因素。同时,umap可用于近似pca降维后数据的空间分布关系,有助于在低维空间中显示高维空间中样本点之间的相似关系,从而更直观地了解城市与pca降维结果之间的相关性。
[0121]
与上述方法实施例相对应,参见图8,本发明还提供一种城市更新发展指标分析装
置800,所述城市更新发展指标分析装置800包括:
[0122]
第一umap降维模块801,用于将预设城市集合对应的原始数据进行第一umap降维处理,并将第一umap降维处理后的原始数据分类为至少两个数据组,其中,所述原始数据为高维数据,所述原始数据包括预设数量个预设类型的城市更新发展指标;
[0123]
主成分降维模块802,用于分别对各所述数据组进行主成分降维分析,得到各所述数据组对应的主成分以及各所述数据组之间的指标相关性;
[0124]
第二umap降维模块803,用于基于各所述数据组对应的主成分分别进行第二umap降维处理,并将第二umap降维处理后的主成分进行聚类分析,得到同类城市子组;
[0125]
输出模块804,用于输出各所述数据组对应的主成分、各所述数据组之间的指标相关性以及所述同类城市子组。
[0126]
具体实施时,所述第一umap降维模块801具体用于:
[0127]
将预设城市集合对应的原始数据进行第一预处理,得到初始数据,其中,所述第一预处理包括缺失值和标准化处理;
[0128]
基于umap分析将高维的初始数据映射到二维空间;
[0129]
将映射到二维空间内的初始数据分类为至少两个数据组。
[0130]
具体实施时,所述主成分降维模块802具体用于:
[0131]
将各数据组中第一umap降维处理后的原始数据进行第二预处理,得到参考数据,其中,所述第二预处理包括缺失值和标准化处理;
[0132]
基于所述参考数据计算协方差矩阵,得到特征值、特征向量以及各所述特征向量对应的方差;
[0133]
根据特征值确定主成分的个数;
[0134]
选择各主成分对应的特征向量,形成荷载矩阵,并计算主成分线性组合系数矩阵;
[0135]
基于各所述特征向量对应的方差以及所述主成分线性组合系数矩阵计算指标权重。
[0136]
将指标权重从大到小排列为目标序列,得到各所述数据组之间的指标相关性。
[0137]
具体实施时,所述第二umap降维模块803具体用于:
[0138]
通过umap分析分别将各所述数据组对应的主成分映射到三维空间;
[0139]
对于任一数据组,在所述三维空间中进行目标类型的聚类分析,得到多个所述同类城市子组,其中,所述目标类型的聚类分析包括k-means聚类分析。本领域技术人员将明白根据本技术实施例的城市更新发展指标分析装置可以结合根据本技术实施例的城市更新发展指标分析方法的特征,反之亦然。
[0140]
此外,还提供一种电子设备,电子设备包括处理器和存储器,存储器存储有计算机程序,计算机程序在处理器上执行时实现上述城市更新发展指标分析方法。
[0141]
图9示出了一种可以实施本技术实施例的方法或实现本技术实施例的电子设备900的示意图,在一些实施例中可以包括比图示更多或更少的电子设备。在一些实施例中,可以利用单个或多个电子设备实施。在一些实施例中,可以利用云端或分布式的电子设备实施。
[0142]
如图9所示,电子设备900包括处理器901,其可以根据存储在只读存储器(rom)902中的程序和/或数据或者从存储部分908加载到随机访问存储器(ram)903中的程序和/或数
据而执行各种适当的操作和处理。处理器901可以是一个多核的处理器,也可以包含多个处理器。在一些实施例中,处理器901可以包含一个通用的主处理器以及一个或多个特殊的协处理器,例如,中央处理器(cpu)、图形处理器(gpu)、神经网络处理器(npu)、数字信号处理器(dsp)等等。在ram 903中,还存储有电子设备900操作所需的各种程序和数据。处理器901、rom 902以及ram 903通过总线904彼此相连。输入/输出(i/o)接口905也连接至总线904。
[0143]
上述处理器与存储器共同用于执行存储在存储器中的程序,所述程序被计算机执行时能够实现上述各实施例描述的方法、步骤或功能。
[0144]
以下部件连接至i/o接口905:包括键盘、鼠标、触摸屏等的输入部分906;包括诸如阴极射线管(crt)、液晶显示器(lcd)等以及扬声器等的输出部分907;包括硬盘等的存储部分908;以及包括诸如lan卡、调制解调器等的网络接口卡的通信部分909。通信部分909经由诸如因特网的网络执行通信处理。驱动器910也根据需要连接至i/o接口905。可拆卸介质911,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器910上,以便于从其上读出的计算机程序根据需要被安装入存储部分908。图9中仅示意性示出部分组件,并不意味着计算机系统900只包括图9所示组件。
[0145]
上述实施例阐明的系统、装置、模块或单元,可以由计算机或其关联部件实现。计算机例如可以为移动终端、智能电话、个人计算机、膝上型计算机、车载人机交互设备、个人数字助理、媒体播放器、导航设备、游戏控制台、平板电脑、可穿戴设备、智能电视、物联网系统、智能家居、工业计算机、服务器或者其组合。
[0146]
尽管未示出,在本技术实施例中,提供一种存储介质,所述存储介质存储有计算机程序,所述计算机程序配置成被运行时执行任一本技术实施例的城市更新发展指标分析方法。
[0147]
在本技术的实施例的存储介质包括永久性和非永久性、可移动和非可移动的可以由任何方法或技术来实现信息存储的物品。存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。
[0148]
在本技术的实施例的方法、程序、系统、装置等,可以在单个或多个连网的计算机中执行或实现,也可以在分布式计算环境中实践。在本说明书实施例中,在这些分布式计算环境中,可以由通过通信网络而被连接的远程处理设备来执行任务。
[0149]
所提供的电子设备和计算机可读存储介质的具体实施过程,可以参见上述实施例提供的城市更新发展指标分析方法的具体实施过程,在此不再一一赘述。
[0150]
本技术提供的电子设备和计算机可读存储介质,通过将pca和umap算法相结合,可以实现对高维原始数据的二次降维分析,简化并强调关键降维因素。同时,umap可用于近似pca降维后数据的空间分布关系,有助于在低维空间中显示高维空间中样本点之间的相似关系,从而更直观地了解城市与pca降维结果之间的相关性。
[0151]
本领域技术人员应明白,本说明书的实施例可提供为方法、系统或计算机程序产
品。因此,本领域技术人员可想到,上述实施例阐明的功能模块/单元或控制器以及相关方法步骤的实现,可以用软件、硬件和软/硬件结合的方式实现。
[0152]
除非明确指出,根据本技术实施例记载的方法、程序的动作或步骤并不必须按照特定的顺序来执行并且仍然可以实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
[0153]
在本文中,针对本技术的多个实施例进行了描述,但为简明起见,各实施例的描述并不是详尽的,各个实施例之间相同或相似的特征或部分可能会被省略。在本文中,“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”意指适用于根据本技术的至少一个实施例或示例中,而非所有实施例。上述术语并不必然意味着指代相同的实施例或示例。在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
[0154]
已参考上述实施例具体示出并描述了本技术的示例性系统及方法,其仅为实施本系统及方法的最佳模式的示例。本领域的技术人员可以理解的是可以在实施本系统及/或方法时对这里描述的系统及方法的实施例做各种改变而不脱离界定在所附权利要求中的本技术的精神及范围。

技术特征:
1.一种城市更新发展指标分析方法,其特征在于,所述城市更新发展指标分析方法包括:将预设城市集合对应的原始数据进行第一umap降维处理,并将第一umap降维处理后的原始数据分类为至少两个数据组,其中,所述原始数据为高维数据,所述原始数据包括预设数量个预设类型的城市更新发展指标;分别对各所述数据组进行主成分降维分析,得到各所述数据组对应的主成分以及各所述数据组之间的指标相关性;基于各所述数据组对应的主成分分别进行第二umap降维处理,并将第二umap降维处理后的主成分进行聚类分析,得到同类城市子组;输出各所述数据组对应的主成分、各所述数据组之间的指标相关性以及所述同类城市子组。2.根据权利要求1所述的城市更新发展指标分析方法,其特征在于,将预设城市集合对应的原始数据进行第一umap降维处理,并将第一umap降维处理后的原始数据分类为至少两个数据组的步骤,包括:将预设城市集合对应的原始数据进行第一预处理,得到初始数据,其中,所述第一预处理包括缺失值和标准化处理;基于umap分析将高维的初始数据映射到二维空间;将映射到二维空间内的初始数据分类为至少两个数据组。3.根据权利要求1所述的城市更新发展指标分析方法,其特征在于,分别对各所述数据组进行主成分降维分析,得到各所述数据组对应的主成分以及各所述数据组之间的指标相关性的步骤,包括:将各数据组中第一umap降维处理后的原始数据进行第二预处理,得到参考数据,其中,所述第二预处理包括缺失值和标准化处理;基于所述参考数据计算协方差矩阵,得到特征值、特征向量以及各所述特征向量对应的方差;根据特征值确定主成分的个数;选择各主成分对应的特征向量,形成荷载矩阵,并计算主成分线性组合系数矩阵;基于各所述特征向量对应的方差以及所述主成分线性组合系数矩阵计算指标权重。将指标权重从大到小排列为目标序列,得到各所述数据组之间的指标相关性。4.根据权利要求1所述的城市更新发展指标分析方法,其特征在于,基于各所述数据组对应的主成分分别进行第二umap降维处理,并将第二umap降维处理后的主成分进行聚类分析,得到同类城市子组的步骤,包括:通过umap分析分别将各所述数据组对应的主成分映射到三维空间;对于任一数据组,在所述三维空间中进行目标类型的聚类分析,得到多个所述同类城市子组,其中,所述目标类型的聚类分析包括k-means聚类分析。5.一种城市更新发展指标体系的数据分析装置,其特征在于,所述城市更新发展指标体系的数据分析装置包括:第一umap降维模块,用于将预设城市集合对应的原始数据进行第一umap降维处理,并将第一umap降维处理后的原始数据分类为至少两个数据组,其中,所述原始数据为高维数
据,所述原始数据包括预设数量个预设类型的城市更新发展指标;主成分降维模块,用于分别对各所述数据组进行主成分降维分析,得到各所述数据组对应的主成分以及各所述数据组之间的指标相关性;第二umap降维模块,用于基于各所述数据组对应的主成分分别进行第二umap降维处理,并将第二umap降维处理后的主成分进行聚类分析,得到同类城市子组;输出模块,用于输出各所述数据组对应的主成分、各所述数据组之间的指标相关性以及所述同类城市子组。6.根据权利要求5所述的城市更新发展指标体系的数据分析装置,其特征在于,所述第一umap降维模块具体用于:将预设城市集合对应的原始数据进行第一预处理,得到初始数据,其中,所述第一预处理包括缺失值和标准化处理;基于umap分析将高维的初始数据映射到二维空间;将映射到二维空间内的初始数据分类为至少两个数据组。7.根据权利要求5所述的城市更新发展指标体系的数据分析装置,其特征在于,所述主成分降维模块具体用于:将各数据组中第一umap降维处理后的原始数据进行第二预处理,得到参考数据,其中,所述第二预处理包括缺失值和标准化处理;基于所述参考数据计算协方差矩阵,得到特征值、特征向量以及各所述特征向量对应的方差;根据特征值确定主成分的个数;选择各主成分对应的特征向量,形成荷载矩阵,并计算主成分线性组合系数矩阵;基于各所述特征向量对应的方差以及所述主成分线性组合系数矩阵计算指标权重。将指标权重从大到小排列为目标序列,得到各所述数据组之间的指标相关性。8.根据权利要求5所述的城市更新发展指标体系的数据分析装置,其特征在于,所述第二umap降维模块具体用于:通过umap分析分别将各所述数据组对应的主成分映射到三维空间;对于任一数据组,在所述三维空间中进行目标类型的聚类分析,得到多个所述同类城市子组,其中,所述目标类型的聚类分析包括k-means聚类分析。9.一种电子设备,其特征在于,所述电子设备包括处理器和存储器,所述存储器存储有计算机程序,所述计算机程序在所述处理器上执行时实现权利要求1-4中任一项所述的城市更新发展指标分析方法。10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序在处理器上执行时实现权利要求1-4中任一项所述的城市更新发展指标分析方法。

技术总结
本申请公开一种城市更新发展指标分析方法、装置、电子设备及介质,该方法包括:将预设城市集合对应的高维原始数据进行第一UMAP降维处理,并将第一UMAP降维处理后的原始数据分类为至少两个数据组;分别对各数据组进行主成分降维分析,得到各数据组对应的主成分以及各数据组之间的指标相关性;基于各数据组对应的主成分分别进行第二UMAP降维处理,并将第二UMAP降维处理后的主成分进行聚类分析,得到同类城市子组;输出各数据组对应的主成分、各数据组之间的指标相关性以及同类城市子组。本申请通过对高维数据进行多重降维分析,将城市群量化为更精细的类别,能够准确分析指标的重要性以及城市间的相关性。性以及城市间的相关性。性以及城市间的相关性。


技术研发人员:王犀 张雨心 凌献尧
受保护的技术使用者:清大睿达(厦门)智能科技有限公司
技术研发日:2023.05.09
技术公布日:2023/8/16
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐