一种健康数据采集及智能分析方法

未命名 09-12 阅读:97 评论:0


1.本发明涉及健康数据处理技术领域,具体涉及一种健康数据采集及智能分析方法。


背景技术:

2.近年来,健康数据的重要性在医疗和健康管理领域得到了广泛认可。随着技术的进步和智能设备的普及,人们能够方便地收集、存储和分析各种健康数据,如心率、血压、睡眠质量等。这些数据提供了宝贵的信息,可以用于个体化的健康管理、预防疾病和改善生活方式。用户画像是对特定个体的综合描述和分析,包括其特征、需求、行为模式等方面的信息。在健康领域中,用户画像是通过分析个人的健康数据来了解其健康状况、生活方式和特定需求的一种方法。
3.在用户画像的构建过程,需要对采集的用户的健康数据进行降维处理,将降维后的用户数据的特征向量来作为用户画像的信息。但是由于采集的用户的健康数据中维度数据较复杂,并且这些维度数据中存在一些数据的变化是由于其他维度数据而产生的,因此传统的数据降维过程中会使得一些不重要的健康数据作为构建用户画像过程中所使用的数据;基于此,本发明提出一种健康数据采集及智能分析方法,通过对用户的健康数据进行自适应pca降维方法,得到准确的降维结果进而获取准确的用户画像。


技术实现要素:

4.本发明提供一种健康数据采集及智能分析方法,以解决现有的问题。
5.本发明的一种健康数据采集及智能分析方法采用如下技术方案:本发明提供了一种健康数据采集及智能分析方法,该方法包括以下步骤:获取多个用户的多维度健康数据;获取任意维度健康数据的若干个分量,获取健康数据的分量与健康数据之间的相关性,根据健康数据的分量与健康数据之间的相关性获得健康数据的分量与其他维度的健康数据之间的相关性参数;根据相关性和相关性参数获得不同维度的健康数据之间的关联性;根据健康数据中数据点的差异,获得健康数据的筛选程度,根据筛选程度的大小,获得用户的基本数据;对所有用户的基本数据进行聚类,获得若干个用户聚类簇,根据用户聚类簇中数据点之间的距离,以及健康数据之间的关联性,获得维度时间的第一联系性;根据第一联系性的大小获得维度集合,对任意一个用户聚类簇中,任意维度集合中一个维度的健康数据进行聚类,获得若干个数值聚类簇,根据数值聚类簇获得波动变化范围;根据维度的数量和第一联系性获得参数a,利用健康数据和波动变化范围之间的差异,对参数a进行校正,获得维度的第二联系性;利用第二联系性对主成分分析算法进行校正,获得任意用户的多维度健康数据的降维数据,根据降维数据获取用户画像,实现健康数据的智能分析。
6.进一步的,所述相关性参数的获取方法为:首先,利用独立成分分析算法获取任意维度的健康数据对应的若干个独立成分分量,记为健康数据的分量,并获取第个维度的健康数据的第个分量与第个维度的健康数据之间的皮尔逊相关系数,记为第个维度的第个分量与第个维度的数据之间的相关性,获得用户每天的第个维度的第个分量与第个维度的数据之间的相关性;然后,以天数作为横轴,以相关性作为纵轴,构建相关性的变化曲线,记为相关性曲线,根据健康数据以及健康数据的分量,获得任意维度的健康数据的分量与其他维度的健康数据之间的相关性参数,具体计算方法为:其中,表示第个维度的健康数据的第个分量,与第个维度的健康数据之间的相关性参数;表示第个维度的健康数据的第个分量,与第个维度的健康数据之间的相关性曲线中数据点的数量;表示第个维度的健康数据的第个分量,与第个维度的健康数据之间的相关性曲线中,第个数据点的数值;表示第个维度的健康数据的第个分量,与第个维度的健康数据之间的相关性曲线中,所有数据点的均值。
7.进一步的,所述关联性的获取方法为:将第个维度的健康数据与第个维度的健康数据的所有分量之间的相关性,记为第一特征;第个维度的健康数据的所有分量与第个维度的健康数据之间的相关性参数,记为第二特征;第一特征乘以第二特征,获得第个维度的健康数据与第个维度的关联性。
8.进一步的,所述筛选程度的获取方法为:获取任意健康数据中各个数据点的斜率;并获取任意健康数据的后向差分序列,记为健康差分序列,获取健康差分序列中连续为0时,数字0对应的数量,记为数值不变间隔,获取健康差分序列中所有的数值不变间隔的平均值,记为健康数据的变化平均间隔;利用指数衰减函数将所有数据点的平均斜率进行归一化处理,获得数值x,将数值x与变化平均间隔的乘积结果,记为对应维度的健康数据的筛选程度。
9.进一步的,所述基本数据的获取方法为:对所有维度的健康数据的筛选程度进行线性归一化处理,获取最大的筛选程度对应的健康数据,记为特殊健康数据,获取所有用户的特殊健康数据;获取所有用户中每个维度下的特殊健康数据的数量,将每个维度下的特殊健康数据的数量,与所有用户的所有健康数据的数量的比值,记为对应维度下健康数据的特殊比值,将特殊比值最大时对应维度的健康数据,记为用户的基本数据。
10.进一步的,所述第一联系性的获取方法为:利用dbscan聚类算法,对所有用户的基本数据进行聚类,获得若干个聚类簇,记为
用户聚类簇;根据用户聚类簇中数据点之间的距离获得用户聚类簇的聚集性;将所有用户聚类簇的聚集性,与所有用户聚类簇下所有用户中所有维度中,第个维度的健康数据与第个维度的健康数据的平均关联性的乘积结果,记为第个维度与第个维度的第一联系性。
11.进一步的,所述聚集性的获取方法为:利用指数衰减函数,对任意用户聚类簇中所有数据点之间的平均距离,与聚类簇中所有数据点的最大距离治安的比值进行归一化,将归一化结果记为用户聚类簇的聚集性。
12.进一步的,所述波动变化范围的获取方法为:步骤(1),获取任意维度的健康数据与其他维度的健康数据之间的第一联系性,将大于预设的第一联系性阈值时的维度,记为对应维度的联系维度,获得任意维度的若干个联系维度形成的集合,记为维度集合;步骤(2),利用dbscan聚类算法对任意一个用户聚类簇中,任意维度集合中任意一个维度的健康数据的所有数据点进行聚类,获得多个聚类簇,记为数值聚类簇;获取任意数值聚类簇中数据点的数量,记为第一数量;获取任意数值聚簇中每个数据点在健康数据中的时间点,记为第一时间点,获取在其他维度的健康数据中所第一时间点对应的数据点,获取相同数值的数据点的数量,记为第二数量,将第二数量与第一数量的比值记为联合分布概率;步骤(3),根据联合分布概率和健康数据中数据点的数值,获得用户聚类簇中任意用户的第个维度的健康数据,相对第个维度的任意数值聚类簇的波动变化范围,具体计算方法为:其中,表示第个维度的健康数据相对第个维度的波动变化范围;表示第个维度的任意数值聚类簇中数据点的数量;表示第个维度的任意数值聚类簇中的第个数据点的时间点,在第个维度的健康数据中对应数据点的数量;表示第个维度的任意数值聚类簇中第个数据点,与在第个维度的健康数据中对应时间点的第个数据点形成的联合分布概率。
13.进一步的,所述第二联系性的获取方法为:获取第个维度的健康数据相对所有维度的最大波动变化范围,记为,将第个维度的健康数据中所有数据点的数值,与最大波动变化范围之间的最小差值绝对值,记为校正系数;任意用户的第个维度的第二联系性的具体计算方法为:
其中,表示第个维度的第二联系性;表示除第个维度外的其他维度的数量,表示第个维度的关联维度的数量;表示校正系数,表示第个维度与对应关联维度中的第个维度之间的第一联系性;表示以自然常数为底数的指数函数。
14.进一步的,所述利用第二联系性对主成分分析算法进行校正,获得任意用户的多维度健康数据的降维数据,根据降维数据获取用户画像,实现健康数据的智能分析,包括的具体步骤如下:首先,利用主成分分析算法对用户的多维度健康数据进行处理,在降维过程中,通过协方差矩阵中获取每个维度的健康数据的特征值,将每个维度的第二联系性与对应的特征值相乘,获得每个维度的健康数据的校正后特征值,完成对多维度健康数据中每一维的健康数据的降维数据;然后,获得大量不同年龄和不同性别的用户的降维数据,将健康、亚健康以及不健康作为降维数据的人工标签,对用户的降维数据进行打标签,将任意用户的所有带有人工标签的降维数据作为一个样本,则由大量的样本形成训练dnn神经网络的数据集,将数据集作为dnn神经网络,结合交叉熵损失函数,对dnn神经网络进行训练,输出用户的健康状态,将用户的年龄、性别以及健康状态,作为用户画像,用于对用户的健康状态进行描述。
15.本发明的技术方案的有益效果是:根据单个用户其自身的维度之间的变化分析,并根据维度数据的分布特性,对多个用户之间进行维度数据层面上的分类,在具有较强相似性的用户之间进行分析,进而得到当前维度与其他维度之间的第一联系性。并结合当前维度数据中的具有关联性的维度数据的分布变化,来获取具有关联性数据的联合分布来获取当前维度数据的波动范围,并结合此波动范围来获取当前维度数据的第二联系性值,进而实现自适应pca降维。避免了传统的pca降维方法中得到的降维结果中包含了较多数据的变化受到其他维度的数据变化影响的维度数据,并且保证了一些具有代表性的维度数据保留,使得计算得到的pca降维结果更加准确,可以精确的构建用户画像。
附图说明
16.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
17.图1为本发明一种健康数据采集及智能分析方法的步骤流程图。
具体实施方式
18.为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种健康数据采集及智能分析方法,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
19.除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的
技术人员通常理解的含义相同。
20.下面结合附图具体的说明本发明所提供的一种健康数据采集及智能分析方法的具体方案。
21.请参阅图1,其示出了本发明一个实施例提供的一种健康数据采集及智能分析方法的步骤流程图,该方法包括以下步骤:步骤s001,获取用户的多维度健康数据。
22.利用带有多种传感器的智能设备实时采集用户的健康数据,分别为心率、血压、体温以及睡眠质量;另外,采集用户的非传感器数据,例如包含性别、年龄的用户个人信息,以及包含血常规检测、尿常规检测和心电图数据的相关医学指标,利用词袋模型将采集非传感器数据转换为对应的多维数据,记为第一数据。
23.需要说明的是,所述传感器有心率传感器、压力传感器、体温传感器、加速度传感器、红外线传感器,其中,心率传感器可以获取用户的心率,体温传感器可以获取用户的体温,压力传感器可以获取用户的血压;压力传感器、加速度传感器和红外线传感器可以检测睡眠期间身体的移动、呼吸和心率等指标,从而评估睡眠的深度和质量,获取用户的睡眠质量。
24.则由用户的心率、血压、体温、睡眠质量以及第一数据共同形成用户的多维度健康数据。
25.至此,获得用户的多维健康数据。
26.步骤s002,根据健康数据的分量和健康数据的相关性,进一步获得任意两个维度之间的第一联系性。
27.在多维度健康数据中,存在部分维度的健康数据受到其他维度的健康数据变化的影响,例如睡眠质量的变化受到心率、呼吸频率的影响,而部分健康数据的变化不受其他健康数据的影响;另外,存在部分健康数据发生变化是受到其他维度的健康数据影响而造成的,但是该健康数据具有较强的代表性意义,例如当睡眠质量不好时,但是与其有关的心率的变化较为正常,则该用户的睡眠质量较具有代表性。
28.因此本实施例的目的为保证健康数据具有代表性,数据点的数值不受其他维度的健康数据的影响,以对用户进行健康评估。
29.由于用户的健康数据不随主观变化,即健康数据的变化是客观存在的,不同用户之间的不同维度的健康数据所发生的变化可能不相同,因此本实施例在分析任意维度的健康数据与其他维度的健康数据之间的联系时,需要根据单个用户其自身的维度之间的变化分析,并根据维度数据的分布特性,对多个用户之间进行维度数据层面上的分类,在具有较强相似性的用户之间进行分析,进而得到任意维度的健康数据与其他维度的健康数据之间的联系性。
30.步骤(1),首先,利用独立成分分析算法获取任意维度的健康数据对应的若干个独立成分分量,记为健康数据的分量,并获取第个维度的健康数据的第个分量,与第个维度的健康数据之间的皮尔逊相关系数,记为第个维度的第个分量与第个维度的数据之间的相关性,获得用户每天的第个维度的第个分量与第个维度的数据之间的相关性;
需要说明的是,预设独立成分分析算法的独立成分数量参数为6,可根据实际情况进行调节,本实施例不作具体限定。
31.然后,以天数作为横轴,以相关性作为纵轴,构建相关性的变化曲线,记为相关性曲线,若相关性曲线的变化较大,即反映了对应的第个维度的第个分量与第个维度的数据之间的相关性变化较大。
32.根据健康数据以及健康数据的分量,获得任意维度的健康数据的分量与其他维度的健康数据之间的相关性参数,具体计算方法为:其中,表示第个维度的健康数据的第个分量,与第个维度的健康数据之间的相关性参数;表示第个维度的健康数据的第个分量,与第个维度的健康数据之间的相关性曲线中数据点的数量;表示第个维度的健康数据的第个分量,与第个维度的健康数据之间的相关性曲线中,第个数据点的数值;表示第个维度的健康数据的第个分量,与第个维度的健康数据之间的相关性曲线中,所有数据点的均值;表示第个维度的健康数据的第个分量,与第个维度的健康数据的相关性值的权重值,数据点的序数越小,相关性参数的值越不可信,则对应的权重值越小。
33.最后,获得所有维度的健康数据的任意分量与其他健康数据之间的相关性参数,并利用softmax函数对所有相关性参数进行归一化处理。
34.需要说明的是,softmax函数为指数归一化函数,为现有的归一化方法,本实施例不过多赘述。
35.步骤(2),首先,利用线性归一化算法对任意维度的健康数据进行归一化处理,将其量化到同一个数据级;然后,获取第个维度的健康数据,与其他第个维度的关联性,具体计算方法为:其中,表示第个维度的健康数据,与第个维度的健康数据之间的关联性;表示第个维度的健康数据所对应分量的数量;表示第个维度的健康数据,与第个维度的健康数据的第个分量之间的相关性;表示第个维度的健康数据的第个分量,与第个维度的健康数据之间的相关性参数。
36.步骤(3),由于用户的差异,若仅分析单个用户的多维度健康数据,来获取健康数据之间的关联性会出现较大误差,因此本实施例通过分析多个用户之间关联性,来获取综合的维度数据之间的第一联系性。
37.用户的相似性根据用户的基本情况数据有关,用户的基本情况数据随着时间的变
化较小,因此本实施例需要对健康数据进行筛选,获取变化较小的健康数据;首先,获取任意健康数据中各个数据点的斜率;并获取任意健康数据的后向差分序列,记为健康差分序列,获取健康差分序列中连续为0时,数字0对应的数量,记为数值不变间隔,获取健康差分序列中所有的数值不变间隔的平均值,记为健康数据的变化平均间隔;根据各数据点的斜率以及变化平均间隔,获取对应维度的健康数据的筛选程度,具体计算方法为:其中,表示健康数据的筛选程度;表示健康数据中所有数据点的平均斜率,表示健康数据的变化平均间隔;exp()表示以自然常数为底数的指数函数。
38.然后,对所有维度的健康数据的筛选程度进行线性归一化处理,获取最大的筛选程度对应的健康数据,记为特殊健康数据,获取所有用户的特殊健康数据,获取所有用户中每个维度下的特殊健康数据的数量,将每个维度下的特殊健康数据的数量,与所有用户的所有健康数据的数量的比值,记为对应维度下健康数据的特殊比值,将特殊比值最大时对应维度的健康数据,记为用户的基本数据;需要说明的是,当特殊比值的最大值存在多个时,选取特殊比值的最大值对应的每个维度下,所有特殊健康数据的平均筛选程度最大值,所对应维度的健康数据,作为基本数据。
39.最后,利用dbscan聚类算法,对所有用户的基本数据进行聚类,获得若干个聚类簇,记为用户聚类簇;每个用户聚类簇反映了同一个类别下的用户。
40.需要说明的是,预设dbscan聚类算法的邻域半径为0.5,密度阈值为6,可根据实际情况进行调节,本实施例不作具体限定。
41.步骤(4),首先,根据用户聚类簇中数据点之间的距离获得用户聚类簇的聚集性,具体计算方法为:其中,表示第个用户聚类簇中数据点之间的平均距离,表示第个用户聚类簇中所有数据点的最大距离;表示以自然常数为底数的指数函数;需要说明的是,用户聚类簇中的一个数据点,对应一个用户的基本数据。
42.然后,获取任意用户聚类簇中所有用户的任意维度的健康数据之间的关联性,根据用户聚类簇的聚集性以及用户聚类簇中健康数据的关联性,获得第个维度与第个维度的第一联系性,具体计算方法为:其中,表示第个维度与第个维度之间的第一联系性;表示用户聚类簇的数量,表示第个用户聚类簇的聚集性;表示第个用户聚类簇下所有用户中所有维度中,第个维度的健康数据与第个维度的健康数据的平均关联性。
43.若用户聚类簇的聚集性较大,则对应用户聚类簇较为离散,用户聚类簇内健康数据之间的第一联系性的波动变化较大,则在获取第一联系性时权重值较小。
44.至此,获得健康数据之间的第一联系性。
45.步骤s003,根据第一联系性进一步获得数值聚类簇,根据数值聚类簇获得任意维度的第二联系性。
46.第一联系性越大,表明对应维度的健康数据易受到其他维度的健康数据的影响,因此获取第一联系性小的健康数据,但是在第一联系性大的部分维度中存在具有代表性的健康数据,例如某个用户的睡眠质量不好,但是与其有关的心率为正常的,则该用户的睡眠质量具有代表性。因此需要结合健康数据中具有关联性的健康数据的分布变化,获取具有关联性健康数据的联合分布,以获取对应维度的健康数据的波动范围,并结合波动范围来获取对应维度的健康数据的第二联系性。
47.步骤(1),获取任意维度的健康数据与其他维度的健康数据之间的第一联系性,将大于预设的第一联系性阈值时的维度,记为对应维度的联系维度,获得任意维度的若干个联系维度形成的集合,记为维度集合;步骤(2),首先,利用dbscan聚类算法对任意一个用户聚类簇中,任意维度集合中任意一个维度的健康数据的所有数据点进行聚类,获得多个聚类簇,记为数值聚类簇;获取任意数值聚类簇中数据点的数量,记为第一数量;获取任意数值聚簇中每个数据点在健康数据中的时间点,记为第一时间点,获取在其他维度的健康数据中所第一时间点对应的数据点,获取相同数值的数据点的数量,记为第二数量,将第二数量与第一数量的比值记为联合分布概率;需要说明的是,本实施例中的dbscan聚类算法的相关参数均相同。
48.然后,根据联合分布概率和健康数据中数据点的数值,获得用户聚类簇中任意用户的第个维度的健康数据,相对第个维度的任意数值聚类簇的波动变化范围,具体计算方法为:其中,表示第个维度的健康数据相对第个维度的波动变化范围;表示第个维度的任意数值聚类簇中数据点的数量;表示第个维度的任意数值聚类簇中的第个数据点的时间点,在第个维度的健康数据中对应数据点的数量;表示第个维度的任意数值聚类簇中第个数据点,与在第个维度的健康数据中对应时间点的第个数据点形成的联合分布概率;获得第个维度的健康数据相对第个维度的所有聚类簇的波动变化范围,将第个维度的健康数据相对第个维度的所有聚类簇的波动变化范围的平均值,记为第个维度的健康数据相对第个维度的波动变化范围;其中若出现的联合分布概率越大,则在第个维度的数值聚类簇中第个数据点,与第个维度的健康数据中对应时间点的第个数据点的权重值就越大。
49.步骤(3),获取第个维度的健康数据相对所有维度的最大波动变化范围,记为,
将第个维度的健康数据中所有数据点的数值,与最大波动变化范围之间的最小差值绝对值,记为校正系数;任意用户的第个维度的第二联系性的具体计算方法为:其中,表示第个维度的第二联系性;表示除第个维度外的其他维度的数量,表示第个维度的关联维度的数量;表示校正系数,表示第个维度与对应关联维度中的第个维度之间的第一联系性;表示以自然常数为底数的指数函数;表示第个维度的关联性权重值,若该值越大,则对应与第个维度具有关联性的维度越小,则对应的为本实施例中越需要保留的维度数据;表示波动权重值,若该波动权重越大,则对应的第个维度下的数据的代表性越大,则越需要保留该维度的数据特征。
50.步骤s004,利用第二联系性对主成分分析算法进行优化,获取用户画像,实现对健康数据的智能分析。
51.首先,利用主成分分析算法对用户的多维度健康数据进行处理,在降维过程中,通过协方差矩阵中获取每个维度的健康数据的特征值,将每个维度的第二联系性与对应的特征值相乘,获得每个维度的健康数据的校正后特征值,完成对多维度健康数据中每一维的健康数据的降维数据;然后,获得大量不同年龄和不同性别的用户的降维数据,将健康、亚健康以及不健康作为降维数据的人工标签,由领域内专业人员对用户的降维数据进行打标签,将任意用户的所有带有人工标签的降维数据作为一个样本,则由大量的样本形成训练dnn神经网络的数据集,将数据集作为dnn神经网络,结合交叉熵损失函数,对dnn神经网络进行训练,输出用户的健康状态,将用户的年龄、性别以及健康状态,作为用户画像,用于对用户的健康状态进行描述。
52.至此实现对用户的健康数据的智能分析。
53.需要说明的是,主成分分析算法为现有算法,本实施例不过多赘述。
54.需要说明的是,本实施例中所用的模型仅用于表示负相关关系和约束模型输出的结果处于区间内,具体实施时,可替换成具有同样目的的其他模型,本实施例只是以模型为例进行叙述,不对其做具体限定,其中是指该模型的输入。
55.以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

技术特征:
1.一种健康数据采集及智能分析方法,其特征在于,该方法包括以下步骤:获取多个用户的多维度健康数据;获取任意维度健康数据的若干个分量,获取健康数据的分量与健康数据之间的相关性,根据健康数据的分量与健康数据之间的相关性获得健康数据的分量与其他维度的健康数据之间的相关性参数;根据相关性和相关性参数获得不同维度的健康数据之间的关联性;根据健康数据中数据点的差异,获得健康数据的筛选程度,根据筛选程度的大小,获得用户的基本数据;对所有用户的基本数据进行聚类,获得若干个用户聚类簇,根据用户聚类簇中数据点之间的距离,以及健康数据之间的关联性,获得维度时间的第一联系性;根据第一联系性的大小获得维度集合,对任意一个用户聚类簇中,任意维度集合中一个维度的健康数据进行聚类,获得若干个数值聚类簇,根据数值聚类簇获得波动变化范围;根据维度的数量和第一联系性获得参数a,利用健康数据和波动变化范围之间的差异,对参数a进行校正,获得维度的第二联系性;利用第二联系性对主成分分析算法进行校正,获得任意用户的多维度健康数据的降维数据,根据降维数据获取用户画像,实现健康数据的智能分析。2.根据权利要求1所述一种健康数据采集及智能分析方法,其特征在于,所述相关性参数的获取方法为:首先,利用独立成分分析算法获取任意维度的健康数据对应的若干个独立成分分量,记为健康数据的分量,并获取第个维度的健康数据的第个分量与第个维度的健康数据之间的皮尔逊相关系数,记为第个维度的第个分量与第个维度的数据之间的相关性,获得用户每天的第个维度的第个分量与第个维度的数据之间的相关性;然后,以天数作为横轴,以相关性作为纵轴,构建相关性的变化曲线,记为相关性曲线,根据健康数据以及健康数据的分量,获得任意维度的健康数据的分量与其他维度的健康数据之间的相关性参数,具体计算方法为:其中,表示第个维度的健康数据的第个分量,与第个维度的健康数据之间的相关性参数;表示第个维度的健康数据的第个分量,与第个维度的健康数据之间的相关性曲线中数据点的数量;表示第个维度的健康数据的第个分量,与第个维度的健康数据之间的相关性曲线中,第个数据点的数值;表示第个维度的健康数据的第个分量,与第个维度的健康数据之间的相关性曲线中,所有数据点的均值。3.根据权利要求1所述一种健康数据采集及智能分析方法,其特征在于,所述关联性的获取方法为:将第个维度的健康数据与第个维度的健康数据的所有分量之间的相关性,记为第一特征;第个维度的健康数据的所有分量与第个维度的健康数据之间的相关性参数,记为第
二特征;第一特征乘以第二特征,获得第个维度的健康数据与第个维度的关联性。4.根据权利要求1所述一种健康数据采集及智能分析方法,其特征在于,所述筛选程度的获取方法为:获取任意健康数据中各个数据点的斜率;并获取任意健康数据的后向差分序列,记为健康差分序列,获取健康差分序列中连续为0时,数字0对应的数量,记为数值不变间隔,获取健康差分序列中所有的数值不变间隔的平均值,记为健康数据的变化平均间隔;利用指数衰减函数将所有数据点的平均斜率进行归一化处理,获得数值x,将数值x与变化平均间隔的乘积结果,记为对应维度的健康数据的筛选程度。5.根据权利要求1所述一种健康数据采集及智能分析方法,其特征在于,所述基本数据的获取方法为:对所有维度的健康数据的筛选程度进行线性归一化处理,获取最大的筛选程度对应的健康数据,记为特殊健康数据,获取所有用户的特殊健康数据;获取所有用户中每个维度下的特殊健康数据的数量,将每个维度下的特殊健康数据的数量,与所有用户的所有健康数据的数量的比值,记为对应维度下健康数据的特殊比值,将特殊比值最大时对应维度的健康数据,记为用户的基本数据。6.根据权利要求1所述一种健康数据采集及智能分析方法,其特征在于,所述第一联系性的获取方法为:利用dbscan聚类算法,对所有用户的基本数据进行聚类,获得若干个聚类簇,记为用户聚类簇;根据用户聚类簇中数据点之间的距离获得用户聚类簇的聚集性;将所有用户聚类簇的聚集性,与所有用户聚类簇下所有用户中所有维度中,第个维度的健康数据与第个维度的健康数据的平均关联性的乘积结果,记为第个维度与第个维度的第一联系性。7.根据权利要求6所述一种健康数据采集及智能分析方法,其特征在于,所述聚集性的获取方法为:利用指数衰减函数,对任意用户聚类簇中所有数据点之间的平均距离,与聚类簇中所有数据点的最大距离治安的比值进行归一化,将归一化结果记为用户聚类簇的聚集性。8.根据权利要求1所述一种健康数据采集及智能分析方法,其特征在于,所述波动变化范围的获取方法为:步骤(1),获取任意维度的健康数据与其他维度的健康数据之间的第一联系性,将大于预设的第一联系性阈值时的维度,记为对应维度的联系维度,获得任意维度的若干个联系维度形成的集合,记为维度集合;步骤(2),利用dbscan聚类算法对任意一个用户聚类簇中,任意维度集合中任意一个维度的健康数据的所有数据点进行聚类,获得多个聚类簇,记为数值聚类簇;获取任意数值聚类簇中数据点的数量,记为第一数量;获取任意数值聚簇中每个数据点在健康数据中的时间点,记为第一时间点,获取在其他维度的健康数据中所第一时间点对应的数据点,获取相同数值的数据点的数量,记为第二数量,将第二数量与第一数量的比值记为联合分布概率;步骤(3),根据联合分布概率和健康数据中数据点的数值,获得用户聚类簇中任意用户
的第个维度的健康数据,相对第个维度的任意数值聚类簇的波动变化范围,具体计算方法为:其中,表示第个维度的健康数据相对第个维度的波动变化范围;表示第个维度的任意数值聚类簇中数据点的数量;表示第个维度的任意数值聚类簇中的第个数据点的时间点,在第个维度的健康数据中对应数据点的数量;表示第个维度的任意数值聚类簇中第个数据点,与在第个维度的健康数据中对应时间点的第个数据点形成的联合分布概率。9.根据权利要求1所述一种健康数据采集及智能分析方法,其特征在于,所述第二联系性的获取方法为:获取第个维度的健康数据相对所有维度的最大波动变化范围,记为,将第个维度的健康数据中所有数据点的数值,与最大波动变化范围之间的最小差值绝对值,记为校正系数;任意用户的第个维度的第二联系性的具体计算方法为:其中,表示第个维度的第二联系性;表示除第个维度外的其他维度的数量,表示第个维度的关联维度的数量;表示校正系数,表示第个维度与对应关联维度中的第个维度之间的第一联系性;表示以自然常数为底数的指数函数。10.根据权利要求1所述一种健康数据采集及智能分析方法,其特征在于,所述利用第二联系性对主成分分析算法进行校正,获得任意用户的多维度健康数据的降维数据,根据降维数据获取用户画像,实现健康数据的智能分析,包括的具体步骤如下:首先,利用主成分分析算法对用户的多维度健康数据进行处理,在降维过程中,通过协方差矩阵中获取每个维度的健康数据的特征值,将每个维度的第二联系性与对应的特征值相乘,获得每个维度的健康数据的校正后特征值,完成对多维度健康数据中每一维的健康数据的降维数据;然后,获得大量不同年龄和不同性别的用户的降维数据,将健康、亚健康以及不健康作为降维数据的人工标签,对用户的降维数据进行打标签,将任意用户的所有带有人工标签的降维数据作为一个样本,则由大量的样本形成训练dnn神经网络的数据集,将数据集作为dnn神经网络,结合交叉熵损失函数,对dnn神经网络进行训练,输出用户的健康状态,将用户的年龄、性别以及健康状态,作为用户画像,用于对用户的健康状态进行描述。

技术总结
本发明涉及健康数据处理技术领域,具体涉及一种健康数据采集及智能分析方法,包括:根据健康数据的分量和健康数据的相关性,进一步获得任意两个维度之间的第一联系性,根据第一联系性进一步获得数值聚类簇,根据数值聚类簇获得任意维度的第二联系性,利用第二联系性对主成分分析算法进行优化,获取用户画像,实现对健康数据的智能分析。本发明实现自适应PCA降维,避免了传统的PCA降维方法中得到的降维结果中包含了较多数据的变化受到其他维度的数据变化影响的维度数据,并且保证了一些具有代表性的维度数据保留,使得计算得到的PCA降维结果更加准确,可以根据健康数据精确的构建用户画像。用户画像。用户画像。


技术研发人员:张光 王大伟 胡文琦 张晓栋
受保护的技术使用者:山东第一医科大学第一附属医院(山东省千佛山医院)
技术研发日:2023.08.07
技术公布日:2023/9/9
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐