一种基于人工智能的可视化数据分析系统及方法与流程
未命名
09-22
阅读:65
评论:0

1.本发明涉及人工智能技术领域,具体为一种基于人工智能的可视化数据分析系统及方法。
背景技术:
2.随着网络技术的快速发展迭代,进入微电影时代,移动时代,新媒体时代,通过种种因素共同作用下诞生了短视频,近年,我国各大互联网巨头纷纷在短视频行业发现商机,加大对短视频行业的投入,想要打造出自己的平台,对各个领域进行细分,打造出美食、游戏、摄影、美景等更具特色的内容,引起了广大人民的热爱狂潮。
3.短视频行业的快速普及,应该更加注重内容的质量,在生活中,经常会遇到以下情况:很多年幼的孩子的行为会表现得极具成人化,因为小孩子的模仿力是很强的,当父母在浏览短视频时,孩子拿到父母手机时同样会浏览父母偏爱的视频内容,由于视频内容的不确定性,对孩子的身心健康会有一定的风险。
技术实现要素:
4.本发明的目的在于提供一种基于人工智能的可视化数据分析方法,以解决上述背景技术中提出的问题。
5.为了解决上述技术问题,本发明提供如下技术方案:一种基于人工智能的可视化数据分析方法,可视化数据分析方法包括以下:
6.步骤s100:采集用户行为特征数据;
7.步骤s200:根据采集用户行为特征数据计算出用户各项行为特征的加权值,将用户各项行为特征的加权值与预设行为特征阈值对比,将用户各项行为特征的加权值超过预设行为特征阈值标记为成人标签,将用户行为特征数据低于预设行为特征阈值标记为儿童标签;的预设行为特征阈值是通过设定的特征阈值来判断用户应该被归类为成人或儿童;
8.步骤s300:根据用户行为特征数据对应的标记标签以及用户行为特征向量,建立多用户匹配模型;多用户匹配模型是指当采集到不同成人或儿童用户时的行为特征数据,通过计算用户行为特征向量与每个用户身份特征向量之间的余弦夹角来衡量用户匹配度;用户行为特征向量是指将用户行为数据转化为特征向量表示;用户身份特征向量是指将用户行为特征数据对应的标记标签转化为特征向量表示;
9.步骤s400:根据当前操作用户行为特征数据,计算出当前操作用户匹配度,与建立多用户匹配模型进行对比,判断当前用户使用者身份,实现用户身份的转换;
10.用户行为特征数据包括:观看视频时长、观看同一个视频的次数、在观看视频时点赞评论频繁程度、分享或转发视频的次数、搜索关键词等。
11.进一步的,步骤s100包括:
12.步骤s110:设置目标视频软件,每当检测到用户打开目标视频软件,对用户在单位时间内对各短视频内容产生的行为进行特征采集,并存储到用户行为特征数据库中;
13.步骤s120:对用户行为特征数据库中的用户行为特征数据进行筛选处理,过滤掉冗余的用户行为特征数据;
14.步骤s130:用户行为特征数据包括:根据单位时间内每个视频类型,统计用户浏览类型视频的个数,用户浏览同一视频的次数,浏览各短视频进行评论,点赞,分享次数,搜索同一类型关键词的数量。
15.进一步的,步骤s200包括:
16.步骤s210:记用户行为特征数据为xn,xn内包括{x1,x2,...,xn},其中x表示行为特征类型,n表示行为特征类型总个数;
17.步骤s220:根据公式:zi=w1*x1+w2*x2+...+wn*xn+b计算用户各项行为特征的加权值,其中w1,w2,w3,...,wn表示的是每个特征对应的权值系数,b表示偏移系数,主要用来限制权值系数的大小,在用户操作阶段,i表示所属用户浏览过程中单位时间内产生的数据波动次数,z表示视频i的各项特征的加权值,假设浏览过程中数据波动总次数为j,那么i∈[1,j],则zi表示用户各项特征的加权值,通过取zi的平均值,得出用户各项特征的加权值;
[0018]
步骤s230:将用户各项行为特征的加权值与预设行为特征阈值进行对比,当用户各项行为特征的加权值超过预设行为特征阈值标记为用户行为特征正常标签,当用户各项行为特征的加权值低于预设行为特征阈值标记为用户行为特征异常标签;
[0019]
步骤s240:对上述的行为特征数据进行标记,将用户行为特征正常标签标记为成人标签,将用户行为特征异常标签标记为儿童标签。
[0020]
进一步的,步骤s300包括:
[0021]
步骤s310:记用户行为特征向量为一个长度为n的二进制向量,当用户出现用户行为特征时,记为1,其余特征位置记为0;
[0022]
步骤s320:记用户身份特征向量为一个长度为m的二进制向量,当用户出现用户行为特征数据对应的标记标签,记为1,其余特征位置记为0;
[0023]
步骤s330:通过公式计算:用户匹配度=dot_product(a,b)/(||a||*||b||),a和b分别表示用户行为特征向量和用户身份特征向量,dot_product(a,b)表示向量a和向量b的点积,点积表示将对应位置的元素相乘并相加得到的结果,||a||表示a的范数,即表示向量a的大小,||b||表示b的范数,即表示向量b的大小。
[0024]
进一步的,步骤s400包括:
[0025]
步骤s410:采集当前用户行为特征数据;
[0026]
步骤s420:根据当前用户行为特征数据,计算出当前用户各项行为特征的加权值;
[0027]
步骤s430:根据当前用户各项行为特征的加权值,通过用户匹配度公式计算出当前用户匹配度;
[0028]
步骤s440:将当前用户匹配度与建立多用户匹配模型中的匹配度进行对比,当当前用户匹配度与建立多用户匹配模型中的匹配度作差运算,当差值在所设定的阈值范围内,则表示当前用户与建立多用户匹配模型中的用户身份相匹配;
[0029]
步骤s450:将当前用户身份切换为建立多用户匹配模型中身份相匹配的用户。
[0030]
进一步的,为更好的实现上述方法还提出了基于人工智能的可视化数据分析系统,可视化数据分析系统包括:数据采集模块、数据分析模块、数据建模模块、数据展示模块,
[0031]
数据采集模块,用于获取用户行为信息,并存储到用户行为特征数据库中;
[0032]
数据分析模块,判断用户行为特征数据是否在预设行为特征阈值范围内,将用户行为特征数据在预设行为特征阈值范围内标记为正常标签,将用户行为特征数据超过预设行为特征阈值范围标记为异常标签;
[0033]
数据建模模块,用于对用户行为特征数据以及预设行为特征数据形成个性化用户行为特征模型;
[0034]
数据展示模块,用于追踪当前用户行为特征数据,确认当前用户使用者身份,实现用户身份的转换。
[0035]
进一步的,数据采集模块包括采集单元,分类单元,
[0036]
采集单元,用于获取用户操作时行为信息;
[0037]
缓存单元,用于对用户操作时行为特征数据进行存储,并过滤掉冗余的用户行为特征数据。
[0038]
进一步的,数据分析模块包括计算单元、标记标签单元,
[0039]
计算单元,用于计算用户各项行为特征的加权值;
[0040]
标记标签单元,用于将用户各项行为特征的加权值超过预设行为特征阈值标记为成人标签,将用户行为特征数据低于预设行为特征阈值标记为儿童标签。
[0041]
进一步的,数据展示模块包括追踪单元,对比单元,转换单元,
[0042]
追踪单元,用于追踪当前用户使用过程中行为特征数据;
[0043]
对比单元,用于对比当前用户匹配度与建立多用户匹配模型中的匹配度进行对比;
[0044]
转换单元,用于将当前用户身份切换为建立多用户匹配模型中身份相匹配的用户。
[0045]
与现有技术相比,本发明所达到的有益效果是:本发明,本发明提供的技术方案能够对用户身份操作行为特征数据进行记录,生成多用户匹配模型,当用户行为发生改变时能够及时判断出当前用户身份发生了改变,并转化为与当前用户身份相匹配的身份。
附图说明
[0046]
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
[0047]
图1是本发明基于人工智能的可视化数据分析方法的流程示意图;
[0048]
图2是本发明基于人工智能的可视化数据分析系统的结构示意图;
具体实施方式
[0049]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0050]
请参阅图1-2,本发明提供技术方案:一种基于人工智能的可视化数据分析方法,步骤s100:采集用户行为特征数据包括:
[0051]
步骤s110:获取用户行为特征数据;
[0052]
步骤s120:将用户的行为特征数据归类,并为每个分类确定对应的行为特征阈值范围;
[0053]
步骤s200判断用户行为特征数据是否在预设行为特征阈值范围内,将用户行为特征数据在预设行为特征阈值范围内标记为正常标签,将用户行为特征数据超过预设行为特征阈值范围标记为异常标签包括:
[0054]
步骤s210:判断用户行为特征数据是否在预设行为特征阈值范围内,将用户行为特征数据在预设行为特征阈值范围内标记为用户行为特征正常标签,将用户行为特征数据超过预设行为特征阈值范围标记为用户行为特征异常标签;
[0055]
步骤s220:对上述的行为特征数据进行标记,将用户行为特征正常标签标记为成人标签,将用户行为特征异常标签标记为儿童标签;
[0056]
本实例可视化数据分析方法就是将用户观看视频的行为数据做统计,包括:观看视频时长、观看同一个视频的次数、在观看视频时点赞评论频繁程度、分享或转发视频的次数、搜索关键词等,当以上数据行为发生超出预设行为特征阈值范围时,需要标记用户行为特征异常标签;
[0057]
例如,一个成人用户刷短视频时,会花一个小时浏览视频,频繁滚动屏幕进行视频的切换,每个视频只浏览一次,并且偶尔会对喜欢视频点赞,评论或者分享,搜索的关键词也更为广泛(如:神舟十六号发射成功,玄武湖景点,秦始皇历史典故,油爆虾的做法,万能新手化妆公式等);相对于儿童会花一个小时只浏览4个视频,看见喜欢的人物会重复观看同一个视频,观看过程中会频繁点击屏幕,并且对于评价,分享意识没有成人那么频繁,搜索内容也比较局限(如:奥特曼、假面骑士、汪汪队超威行动、小猪佩奇、宠物、玩具等);
[0058]
步骤s300根据用户预设行为特征数据以及以及对应的标记标签,建立个性化用户行为特征模型:
[0059]
步骤s310:收集用户行为数据,从搜集的用户行为数据中提取用户行为特征;
[0060]
步骤s320:选择与用户相关的行为特征,去除冗余的用户行为数据;
[0061]
步骤s330:对用户行为特征模型进行评估,检查其准确性和有效性,并将用户行为特征模型应用于实际用户操作中;
[0062]
例如,用户刷短视频时,习惯在中午十二点到一点,晚上八点到十点期间刷短视频会预测这位用户可能是上班族,刷短视频时偏好美食类视频该用户可能是美食爱好者,餐饮界工作人员,搜索内容多为新闻类关键词该用户爱好新闻类视频,对时事,社会事件感兴趣的人,喜欢点评一些抖音短视频音乐创作者,可能是一位知名的音乐博主,基于以上用户行为特性,可以根据这些内容形成该用户的个性化用户行为特征模型;
[0063]
步骤s400追踪用户行为特征,根据建立的个性化用户行为特征模型判断当前用户使用者身份,并能够实现用户身份的转换;本发明提供的技术方案具有人物身份识别准确率高,并能够实现用户身份的切换包括:
[0064]
步骤s410:追踪用户使用过程中用户行为数据特征;
[0065]
步骤s420:分析对比当前用户与建立的个性化用户行为特征模型;
[0066]
步骤s430:根据当前用户行为特征转换为更匹配他们的身份类型;
[0067]
例如当父母在孩子取得好成绩时,允许孩子对手机进行娱乐,孩子刷短视频时,自
己的偏爱内容与父母偏好内容不同,就会搜索一些如假面骑士,芭比娃娃偏动画,少儿类的关键词,这时系统会识别当前用户身份发了改变;
[0068]
为更好的实现上述方法还提出了基于人工智能的可视化数据分析系统,可视化数据分析系统包括:数据采集模块、数据分析模块、数据建模模块、数据展示模块,
[0069]
数据采集模块,用于获取用户行为信息,对获取的用户行为特征数据归类,并为每个分类确定对应的行为特征阈值范围;
[0070]
数据分析模块,判断用户行为特征数据是否在预设行为特征阈值范围内,将用户行为特征数据在预设行为特征阈值范围内标记为正常标签,将用户行为特征数据超过预设行为特征阈值范围标记为异常标签;
[0071]
数据建模模块,用于对用户行为特征数据以及预设行为特征数据形成个性化用户行为特征模型;
[0072]
数据展示模块,用于追踪用户行为特征,确认当前用户使用者身份,实现用户身份的转换;
[0073]
其中,数据采集模块包括采集单元,分类单元;
[0074]
采集单元,用于获取用户操作时行为信息;
[0075]
分类单元,用于对用户操作时行为特征数据归类,并为每个分类确定对应的行为特征阈值范围;
[0076]
其中,数据分析模块包括判断单元、标记标签单元;
[0077]
判断单元,用于判断用户行为特征数据是否在预设行为特征阈值范围内;
[0078]
标记标签单元,用于,将用户行为特征数据在预设行为特征阈值范围内标记为正常标签,将用户行为特征数据超过预设行为特征阈值范围标记为异常标签;
[0079]
其中,数据建模模块包括特征提取单元、缓存单元,评估单元;
[0080]
特征提取单元,用于对获取的用户行为数据中提取用户行为特征;
[0081]
缓存单元,用于选择与当前用户相关的特征,去除冗余的数据;
[0082]
评估单元,用于对模型进行评估,检查其准确性和有效性,并将模型应用于实际用户操作中;
[0083]
其中,数据展示模块包括追踪单元,对比单元,转换单元;
[0084]
追踪单元,用于追踪用户使用过程中行为数据特征;
[0085]
对比单元,用于分析对比当前用户与建立的个性化用户行为特征模型;
[0086]
转换单元,用于根据当前用户行为特征转换为更匹配他们的身份类型。
[0087]
本发明的工作原理:本发明利用数据采集模块记录用户的基本信息以及面部信息,通过数据存储模块对用户的基本信息以及面部信息过滤传输,利用数据识别模块对当前用户进行身份判断并选择身份所对应的内容,利用数据分析模块记录当前用户视频浏览记录并作兴趣特征分类,最后通过数据展示模块向当前用户推荐兴趣相关内容。
[0088]
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备
所固有的要素。
[0089]
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
技术特征:
1.一种基于人工智能的可视化数据分析方法,其特征在于,所述方法包括以下步骤:步骤s100:采集用户行为特征数据;步骤s200:根据采集的用户行为特征数据计算出用户各项行为特征的加权值,将所述用户各项行为特征的加权值与预设行为特征阈值对比,将所述用户各项行为特征的加权值超过预设行为特征阈值标记为第一标签,将所述用户行为特征数据低于预设行为特征阈值标记为第二标签;所述的预设行为特征阈值是通过设定的特征阈值来判断用户类别;步骤s300:根据所述用户行为特征数据对应的标记标签以及用户行为特征向量,建立多用户匹配模型;所述多用户匹配模型是指当采集到不同类型的用户时的行为特征数据,通过计算用户行为特征向量与每个用户身份特征向量之间的余弦夹角来衡量用户匹配度;所述用户行为特征向量是指将用户行为数据转化为特征向量表示;所述用户身份特征向量是指将所述用户行为特征数据对应的标记标签转化为特征向量表示;步骤s400:根据当前操作用户行为特征数据,计算出当前操作用户匹配度,与建立多用户匹配模型进行对比,判断当前用户使用者身份,实现用户身份的转换。2.根据权利要求1所述的一种基于人工智能的可视化数据分析方法,其特征在于,所述步骤s100包括:步骤s110:设置目标软件,每当检测到所述用户打开所述目标软件,对用户在单位时间内对各软件内容产生的行为进行特征采集,并存储到用户行为特征数据库中;步骤s120:对用户行为特征数据库中的所述用户行为特征数据进行筛选处理,过滤掉冗余的所述用户行为特征数据;步骤s130:所述用户行为特征数据包括:根据单位时间内每个内容类型,统计所述用户浏览所述类型内容的个数,所述用户浏览同一内容的次数、浏览各内容进行评论、点赞、分享次数、搜索同一类型关键词的数量。3.根据权利要求2所述的一种基于人工智能的可视化数据分析方法,其特征在于,所述步骤s200包括:步骤s210:记用户行为特征数据为x
n
,所述x
n
内包括{x1,x2,...,x
n
},其中x表示行为特征类型,n表示行为特征类型总个数;步骤s220:根据公式:z
i
=w1*x1+w2*x2+...+w
n
*x
n
+b计算用户各项行为特征的加权值,其中w1,w2,w3,...,w
n
表示的是每个特征对应的权值系数,b表示偏移系数,主要用来限制权值系数的大小,在用户操作阶段,i表示所属用户浏览过程中单位时间内产生的数据波动次数,z表示视频i的各项特征的加权值,假设浏览过程中数据波动总次数为j,那么i∈[1,j],则z
i
表示用户各项特征的加权值,通过取z
i
的平均值,得出用户各项特征的加权值;步骤s230:将所述用户各项行为特征的加权值与预设行为特征阈值进行对比,当所述用户各项行为特征的加权值超过预设行为特征阈值标记为用户行为特征正常标签,当所述用户各项行为特征的加权值低于预设行为特征阈值标记为用户行为特征异常标签;步骤s240:对上述的行为特征数据进行标记,将所述用户行为特征正常标签标记为第一标签,将所述用户行为特征异常标签标记为第二标签。4.根据权利要求3所述的一种基于人工智能的可视化数据分析方法,其特征在于,所述步骤s300建立多用户匹配模型为:步骤s310:记用户行为特征向量为一个长度为n的二进制向量,当所述用户出现所述用
户行为特征时,记为1,其余特征位置记为0;步骤s320:记用户身份特征向量为一个长度为m的二进制向量,当用户出现所述用户行为特征数据对应的标记标签,记为1,其余特征位置记为0;步骤s330:通过公式计算:用户匹配度=dot_product(a,b)/(||a||*||b||),a和b分别表示用户行为特征向量和用户身份特征向量,dot_product(a,b)表示向量a和向量b的点积,点积表示将对应位置的元素相乘并相加得到的结果,||a||表示a的范数,即表示向量a的大小,||b||表示b的范数,即表示向量b的大小。5.根据权利要求4所述的一种基于人工智能的可视化数据分析方法,其特征在于,所述步骤s400包括:步骤s410:采集当前用户行为特征数据;步骤s420:根据所述当前用户行为特征数据,计算出当前用户各项行为特征的加权值;步骤s430:根据所述当前用户各项行为特征的加权值,通过用户匹配度公式计算出当前用户匹配度;步骤s440:将所述当前用户匹配度与建立多用户匹配模型中的匹配度进行对比,当所述当前用户匹配度与所述建立多用户匹配模型中的匹配度作差运算,当差值在所设定的阈值范围内,则表示所述当前用户与所述建立多用户匹配模型中的用户身份相匹配;步骤s450:将所述当前用户身份切换为所述建立多用户匹配模型中身份相匹配的用户。6.一种实现权利要求1-5任意一项所述的一种基于人工智能的可视化数据分析方法的基于人工智能的可视化数据分析系统,其特征在于,所述可视化数据分析系统包括:数据采集模块、数据分析模块、数据建模模块和数据展示模块,所述数据采集模块,用于获取用户行为信息,并存储到用户行为特征数据库中;所述数据分析模块,判断所述用户行为特征数据是否在预设行为特征阈值范围内,将所述用户行为特征数据在预设行为特征阈值范围内标记为正常标签,将所述用户行为特征数据超过预设行为特征阈值范围标记为异常标签;所述数据建模模块,用于对所述用户行为特征数据以及预设行为特征数据形成个性化用户行为特征模型;所述数据展示模块,用于追踪当前用户行为特征数据,确认当前用户使用者身份,实现用户身份的转换。7.根据权利要求6所述的基于人工智能的可视化数据分析系统,其特征在于,所述数据采集模块包括采集单元和缓存单元,所述采集单元,用于获取用户操作时行为特征数据;所述缓存单元,用于对用户操作时行为特征数据进行存储,并过滤掉冗余的所述用户行为特征数据。8.根据权利要求6所述的基于人工智能的可视化数据分析系统,其特征在于,所述数据分析模块包括计算单元和标记标签单元,所述计算单元,用于计算用户各项行为特征的加权值;所述标记标签单元,用于将所述用户各项行为特征的加权值超过预设行为特征阈值标记为第一标签,将所述用户行为特征数据低于预设行为特征阈值标记为第二标签。
9.根据权利要求6所述的基于人工智能的可视化数据分析系统,其特征在于,所述数据展示模块包括追踪单元、对比单元和转换单元,所述追踪单元,用于追踪当前用户使用过程中行为特征数据;所述对比单元,用于对比当前用户匹配度与建立多用户匹配模型中的匹配度进行对比;所述转换单元,用于将所述当前用户身份切换为所述建立多用户匹配模型中身份相匹配的用户。
技术总结
本发明公开了一种基于人工智能的可视化数据分析系统及方法,本申请涉及人工智能技术领域,所述方法包括以下步骤:S100:采集用户行为特征数据;S200:根据采集的用户行为特征数据计算出用户各项行为特征的加权值,判断所述用户各项行为特征的加权值是否在预设行为特征阈值范围内;S300:根据所述用户行为特征数据对应的标记标签以及用户行为特征向量,建立多用户匹配模型;S400:追踪用户日常浏览数据时的行为特征,根据当前操作用户与建立多用户匹配模型判断当前用户使用者身份,实现用户身份的转换;本发明提供的技术方案具有人物身份识别准确率高,并能够实现用户身份的切换。并能够实现用户身份的切换。并能够实现用户身份的切换。
技术研发人员:韩恒科 韩继明
受保护的技术使用者:大庆市鑫海天网络科技有限公司
技术研发日:2023.06.26
技术公布日:2023/9/20
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/