用户交互路径优化方法、装置、设备和介质与流程
未命名
09-15
阅读:108
评论:0

1.本公开涉及大数据技术领域,可以用于金融领域,更具体地涉及一种用户交互路径优化方法、装置、设备、介质和程序产品。
背景技术:
2.互联网应用的设计时,要安排页面之间的跳转关系,每个页面上设置其他页面的链接入口等引导用户使用。然而页面跳转关系、链接设计是否合乎用户使用习惯,需要在投产后根据用户使用反馈进行优化。相关技术中用户交互路径的分析方法,对固定的起始页面和终止页面能够实现很好的分析效果,但是无法有效的获得产品用户交互中所有出现的路径,无助于协助用户优化产品的用户体验和交互方式。
技术实现要素:
3.鉴于上述问题,本公开提供了智能地、可以基于全路径交互数据进行优化的用户交互路径优化方法、装置、设备、介质和程序产品。
4.根据本公开的第一个方面,提供了一种用户交互路径优化方法。所述方法包括:获取预定时间范围内产生的用户会话,得到初始用户会话集;从所述初始用户会话集中筛选出包含指定起始页面的信息的用户会话,得到候选用户会话集;从所述候选用户会话集中的每个用户会话提取出一个访问路径,得到待分析访问路径集,其中,每个访问路径中以页面为节点,以页面之间的跳转关系为边,所述待分析访问路径集中的访问路径的起点为所述指定起始页面;按照所述待分析路径集中每个访问路径所满足的条件,将所述待分析访问路径集划分成多个类别;以及基于划分到每个类别中的访问路径的统计特征,优化以所述指定起始页面为访问起点的用户交互路径。
5.根据本公开的实施例,所述统计特征包括:划分到每个类别中的访问路径的数量;和/或划分到每个类别中的访问路径中所有的边和每条边的总访问量。
6.根据本公开的实施例,所述多个类别包括以下至少之一:成功路径、失败路径和流失路径;其中,划分到所述成功路径中的访问路径需要满足的条件包括:访问路径必须经过指定成功页面,且从所述指定起始页面到所述指定成功页面之间的跳转次数小于或等于n,其中,n为大于或等于1的整数;划分到所述失败路径中的访问路径需要满足的条件包括:访问路径不包含不在预定范围内的页面,但也未达到所述指定成功页面;划分到所述流失路径中的访问路径需满足的条件包括:访问路径中包含不在所述预定范围内的页面,且不存在从所述指定起始页面开始在n步以内达到所述指定成功页面的情况。
7.根据本公开的实施例,所述多个类别包括成功路径。所述基于划分到每个类别中的访问路径的统计特征,优化以所述指定起始页面为访问起点的用户交互路径包括:统计划分到所述成功路径中的访问路径中,从所述指定起始页面到所述指定成功页面之间的跳转次数分布;如果所述跳转次数分布中大于预定阈值比例的访问路径对应的跳转次数小于或等于m,且m小于n时,根据划分到所述成功路径中的访问路径中所有的边的总访问量从大
到小排序,筛选出排序靠后的n-m个待优化边;以及优化所述n-m个待优化边对应的跳转关系和/或所述n-m个待优化边所连接的页面。
8.根据本公开的实施例,所述多个类别包括流失路径,所述基于划分到每个类别中的访问路径的统计特征,优化以所述指定起始页面为访问起点的用户交互路径包括:从划分到所述流失路径中的访问路径中的所有边中,筛选出从在所述预定范围内的页面跳转到不在所述预定范围内的页面组成的流失边,得到流失边集合;根据所述流失边集合中每个流失边的总访问量从大到小排序,从所述流失边集合中确定出排名靠前的s个关键流失边,其中,s为大于或等于1的整数;以及优化所述s个关键流失边中每个关键流失边所连接的所述预定范围内的页面。
9.根据本公开的实施例,所述多个类别包括失败路径,所述基于划分到每个类别中的访问路径的统计特征,优化以所述指定起始页面为访问起点的用户交互路径包括:从划分到所述失败路径中的访问路径中,筛选出终点页面为指定失败页面以外的其他页面的访问路径,得到异常路径集合;基于所述异常路径集合中的访问路径,统计具有相同的终点页面的中断边的总访问量;当存在任意中断边的总访问量大于预警访问量时,确定所述任意中断边及其对应的终点页面存在设计缺陷;以及输出对所述任意中断边对应的跳转关系和/或所述任意中断边所连接的终点页面的修复提示信息。
10.根据本公开的实施例,从所述候选用户会话集中的每个用户会话提取出一个访问路径包括:拆分每个用户会话中每个当前页面及其来源页面各为一个点,并通过去重计算,得到所有的节点;按照从所述来源页面跳转到所述当前页面的方向,连接所述来源页面和所述当前页面得到一条边;对来自相同会话标识的用户会话中的边,以所述指定起始页面为起点的边为第一条边,按照时间先后顺序,将前一条边的终点和后一条边的起点为相同页面的两条边连接起来,以得到一个访问路径。
11.根据本公开的实施例,所述连接所述来源页面和所述当前页面得到一条边还包括:以预定的数据结构记录该条边在所述用户会话中访问量、出现该条边的用户会话数和该条边所在的用户会话标识。
12.根据本公开实施例,所述方法还包括:通过桑基图可视化展示划分到每个类别中的访问路径的统计特征。
13.本公开实施例的第二方面,提供了一种用户交互路径优化装置。所述装置包括会话获取模块、会话筛选模块、全路径提取模块、类别划分模块和优化分析模块。会话获取模块用于获取预定时间范围内产生的用户会话,得到初始用户会话集。会话筛选模块用于从所述初始用户会话集中筛选出包含指定起始页面的信息的用户会话,得到候选用户会话集。全路径提取模块用于从所述候选用户会话集中的每个用户会话提取出一个访问路径,得到待分析访问路径集,其中,每个访问路径中以页面为节点,以页面之间的跳转关系为边,所述待分析访问路径集中的访问路径的起点为所述指定起始页面。类别划分模块用于按照所述待分析路径集中每个访问路径所满足的条件,将所述待分析访问路径集划分成多个类别。优化分析模块用于基于划分到每个类别中的访问路径的统计特征,优化以所述指定起始页面为访问起点的用户交互路径。
14.本公开实施例的第三方面,提供了一种电子设备。所述电子设备包括一个或多个处理器和存储器。所述存储器用于存储一个或多个程序,其中,当所述一个或多个程序被所
述一个或多个处理器执行时,使得一个或多个处理器执行上述方法。
15.本公开实施例的第四方面,还提供了一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行上述方法。
16.本公开实施例的第五方面,还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述方法。
17.上述一个或多个实施例具有如下优点或有益效果:可以通过智能算法获取到大量用户从一个指定起始页面出发,沿不同路径进行访问而产生的全路径数据,并可以对全路径分类为据成功路径、失败路径或流失路径等,然后根据成功路径、失败路径、流失路径的统计特征分析,优化用户的交互方法,提升用户交互体验。
附图说明
18.通过以下参照附图对本公开实施例的描述,本公开的上述内容以及其他目的、特征和优点将更为清楚,在附图中:
19.图1示意性示出了根据本公开实施例的用户交互路径优化方法、装置、设备、介质和程序产品的应用场景图;
20.图2示意性示出了根据本公开实施例的用户交互路径优化方法的流程图;
21.图3示意性示出了本公开一实施例中将待分析访问路径集划分成多个类别针对性进行优化的构思示意图;
22.图4示意性示出了本公开一实施例中与成功路径对应的优化处理流程;
23.图5示意性示出了本公开一实施例中与流失路径对应的优化处理流程;
24.图6示意性示出了本公开一实施例中与失败路径对应的优化处理流程;
25.图7示意性示出了应用根据本公开实施例的用户交互路径优化方法的系统架构;
26.图8示意性示出了根据本公开实施例的用户交互路径优化装置的框图;以及
27.图9示意性示出了适于实现根据本公开实施例的用户交互路径优化方法的电子设备的方框图。
具体实施方式
28.以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
29.在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
30.在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
31.在使用类似于“a、b和c等中至少一个”这样的表述的情况下,一般来说应该按照本
领域技术人员通常理解该表述的含义来予以解释(例如,“具有a、b和c中至少一个的系统”应包括但不限于单独具有a、单独具有b、单独具有c、具有a和b、具有a和c、具有b和c、和/或具有a、b、c的系统等)。本文中术语“第一”、“第二”等命名都仅用于区分,而不具有任何限制含义,以及附图中的任何元素数量均用于示例而非限制。
32.本文中的关键术语解释如下:
[0033]“访问路径”:也称为路径,是指用户在一次用户会话中访问应用程序中的页面而形成的足迹,其中,在一个访问路径以页面为节点,以页面之间的跳转关系为边。为了便于页面设计优化,访问路径中的边以页面之间的正向跳转关系为方向的有向边。
[0034]“用户会话”:指的是用户与服务器建立连接后,服务器会为用户创建一个会话(即,session)。其中,一个会话标识(即,session id)用于标记一个会话。不同用户会话具有不同的会话标识。
[0035]“全路径”:指的是一个业务场景中,根据用户的使用,可以产生多个访问路径,这些访问路径均以业务场景中的指定起始页为起点,而终点则可能是多个不同的终点页面。这些访问路径汇集起来的总体为该业务场景的全路径。基于一个业务场景的全路径,可以绘制全部成功路径、失败路径、流失路径,并最终通过桑基图形式可视化展示的模型。
[0036]“成功路径”:指的是一个业务场景中,从用户访问指定起始页面开始计,用户的访问路径经过指定成功页面,且从指定起始页面到指定成功页面之间的跳转小于或等于n,其中,n为大于或等于1的整数,所有满足该条件的访问路径均属于该业务场景下的成功路径。
[0037]“失败路径”:指的是一个业务场景中,从用户访问指定起始页面开始计,用户的访问路径最终未达到指定成功页面,且该访问路径中也不包含不在针对该业务场景而设置的预定范围内的页面,所有满足该条件的访问路径均属于该业务场景下的失败路径。
[0038]“流失路径”:指的是从用户访问一个业务场景的指定起始页面开始计,用户的访问路径中包含了不在预定范围内的页面,且不存在用户从指定起始页面开始在n步以内访问到指定成功路径的情况,所有满足该条件的访问路径属于该业务场景下的流失路径。
[0039]
本公开实施例提供了一种用户交互路径优化方法、装置、设备、介质和程序产品,可以从大量用户会话中提取出某一业务场景下全路径。具体地,通过引入有向无环图(directed acyclic graph,dag)的算法,在任意业务场景下可以设置一个指定起始页面、一个或多个指定成功页面、一个或多个指定失败页面,同时还可以给出该业务场景内的预定范围的页面,通过人工智能中图计算可以得出从指定起始业务开始到任意终点页面的所有路径,即得到该业务场景下的全路径数据,根据该全路径数据,可以对其中的成功路径、失败路径、流失路径进行统计,例如统计所有成功路径、失败路径、流失路径中每一步的访问量,据此对该业务场景下的访问路径进行优化。
[0040]
需要说明的是,本公开实施例确定的用户交互路径优化方法、装置、设备、介质和程序产品可用于金融领域(例如,互联网金融),也可用于除金融领域之外的任意领域,本公开对应用领域不做限定。
[0041]
图1示意性示出了根据本公开实施例的用户交互路径优化方法、装置、设备、介质和程序产品的应用场景图。
[0042]
如图1所示,根据该实施例的应用场景100可以包括终端设备101、102、103,集群104和运维服务器105。
[0043]
用户可以使用终端设备101、102、103访问集群104。集群104可以是提供各种服务的服务器集群,例如对用户利用终端设备101、102、103所浏览的网站或所使用的客户端应用提供支持的后台管理和应用支持。
[0044]
当用户使用终端设备101、102、103与集群104建立连接时,集群104会创建一个用户会话,其中针对该用户会话分配一个session id。当该用户会话保持存活期间,该用户与集群104的交互信息(例如,访问了哪些页面、在每个页面中的访问内容、用户设置要求等)都会关联或记录到该用户会话中。
[0045]
运维服务器105可以与集群104通信。在本公开实施例中,运维服务器105可以执行本公开实施例的用户交互路径优化方法,从集群104中收集大量的用户会话,并从这些用户会话中智能地提取某一个业务场景下的全路径数据,据此对该业务场景下的用户交互路径进行优化。相应地,本公开实施例的用户交互路径优化装置、设备、介质和程序产品也可以设置在运维服务器105中。
[0046]
需要注意的是,图1所示仅为可以应用本公开实施例的系统架构的示例,以帮助本领域技术人员理解本公开的技术内容,但并不意味着本公开实施例不可以用于其他设备、系统、环境或场景。例如,在另一些实施例中,运维服务器105可以设置在集群104中。
[0047]
以下将基于图1描述的场景,通过图2~图7对本公开实施例的用户交互路径优化方法进行详细描述。应注意,以下方法中各个操作的序号仅作为该操作的表示以便描述,而不应被看作表示该各个操作的执行顺序。除非明确指出,否则该方法不需要完全按照所示顺序来执行。
[0048]
图2示意性示出了根据本公开实施例的用户交互路径优化方法的流程图。
[0049]
如图2所示,该用户交互路径优化方法可以包括操作s210~操作s250。
[0050]
首先在操作s210,获取预定时间范围内产生的用户会话,得到初始用户会话集。
[0051]
接下来在操作s220,从初始用户会话集中筛选出包含指定起始页面的信息的用户会话,得到候选用户会话集。
[0052]
例如,在汇款转账业务场景下,该指定起始页面可以是汇款转账首页。例如,用户登陆手机银行首页,点击汇款转账按钮,进入汇款转账页面,其中,该汇款转账页面为指定起始页面。从而在操作s220中可以筛选出访问过汇款转账页面的用户会话。
[0053]
然后在操作s230,从候选用户会话集中的每个用户会话中提取出一个访问路径,得到待分析访问路径集,其中,每个访问路径中以页面为节点,以页面之间的跳转关系为边。为便于对特定业务场景进行分析,提取出的待分析访问路径集中的访问路径的起点可以是指定起始页面。
[0054]
例如,当一个用户会话中记录的用户操作为用户登陆手机银行首页,点击汇款转账按钮,进入汇款转账页面后进入汇款转账业务并进行后续操作。对于该用户会话,可以将用户进入汇款转账页面之后的操作页面提取出来形成节点,并根据节点的跳转关系形成边,得到一个访问路径。
[0055]
在一个实施例中,在操作s230中从用户会话中提取访问路径时,可以拆分每个用户会话中每次会话的当前页面及其来源页面各为一个点,并通过去重计算,得到所有的节点,然后按照从来源页面跳转到当前页面的方向,连接来源页面和当前页面得到一条边。接下来对来自相同会话标识的用户会话中的边,以指定起始页面为起点的边为第一条边,按
照时间先后顺序,将前一条边的终点和后一条边的起点为相同页面的两条边连接起来,以得到一个访问路径。通过从用户会话从拆分节点、合并边,然后在针对同一会话进行边的合并连接,提高了从大量用户会话中分别提取符合条件的访问路径的效率。
[0056]
在一些实施例中,也可以在操作s210之前,就从收集到的用户会话中拆分出点、并合并出边,然后以结构化数据的形式从用户会话中提取出的点和边,便于将节点、边等的数据与用户会话解耦,方便在操作s230以及其他情况下进行数据统计分析。
[0057]
具体地,可以将从集群104中收集到的每个用户会话,拆分每个用户会话中每次会话的当前页面及其来源页面各为一个点,并通过去重计算,得到所有的节点;然后合并每个来源页面和当前页面得到一条边;接下来以预定的数据结构记录每条边在用户会话中访问量、出现该条边的用户会话数和该条边所在的用户会话标识等信息。
[0058]
例如,第i个会话记为h(i)(假设h(i)为会话标识),来源页面为m(i),当前页面为n(i),在会话h(i)中的访问量为q(i),其中i=1,2,3...,n,则可以对该条边以如下结构化数据进行记录:(m(i)-n(i),q(i),1,h(i)),其中1代表一个用户会话,q(i)可以大于1也可以等于1。其中,一个用户会话中的某条边的访问量通常为1,但也可能大于1,例如,用户进行多笔转账汇款时,一次会话中从交易金额——》转账人,这个边的访问量q(i)可以大于1。
[0059]
这样,当上述操作s230在将来自相同会话标识的用户会话中的边进行连接形成一条访问路径时,可以先筛选用户会话标识h(i),然后将筛选出的相同h(i)的结构化数据记录中,各个边的起点和终点进行对比,将前一条边的终点和后一条边的起点为相同页面的两条边依次连接起来,就可以以得到一个访问路径。
[0060]
接下来在操作s240,按照待分析路径集中每个访问路径所满足的条件,将待分析访问路径集划分成多个类别。
[0061]
图3示意性示出了本公开一实施例中将待分析访问路径集划分成多个类别针对性进行优化的构思示意图。
[0062]
结合图3,该多个类别可以包括以下至少之一:成功路径、失败路径和流失路径。其中,划分到成功路径中的访问路径需要满足的条件包括:访问路径必须经过指定成功页面,且从指定起始页面到指定成功页面之间的跳转小于或等于n,其中,n为大于或等于1的整数。划分到失败路径中的访问路径需要满足的条件包括:访问路径不包含不在预定范围内的页面,但也未达到指定成功页面。划分到流失路径中的访问路径需满足的条件包括:访问路径中包含不在预定范围内的页面,且不存在从指定起始页面开始在n步以内达到指定成功页面的情况。
[0063]
在操作s250,基于划分到每个类别中的访问路径的统计特征,优化以指定起始页面为访问起点的用户交互路径。
[0064]
该统计特征可以包括划分到每个类别中的访问路径的数量,可以根据全路径中划分到每个类别的访问路径的数量或数量对比,从宏观上判断该业务场景下用户交互路径设计是否合理。例如,在汇款转账业务中,当成功路径类别中的访问路径数量明显大于失败路径和流失路径时,说明汇款转账业务的用户交互路径设计是比较合理的。又例如,如果出现相反的情况,如成功类别中的访问路径数量偏少,即使用汇款转账业务时大多数场景下是失败或流失,则说明汇款转账业务的用户交互路径设计不合理。
[0065]
该统计特征还可以包括划分到每个类别中的访问路径中所有的边和每条边的总
访问量,便于针对性地优化页面或跳转关系。当以结构化数据,如上文示例的(m(i)-n(i),q(i),1,h(i)),记录从用户会话中提取出的边时,可以通过对该结构化数据的汇总来统计每个类别中所有的边、每条边的总访问量量等,例如,使用reduce方法合并所有边各自的访问值和某条边出现会话数为(distinct(m(i)-n(i)),sum(q(i)),count(h(i)))。
[0066]
如图3所示,基于划分到每个类别中的访问路径的统计特征,可以针对性地选择优化策略,对用户访问路径进行优化。以下通过图4~图6对不同类别的路径对应的优化策略进行介绍。
[0067]
图4示意性示出了本公开一实施例中与成功路径对应优化处理流程。
[0068]
如图4所示,在该实施例中,与成功路径对应优化策略的处理流程可以包括操作s401~操作s403。
[0069]
在操作s401,统计划分到成功路径中的访问路径中,从指定起始页面到指定成功页面之间的跳转次数分布。
[0070]
在操作s402,如果跳转次数分布中大于预定阈值比例(例如,90%)的访问路径对应的跳转次数小于或等于m,且m小于n时,根据划分到成功路径中的访问路径中所有的边的总访问量从大到小排序,筛选出排序靠后的n-m个待优化边。
[0071]
在操作s403,优化n-m个待优化边对应的跳转关系和/或n-m个待优化边所连接的页面。例如,删除或合并待优化边对应的跳转关系,或者将待优化边连接的页面的内容合并到一个页面中。
[0072]
当成功路径中大于预定阈值比例的访问路径的调转次数下于或等于m,说明n步交易成功的交互设计存在冗余,有必要对交互使用率比较低的页面或跳转关系的缩减,精简交互流程。
[0073]
图5示意性示出了本公开一实施例中与流失路径对应的优化处理流程。
[0074]
如图5所示,在该实施例中与流失路径对应的优化策略的处理流程可以包括操作s501~操作s503。
[0075]
在操作s501,从划分到流失路径中的访问路径中的所有边中,筛选出从在预定范围内的页面跳转到不在预定范围内的页面组成的流失边,得到流失边集合。
[0076]
在操作s502,根据流失边集合中每个流失边的总访问量从大到小排序,从流失边集合中确定出排名靠前的s个关键流失边,其中,s为大于或等于1的整数。
[0077]
在操作s503,优化s个关键流失边中每个关键流失边所连接的预定范围内的页面。
[0078]
在一个实施例中,在每个关键流失边对应的预定范围内的页面(简称“关键流失页面”)中,优化对该关键流失边对应的不在预定范围内的页面(简称“目的地页面”)的内容的营销推荐信息或消息入口。例如,对每个关键流失页面上增加去往关键流失目的地页面的营销路径或调转链接,顺应用户意愿引导用户前往目的地页面。
[0079]
图6示意性示出了本公开一实施例中与失败路径对应的优化处理流程。
[0080]
如图6所示,在该实施例中与失败路径对应的优化策略处理流程包括操作s601~操作s604。
[0081]
在操作s601,从划分到失败路径中的访问路径中,筛选出终点页面为指定失败页面以外的其他页面的访问路径,得到异常路径集合。
[0082]
以汇款转账业务为例,指定失败页面例如可以是余额不足交易失败页面、收款人
姓名或账户错误交易失败页面。当访问路径到达指定失败页面时,说明该访问路径的失败是业务交易引起的,非用户交互故障。由此可见,操作s601中的异常路径集合,是从失败路径中排除掉业务交易引起的访问失败后剩余路径的集合。
[0083]
在操作s602,基于异常路径集合中的访问路径,统计具有相同的终点页面的中断边的总访问量。
[0084]
在操作s603,当存在任意中断边的总访问量大于预警访问量时,确定任意中断边及其对应的终点页面存在设计缺陷。
[0085]
设置预警访问量的目的是为了进一步排除用户原因导致的访问中断,例如用户接打电话,或者中途放弃操作。如果中断访问的总访问量大于预警访问量,则说明这种中断访问会经常性在同一个页面中发生,这个时候说明这个中断边的跳转关系或者终点页面极有可能存在设计缺陷,诸如跳转失灵、数据加载通路不顺畅等问题。
[0086]
在操作s604,输出对任意中断边对应的跳转关系和/或任意中断边所连接的终点页面的修复提示信息,以此来提醒运维终端及时关注该问题,并及时处理修复。
[0087]
图7示意性示出了应用根据本公开实施例的用户交互路径优化方法的系统架构。
[0088]
如图7所示,该系统架构中可以包括数据采集平台、参数管理平台、人工智能计算平台、大数据计算平台和数据可视化工具。该系统架构可以部署于运维服务器105中,或者该系统架构可以部分部署于运维服务器105,部分部署于集群104。在该系统架构中,用户交互路径优化方法的流程可以包括s701~s705。
[0089]
首先在s701,由数据采集平台进行数据采集。数据采集是一切有效分析的前提,数据采集要充分考虑用户规模和数据规模的增长,做好数据资产积累的准备。采集过程中,要支持多种数据源、多方案的采集,贯穿整个交易流程的每一个环节。同时,采集过程中可以通过批量、准实时、实时等方案,对不同时效的数据进行处理。路径分析主要需要一个交易流程中都经过哪些页面的数据,可以按照用户会话信息对ios、安卓、web/h5、微信小程序等渠道进行精准的采集。为便于后续不同加工平台的数据处理,所有采集的数据应该按照一定的规范和标准存储到数据湖中。
[0090]
接下来可以在s702,通过参数管理平台,根据分析需求,配置各种参数,包括但不限于:预定时间范围(例如,1个月)、指定起始页面、指定失败页面、预定范围内的页面的列表、成功路径的判别条件中的参数n、m,关键流失边的个数s,成功路径中分析跳转次数分布的预定阈值比例,失败路径中分析中断边是否存在设计缺陷的预警访问量等。
[0091]
本公开实施例可以通过桑基图等方式展示所有成功路径、失败路径、流失路径及其中各个边的访问量的情况,进而优化交互流程和方式。因此,参数的配置应该足够的灵活,为业务提供专门的参数管理平台,通过前端可以随时调整分析的客户画像、业务场景、页面信息、时间维度等信息,进而可以实现定制化的全路径路径分析。
[0092]
接下来在s703,通过人工智能计算平台筛选访问路径。
[0093]
埋点数据入湖和参数平台设置完路径分析的参数后,人工智能计算平台则通过有向无环图的算法,计算出所有符合条件的交易路径明细。具体地,可以通过拆分点、合并边和路径生成来生成大量的访问路径。
[0094]
(1)拆分点:拆分用户会话中每次会话的来源页面和当前页面各为一个点,进行去重计算,得到所有的点。比如有会话h(1),来源页面为a,当前页面为b;会话h(2),来源页面
为a,当前页面为c;会话h(3),来源页面为b,当前页面为d;则拆分去重得到点a、点b、点c、点d
[0095]
(2)合并边:合并来源页面和当前页面为一条边,使用reduce方法合并所有边各自的访问值和会话数。假设有n个会话,第i个会话记为h(i),来源页面为m(i),当前页面为n(i),访问量为q(i),其中i=1,2,3...,n,则第i条边的访问值和会话数记为(m(i)-n(i),q(i),1),使用reduce方法合并所有边各自的访问值和会话数为(distinct(m(i)-n(i)),sum(q(i)),count(h(i)))。
[0096]
经过拆分点和合并边后,可以将文本格式的用户会话转换成具有一定数据结构的图数据,可以实现与用户会话的解耦。
[0097]
(3)访问路径生成:针对相同的用户会话标识(即,session id),按时间先后顺序,将前一条边的终点和后一条边的起点相同的两条边连成一条边,依次完成符合条件的所有边的连接,得到用户会话id和全部路径以及点击数的数据。
[0098]
在本公开实施例中,如上述操作s230中需要分析指定起始页面的访问路径,此时在(3)访问路径生成时,可以先筛选出包含有指定起始页面的用户会话id,然后针对这些用户会话id,以每个会话id中以指定起始页面为起点的边作为起始边,依次连接其后的边来分别生成访问路径。这样就可以得到上述操作s230中的候选用户会话集。
[0099]
接下来在s704,通过大数据计算平台进行统计和数据挖掘。通过人工智能计算平台计算后,符合条件的访问路径明显已经全部筛选出来,为后续的指标计算提供了规范和整洁的数据基础。通过大数据计算平台,例如,hadoop集群,对所有的成功路径、失败路径、流失路径的访问量进行计算,并存储到数据湖。通过数据同步工具,将hadoop集群hive表的结果集同步到mysql等关系型数据库,以便于实现快速展现可视化图表。
[0100]
最后可以在s705,通过数据可视化工具进行数据可视化。例如,通过商业智能软件(business intelligence,bi)或传统的前端组件,对指标结果进行路径展示,例如以桑基图来展现,为业务提供决策和分析的数据参考。
[0101]
可见,本公开实施例可以通过智能算法提供从一个指定起始页面沿不同路径到各个成功页面的成功路径进行全路径分析,还可以对失败路径和流失路径也进行可视化展现,提升了加工时效、减少了资源消耗、拓展了适用场景。
[0102]
对于业务人员来说,本公开实施例的路径分析更全面且更加直观,加工的数据范围更为宽泛,指标更为可靠,能够科学的分析路径的访问情况。根据成功路径、失败路径、流失路径的统计特征分析,可以优化产品的交互方法,比如通过减少交易步骤缩短交易时间;将成功路径多的流程,应用于其他产品的交互场景上,间接提升用户体验;根据失败路径和流失路径,着重检查和分析问题,提升成功路径的占比等。
[0103]
基于上述各个实施例的用户交互路径优化方法,本公开还提供了一种用户交互路径优化装置。以下将结合图8对该装置进行详细描述。
[0104]
图8示意性示出了根据本公开实施例的用户交互路径优化装置的框图。
[0105]
如图8所示,根据该实施例的用户交互路径优化装置800可以包括会话获取模块810、会话筛选模块820、全路径提取模块830、类别划分模块840和优化分析模块850。该装置800可以执行参考图2~图7所描述的方法。
[0106]
会话获取模块810用于获取预定时间范围内产生的用户会话,得到初始用户会话
集。在一个实施例中,会话获取模块810可以执行操作s210。
[0107]
会话筛选模块820用于从初始用户会话集中筛选出包含指定起始页面的信息的用户会话,得到候选用户会话集。在一个实施例中,会话筛选模块820可以执行操作s220。
[0108]
全路径提取模块830用于从候选用户会话集中的每个用户会话提取出一个访问路径,得到待分析访问路径集,其中,每个访问路径中以页面为节点,以页面之间的跳转关系为边,待分析访问路径集中的访问路径的起点为指定起始页面。在一个实施例中,全路径提取模块830可以执行操作s230。
[0109]
类别划分模块840用于按照待分析路径集中每个访问路径所满足的条件,将待分析访问路径集划分成多个类别。在一个实施例中,类别划分模块840可以执行前述操作s240。
[0110]
优化分析模块850用于基于划分到每个类别中的访问路径的统计特征,优化以指定起始页面为访问起点的用户交互路径。在一个实施例中,优化分析模块850可以执行前述操作s250。
[0111]
在一个实施例中,多个类别包括以下至少之一:成功路径、失败路径和流失路径。
[0112]
相应地,在一个实施例中,优化分析模块850包括成功路径优化子模块。成功路径优化子模块用于:统计划分为成功路径的访问路径中,从指定起始页面到指定成功页面之间的跳转次数分布;如果跳转次数分布中大于预定阈值比例的访问路径对应的跳转次数小于或等于m,且m小于n时,根据划分到成功路径中的访问路径中所有的边的总访问量从大到小排序,筛选出排序靠后的n-m个待优化边;以及优化n-m个待优化边对应的跳转关系和/或n-m个待优化边所连接的页面。
[0113]
在另一实施例中,优化分析模块850包括流失路径优化子模块。流失路径优化子模块用于:从划分为流失路径的访问路径中的所有边中,筛选出从在预定范围内的页面跳转到不在预定范围内的页面组成的流失边,得到流失边集合;根据流失边集合中每个流失边的总访问量从大到小排序,从流失边集合中确定出排名靠前的s个关键流失边,其中,s为大于或等于1的整数;优化s个关键流失边中每个关键流失边所连接的预定范围内的页面。
[0114]
在再一个实施例中,优化分析模块850包括失败路径优化子模块。失败路径优化子模块用于:从划分到失败路径中的访问路径中,筛选出终点页面为指定失败页面以外的其他页面的访问路径,得到异常路径集合;基于异常路径集合中的访问路径,统计具有相同的终点页面的中断边的总访问量;当存在任意中断边的总访问量大于预警访问量时,确定任意中断边及其对应的终点页面存在设计缺陷;以及输出对任意中断边对应的跳转关系和/或任意中断边所连接的终点页面的修复提示信息。
[0115]
根据本公开的实施例,会话获取模块810、会话筛选模块820、全路径提取模块830、类别划分模块840和优化分析模块850中的任意多个模块可以合并在一个模块中实现,或者其中的任意一个模块可以被拆分成多个模块。或者,这些模块中的一个或多个模块的至少部分功能可以与其他模块的至少部分功能相结合,并在一个模块中实现。根据本公开的实施例,会话获取模块810、会话筛选模块820、全路径提取模块830、类别划分模块840和优化分析模块850中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(fpga)、可编程逻辑阵列(pla)、片上系统、基板上的系统、封装上的系统、专用集成电路(asic),或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,
或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,会话获取模块810、会话筛选模块820、全路径提取模块830、类别划分模块840和优化分析模块850中的至少一个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
[0116]
图9示意性示出了适于实现根据本公开实施例的用户交互路径优化方法的电子设备900的方框图。
[0117]
如图9所示,根据本公开实施例的电子设备900包括处理器901,其可以根据存储在只读存储器(rom)902中的程序或者从存储部分908加载到随机访问存储器(ram)903中的程序而执行各种适当的动作和处理。处理器901例如可以包括通用微处理器(例如cpu)、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(asic))等等。处理器901还可以包括用于缓存用途的板载存储器。处理器901可以包括用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
[0118]
在ram 903中,存储有电子设备900操作所需的各种程序和数据。处理器901、rom 902以及ram 903通过总线904彼此相连。处理器901通过执行rom 902和/或ram 903中的程序来执行根据本公开实施例的方法流程的各种操作。需要注意,所述程序也可以存储在除rom 902和ram 903以外的一个或多个存储器中。处理器901也可以通过执行存储在所述一个或多个存储器中的程序来执行根据本公开实施例的方法流程的各种操作。
[0119]
根据本公开的实施例,电子设备900还可以包括输入/输出(i/o)接口905,输入/输出(i/o)接口905也连接至总线904。电子设备900还可以包括连接至i/o接口905的以下部件中的一项或多项:包括键盘、鼠标等的输入部分906;包括诸如阴极射线管(crt)、液晶显示器(lcd)等以及扬声器等的输出部分907;包括硬盘等的存储部分908;以及包括诸如lan卡、调制解调器等的网络接口卡的通信部分909。通信部分909经由诸如因特网的网络执行通信处理。驱动器910也根据需要连接至i/o接口905。可拆卸介质911,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器910上,以便于从其上读出的计算机程序根据需要被安装入存储部分908。
[0120]
本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的设备/装置/系统中所包含的;也可以是单独存在,而未装配入该设备/装置/系统中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被执行时,实现根据本公开实施例的方法。
[0121]
根据本公开的实施例,计算机可读存储介质可以是非易失性的计算机可读存储介质,例如可以包括但不限于:便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。例如,根据本公开的实施例,计算机可读存储介质可以包括上文描述的rom 902和/或ram 903和/或rom 902和ram 903以外的一个或多个存储器。
[0122]
本公开的实施例还包括一种计算机程序产品,其包括计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。当计算机程序产品在计算机系统中运行时,该程序代码用于使计算机系统实现本公开实施例所提供的方法。
[0123]
在该计算机程序被处理器901执行时执行本公开实施例的系统/装置中限定的上述功能。根据本公开的实施例,上文描述的系统、装置、模块、单元等可以通过计算机程序模块来实现。
[0124]
在一种实施例中,该计算机程序可以依托于光存储器件、磁存储器件等有形存储介质。在另一种实施例中,该计算机程序也可以在网络介质上以信号的形式进行传输、分发,并通过通信部分909被下载和安装,和/或从可拆卸介质911被安装。该计算机程序包含的程序代码可以用任何适当的网络介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
[0125]
在这样的实施例中,该计算机程序可以通过通信部分909从网络上被下载和安装,和/或从可拆卸介质911被安装。在该计算机程序被处理器901执行时,执行本公开实施例的系统中限定的上述功能。根据本公开的实施例,上文描述的系统、设备、装置、模块、单元等可以通过计算机程序模块来实现。
[0126]
根据本公开的实施例,可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例提供的计算机程序的程序代码,具体地,可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。程序设计语言包括但不限于诸如java,c++,python,“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(lan)或广域网(wan),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
[0127]
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
[0128]
本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合,即使这样的组合或结合没有明确记载于本公开中。特别地,在不脱离本公开精神和教导的情况下,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。
[0129]
以上对本公开的实施例进行了描述。但是,这些实施例仅仅是为了说明的目的,而并非为了限制本公开的范围。尽管在以上分别描述了各实施例,但是这并不意味着各个实施例中的措施不能有利地结合使用。本公开的范围由所附权利要求及其等同物限定。不脱离本公开的范围,本领域技术人员可以做出多种替代和修改,这些替代和修改都应落在本公开的范围之内。
技术特征:
1.一种用户交互路径优化方法,包括:获取预定时间范围内产生的用户会话,得到初始用户会话集;从所述初始用户会话集中筛选出包含指定起始页面的信息的用户会话,得到候选用户会话集;从所述候选用户会话集中的每个用户会话中提取出一个访问路径,得到待分析访问路径集,其中,每个访问路径中以页面为节点,以页面之间的跳转关系为边,所述待分析访问路径集中的访问路径的起点为所述指定起始页面;按照所述待分析路径集中每个访问路径所满足的条件,将所述待分析访问路径集划分成多个类别;以及基于划分到每个类别中的访问路径的统计特征,优化以所述指定起始页面为访问起点的用户交互路径。2.根据权利要求1所述的方法,其中,所述统计特征包括:划分到每个类别中的访问路径的数量;和/或划分到每个类别中的访问路径中所有的边和每条边的总访问量。3.根据权利要求1或2所述的方法,其中,所述多个类别包括以下至少之一:成功路径、失败路径和流失路径;其中,划分到所述成功路径中的访问路径需要满足的条件包括:访问路径必须经过指定成功页面,且从所述指定起始页面到所述指定成功页面之间的跳转次数小于或等于n,其中,n为大于或等于1的整数;划分到所述失败路径中的访问路径需要满足的条件包括:访问路径不包含不在预定范围内的页面,但也未达到所述指定成功页面;划分到所述流失路径中的访问路径需满足的条件包括:访问路径中包含不在所述预定范围内的页面,且不存在从所述指定起始页面开始在n步以内达到所述指定成功页面的情况。4.根据权利要求3所述的方法,其中,所述多个类别包括成功路径,所述基于划分到每个类别中的访问路径的统计特征,优化以所述指定起始页面为访问起点的用户交互路径包括:统计划分到所述成功路径中的访问路径中,从所述指定起始页面到所述指定成功页面之间的跳转次数分布;如果所述跳转次数分布中大于预定阈值比例的访问路径对应的跳转次数小于或等于m,且m小于n时,根据划分到所述成功路径中的访问路径中所有的边的总访问量从大到小排序,筛选出排序靠后的n-m个待优化边;以及优化所述n-m个待优化边对应的跳转关系和/或所述n-m个待优化边所连接的页面。5.根据权利要求3所述的方法,其中,所述多个类别包括流失路径,所述基于划分到每个类别中的访问路径的统计特征,优化以所述指定起始页面为访问起点的用户交互路径包括:从划分到所述流失路径中的访问路径中的所有边中,筛选出从在所述预定范围内的页面跳转到不在所述预定范围内的页面组成的流失边,得到流失边集合;根据所述流失边集合中每个流失边的总访问量从大到小排序,从所述流失边集合中确
定出排名靠前的s个关键流失边,其中,s为大于或等于1的整数;优化所述s个关键流失边中每个关键流失边所连接的所述预定范围内的页面。6.根据权利要求3所述的方法,其中,所述多个类别包括失败路径,所述基于划分到每个类别中的访问路径的统计特征,优化以所述指定起始页面为访问起点的用户交互路径包括:从划分到所述失败路径中的访问路径中,筛选出终点页面为指定失败页面以外的其他页面的访问路径,得到异常路径集合;基于所述异常路径集合中的访问路径,统计具有相同的终点页面的中断边的总访问量;当存在任意中断边的总访问量大于预警访问量时,确定所述任意中断边及其对应的终点页面存在设计缺陷;以及输出对所述任意中断边对应的跳转关系和/或所述任意中断边所连接的终点页面的修复提示信息。7.根据权利要求1所述的方法,其中,从所述候选用户会话集中的每个用户会话提取出一个访问路径包括:拆分每个用户会话中每个当前页面及其来源页面各为一个点,并通过去重计算,得到所有的节点;按照从所述来源页面跳转到所述当前页面的方向,连接所述来源页面和所述当前页面得到一条边;对来自相同会话标识的用户会话中的边,以所述指定起始页面为起点的边为第一条边,按照时间先后顺序,将前一条边的终点和后一条边的起点为相同页面的两条边连接起来,以得到一个访问路径。8.根据权利要求7所述的方法,其中,所述连接所述来源页面和所述当前页面得到一条边还包括:以预定的数据结构记录该条边在所述用户会话中访问量、出现该条边的用户会话数和该条边所在的用户会话标识。9.根据权利要求1所述的方法,其中,所述方法还包括:通过桑基图可视化展示划分到每个类别中的访问路径的统计特征。10.一种用户交互路径优化装置,包括:会话获取模块,用于获取预定时间范围内产生的用户会话,得到初始用户会话集;会话筛选模块,用于从所述初始用户会话集中筛选出包含指定起始页面的信息的用户会话,得到候选用户会话集;全路径提取模块,用于从所述候选用户会话集中的每个用户会话中提取出一个访问路径,得到待分析访问路径集,其中,每个访问路径中以页面为节点,以页面之间的跳转关系为边,所述待分析访问路径集中的访问路径的起点为所述指定起始页面;类别划分模块,用于按照所述待分析路径集中每个访问路径所满足的条件,将所述待分析访问路径集划分成多个类别;以及优化分析模块,用于基于划分到每个类别中的访问路径的统计特征,优化以所述指定起始页面为访问起点的用户交互路径。
11.一种电子设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行权利要求1~9中任一项所述的方法。12.一种计算机可读存储介质,其上存储有计算机程序指令,该计算机程序指令被处理器执行时实现权利要求1~9中任一项所述的方法。13.一种计算机程序产品,包括计算机程序指令,所述计算机程序指令被处理器执行时实现权利要求1~9中任一项所述的方法。
技术总结
本公开提供了一种用户交互路径优化方法,可以应用于大数据技术领域。该方法包括:首先获取预定时间范围内产生的用户会话,然后从中筛选出包含指定起始页面的信息的用户会话,得到候选用户会话集;从候选用户会话集中的每个用户会话提取出一个访问路径,得到待分析访问路径集,其中,每个访问路径中以页面为节点,以页面之间的跳转关系为边,起点为所述指定起始页面;按照待分析路径集中每个访问路径所满足的条件,将待分析访问路径集划分成多个类别;以及基于划分到每个类别中的访问路径的统计特征,优化以指定起始页面为访问起点的用户交互路径。本公开还提供了一种用户交互路径优化装置、设备、存储介质和程序产品。存储介质和程序产品。存储介质和程序产品。
技术研发人员:曾文华 高杰 何奕阳
受保护的技术使用者:中国工商银行股份有限公司
技术研发日:2023.06.20
技术公布日:2023/9/12
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/