一种自媒体账号粉丝群体画像自动补全的方法及系统与流程
未命名
10-18
阅读:74
评论:0

1.本发明涉及信息处理技术领域,尤其涉及一种自媒体账号粉丝群体画像自动补全的方法及系统。
背景技术:
2.随着社交媒体平台的兴起,越来越多的人开始使用自媒体平台,通过分享自己的经验、兴趣、观点和生活方式等来吸引更多粉丝。这些自媒体账号不仅在娱乐、时尚、美食等领域广受欢迎,还在新零售、健康、教育等领域展现了巨大的影响力。
3.相较于传统的营销方式,自媒体平台广告营销展现出更高精准度的目标受众触达能力。在选定目标账号进行推广时,其粉丝群体信息是一个重要的筛选因素,通常包括人口属性、兴趣特征、消费特征、地理位置和设备属性等多维度信息。这些维度按照百分比数值的形式,用于概括一个账号的粉丝群体画像。然而,由于社交媒体平台数据的不透明性和缺失性,导致许多品牌和营销企业无法准确获得目标账号的粉丝群体画像数据,增加了决策成本并影响实际营销效果。
4.另外传统的进行粉丝群体画像构建的方法,需要收集该账号的全部或部分粉丝身份、设备等信息;这类方法数据收集成本过高,且从可能侵犯用户隐私等问题。
技术实现要素:
5.针对现有技术中存在的问题,本发明实施例提供一种自媒体账号粉丝群体画像自动补全的方法及系统。
6.本发明实施例提供一种自媒体账号粉丝群体画像自动补全的方法,包括:收集已公开的kol账号的粉丝群体画像数据,并爬取所述kol账号与关注的粉丝账号之间的互动数据,所述kol账号与目标账号存在相同的粉丝账号;基于所述互动数据,结合预设的关联算法,确定所述粉丝账号中与kol账号存在强关联关系的强关联粉丝账号,建立所述kol账号与强关联粉丝账号之间的关联关系,并基于所述关联关系建立对应的关系网络图;基于所述关系网络图中关联关系的数量对所述kol账号的粉丝群体画像数据进行均分并通过关联关系传输至对应的强关联粉丝账号,所述强关联粉丝账号接收到均分后的子信息量;对所述子信息量进行数据处理,得到所述强关联粉丝对应的近似画像概率,并检测所述强关联粉丝中与目标账号存在强关系关系的关键粉丝节点,所述关键粉丝节点将所述近似画像概率传输至目标账号;将所述目标账号接收的近似画像概率进行统计并百分比转化,确定所述目标账号的粉丝群体画像结果。
7.在其中一个实施例中,所述方法还包括:基于所述互动数据中获取对应的第一数据及第二数据,所述第一数据为互动数据
的频次描述数据,所述第二数据为互动数据中互动内容的喜好评价数据;根据所述频次描述数据,结合预设的频次标准,计算对应的频次分数,根据所述喜好评价数据,结合预设的喜欢标准,计算对应的喜好分数;基于所述频次分数及喜好分数确定所述粉丝账号的关联分数,当所述关联粉丝达到预设的强关联分数时,将所述粉丝账号标记为强关联粉丝账号。
8.在其中一个实施例中,所述方法还包括:获取所述目标账号对应的账号类型及自定义标签,基于所述账号类型及自定义标签分级对第三方数据中的所有kol账号进行筛选,得到筛选后的kol账号,并在筛选后的kol账号中收集已公开的kol账号的粉丝群体画像数据。
9.在其中一个实施例中,所述方法还包括:获取预设的账号清洗规则,并基于所述账号清洗规则对所述kol账号进行账号清洗,所述账号清洗规则包括:账号粉丝数据集合、登录时间标准、异常账号条件。
10.在其中一个实施例中,所述前置处理,包括:将目标账号的id与对应的粉丝群体画像结果对应存储至kv数据库。
11.本发明实施例提供一种自媒体账号粉丝群体画像自动补全的系统,包括:收集模块,用于收集已公开的kol账号的粉丝群体画像数据,并爬取所述kol账号与关注的粉丝账号之间的互动数据,所述kol账号与目标账号存在相同的粉丝账号;关联模块,用于基于所述互动数据,结合预设的关联算法,确定所述粉丝账号中与kol账号存在强关联关系的强关联粉丝账号,建立所述kol账号与强关联粉丝账号之间的关联关系,并基于所述关联关系建立对应的关系网络图;第一传输模块,用于基于所述关系网络图中关联关系的数量对所述kol账号的粉丝群体画像数据进行均分并通过关联关系传输至对应的强关联粉丝账号,所述强关联粉丝账号接收到均分后的子信息量;第二传输模块,用于对所述子信息量进行数据处理,得到所述强关联粉丝对应的近似画像概率,并检测所述强关联粉丝中与目标账号存在强关系关系的关键粉丝节点,所述关键粉丝节点将所述近似画像概率传输至目标账号;处理模块,用于将所述目标账号接收的近似画像概率进行统计并百分比转化,确定所述目标账号的粉丝群体画像结果。
12.在其中一个实施例中,所述系统还包括:获取模块,用于基于所述互动数据中获取对应的第一数据及第二数据,所述第一数据为互动数据的频次描述数据,所述第二数据为互动数据中互动内容的喜好评价数据;计算模块,用于根据所述频次描述数据,结合预设的频次标准,计算对应的频次分数,根据所述喜好评价数据,结合预设的喜欢标准,计算对应的喜好分数;粉丝模块,用于基于所述频次分数及喜好分数确定所述粉丝账号的关联分数,当所述关联粉丝达到预设的强关联分数时,将所述粉丝账号标记为强关联粉丝账号。
13.本发明实施例提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述自媒体账号粉丝群体画像自动补全的方法的步骤。
14.本发明实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该
计算机程序被处理器执行时实现上述自媒体账号粉丝群体画像自动补全的方法的步骤。
15.本发明实施例提供的一种自媒体账号粉丝群体画像自动补全的方法及系统,收集已公开的kol账号的粉丝群体画像数据,并爬取kol账号与关注的粉丝账号之间的互动数据,kol账号与目标账号存在相同的粉丝账号;基于互动数据,结合预设的关联算法,确定粉丝账号中与kol账号存在强关联关系的强关联粉丝账号,建立kol账号与强关联粉丝账号之间的关联关系,并基于关联关系建立对应的关系网络图;基于关系网络图中关联关系的数量对kol账号的粉丝群体画像数据进行均分并通过关联关系传输至对应的强关联粉丝账号,强关联粉丝账号接收到均分后的子信息量;对子信息量进行数据处理,得到强关联粉丝对应的近似画像概率,并检测强关联粉丝中与目标账号存在强关系关系的关键粉丝节点,关键粉丝节点将近似画像概率传输至目标账号;将目标账号接收的近似画像概率进行统计并百分比转化,确定目标账号的粉丝群体画像结果。这样能够低成本、高效率、高准确性的挖掘目标账号的粉丝群体画像,并且也避免了涉及用户隐私的问题。
附图说明
16.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
17.图1为本发明实施例中一种自媒体账号粉丝群体画像自动补全的方法的流程图;图2为本发明实施例中一种kol账号的信息扩散步骤的示意图;图3为本发明实施例中一种粉丝节点与目标节点之间信息聚合步骤的示意图;图4为本发明实施例中一种自媒体账号粉丝群体画像自动补全的系统的结构图;图5为本发明实施例中电子设备结构示意图。
具体实施方式
18.为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
19.图1为本发明实施例提供的一种自媒体账号粉丝群体画像自动补全的方法的流程示意图,如图1所示,本发明实施例提供了一种自媒体账号粉丝群体画像自动补全的方法:步骤s101,收集已公开的kol账号的粉丝群体画像数据,并爬取所述kol账号与关注的粉丝账号之间的互动数据,所述kol账号与目标账号存在相同的粉丝账号。
20.具体地,在社交网络中,存在某些已经公开过粉丝群体画像数据的kol账号,从社交网络中收集kol账号的粉丝群体画像数据,并爬取kol账号与粉丝账号之间的交互数据,交互数据可以交互账号双方的唯一的账号数据(比如账号uid)以及账号互动关系记录(如评论关系中:评论人、被评论人、评论对应的内容作品)等,其中,粉丝群体画像数据可以包括粉丝性别分布、年龄段分布、地域分布、线级分布、设备分布等数据。其中各分布数据以百分数比例的形式记录,如性别分布通常可划分为:男性(xx%)、女性(xx%)。并且通常各项分
布中各维度的比例相加等于100%,另外,各个数据可以分布表示为粉丝性别比例分布g、年龄区间比例分布a、地域比例分布r、设备比例分布d等,其中各项比例分布可以以百分数或浮点数记录,比如某个kol账号的粉丝群体画像数据表示为,另外,kol账号通常与目标账号存在相同的粉丝账号,及存在粉丝账号既关注kol账号又关注需要进行粉丝群体画像的目标账号。
21.另外,在收集社交网络中的kol账号后,还可以依据预设的清洗规则对kol账号进行数据清洗,排除kol账号中存在异常的或已注销的账号,其中,清洗规则可以包括账号粉丝数据集合、登录时间标准、异常账号条件等规则,具体可以比如仅保留粉丝关注数量处于【n,m】区间范围内的账号数据(如n=10,m=1000),其中n值用于过滤关注数偏少即用户非平台常活跃或深度用户,m值用于过滤关注数过多极有可能为刷量等虚假用户,另外会剔除kol账号中部分画像维度信息可能异常账号,如性别中某一项占比为100%,同样也会进行账号剔除。
22.另外,为了收集到的已公开的kol账号的粉丝群体画像数据的准确性,在进行数据收集之前,获取目标账号对应的账号类型及自定义标签,其中,账号类型可以比如运动类、军事类、美妆类等等,而自定义标签则是账号自身的类型定位,比如运动类的自定义标签可以为足球、篮球、综合等等,基于账号类型及自定义标签分级对第三方数据中的所有kol账号进行筛选,得到筛选后的kol账号,并在筛选后的kol账号中收集已公开的kol账号的粉丝群体画像数据,能够进一步的收集与目标账号相关的kol账号的粉丝画像信息,这样使得kol账号与目标账号双方的粉丝重合性可能更大,得到的最终结果更准确。
23.步骤s102,基于所述互动数据,结合预设的关联算法,确定所述粉丝账号中与kol账号存在强关联关系的强关联粉丝账号,建立所述kol账号与强关联粉丝账号之间的关联关系,并基于所述关联关系建立对应的关系网络图。
24.具体地,在确定kol账号与粉丝账号之间的互动数据之后,结合预设的计算kol账号与粉丝账号之间的关联度算法,计算kol账号与粉丝账号关联度,其中,关联度算法可以基于账号之间的关注情况(单方面关注、互关),账号之间的评论沟通次数等等,然后确定其中与kol账号存在强关联关系的粉丝账号,即为强关联粉丝账号,建立账号与强关联粉丝账号之间的关联关系,并基于关联关系建立对应的关系网络图,其中,关系网络图中的节点为各社交媒体账号,包括kol账号、粉丝账号、目标账号,而各节点间边标识连接的节点具有强社交关系。
25.另外,强关联粉丝账号的确认步骤可以通过获取互动数据中获取对应的第一数据及第二数据,其中,第一数据为互动数据的频次描述数据,比如互动的频次,互动的及时性等等,第二数据为互动数据中互动内容的喜好评价数据,比如在互动内容中的喜好关键词,厌恶关键词,通常关键词的词义分析确定,然后基于频次描述数据,结合预设的频次标准,计算粉丝账号对应的频次分数,根据喜好评价数据,结合预设的喜欢标准,计算粉丝账号对应的喜好分数,然后基于频次分数及喜好分数的总和确定粉丝账号的关联分数,然后判断关联粉丝是否达到预设的强关联分数时,当达到强关联分数时,说明粉丝账号与kol账号之间存在强关联性,将粉丝账号标记为强关联粉丝账号步骤s103,基于所述关系网络图中关联关系的数量对所述kol账号的粉丝群体画像数据进行均分并通过关联关系传输至对应的强关联粉丝账号,所述强关联粉丝账号接收
到均分后的子信息量。
26.具体地,基于关系网络图中的关联关系数量,将种子节点(kol账号节点)的粉丝群体画像信息按照该种子节点的边,以均分的方式传播给相应的强互动节点,比如给定一个已知粉丝群体画像的种子账号节点,计算该节点的边数量(即数据集中与该账号有强相关性的粉丝账号数量),将种子账号节点的各项粉丝画像数据均除以边数量得到均分后的子信息量,其中,均分后的信息量的计算公式为:其中,为节点的边数量,然后将均分后的子信息量分别传输给种子节点的粉丝节点,并将粉丝节点将接收到的子信息量进行累加,各累加的子信息量来自不同种子账号,上述kol账号的信息扩散步骤可以如图2所示,其中kol1、kol2代表所述已知粉丝群体画像的种子节点,fans1、fans2、fans3为粉丝节点,kol3代表待预测粉丝群体画像的kol节点。信息扩散阶段为从已知粉丝画像信息的kol节点,推测某个粉丝节点的画像概率。
27.步骤s104,对所述子信息量进行数据处理,得到所述强关联粉丝对应的近似画像概率,并检测所述强关联粉丝中与目标账号存在强关系关系的关键粉丝节点,所述关键粉丝节点将所述近似画像概率传输至目标账号。
28.具体地,在粉丝节点得到子信息量之后,对子信息量进行数据处理,其中,数据处理可以包括对不同kol账号传输的子信息量的整合以及归一化,其中,数据整合的公式化表示可以为:其中,为的强关联节点,其次,子信息量的归一化过程,具体的为对不同的类型的信息量分别进行归一化,比如对g,a,r,d等部分分别进行归一化。以性别g信息量为例其公式化表示为:其中,表示性别为男性的信息量,表示性别为女性的信息量。该过程相当于通过种子节点对粉丝节点进行投票,通过群体投票的方式得到各粉丝节点的画像属性概率分布,然后遍历关系图中粉丝节点与目标节点之间的连接关系,通过信息聚合步骤,如图3所示,将得到的子信息量通过边传递到各强关系节点,即目标节点,通过从推测的粉丝画像概率,汇总至目标节点,从而确定待预测节点的粉丝画像结果。
29.步骤s105,将所述目标账号接收的近似画像概率进行统计并百分比转化,确定所述目标账号的粉丝群体画像结果。
30.具体地,将目标账号接收的近似画像概率进行统计并百分比转化,即通过遍历关系图中待进行补全粉丝群体画像的目标节点,将该节点经过粉丝节点传输接收到的子信息量进行累加求和,将累加后的结果按照维度进行归一化,换算成各项百分比例。得到各被关
注节点的预估粉丝群体画像结果,具体的计算公式可以包括:另外,在确定目标账号的预估粉丝群体画像结果后,还可以将目标账号的id与预估粉丝群体画像结果对应存储到kv(key-value,键值型)数据库(如redis、mongodb等)中,以供后续进行查询分析。
31.本发明实施例提供的一种自媒体账号粉丝群体画像自动补全的方法,收集已公开的kol账号的粉丝群体画像数据,并爬取kol账号与关注的粉丝账号之间的互动数据,kol账号与目标账号存在相同的粉丝账号;基于互动数据,结合预设的关联算法,确定粉丝账号中与kol账号存在强关联关系的强关联粉丝账号,建立kol账号与强关联粉丝账号之间的关联关系,并基于关联关系建立对应的关系网络图;基于关系网络图中关联关系的数量对kol账号的粉丝群体画像数据进行均分并通过关联关系传输至对应的强关联粉丝账号,强关联粉丝账号接收到均分后的子信息量;对子信息量进行数据处理,得到强关联粉丝对应的近似画像概率,并检测强关联粉丝中与目标账号存在强关系关系的关键粉丝节点,关键粉丝节点将近似画像概率传输至目标账号;将目标账号接收的近似画像概率进行统计并百分比转化,确定目标账号的粉丝群体画像结果。这样能够低成本、高效率、高准确性的挖掘目标账号的粉丝群体画像,并且也避免了涉及用户隐私的问题。
32.图4为本发明实施例提供的一种自媒体账号粉丝群体画像自动补全的系统,包括:收集模块s201、关联模块s202、第一传输模块s203、第二传输模块s204、处理模块s205,其中:收集模块s201,用于收集已公开的kol账号的粉丝群体画像数据,并爬取所述kol账号与关注的粉丝账号之间的互动数据,所述kol账号与目标账号存在相同的粉丝账号。
33.关联模块s202,用于基于所述互动数据,结合预设的关联算法,确定所述粉丝账号中与kol账号存在强关联关系的强关联粉丝账号,建立所述kol账号与强关联粉丝账号之间的关联关系,并基于所述关联关系建立对应的关系网络图。
34.第一传输模块s203,用于基于所述关系网络图中关联关系的数量对所述kol账号的粉丝群体画像数据进行均分并通过关联关系传输至对应的强关联粉丝账号,所述强关联粉丝账号接收到均分后的子信息量。
35.第二传输模块s204,用于对所述子信息量进行数据处理,得到所述强关联粉丝对应的近似画像概率,并检测所述强关联粉丝中与目标账号存在强关系关系的关键粉丝节点,所述关键粉丝节点将所述近似画像概率传输至目标账号。
36.处理模块s205,用于将所述目标账号接收的近似画像概率进行统计并百分比转化,确定所述目标账号的粉丝群体画像结果。
37.在其中一个实施例中,所述系统还包括:获取模块,用于基于所述互动数据中获取对应的第一数据及第二数据,所述第一数据为互动数据的频次描述数据,所述第二数据为互动数据中互动内容的喜好评价数据。
38.计算模块,用于根据所述频次描述数据,结合预设的频次标准,计算对应的频次分数,根据所述喜好评价数据,结合预设的喜欢标准,计算对应的喜好分数。
39.粉丝模块,用于基于所述频次分数及喜好分数确定所述粉丝账号的关联分数,当所述关联粉丝达到预设的强关联分数时,将所述粉丝账号标记为强关联粉丝账号。
40.在其中一个实施例中,所述系统还包括:标签模块,用于获取所述目标账号对应的账号类型及自定义标签,基于所述账号类型及自定义标签分级对第三方数据中的所有kol账号进行筛选,得到筛选后的kol账号,并在筛选后的kol账号中收集已公开的kol账号的粉丝群体画像数据。
41.关于自媒体账号粉丝群体画像自动补全的系统的具体限定可以参见上文中对于自媒体账号粉丝群体画像自动补全的方法的限定,在此不再赘述。上述自媒体账号粉丝群体画像自动补全的系统中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
42.图5示例了一种电子设备的实体结构示意图,如图5所示,该电子设备可以包括:处理器(processor)301、存储器(memory)302、通信接口(communications interface)303和通信总线304,其中,处理器301,存储器302,通信接口303通过通信总线304完成相互间的通信。处理器301可以调用存储器302中的逻辑指令,以执行如下方法:收集已公开的kol账号的粉丝群体画像数据,并爬取kol账号与关注的粉丝账号之间的互动数据,kol账号与目标账号存在相同的粉丝账号;基于互动数据,结合预设的关联算法,确定粉丝账号中与kol账号存在强关联关系的强关联粉丝账号,建立kol账号与强关联粉丝账号之间的关联关系,并基于关联关系建立对应的关系网络图;基于关系网络图中关联关系的数量对kol账号的粉丝群体画像数据进行均分并通过关联关系传输至对应的强关联粉丝账号,强关联粉丝账号接收到均分后的子信息量;对子信息量进行数据处理,得到强关联粉丝对应的近似画像概率,并检测强关联粉丝中与目标账号存在强关系关系的关键粉丝节点,关键粉丝节点将近似画像概率传输至目标账号;将目标账号接收的近似画像概率进行统计并百分比转化,确定目标账号的粉丝群体画像结果。
43.此外,上述的存储器302中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,randomaccess memory)、磁碟或者光盘等各种可以存储程序代码的介质。
44.另一方面,本发明实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例提供的传输方法,例如包括:收集已公开的kol账号的粉丝群体画像数据,并爬取kol账号与关注的粉丝账号之间的互动数据,kol账号与目标账号存在相同的粉丝账号;基于互动数据,结合预设的关联算法,确定粉丝账号中与kol账号存在强关联关系的强关联粉丝账号,建立kol账号与强关联粉丝账号之间的关联关系,并基于关联关系建立对应的关系网络图;基于关系网络图中关联关系的数量对kol账号的粉丝群体画像数据进行均分并通过关联关系传输至对应的强关
联粉丝账号,强关联粉丝账号接收到均分后的子信息量;对子信息量进行数据处理,得到强关联粉丝对应的近似画像概率,并检测强关联粉丝中与目标账号存在强关系关系的关键粉丝节点,关键粉丝节点将近似画像概率传输至目标账号;将目标账号接收的近似画像概率进行统计并百分比转化,确定目标账号的粉丝群体画像结果。
45.以上所描述的系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
46.通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
47.最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
技术特征:
1.一种自媒体账号粉丝群体画像自动补全的方法,其特征在于,包括:收集已公开的kol账号的粉丝群体画像数据,并爬取所述kol账号与关注的粉丝账号之间的互动数据,所述kol账号与目标账号存在相同的粉丝账号;基于所述互动数据,结合预设的关联算法,确定所述粉丝账号中与kol账号存在强关联关系的强关联粉丝账号,建立所述kol账号与强关联粉丝账号之间的关联关系,并基于所述关联关系建立对应的关系网络图;基于所述关系网络图中关联关系的数量对所述kol账号的粉丝群体画像数据进行均分并通过关联关系传输至对应的强关联粉丝账号,所述强关联粉丝账号接收到均分后的子信息量;对所述子信息量进行数据处理,得到所述强关联粉丝对应的近似画像概率,并检测所述强关联粉丝中与目标账号存在强关系关系的关键粉丝节点,所述关键粉丝节点将所述近似画像概率传输至目标账号;将所述目标账号接收的近似画像概率进行统计并百分比转化,确定所述目标账号的粉丝群体画像结果。2.根据权利要求1所述的自媒体账号粉丝群体画像自动补全的方法,其特征在于,所述基于所述互动数据,结合预设的关联算法,确定所述粉丝账号中与kol账号存在强关联关系的强关联粉丝账号,包括:基于所述互动数据中获取对应的第一数据及第二数据,所述第一数据为互动数据的频次描述数据,所述第二数据为互动数据中互动内容的喜好评价数据;根据所述频次描述数据,结合预设的频次标准,计算对应的频次分数,根据所述喜好评价数据,结合预设的喜好标准,计算对应的喜好分数;基于所述频次分数及喜好分数确定所述粉丝账号的关联分数,当所述关联粉丝达到预设的强关联分数时,将所述粉丝账号标记为强关联粉丝账号。3.根据权利要求1所述的自媒体账号粉丝群体画像自动补全的方法,其特征在于,所述收集已公开的kol账号的粉丝群体画像数据之前,还包括:获取所述目标账号对应的账号类型及自定义标签,基于所述账号类型及自定义标签分级对第三方数据中的所有kol账号进行筛选,得到筛选后的kol账号,并在筛选后的kol账号中收集已公开的kol账号的粉丝群体画像数据。4.根据权利要求1所述的自媒体账号粉丝群体画像自动补全的方法,其特征在于,所述收集已公开的kol账号的粉丝群体画像数据之后,还包括:获取预设的账号清洗规则,并基于所述账号清洗规则对所述kol账号进行账号清洗,所述账号清洗规则包括:账号粉丝数据集合、登录时间标准、异常账号条件。5.根据权利要求1所述的自媒体账号粉丝群体画像自动补全的方法,其特征在于,所述确定所述目标账号的粉丝群体画像结果之后,还包括:将目标账号的id与对应的粉丝群体画像结果对应存储至kv数据库。6.一种自媒体账号粉丝群体画像自动补全的系统,其特征在于,所述系统包括:收集模块,用于收集已公开的kol账号的粉丝群体画像数据,并爬取所述kol账号与关注的粉丝账号之间的互动数据,所述kol账号与目标账号存在相同的粉丝账号;关联模块,用于基于所述互动数据,结合预设的关联算法,确定所述粉丝账号中与kol
账号存在强关联关系的强关联粉丝账号,建立所述kol账号与强关联粉丝账号之间的关联关系,并基于所述关联关系建立对应的关系网络图;第一传输模块,用于基于所述关系网络图中关联关系的数量对所述kol账号的粉丝群体画像数据进行均分并通过关联关系传输至对应的强关联粉丝账号,所述强关联粉丝账号接收到均分后的子信息量;第二传输模块,用于对所述子信息量进行数据处理,得到所述强关联粉丝对应的近似画像概率,并检测所述强关联粉丝中与目标账号存在强关系关系的关键粉丝节点,所述关键粉丝节点将所述近似画像概率传输至目标账号;处理模块,用于将所述目标账号接收的近似画像概率进行统计并百分比转化,确定所述目标账号的粉丝群体画像结果。7.根据权利要求6所述的自媒体账号粉丝群体画像自动补全的系统,其特征在于,所述系统还包括:获取模块,用于基于所述互动数据中获取对应的第一数据及第二数据,所述第一数据为互动数据的频次描述数据,所述第二数据为互动数据中互动内容的喜好评价数据;计算模块,用于根据所述频次描述数据,结合预设的频次标准,计算对应的频次分数,根据所述喜好评价数据,结合预设的喜欢标准,计算对应的喜好分数;粉丝模块,用于基于所述频次分数及喜好分数确定所述粉丝账号的关联分数,当所述关联粉丝达到预设的强关联分数时,将所述粉丝账号标记为强关联粉丝账号。8.根据权利要求6所述的自媒体账号粉丝群体画像自动补全的系统,其特征在于,所述系统还包括:标签模块,用于获取所述目标账号对应的账号类型及自定义标签,基于所述账号类型及自定义标签分级对第三方数据中的所有kol账号进行筛选,得到筛选后的kol账号,并在筛选后的kol账号中收集已公开的kol账号的粉丝群体画像数据。9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至5任一项所述自媒体账号粉丝群体画像自动补全的方法的步骤。10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至5任一项所述自媒体账号粉丝群体画像自动补全的方法的步骤。
技术总结
本发明实施例提供一种自媒体账号粉丝群体画像自动补全的方法及系统,所述方法包括:并爬取KOL账号与关注的粉丝账号之间的互动数据;基于互动数据确定粉丝账号中的强关联粉丝账号并建立关联关系对应的关系网络图;基于关系网络图中关联关系的数量对KOL账号的粉丝群体画像数据进行均分并传输至对应的强关联粉丝账号;对接收到的数据处理得到对应的近似画像概率,并检测强关联粉丝中与目标账号存在强关系关系的关键粉丝节点,关键粉丝节点将近似画像概率传输至目标账号;统计近似画像概率进行统计并百分比转化,确定目标账号的粉丝群体画像结果。这样能够低成本、高效率、高准确性的挖掘目标账号的粉丝群体画像,并且也避免了涉及用户隐私的问题。及用户隐私的问题。及用户隐私的问题。
技术研发人员:朱卫祥 何源
受保护的技术使用者:杭州麦加品牌营销策划有限公司
技术研发日:2023.07.06
技术公布日:2023/10/15
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/