基于群优化算法的推广投放系统的制作方法
未命名
09-22
阅读:84
评论:0

1.本发明涉及计算机推广技术领域,特别涉及基于群优化算法的推广投放系统。
背景技术:
2.在当前的数字营销和广告推广领域,为了提高广告投放的效果和精准度,许多企业和广告主都致力于寻找新的方法和技术来优化推广策略和目标用户定位。然而,传统的广告投放方法存在一些问题,例如缺乏个性化和精准度、无法满足特定需求以及投放效果评估困难等。
3.目前,一些已经公开的技术尝试通过数据分析和算法优化来提高广告投放的效果。其中一种常见的方法是利用关键词匹配和相似度计算来确定广告和目标用户之间的匹配程度。然而,这种方法仍然存在一些问题,如关键词的选择和匹配不准确、无法充分考虑目标用户的兴趣和偏好、对于复杂的投放需求和多维特征的处理能力有限等。
4.此外,现有技术中也存在着对广告投放效果评估的挑战。传统的广告评估方法主要依赖于点击率和转化率等指标,这些指标无法完全反映广告对目标用户的实际影响和推广效果。同时,广告投放涉及到多个因素的综合考虑,如广告内容、目标用户特征、投放需求等,如何综合这些因素进行优化决策仍然是一个亟待解决的问题。
技术实现要素:
5.本发明的目的是提供基于群优化算法的推广投放系统,提升了广告投放的精准度,同时优化了广告投放策略,提升了用户体验。
6.为解决上述技术问题,本发明基于群优化算法的推广投放系统,:
7.基于群优化算法的推广投放系统,其特征在于,所述系统包括:目标用户数据采集单元,配置用于采集目标用户的使用数据,对使用数据进行数据分析,提取出使用数据的多个不同的特征,以及生成对应特征的特征值,将每个特征的特征值映射到一个三维空间中,得到三维空间中的特征点,其中特征为关键词特征,特征值为该关键词特征对应的目标用户数;投放需求分析单元,配置用于获取投放需求,对投放需求进行关键词分析,得到投放需求的关键词;群优化空间搜索单元,配置用于基于投放需求的关键词,在使用数据的特征中进行相似度匹配检索,找到与关键词相似度最高的特征,然后在三维空间中以该特征对应的特征点为起点,进行目标点搜索,找到三维空间中的目标点对应的最优位置,该最优位置将使得目标函数的值为最大。
8.进一步的,所述目标用户数据采集单元包括:数据获取模块,配置用于采集目标用户的使用数据;数据分析模块,配置用于对使用数据进行数据分析,提取出使用数据的多个不同的特征,以及生成对应特征的特征值;映射模块,配置用于将每个特征的特征值映射到一个三维空间中,得到三维空间中的特征点,其中特征为关键词特征,特征值为该关键词特征对应的目标用户数;所述使用数据包括:广告内容和查看广告人数;所述数据分析模块使用基于文本的关键词提取算法对广告内容进行关键词提取,得到使用数据的特征。
9.进一步的,所述数据分析模块使用基于文本的关键词提取算法对广告内容进行关键词提取,得到使用数据的特征的方法包括:
10.步骤a1:对广告内容进行预处理,得到预处理文本;所述预处理的过程包括:将广告内容进行词语划分后,再进行停用词去除,得到多个词语;
11.步骤a2:构建共现矩阵,包括:统计词语之间的共现关系,构建共现矩阵c;矩阵c的元素c(i,j)表示词语i和词语j的共现次数;
12.步骤a3:构建转移矩阵,包括:根据共现矩阵c构建转移矩阵m;转移矩阵m的元素m(i,j)表示从词语i到词语j的转移概率;
13.步骤a4:计算词语重要性得分,包括:初始化词语的重要性得分向量s为一个向量,设定所有元素初始值为1;迭代计算重要性得分,直到收敛;使用马尔科夫链的收敛条件,当重要性得分向量s的变化小于给定的阈值时停止迭代;
14.步骤a5:根据词语的重要性得分,按照得分从高到低的顺序提取前n个词语作为关键词。
15.进一步的,所述转移概率使用如下公式计算得到:
[0016][0017]
其中,∑kc(i,k)表示词语的所有共现次数之和;k表示循环的索引,用于遍历词语i的共现次数。
[0018]
进一步的,所述重要性得分使用如下公式计算得到:
[0019][0020]
其中,d是阻尼系数取值为0.85~0.9,∑km(j,k)表示词语j的所有出链的转移概率之和。
[0021]
进一步的,所述投放需求分析单元,对投放需求使用tf-idf的方法进行关键词分析,得到投放需求的关键词。
[0022]
进一步的,所述群优化空间搜索单元包括:相似度计算模块,配置用于基于投放需求的关键词,在使用数据的特征中进行相似度匹配检索,找到与关键词相似度最高的特征;空间搜索模块,配置用于在三维空间中以该特征对应的特征点为起点,进行目标点搜索,找到三维空间中的目标点对应的最优位置,该最优位置将使得目标函数的值为最大,所述目标函数使用如下公式进行表示:其中,n为特征点的数量;q为特征值;表示特征点pi与目标点的h的距离;d
hp
表示目标点h距离起点p的距离;f为目标函数。
[0023]
进一步的,所述相似度计算模块,基于投放需求的关键词,在使用数据的特征中进行相似度匹配检索,找到与关键词相似度最高的特征的方法包括:分别将特征和关键词表示为向量;使用如下公式计算向量之间的相似度:
[0024]
similarity=dot(a,b)/(norm(a)*norm(b));
[0025]
其中,a和b分别表示特征和关键词的向量表示,dot(a,b)表示a和b的点积,norm(a)表示a的范数;norm(b)表示b的范数。
[0026]
进一步的,所述空间搜索模块,在三维空间中以该特征对应的特征点为起点,进行目标点搜索,找到三维空间中的目标点对应的最优位置的方法包括:
[0027]
步骤b1:初始化目标点群,包括:设置目标点群大小n;初始化目标点的位置xi和速度vi;位置xi为起点的位置;设置目标点的最佳位置pi为当前位置,即pi=xi;找到全局最佳位置g,即目标点最佳位置中的最优解;
[0028]
步骤b2:更新目标点群,包括:对于目标点i:计算当前位置xi的目标函数值f(xi);如果f(xi)优于个体最佳位置pi的目标函数值,即f(xi)>f(g),则使用如下公式更新最佳位置:
[0029]
pi(t+1)=xi(t);
[0030]
如果f(xi)优于全局最佳位置g的目标函数值,即f(xi)>f(g),则使用如下公式更新全局最佳位置:
[0031]
g(t+1=xi(t);
[0032]
更新速度:
[0033][0034]
更新位置:
[0035]
xi(t+1)=xi(t)+vi(t+1);
[0036]
步骤b3:重复步骤b2,直到达到指定的迭代次数。
[0037]
本发明所提供的基于群优化算法的推广投放系统,具备如下有益效果:
[0038]
提高广告投放的精准度:传统的广告投放方法往往只依靠简单的关键词匹配,无法准确捕捉用户的兴趣和需求。而本发明通过目标用户数据采集单元和投放需求分析单元,综合考虑目标用户的使用数据和投放需求的关键词,实现了更准确的用户定位和匹配。通过相似度匹配和群优化算法的应用,可以精准找到与关键词相似度最高的特征,从而提高广告与目标用户之间的匹配程度,使广告投放更具精准度。
[0039]
优化广告投放策略:本发明中的群优化空间搜索单元利用群优化算法和三维空间搜索,能够寻找最优位置以最大化目标函数的值。通过在三维空间中搜索最优位置,可以在多个特征点中找到最适合的目标点,从而优化广告投放的策略。这意味着广告将更好地满足投放需求和目标用户的要求,提高广告的效果和用户的满意度。
[0040]
改进广告投放效果评估:传统的广告效果评估主要依赖于点击率和转化率等指标,但这些指标无法全面反映广告对目标用户的实际影响和推广效果。而本发明中的目标函数通过综合考虑多个因素,如特征值、特征点之间的距离和目标点与起点的距离,来评估目标点位置的优劣。这样可以更全面地评估广告投放效果,使广告主能够更准确地了解广告的实际影响和效果,从而做出更科学的决策和调整。
附图说明
[0041]
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据
提供的附图获得其他的附图。
[0042]
图1为本发明实施例所提供的基于群优化算法的推广投放系统的系统结构示意图。
具体实施方式
[0043]
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0044]
实施例1。
[0045]
请参考图1,基于群优化算法的推广投放系统,其特征在于,所述系统包括:目标用户数据采集单元,配置用于采集目标用户的使用数据,对使用数据进行数据分析,提取出使用数据的多个不同的特征,以及生成对应特征的特征值,将每个特征的特征值映射到一个三维空间中,得到三维空间中的特征点,其中特征为关键词特征,特征值为该关键词特征对应的目标用户数;投放需求分析单元,配置用于获取投放需求,对投放需求进行关键词分析,得到投放需求的关键词;群优化空间搜索单元,配置用于基于投放需求的关键词,在使用数据的特征中进行相似度匹配检索,找到与关键词相似度最高的特征,然后在三维空间中以该特征对应的特征点为起点,进行目标点搜索,找到三维空间中的目标点对应的最优位置,该最优位置将使得目标函数的值为最大。
[0046]
具体的,系统首先收集目标用户的使用数据,并进行数据分析。这些使用数据可以包括用户的行为记录、浏览历史、购买记录等。通过对使用数据的分析,系统可以提取出多个不同的特征,并为每个特征生成对应的特征值。系统获取投放需求,这是广告主或推广者提供的需求信息,其中包含了他们希望推广的产品或服务的相关要求和关键词。系统对投放需求进行关键词分析,提取出关键词。系统将投放需求的关键词与使用数据的特征进行相似度匹配。通过计算关键词与特征之间的相似度,系统可以找到与关键词相似度最高的特征。这里的相似度匹配可以使用各种算法和技术,例如文本相似度计算或者词向量模型。一旦找到与关键词相似度最高的特征,系统将把该特征的特征值映射到一个三维空间中,并得到该特征在三维空间中的特征点。然后,系统以该特征点为起点进行目标点搜索。这个搜索过程可以使用群优化算法,如粒子群优化算法或遗传算法。系统在三维空间中搜索目标点的位置,目标点对应的位置被认为是最优位置。搜索的目标是使得目标函数的值最大化。目标函数可以是广告投放的效果指标,如点击率、转化率或收益等。通过群优化算法的搜索过程,系统可以找到最优的投放位置,从而提高广告推广的效果。
[0047]
实施例2。
[0048]
在上一实施例的基础上,所述目标用户数据采集单元包括:数据获取模块,配置用于采集目标用户的使用数据;数据分析模块,配置用于对使用数据进行数据分析,提取出使用数据的多个不同的特征,以及生成对应特征的特征值;映射模块,配置用于将每个特征的特征值映射到一个三维空间中,得到三维空间中的特征点,其中特征为关键词特征,特征值为该关键词特征对应的目标用户数;所述使用数据包括:广告内容和查看广告人数;所述数据分析模块使用基于文本的关键词提取算法对广告内容进行关键词提取,得到使用数据的
特征。
[0049]
具体的,在映射模块执行之前,需要准备好特征值数据。每个特征对应一个特征值,例如关键词特征对应的目标用户数。为了确保特征值在相同的尺度上,可能需要对特征值进行归一化处理。常见的归一化方法是将特征值缩放到[0,1]或[-1,1]的范围内,以消除不同特征值之间的数量级差异。
[0050]
mds是一种用于将高维数据映射到低维空间的技术,可以在此处应用于将特征值映射到三维空间中。
[0051]
mds算法的目标是在低维空间中保持高维数据点之间的距离关系。具体步骤如下:
[0052]
计算特征值之间的相似度矩阵。可以使用相似度度量方法,如欧氏距离、余弦相似度等,将特征值之间的相似度计算出来。
[0053]
根据相似度矩阵进行距离矩阵的计算。距离矩阵是由相似度矩阵计算得到的,其中每个元素表示特征值之间的距离。
[0054]
应用mds算法来将距离矩阵映射到三维空间中。mds算法通过迭代优化的方式,将高维数据点的距离关系在低维空间中重建。具体的优化目标可以使用stress函数,如下所示:
[0055][0056]
其中,d
ij
表示距离矩阵中的实际距离,表示映射后在三维空间中计算得到的距离。通过最小化stress函数,可以优化映射结果的准确性。
[0057]
最终得到映射后的三维坐标,即特征点的位置,表示不同特征在三维空间中的位置关系。
[0058]
实施例3。
[0059]
在上一实施例的基础上,所述数据分析模块使用基于文本的关键词提取算法对广告内容进行关键词提取,得到使用数据的特征的方法包括:
[0060]
步骤a1:对广告内容进行预处理,得到预处理文本;所述预处理的过程包括:将广告内容进行词语划分后,再进行停用词去除,得到多个词语;
[0061]
该步骤将广告内容进行预处理,得到预处理文本。预处理过程包括词语划分和停用词去除。首先,将广告内容进行词语划分,将文本划分为多个词语。然后,去除停用词,这些停用词是在文本处理中常见但没有实际含义的词语,如介词、连词等。最终得到经过预处理的文本。
[0062]
步骤a2:构建共现矩阵,包括:统计词语之间的共现关系,构建共现矩阵c;矩阵c的元素c(i,j)表示词语i和词语j的共现次数;
[0063]
该步骤包括统计词语之间的共现关系,构建共现矩阵c。共现矩阵c的元素c(i,j)表示词语i和词语j的共现次数。共现指的是在广告内容中同时出现的两个词语的次数统计。
[0064]
步骤a3:构建转移矩阵,包括:根据共现矩阵c构建转移矩阵m;转移矩阵m的元素m(i,j)表示从词语i到词语j的转移概率;
[0065]
步骤a4:计算词语重要性得分,包括:初始化词语的重要性得分向量s为一个向量,设定所有元素初始值为1;迭代计算重要性得分,直到收敛;使用马尔科夫链的收敛条件,当重要性得分向量s的变化小于给定的阈值时停止迭代;
[0066]
根据转移矩阵m,计算词语的重要性得分。首先,初始化词语的重要性得分向量s,将所有元素初始值设定为1。然后,迭代计算重要性得分,直到收敛。迭代过程使用马尔科夫链的收敛条件,当重要性得分向量s的变化小于给定的阈值时停止迭代。
[0067]
步骤a5:根据词语的重要性得分,按照得分从高到低的顺序提取前n个词语作为关键词。
[0068]
根据词语的重要性得分,按照得分从高到低的顺序提取前n个词语作为关键词。可以根据设定的阈值或者固定的关键词数量来确定提取的词语数量。
[0069]
具体的,在词语划分过程中,将广告内容分割成多个词语。这个过程可以使用基于规则的方法或者基于机器学习的自然语言处理方法。
[0070]
基于规则的方法:这种方法使用预定义的规则来划分词语,例如基于空格或标点符号的划分。算法流程如下:
[0071]
首先,将广告内容按照空格或标点符号进行划分,得到候选词语。
[0072]
然后,可以使用其他规则或技术来进一步处理候选词语,例如词干提取或词性标注。
[0073]
最终,得到划分后的词语列表。
[0074]
基于机器学习的自然语言处理方法:这种方法使用机器学习模型来学习词语的划分模式。常见的方法是使用分词工具,如中文的jieba分词或英文的nltk库。这些工具使用训练好的模型或规则来划分词语,以提高准确性。
[0075]
停用词去除:在停用词去除过程中,需要去除在文本处理中没有实际含义的常见词语,例如介词、连词、冠词等。这些词语对于分析和提取关键词没有太大的帮助。
[0076]
停用词列表:停用词列表是一个包含常见停用词的预定义词语集合。这个列表可以包含根据特定领域或语言特征选择的停用词。
[0077]
算法流程:
[0078]
首先,将词语划分后的结果与停用词列表进行比较。
[0079]
对于出现在停用词列表中的词语,将其从词语列表中删除。
[0080]
最终,得到去除停用词的词语列表。
[0081]
实施例4。
[0082]
在上一实施例的基础上,所述转移概率使用如下公式计算得到:
[0083][0084]
其中,∑kc(i,k)表示词语的所有共现次数之和;k表示循环的索引,用于遍历词语i的共现次数。
[0085]
实施例5。
[0086]
在上一实施例的基础上,所述重要性得分使用如下公式计算得到:
[0087]
[0088]
其中,d是阻尼系数取值为0.85~0.9,∑km(j,k)表示词语j的所有出链的转移概率之和。
[0089]
具体的,d:阻尼系数,其取值范围通常为0.85至0.9。该系数控制了重要性得分在迭代过程中的衰减程度。较高的阻尼系数会使得重要性得分更加保守,更加依赖于当前节点的重要性,而较低的阻尼系数则会更加注重网络中的整体连通性。
[0090]
m(j,i):转移矩阵中词语j到词语i的转移概率。该转移概率表示从词语j转移到词语i的可能性。在这里,该概率用于衡量词语j对词语i的重要性贡献。
[0091]
s(j):词语j的重要性得分。该得分表示词语j的重要程度。
[0092]
∑km(j,k):表示词语j的所有出链的转移概率之和。它表示从词语j转移到其他词语的总概率。
[0093]
实施例6。
[0094]
在上一实施例的基础上,所述投放需求分析单元,对投放需求使用tf-idf的方法进行关键词分析,得到投放需求的关键词。
[0095]
具体过程包括:
[0096]
文本预处理:在对投放需求进行关键词分析之前,首先需要对文本进行预处理,包括去除特殊字符、转换为小写字母等操作。
[0097]
构建词频矩阵:根据预处理后的投放需求文本,构建文本的词频矩阵。词频矩阵记录了每个词语在投放需求文本中的出现次数。
[0098]
计算词语的tf值:计算每个词语的tf值,表示词语在投放需求文本中的相对重要程度。tf值可以通过以下公式计算:
[0099]
tf(t)=(词语t在文本中的出现次数)/(文本中的总词语数)
[0100]
其中,t表示待计算tf的词语。
[0101]
计算词语的idf值:计算每个词语的idf值,表示词语在整个语料库中的重要程度。idf值可以通过以下公式计算:
[0102]
idf(t)=log((语料库中的文档总数)/(包含词语t的文档数))
[0103]
其中,t表示待计算idf的词语。
[0104]
计算词语的tf-idf值:通过将词语的tf值和idf值相乘,得到词语的tf-idf值。tf-idf值可以衡量词语在投放需求文本中的重要程度。计算公式如下:
[0105]
tf-idf(t)=tf(t)*idf(t)
[0106]
其中,t表示待计算tf-idf的词语。
[0107]
提取关键词:根据计算得到的词语的tf-idf值,按照得分从高到低的顺序提取前n个词语作为投放需求的关键词。
[0108]
实施例7。
[0109]
在上一实施例的基础上,所述群优化空间搜索单元包括:相似度计算模块,配置用于基于投放需求的关键词,在使用数据的特征中进行相似度匹配检索,找到与关键词相似度最高的特征;空间搜索模块,配置用于在三维空间中以该特征对应的特征点为起点,进行目标点搜索,找到三维空间中的目标点对应的最优位置,该最优位置将使得目标函数的值
为最大,所述目标函数使用如下公式进行表示:其中,n为特征点的数量;q为特征值;表示特征点pi与目标点的h的距离;d
hp
表示目标点h距离起点p的距离;f为目标函数。
[0110]
特征点与目标点的距离:
[0111]
在目标函数中,通过计算特征点pi与目标点h之间的距离衡量了目标点与特征点之间的相似度或接近程度。距离越小,表示目标点与特征点越相似或越接近。
[0112]
特征值的重要性权重:
[0113]
特征值q用来表示特征的重要性或权重。它反映了在目标点选择中,特征的重要程度。特征值越大,表示特征对于目标点的选择越重要。
[0114]
目标点与起点的距离:
[0115]
目标点h距离起点p的距离d
hp
,表示目标点与起点之间的距离。这个距离可以用来衡量目标点相对于起点的位置,距离越小表示目标点越接近起点。
[0116]
目标函数的计算:
[0117]
目标函数公式中的分子部分是特征值q与特征点与目标点的距离的乘积之和,分母部分是目标点与起点的距离d
hp
。目标函数的值f是通过计算分子除以分母得到的。
[0118]
具体而言,分子部分可以理解为特征值q与每个特征点的相似度的加权和,分母部分可以理解为起点到目标点的距离。目标函数的值f越大,表示目标点位置越优。
[0119]
目标函数的计算过程可以理解为对特征点与目标点之间的相似度和距离进行综合评估,以确定目标点的位置优劣程度。
[0120]
分子部分:分子部分的计算是特征值q与特征点与目标点的距离的乘积之和。这表示了特征点对于目标点的贡献程度。特征值q表示特征的重要性,而表示特征点与目标点之间的距离,两者的乘积反映了特征在目标点选择中的相对重要性。相似度越高、距离越近的特征点会对目标函数的值产生更大的贡献。
[0121]
分母部分:分母部分是目标点与起点的距离d
hp
。这个距离表示了目标点相对于起点的位置。分母的作用是对目标点的位置进行归一化,使目标函数的值不仅依赖于特征点的贡献度,还考虑了目标点与起点的相对位置。
[0122]
目标函数的值:通过将分子部分除以分母部分得到目标函数的值f。目标函数的值越大,表示目标点的位置越优,更符合系统设计中定义的目标。
[0123]
实施例8。
[0124]
在上一实施例的基础上,所述相似度计算模块,基于投放需求的关键词,在使用数据的特征中进行相似度匹配检索,找到与关键词相似度最高的特征的方法包括:分别将特征和关键词表示为向量;使用如下公式计算向量之间的相似度:
[0125]
similarity=dot(a,b)/(norm(a)*norm(b));
[0126]
其中,a和b分别表示特征和关键词的向量表示,dot(a,b)表示a和b的点积,norm(a)表示a的范数;norm(b)表示b的范数。
[0127]
实施例9。
[0128]
在上一实施例的基础上,所述空间搜索模块,在三维空间中以该特征对应的特征点为起点,进行目标点搜索,找到三维空间中的目标点对应的最优位置的方法包括:
[0129]
步骤b1:初始化目标点群,包括:设置目标点群大小n;初始化目标点的位置xi和速度vi;位置xi为起点的位置;设置目标点的最佳位置pi为当前位置,即pi=xi;找到全局最佳位置g,即目标点最佳位置中的最优解;
[0130]
步骤b2:更新目标点群,包括:对于目标点i:计算当前位置xi的目标函数值f(xi);如果f(xi)优于个体最佳位置pi的目标函数值,即f(xi)>f(g),则使用如下公式更新最佳位置:
[0131]
pi(t+1)=xi(t);
[0132]
如果f(xi)优于全局最佳位置g的目标函数值,即f(xi)>f(g),则使用如下公式更新全局最佳位置:
[0133]
g(t+1)=xi(t);
[0134]
更新速度:
[0135][0136]
更新位置:
[0137]
xi(t+1)=xi(t)+vi(t+1);
[0138]
步骤b3:重复步骤b2,直到达到指定的迭代次数。
[0139]
以上对本发明所提供的详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
技术特征:
1.基于群优化算法的推广投放系统,其特征在于,所述系统包括:目标用户数据采集单元,配置用于采集目标用户的使用数据,对使用数据进行数据分析,提取出使用数据的多个不同的特征,以及生成对应特征的特征值,将每个特征的特征值映射到一个三维空间中,得到三维空间中的特征点,其中特征为关键词特征,特征值为该关键词特征对应的目标用户数;投放需求分析单元,配置用于获取投放需求,对投放需求进行关键词分析,得到投放需求的关键词;群优化空间搜索单元,配置用于基于投放需求的关键词,在使用数据的特征中进行相似度匹配检索,找到与关键词相似度最高的特征,然后在三维空间中以该特征对应的特征点为起点,进行目标点搜索,找到三维空间中的目标点对应的最优位置,该最优位置将使得目标函数的值为最大。2.如权利要求1所述的基于群优化算法的推广投放系统,其特征在于,所述目标用户数据采集单元包括:数据获取模块,配置用于采集目标用户的使用数据;数据分析模块,配置用于对使用数据进行数据分析,提取出使用数据的多个不同的特征,以及生成对应特征的特征值;映射模块,配置用于将每个特征的特征值映射到一个三维空间中,得到三维空间中的特征点,其中特征为关键词特征,特征值为该关键词特征对应的目标用户数;所述使用数据包括:广告内容和查看广告人数;所述数据分析模块使用基于文本的关键词提取算法对广告内容进行关键词提取,得到使用数据的特征。3.如权利要求2所述的基于群优化算法的推广投放系统,其特征在于,所述数据分析模块使用基于文本的关键词提取算法对广告内容进行关键词提取,得到使用数据的特征的方法包括:步骤a1:对广告内容进行预处理,得到预处理文本;所述预处理的过程包括:将广告内容进行词语划分后,再进行停用词去除,得到多个词语;步骤a2:构建共现矩阵,包括:统计词语之间的共现关系,构建共现矩阵c;矩阵c的元素c(i,j)表示词语i和词语j的共现次数;步骤a3:构建转移矩阵,包括:根据共现矩阵c构建转移矩阵m;转移矩阵m的元素m(i,j)表示从词语i到词语j的转移概率;步骤a4:计算词语重要性得分,包括:初始化词语的重要性得分向量s为一个向量,设定所有元素初始值为1;迭代计算重要性得分,直到收敛;使用马尔科夫链的收敛条件,当重要性得分向量s的变化小于给定的阈值时停止迭代;步骤a5:根据词语的重要性得分,按照得分从高到低的顺序提取前n个词语作为关键词。4.如权利要求3所述的基于群优化算法的推广投放系统,其特征在于,所述转移概率使用如下公式计算得到:其中,∑
k
c(i,k)表示词语的所有共现次数之和;k表示循环的索引,用于遍历词语i的共现次数。5.如权利要求4所述的基于群优化算法的推广投放系统,其特征在于,所述重要性得分使用如下公式计算得到:
其中,d是阻尼系数取值为0.85~0.9,∑
k
m(j,k)表示词语j的所有出链的转移概率之和。6.如权利要求1所述的基于群优化算法的推广投放系统,其特征在于,所述投放需求分析单元,对投放需求使用tf-idf的方法进行关键词分析,得到投放需求的关键词。7.如权利要求5或6所述的基于群优化算法的推广投放系统,其特征在于,所述群优化空间搜索单元包括:相似度计算模块,配置用于基于投放需求的关键词,在使用数据的特征中进行相似度匹配检索,找到与关键词相似度最高的特征;空间搜索模块,配置用于在三维空间中以该特征对应的特征点为起点,进行目标点搜索,找到三维空间中的目标点对应的最优位置,该最优位置将使得目标函数的值为最大,所述目标函数使用如下公式进行表示:其中,n为特征点的数量;q为特征值;表示特征点p
i
与目标点的h的距离;d
hp
表示目标点h距离起点p的距离;f为目标函数。8.如权利要求7所述的基于群优化算法的推广投放系统,其特征在于,所述相似度计算模块,基于投放需求的关键词,在使用数据的特征中进行相似度匹配检索,找到与关键词相似度最高的特征的方法包括:分别将特征和关键词表示为向量;使用如下公式计算向量之间的相似度:similarity=dot(a,b)/(norm(a)*norm(b));其中,a和b分别表示特征和关键词的向量表示,dot(a,b)表示a和b的点积,norm(a)表示a的范数;norm(b)表示b的范数。9.如权利要求8所述的基于群优化算法的推广投放系统,其特征在于,所述空间搜索模块,在三维空间中以该特征对应的特征点为起点,进行目标点搜索,找到三维空间中的目标点对应的最优位置的方法包括:步骤b1:初始化目标点群,包括:设置目标点群大小n;初始化目标点的位置x
i
和速度v
i
;位置x
i
为起点的位置;设置目标点的最佳位置p
i
为当前位置,即p
i
=x
i
;找到全局最佳位置g,即目标点最佳位置中的最优解;步骤b2:更新目标点群,包括:对于目标点i:计算当前位置x
i
的目标函数值f(x
i
);如果f(x
i
)优于个体最佳位置p
i
的目标函数值,即f(x
i
)>f(g),则使用如下公式更新最佳位置:p
i
(t+1)=x
i
(t);如果f(x
i
)优于全局最佳位置g的目标函数值,即f(x
i
)>f(g),则使用如下公式更新全局最佳位置:g(t+1)=x
i
(t);更新速度:更新位置:x
i
(t+1)=x
i
(t)+v
i
(t+1);
步骤b3:重复步骤b2,直到达到指定的迭代次数。
技术总结
本发明公开了基于群优化算法的推广投放系统,涉及计算机推广技术领域,所述系统包括:目标用户数据采集单元,配置用于采集目标用户的使用数据,对使用数据进行数据分析,以及生成对应特征的特征值,将每个特征的特征值映射到一个三维空间中,得到三维空间中的特征点;投放需求分析单元,配置用于获取投放需求,对投放需求进行关键词分析,得到投放需求的关键词;群优化空间搜索单元,配置用于基于投放需求的关键词,找到与关键词相似度最高的特征,然后在三维空间中以该特征对应的特征点为起点,进行目标点搜索,找到三维空间中的目标点对应的最优位置。提升了广告投放的精准度,同时优化了广告投放策略,提升了用户体验。提升了用户体验。提升了用户体验。
技术研发人员:黄念聘
受保护的技术使用者:深圳市创致联创科技有限公司
技术研发日:2023.06.21
技术公布日:2023/9/20
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/
上一篇:一种玉米种子活力度、破损检测、翻面方法与装置 下一篇:一种可调节采血流速的采血装置