文件存储路径推荐方法、装置、终端设备和存储介质与流程
未命名
09-17
阅读:95
评论:0

1.本技术实施例涉及通信技术领域,尤其涉及一种文件存储路径推荐方法、装置、终端设备和存储介质。
背景技术:
2.随着互联网的蓬勃发展,网络上可以存放文件/程序/音乐/视频等各种数据资源,用户可通过浏览器等软件下载自己所需的数据文件。
3.目前,在通过浏览器下载文件时,浏览器一般设有默认的下载位置,但是,所有需要下载的文件,在下载后均存储在默认的一个位置,文件存放杂乱无序,不利于用户查找下载的文件。
技术实现要素:
4.本技术实施例提供一种文件存储路径推荐方法、装置、终端设备和存储介质,用以在用户下载文件时,推荐文件的存储路径,方便用户后续对下载的文件进行管理和查找。
5.为达到上述目的,本技术实施例的技术方案是这样实现的:
6.第一方面,本技术实施例提供了一种文件存储路径推荐方法,所述方法包括:
7.根据待下载文件的文件名中包含的谓语中心词和所述谓语中心词的支配内容,生成所述文件名的语义特征向量;
8.根据所述待下载文件的文件名中包含的主题分词,以及每个主题分词所属的主题,生成所述文件名的主题特征向量;
9.将所述语义特征向量和所述主题特征向量进行拼接,得到融合特征向量;
10.根据所述融合特征向量,确定所述待下载文件的存储路径,并输出所述存储路径。
11.在一种可选的实现方式中,所述根据待下载文件的文件名中包含的谓语中心词和所述谓语中心词的支配内容,生成所述文件名的语义特征向量,包括:
12.确定所述文件名中包含的谓语中心词和所述谓语中心词的支配内容;
13.对所述支配内容进行分词,得到多个内容分词;
14.根据每个内容分词的词向量、每个内容分词与所述谓语中心词之间的距离和所述谓语中心词的词向量,生成所述文件名的语义特征向量。
15.在一种可选的实现方式中,所述确定所述文件名中包含的谓语中心词和所述谓语中心词的支配内容,包括:
16.通过骨架依存树对所述文件名进行句法结构分析,得到所述谓语中心词和所述谓语中心词的支配内容。
17.在一种可选的实现方式中,所述根据所述待下载文件的文件名中包含的主题分词,以及每个主题分词所属的主题,生成所述文件名的主题特征向量,包括:
18.确定所述文件名中包含的主题分词以及每个主题分词所属的主题;
19.根据每个主题的高频词与所述文件名的余弦距离,以及所述主题分词,生成所述
文件名的主题特征向量。
20.在一种可选的实现方式中,所述确定所述文件名中包含的主题分词以及每个主题分词所属的主题,包括:
21.通过lda模型确定所述文件名中包含的主题分词以及每个主题分词所属的主题。
22.在一种可选的实现方式中,所述根据所述融合特征向量,确定所述待下载文件的存储路径,包括:
23.根据所述融合特征向量,确定所述待下载文件所属的目标类别;
24.将所述目标类别的存储路径作为所述待下载文件的存储路径,并输出所述待下载文件的存储路径。
25.在一种可选的实现方式中,所述根据所述融合特征向量,确定所述待下载文件所属的目标类别,包括:
26.通过将所述融合特征向量与预先保存的各个类别的特征向量进行聚类,确定所述待下载文件所属的目标类别。
27.在一种可选的实现方式中,所述输出所述存储路径之后,所述方法还包括:
28.若接收到用户输入的路径确认操作,则按照所述存储路径保存所述待下载文件;
29.若接收到用户输入的路径修改操作,则按照用户修改后的存储路径保存所述待下载文件。
30.第二方面,本技术实施例还提供了一种文件存储路径推荐装置,所述装置包括:
31.文件名处理单元,用于根据待下载文件的文件名中包含的谓语中心词和所述谓语中心词的支配内容,生成所述文件名的语义特征向量;根据所述文件名中包含的主题分词,以及每个主题分词所属的主题,生成所述文件名的主题特征向量;将所述语义特征向量和所述主题特征向量进行拼接,得到融合特征向量;
32.存储路径确定单元,用于根据所述融合特征向量,确定所述待下载文件的存储路径,并输出所述存储路径。
33.在一种可选的实现方式中,所述文件名处理单元,具体用于:
34.确定所述文件名中包含的谓语中心词和所述谓语中心词的支配内容;
35.对所述支配内容进行分词,得到多个内容分词;
36.根据每个内容分词的词向量、每个内容分词与所述谓语中心词之间的距离和所述谓语中心词的词向量,生成所述文件名的语义特征向量。
37.在一种可选的实现方式中,所述文件名处理单元,具体用于:
38.通过骨架依存树对所述文件名进行句法结构分析,得到所述谓语中心词和所述谓语中心词的支配内容。
39.在一种可选的实现方式中,所述文件名处理单元,具体用于:
40.确定所述文件名中包含的主题分词以及每个主题分词所属的主题;
41.根据每个主题的高频词与所述文件名的余弦距离,以及所述主题分词,生成所述文件名的主题特征向量。
42.在一种可选的实现方式中,所述文件名处理单元,具体用于:
43.通过lda模型确定所述文件名中包含的主题分词以及每个主题分词所属的主题。
44.在一种可选的实现方式中,所述文件名处理单元,具体用于:
45.根据所述融合特征向量,确定所述待下载文件所属的目标类别;
46.将所述目标类别的存储路径作为所述待下载文件的存储路径,并输出所述待下载文件的存储路径。
47.在一种可选的实现方式中,所述文件名处理单元,具体用于:
48.通过将所述融合特征向量与预先保存的各个类别的特征向量进行聚类,确定所述待下载文件所属的目标类别。
49.在一种可选的实现方式中,所述存储路径确定单元,还可以用于:
50.若接收到用户输入的路径确认操作,则按照所述存储路径保存所述待下载文件;
51.若接收到用户输入的路径修改操作,则按照用户修改后的存储路径保存所述待下载文件。
52.第三方面,本技术实施例提供一种终端设备,包括存储器和处理器,所述存储器上存储有计算机程序;所述处理器用于读取所述存储器中存储的所述计算机程序并执行,以使得第一方面提供的任一种方法被执行。
53.第四方面,本技术提供一种计算机可读存储介质,计算机可读存储介质中存储有计算机程序或指令,当计算机程序或指令被终端设备执行时,使得该终端设备执行上述第一方面提供的任一种方法。
54.第五方面,本技术提供一种计算机程序产品,该计算机程序产品包括计算机程序或指令,当该计算机程序或指令被终端设备执行时,实现上述第一方面提供的任一种方法。
55.本技术实施例提供的文件存储路径推荐方法,分别确定待下载文件的语义特征向量和主题特征向量,基于语义特征向量和主题特征向量拼接得到的融合特征向量,确定待下载文件的存储路径,进行存储路径推荐,以便将不同类别的文件保存至不同的存储路径下,方便用户后续对下载的文件进行管理和查找。并且,基于语义特征向量和主题特征向量拼接得到的融合特征向量,确定待下载文件的存储路径,可以提高推荐的存储路径的准确性。
附图说明
56.图1为本技术实施例提供的一种文件存储路径推荐方法的应用场景图;
57.图2为本技术实施例提供的一种文件存储路径推荐方法的流程图;
58.图3为本技术实施例提供的一种显示界面的示意图;
59.图4为本技术实施例提供的一种文件存储路径推荐装置的结构示意图;
60.图5为本技术实施例提供的一种终端设备的结构示意图。
具体实施方式
61.为了使本技术实施例的目的、技术方案和优点更加清楚,下面将结合附图,对本技术实施例进行详细描述。本技术的实施方式部分使用的术语仅用于对本技术的具体实施例进行解释,而非旨在限定本技术。显然,所描述的实施例仅仅是本技术一部分实施例,并不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
62.本技术实施例中“多个”是指两个或两个以上,鉴于此,本技术实施例中也可以将“多个”理解为“至少两个”。“至少一个”可理解为一个或多个,例如理解为一个、两个或更多个。例如,包括至少一个,是指包括一个、两个或更多个,而且不限制包括的是哪几个,例如,包括a、b和c中的至少一个,那么包括的可以是a、b、c、a和b、a和c、b和c、或a和b和c。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。另外,字符“/”,如无特殊说明,一般表示前后关联对象是一种“或”的关系。
63.除非有相反的说明,本技术实施例提及“第一”、“第二”等序数词用于对多个对象进行区分,不用于限定多个对象的顺序、时序、优先级或者重要程度。
64.目前,在通过浏览器下载文件时,浏览器一般设有默认的下载位置,但是,所有需要下载的文件,在下载后均存储在默认的一个位置,文件存放杂乱无序,不利于用户查找下载的文件。基于此,本技术实施例提供一种文件存储路径推荐方法。
65.图1示例性地示出本技术实施例提供的文件存储路径推荐方法的应用场景。如图1所示,在该应用场景中,终端设备100可以通过网络连接服务器200。服务器200可以是云存储服务器,服务器200上可以存储音乐文件、视频文件和其他各种不同类型的文件。在实际应用中,终端设备100可以通过网络连接不同的服务器,不同的服务器可以用于存储不同领域的文件。
66.终端设备100可以是手机、车载终端、便携式终端、台式机或个人计算机等设备。终端设备100上安装有浏览器或其他提供下载功能的软件。终端设备100可以通过提供下载功能的软件从服务器200上下载文件,并将下载的文件保存到本地。
67.为避免下载的文件杂乱无序地存储在一个默认位置,本技术实施例提供一种文件存储路径推荐方法,将不同类别的文件保存至终端设备中的不同位置。
68.下文以通过浏览器下载文件为例,对本技术实施例提供的文件存储路径推荐方法进行详细说明。图2示例性地示出了本技术实施例提供的一种文件存储路径推荐方法的流程图,该文件存储路径推荐方法可以由图1中的终端设备100执行,如图2所示,该方法可以包括如下步骤:
69.s201,根据待下载文件的文件名中包含的谓语中心词和谓语中心词的支配内容,生成文件名的语义特征向量。
70.终端设备接收到用户通过浏览器下载文件的操作指令时,获取待下载文件的文件名,确定文件名中包含的谓语中心词和谓语中心词的支配内容。示例性地,文件名可以看作一个句子,谓语中心词可以是指句子中的动词,在一个句子中,谓语动词是一个句子的核心,可以支配句子中的其它词语,而该动词本身不受其它词语的支配。因此,谓语中心词的支配内容可以是指动词前的主语、动词后的宾语等。例如,假设文件名为“提取石油中的化工原料的方法”,在该文件名中,谓语中心词为“提取”,谓语中心词的支配内容包括如下分词:“石油”、“化工原料”和“方法”。
71.在一些实施例中,可以通过骨架依存树对文件名进行句法结构分析,得到谓语中心词和谓语中心词的支配内容两层结构。骨架依存树可以按照设定的语法规则,分析出句子所包含的词语与词语之间的关系,自动将一个线性序列的句子推导成词语级的树形结构。一个句子中所有的修饰词语都以某种依存关系直接或间接地从属于该句子的谓语中心词,即除谓语中心词之外,句子中的其它词语都直接依存于另一词,并且,句中任何一个词
都不能同时依存于两个或两个以上的其他词。也可以说,除谓语中心词之外,句子中的每个词语都有自己的父节点,句子中的词语与词语之间,可以形成一个树形结构,该树形结构可以体现该句子的句式结构。
72.在确定谓语中心词的支配内容之后,可以对支配内容进行分词,得到多个内容分词,根据每个内容分词的词向量、每个内容分词与谓语中心词之间的距离和谓语中心词的词向量,生成文件名的语义特征向量。其中,任意一个内容分词与谓语中心词之间的距离可以理解为位于该内容分词与谓语中心词之间的内容分词的数量,即该内容分词的位置。词向:也可以称为词向量特征,用于描述自然语言文本所包括的词语的语义特征,通常是指对自然语言表示的词语进行向量转换得到的机器能够理解的稠密向量(dense vector)或矩阵形式,词向量是自然语言文本中的词语在机器中数值化的体现。任意一个词语的词向量可以通过word2vec模型得到。
73.示例性地,可以根据每个内容分词的位置为该内容分词的词向量赋予权重,生成包含谓语中心词的词向量、每个内容分词的词向量以及权重的语义特征向量。语义特征向量g可以表示为:g={w,aσi},其中,w为文件名中的谓语中心词的词向量,即谓语中心词的向量化表示;a为权重向量,a={ωi|i∈{1,2,
…
,n}};ωi第i个内容分词与谓语中心词之间的距离大小,i∈n,;σi为第i个内容分词的词向量,即第i个内容分词的向量化表示。内容分词与谓语中心词之间的距离越大,即内容分词距离谓语中心词越远,权重越小,权重最大值可以为1。例如,“提取石油中的化工原料的方法”,谓语中心词为“提取”,谓语中心词的支配内容为“石油”“化工原料”“方法”。它们的权重分别为6/11,3/11,2/11。
74.通过将内容分词与谓语中心词之间的距离作为内容分词的权重,来体现不同内容分词的重要程度,可以更细致更准确地表达文件名的语义特征。
75.s202,根据待下载文件的文件名中包含的主题分词,以及每个主题分词所属的主题,生成文件名的主题特征向量。
76.终端设备可以通过隐含狄利克雷分布(latent dirichlet allocation,lda)模型确定文件名中包含的主题分词以及每个主题分词所属的主题。lda模型是一种主题模型,用于在一句或一段文字中识别主题分词。例如,假设文件名d包括ni个主题分词,w
ij
表示第j个主题分词,每个主题分词对应一个潜在的主题,z
ij
为第j个主题分词所属的主题。将文件名d输入lda模型,lda模型输出主题分布矩阵,主题分布矩阵可以表示为wi={w
ij
|j∈{1,2,
…
,ni}},zi={z
ij
|j∈{1,2,
…
,ni}}。主题分布矩阵的向量维度与上述语义特征向量g的维度相同。
77.终端设备中保存有预先设置的多个主题的数据集,或者,终端设备可以通过网络下载多个主题的数据集,每个主题的数据集中包括该主题的高频词。例如,在主题为“猫”的数据集中,高频词可以包括“猫”和“鱼”等词语。终端设备在确定文件名中包含的每个主题分词所属的主题之后,可以获取每个主题的高频词,确定每个主题的高频词与文件名的余弦距离。例如,以第j个主题分词w
ij
对应的主题w
ij
为例,将主题w
ij
的高频词表征为n维的特征向量,将文件名d包含的分词也表征为n维的特征向量。则主题z
ij
的高频词与文件名d的余
弦距离可以表示为:其中,z
ijk
表示主题w
ij
的特征向量的第k个维度,dk表示文件名d的特征向量的第k个维度。终端设备根据每个主题分词,以及每个主题的高频词与文件名的余弦距离,以及主题分词,生成该文件名的主题特征向量p。主题特征向量p可以表示为
78.将主题分词所属的主题的高频词与文件名的余弦距离,作为该主题分词的权重,不同主题分词的权重不同,可以使得到的主题特征向量更准确地体现文件名的主题特征。
79.在一些实施例中,步骤s201和步骤s202的执行顺序可以调换,或者,步骤s201和步骤s202可以同时执行。
80.s203,将语义特征向量和主题特征向量进行拼接,得到融合特征向量。
81.终端设备可以采用向量拼接方式,将语义特征向量和主题特征向量叠加一起,形成包含词义特征和整体语义特征的融合输入向量g
′
={p;g},g
′
表示融合语义特征向量与主题特征向量的文本向量化表示,“;”为向量拼接符号。
82.s204,根据融合特征向量,确定待下载文件的存储路径,并输出存储路径。
83.终端设备中预先保存有多个不同类别的文件的特征向量,不同类别的文件保存在终端设备中不同的位置,即不同类别的文件对应不同的存储路径。利用k-means聚类算法将融合特征向量与预先保存的各个类别的特征向量进行聚类,确定待下载文件所属的目标类别。聚类过程可以表示为其中aj指代第j个类别,对融合特征向量和预先保存的各个类别的特征向量进行迭代计算,直至aj收敛,即aj达到最小误差为止,将此时与融合特征向量属于同一类的特征向量的类别作为待下载文件所属的目标类别。目标类别为与待下载文件的文件名的相似度最接近的主题类别。在其他实施例中,终端设备也可以通过其他方式,例如,可以通过将融合特征向量与预先保存的各个类别的特征向量逐一进行比对的方式,确定与待下载文件的文件名的相似度最接近的目标类别。
84.终端设备中预先保存有多个类别的存储路径,终端设备获取目标类别的存储路径,将目标类别的存储路径作为待下载文件的存储路径,并输出待下载文件的存储路径。
85.示例性地,终端设备可以显示待下载文件的存储路径。如图3所示,显示界面中还包括“一键下载”和“另存为”两个按键。如果用户认可终端设备推荐的存储路径,可以点击“一键下载”按键,终端设备接收到用户通过点击“一键下载”按键输入的路径确认操作,按照已确定的存储路径保存待下载文件。如果用户不认可终端设备推荐的存储路径,可以点击“另存为”按键,终端设备接收到用户通过点击“另存为”按键输入的路径修改操作,获取用户修改后的存储路径,按照用户修改后的存储路径保存待下载文件。
86.本技术实施例提供一种充分考虑词义以及整体语义特征的提取技术进行下载文件位置路径智能推荐的方法,该方法在进行文件下载时,获取文件名,通过骨架依存树分析文件名的整体句法结构,通过赋予内容分词位置权重,标注文件名的谓语中心词与其支配的内容分词与之间的依存关系以及内容分词与谓语中心词的相对位置,确定表征文件名句式结构的语义特征向量。基于语义特征向量和主题特征向量拼接得到的融合特征向量,确定待下载文件的存储路径,可实现智能推荐下载位置路径,方便用户进行“一键下载”,对下
载的文件进行精准内容存储,方便用户操作和后续对下载的文件进行管理和查找。并且,通过骨架依存树语义和lda主题融合提取技术,获得相似度最接近的主题类别的存储路径,可以提高推荐的存储路径的准确性,减少用户手工添加文件存储路径的繁琐操作,提高文件下载过程的智能性和灵活性。
87.与上述实施例基于相同的发明构思,本技术实施例还提供一种文件存储路径推荐装置,该文件存储路径推荐装置可以应用于图1所示的终端设备100中,该文件存储路径推荐装置可以用于实现上述方法实施例的功能,因此可以实现上述方法实施例所具备的有益效果。
88.如图4所示,该文件存储路径推荐装置可以包括文件名处理单元401和存储路径确定单元402。该文件存储路径推荐装置用于实现上述图2中所示的方法实施例中的功能。当该文件存储路径推荐装置用于实现图2所示的方法实施例的功能时:文件名处理单元401可以用于执行s201~s203,存储路径确定单元402可以用于执行s204。比如:文件名处理单元401,用于根据待下载文件的文件名中包含的谓语中心词和谓语中心词的支配内容,生成文件名的语义特征向量;根据文件名中包含的主题分词,以及每个主题分词所属的主题,生成文件名的主题特征向量;将语义特征向量和主题特征向量进行拼接,得到融合特征向量。存储路径确定单元402,用于根据融合特征向量,确定待下载文件的存储路径,并输出存储路径。
89.在一种可选的实现方式中,文件名处理单元401,具体可以用于:
90.确定文件名中包含的谓语中心词和谓语中心词的支配内容;
91.对支配内容进行分词,得到多个内容分词;
92.根据每个内容分词的词向量、每个内容分词与谓语中心词之间的距离和谓语中心词的词向量,生成文件名的语义特征向量。
93.在一种可选的实现方式中,文件名处理单元401,具体可以用于:
94.通过骨架依存树对文件名进行句法结构分析,得到谓语中心词和谓语中心词的支配内容。
95.在一种可选的实现方式中,文件名处理单元401,具体可以用于:
96.确定文件名中包含的主题分词以及每个主题分词所属的主题;
97.根据每个主题的高频词与文件名的余弦距离,以及主题分词,生成文件名的主题特征向量。
98.在一种可选的实现方式中,文件名处理单元401,具体可以用于:
99.通过lda模型确定文件名中包含的主题分词以及每个主题分词所属的主题。
100.在一种可选的实现方式中,文件名处理单元401,具体可以用于:
101.根据融合特征向量,确定待下载文件所属的目标类别;
102.将目标类别的存储路径作为待下载文件的存储路径,并输出待下载文件的存储路径。
103.在一种可选的实现方式中,文件名处理单元401,具体可以用于:
104.通过将融合特征向量与预先保存的各个类别的特征向量进行聚类,确定待下载文件所属的目标类别。
105.在一种可选的实现方式中,存储路径确定单元402,还可以用于:
106.若接收到用户输入的路径确认操作,则按照存储路径保存待下载文件;
107.若接收到用户输入的路径修改操作,则按照用户修改后的存储路径保存待下载文件。
108.与上述实施例基于相同的发明构思,本技术实施例还提供一种终端设备,该终端设备可以是图1中所示的终端设备100。终端设备100可以用于实现上述方法实施例的功能,因此可以实现上述方法实施例所具备的有益效果。
109.图5为本技术实施例提供的一种电子设备的结构示意图;如图5所示,本技术实施例中该电子设备100包括:处理器101、显示器102、存储器103、输入设备106、总线105和通讯模块104;该处理器101、存储器103、输入设备106、显示器102和通讯模块104均通过总线105连接,该总线105用于该处理器101、存储器103、显示器102、通讯模块104和输入设备106之间传输数据。
110.其中,存储器103可用于存储软件程序以及模块,如本技术实施例中的文本处理方法对应的程序指令/模块,处理器101通过运行存储在存储器103中的软件程序以及模块,从而执行电子设备100的各种功能应用以及数据处理,如本技术实施例提供的文件存储路径推荐方法。存储器103可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个应用的应用程序等;存储数据区可存储根据电子设备100的使用所创建的数据(不同类别的文件对应的存储路径)等。此外,存储器103可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
111.处理器101是电子设备100的控制中心,利用总线105以及各种接口和线路连接整个电子设备100的各个部分,通过运行或执行存储在存储器103内的软件程序和/或模块,以及调用存储在存储器103内的数据,执行电子设备100的各种功能和处理数据。可选的,处理器101可包括一个或多个处理单元,如cpu、gpu、数字处理单元等。
112.在本技术实施例在,处理器101,用于从存储器102中读取程序指令,并执行如下步骤:根据待下载文件的文件名中包含的谓语中心词和所述谓语中心词的支配内容,生成文件名的语义特征向量;根据文件名中包含的主题分词,以及每个主题分词所属的主题,生成文件名的主题特征向量;将语义特征向量和主题特征向量进行拼接,得到融合特征向量;根据融合特征向量,确定待下载文件的存储路径,并输出存储路径。
113.处理器101可以将推荐的存储路径通过显示器102展示给用户。
114.处理器101还可以通过通讯模块104连接网络,通过网络从服务器下载文件等。
115.输入设备106主要用于获得用户输入的操作指令,当该电子设备不同时,该输入设备106也可能不同。例如,当该电子设备为计算机时,该输入设备106可以为鼠标、键盘等输入设备;当该电子设备为智能手机、平板电脑等便携设备时,该输入设备106可以为触控屏。
116.在一些可能的实施方式中,本技术提供的文件存储路径推荐方法的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在计算机设备上运行时,所述程序代码用于使所述计算机设备执行本说明书上述描述的根据本技术各种示例性实施方式的文件存储路径推荐方法的步骤,例如,所述计算机设备可以执行如图2所示的步骤s201~s204的文件存储路径推荐方法的流程。
117.本技术实施例还提供了一种计算机存储介质,该计算机存储介质中存储有计算机
可执行指令,该计算机可执行指令用于实现本技术任一实施例所记载的文件存储路径推荐方法。
118.其中,存储介质可以是计算机能够存取的任何可用介质。以此为例但不限于:计算机可读介质可以包括ram、rom、eeprom、cd-rom或其他光盘存储、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质。
119.本领域内的技术人员应明白,本技术的实施例可提供为方法、系统、或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
120.本技术是参照根据本技术的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
121.这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
122.这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
123.显然,本领域的技术人员可以对本技术进行各种改动和变型而不脱离本技术的保护范围。这样,倘若本技术的这些修改和变型属于本技术权利要求及其等同技术的范围之内,则本技术也意图包含这些改动和变型在内。
技术特征:
1.一种文件存储路径推荐方法,其特征在于,包括:根据待下载文件的文件名中包含的谓语中心词和所述谓语中心词的支配内容,生成所述文件名的语义特征向量;根据所述待下载文件的文件名中包含的主题分词,以及每个主题分词所属的主题,生成所述文件名的主题特征向量;将所述语义特征向量和所述主题特征向量进行拼接,得到融合特征向量;根据所述融合特征向量,确定所述待下载文件的存储路径,并输出所述存储路径。2.根据权利要求1所述的方法,其特征在于,所述根据待下载文件的文件名中包含的谓语中心词和所述谓语中心词的支配内容,生成所述文件名的语义特征向量,包括:确定所述文件名中包含的谓语中心词和所述谓语中心词的支配内容;对所述支配内容进行分词,得到多个内容分词;根据每个内容分词的词向量、每个内容分词与所述谓语中心词之间的距离和所述谓语中心词的词向量,生成所述文件名的语义特征向量。3.根据权利要求2所述的方法,其特征在于,所述确定所述文件名中包含的谓语中心词和所述谓语中心词的支配内容,包括:通过骨架依存树对所述文件名进行句法结构分析,得到所述谓语中心词和所述谓语中心词的支配内容。4.根据权利要求1所述的方法,其特征在于,所述根据所述待下载文件的文件名中包含的主题分词,以及每个主题分词所属的主题,生成所述文件名的主题特征向量,包括:确定所述文件名中包含的主题分词以及每个主题分词所属的主题;根据每个主题的高频词与所述文件名的余弦距离,以及所述主题分词,生成所述文件名的主题特征向量。5.根据权利要求4所述的方法,其特征在于,所述确定所述文件名中包含的主题分词以及每个主题分词所属的主题,包括:通过lda模型确定所述文件名中包含的主题分词以及每个主题分词所属的主题。6.根据权利要求1所述的方法,其特征在于,所述根据所述融合特征向量,确定所述待下载文件的存储路径,包括:根据所述融合特征向量,确定所述待下载文件所属的目标类别;将所述目标类别的存储路径作为所述待下载文件的存储路径,并输出所述待下载文件的存储路径。7.根据权利要求1所述的方法,其特征在于,所述根据所述融合特征向量,确定所述待下载文件所属的目标类别,包括:通过将所述融合特征向量与预先保存的各个类别的特征向量进行聚类,确定所述待下载文件所属的目标类别。8.根据权利要求1所述的方法,其特征在于,所述输出所述存储路径之后,所述方法还包括:若接收到用户输入的路径确认操作,则按照所述存储路径保存所述待下载文件;若接收到用户输入的路径修改操作,则按照用户修改后的存储路径保存所述待下载文件。
9.一种文件存储路径推荐装置,其特征在于,包括:文件名处理单元,用于根据待下载文件的文件名中包含的谓语中心词和所述谓语中心词的支配内容,生成所述文件名的语义特征向量;根据所述文件名中包含的主题分词,以及每个主题分词所属的主题,生成所述文件名的主题特征向量;将所述语义特征向量和所述主题特征向量进行拼接,得到融合特征向量;存储路径确定单元,用于根据所述融合特征向量,确定所述待下载文件的存储路径,并输出所述存储路径。10.一种终端设备,其特征在于,包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的计算机程序,当所述计算机程序被所述处理器执行时,实现权利要求1~8中任一项所述的方法。11.一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,其特征在于:所述计算机程序被处理器执行时,实现权利要求1~8中任一项所述的方法。12.一种计算机程序产品,其特征在于,包含有计算机可执行指令,所述计算机可执行指令用于使计算机执行如权利要求1~8任一项所述的方法。
技术总结
本申请提供一种文件存储路径推荐方法、装置、终端设备和存储介质,属于通信技术领域。其中,终端设备分别确定待下载文件的语义特征向量和主题特征向量,基于语义特征向量和主题特征向量拼接得到的融合特征向量,确定待下载文件的存储路径,进行存储路径推荐,以便将不同类别的文件保存至不同的存储路径下,方便用户后续对下载的文件进行管理和查找。并且,基于语义特征向量和主题特征向量拼接得到的融合特征向量,确定待下载文件的存储路径,可以提高推荐的存储路径的准确性。高推荐的存储路径的准确性。高推荐的存储路径的准确性。
技术研发人员:邓丽华 左芳芳 田盼 裴迎栋 李国钦
受保护的技术使用者:中国电信股份有限公司
技术研发日:2023.05.23
技术公布日:2023/9/14
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/