检索装置、检索系统、检索方法以及存储介质与流程
未命名
07-12
阅读:75
评论:0

1.本发明的实施方式涉及检索装置、检索系统、检索方法以及存储介质。
背景技术:
2.存在根据某个字符串来检索与该字符串对应的其他字符串的情况。期待有能够减轻这种检索作业的负担的技术。
3.专利文献1:日本特开2020-095657号公报
技术实现要素:
4.本发明要解决的课题在于提供能够更容易地检索与字符串对应的其他字符串的检索装置、检索系统、检索方法以及存储介质。
5.实施方式的检索装置使用第一字符串来生成表示上述第一字符串的字符串图像。上述检索装置进一步向与图像的输入相应地输出字符串数据的分类的分类器输入上述字符串图像。上述检索装置进一步基于上述分类器的分类结果来输出与上述第一字符串不同的其他字符串。
附图说明
6.图1是表示实施方式的检索系统的构成的示意图。
7.图2是登记有字符串的数据库的一个例子。
8.图3是表示实施方式的检索装置进行的处理的流程图。
9.图4的(a)~图4的(c)是用于说明处理的具体例的图。
10.图5是表示分类器的学习方法的流程图。
11.图6是表示实施方式的变形例的检索装置的处理的流程图。
12.图7的(a)~图7的(e)是用于说明处理的具体例的图。
13.图8的(a)以及图8的(b)是用于说明处理的具体例的图。
14.图9是表示实施方式的变形例的检索装置的输出例的图。
15.图10是表示硬件构成的示意图。
具体实施方式
16.以下,参照附图对本发明的各实施方式进行说明。在本技术说明书以及各图中,对于已经说明过的要素相同的要素标注相同的附图标记而适当地省略详细的说明。
17.图1是表示实施方式的检索系统的构成的示意图。
18.实施方式的检索系统用于根据某个字符串来检索与该字符串对应的其他字符串。实施方式的检索系统1具备检索装置10、输入装置20、显示装置30、以及存储装置40。
19.检索装置10对与所输入的字符串对应的其他字符串进行检索。输入装置20用于供用户向检索装置10输入字符串。显示装置30显示检索结果。存储装置40存储检索所需要的
数据。例如,存储装置40存储检索所使用的分类器c、包括字符串的数据库等。
20.图2是登记有字符串的数据库的一个例子。
21.图2所示的数据库100包括字符串101a~101g、与字符串101a~101g分别对应的对应字符串102a~102g。检索装置10为,当被输入字符串时,输出与该字符串对应的对应字符串。作为一个例子,检索装置10为,当受理了“bm-ygb2.2nn120d”的字符串的输入时,输出与其对应的“bm-ygb2.2”的对应字符串。
22.图3是表示实施方式的检索装置进行的处理的流程图。图4的(a)~图4的(c)是用于说明处理的具体例的图。
23.在图3所示的检索方法m1中,检索装置10取得通过输入装置20输入的第一字符串的数据(步骤s1)。所取得的数据例如是文本数据。第一字符串也可以从数据库等取得。第一字符串也可以从其他处理装置输入。检索装置10也可以从包含字体、行间距等属性的数据中提取仅由字符代码构成的文本数据。
24.检索装置10使用所输入的第一字符串生成表示第一字符串的字符串图像(步骤s3)。图4的(a)是所输入的第一字符串的一个例子。图4的(b)表示根据图4的(a)的字符串生成的字符串图像img。
25.检索装置10将所生成的字符串图像向分类器c输入(步骤s5)。分类器c预先进行学习,以便与图像的输入相应地输出其分类。分类器c为,当被输入字符串图像时,输出第一字符串的分类结果。
26.检索装置10从分类器c取得第一字符串的分类结果(步骤s7)。检索装置10基于分类结果输出与第一字符串不同的其他字符串(步骤s9)。在此,分类是对应字符串。即,分类器c与图像的输入相应地,输出与该图像所示的字符串对应的对应字符串。如果分类器c的分类结果适当,则输出数据库中与第一字符串对应的对应字符串。显示装置30显示所输出的对应字符串。
27.例如,从分类器c输出的分类结果包括多个分类(对应字符串)以及各分类的可信度。检索装置10输出可信度最高的对应字符串。检索装置10也可以按照可信度从高到低的顺序输出多个对应字符串。图4的(c)表示图4的(b)的字符串图像img的分类结果(对应字符串)。
28.关于分类器c的具体构成,只要能够对图像进行分类,则是任意的。例如,分类器c包括神经网络、支持向量机、k-近邻法、决策树、随机森林。分类器c优选包括神经网络。从分类精度的观点出发,分类器c更优选包括卷积神经网络(cnn)。
29.图5是表示分类器的学习方法的流程图。
30.通过检索装置10执行学习。也可以通过其他处理装置执行学习。在图5所示的学习方法t1中,检索装置10取得学习数据(步骤s11)。学习数据是从数据库取得的。学习数据包括多个数据集。各数据集包括字符串、以及与该字符串相对的对应字符串。学习数据也可以由用户使用输入装置20来输入。图5所示的学习方法能够应用于上述各种分类器c。
31.检索装置10根据所取得的学习数据来生成学习用的字符串图像(步骤s12)。检索装置10对于字符串图像执行前处理(步骤s13)。在前处理中,执行从向字符串图像追加噪声、字符串的尺寸变更、字符串图像的旋转以及字符串图像的反转中选择出的一种以上。旋转角度、反转方向等能够由用户适当设定。
32.检索装置10对于分类器c,将施加了前处理的字符串图像设定于输入数据,并将其分类(对应字符串)设定于教示数据。检索装置10根据输入数据使分类器c进行学习以使得输出被设定为教示数据的分类(步骤s14)。
33.检索装置10判断是否满足结束条件(步骤s15)。例如,作为结束条件,设定有针对一个字符串的学习次数。检索装置10判断针对一个字符串是否执行了所设定的次数的学习。或者,作为结束条件,也可以设定分类器c的分类精度。检索装置10判断从分类器c输出的分类结果相对于被设定为教示数据的分类而言的误差是否低于预先设定的阈值。作为误差,能够使用最小平方误差。
34.在不满足结束条件的情况下,检索装置10再次执行前处理。例如,前处理的条件被设定为与在此以前的前处理不同的条件。对于一个字符串重复进行学习,直到满足结束件为止。在满足结束条件的情况下,检索装置10判断是否对在步骤s11中取得的所有数据集进行了学习(步骤s16)。在未对所有数据集进行学习的情况下,对于未学习的数据集再次执行步骤s12。
35.在对所有数据集结束了学习的情况下,检索装置10将进行了学习的分类器c保存于存储装置40。检索装置10使学习结束。
36.对实施方式的优点进行说明。
37.有时某个物品被赋予有用于识别该物品的字符串。通过赋予字符串,使该物品的识别变得容易。另一方面,也有时对于相同的物品赋予按照组而不同的字符串。在组间将与该物品相关的信息进行关联的情况下,需要将在某个组中使用的字符串转换为在其他组中使用的字符串。以往,转换是参照数据库来进行的。例如,负责者在数据库中对在某个组中使用的字符串进行检索,取得在其他组中使用的对应字符串。
38.在上述作业中,所检索的字符串有可能产生偏差。偏差是大写字母与小写字母的不同、全角与半角的不同、输入错误等。输入错误例如是“:”(冒号)与“;”(分号)的错误、“o”(英文字母)与“0”(零)的错误等。在所检索到的字符串与数据库中登记的字符串不一致的情况下,无法得到正确的检索结果。因此,对应字符串的检索花费无用的时间。因此,期待有能够更容易地检索对应字符串的技术。
39.对于该课题,实施方式的检索装置10使用第一字符串生成表示该第一字符串的字符串图像。然后,检索装置10将该字符串图像向分类器输入,基于分类器的分类结果输出与第一字符串不同的其他字符串。即,检索装置10使用图像来检索对应字符串。即使在所输入的字符串存在上述偏差的情况下,该字符串的图像也与无偏差的情况下的字符串的图像类似。通过使用图像,能够与所输入的字符串中的偏差无关,容易地得到正确的检索结果。根据实施方式,能够更容易地检索出与某个字符串对应的其他字符串。
40.例如,实施方式的检索系统1在制造业中使用。在制造业中,存在制造物品的制造部门、调度部件的调度部门、对部件进行订货的订货部门。制造部门将制造所需要的部件传递给调度部门。调度部门将所需要的部件集中传递给订货部门。订货部门向部件制造者对部件进行订货。在该情况下,对于相同部件,在制造部门使用的字符串与在订货部门使用的字符串有可能不同。调度部门需要将制造部门使用的字符串转换为在订货部门使用的字符串。以往,该转换花费较多时间。根据实施方式,能够更容易根据在制造部门使用的字符串检索出在订货部门使用的字符串。
41.(变形例)
42.图6是表示实施方式的变形例的检索装置的处理的流程图。图7的(a)~图7的(e)、图8的(a)以及图8的(b)是用于说明处理的具体例的图。
43.图6所示的变形例的检索方法m2与检索方法m1相比,进一步包括步骤s2。在步骤s2中,检索装置10取得通过输入装置20输入的第二字符串的数据。所取得的数据例如是文本数据。第二字符串也可以从数据库取得。第二字符串也可以从其他处理装置输入。检索装置10也可以根据包括字体、行间距等属性的数据中提取仅由字符代码构成的文本数据。
44.第二字符串与第一字符串不同,对于某个物品表示与第一字符串不同的信息。例如,第一字符串是用于识别物品的字符串,第二字符串表示该物品的属性。作为一个例子,特定的布线部件被赋予有图7的(a)所示的第一字符串。作为第二字符串,如图7的(c)所示那样,使用供给该布线部件的公司名。
45.在步骤s3中,检索装置10生成表示第一字符串以及第二字符串的字符串图像。例如,检索装置10生成表示第一字符串的第一图像、以及表示第二字符串的第二图像。图7的(b)以及图7的(d)分别表示第一图像img1以及第二图像img2。如图7的(e)所示那样,检索装置10将第一图像img1以及第二图像img2合成而生成字符串图像img3。
46.在图7的(b)以及图7的(d)的例子中,第一字符串与第二字符串以相互不同的颜色表示。例如,在通过256灰度来表示颜色的情况下,第一字符串由红r(即,[r,g,b]=[255、0、0])表示。第二字符串以绿g(即,[r,g,b]=[0、255、0])表示。另外,背景以黑bk(即,[r,g,b]=[0、0、0])表示。该第一字符串以及第二字符串被重合而生成图7的(e)所示的字符串图像img3。
[0047]
作为另外一个例子,也可以如图8的(a)所示那样,检索装置10将以相同颜色表示了第一字符串以及第二字符串的第一图像与第二图像纵向排列而生成字符串图像img4。或者,也可以如图8的(b)所示那样,检索装置10将第一图像与第二图像横向排列而生成字符串图像img5。
[0048]
如上述那样,字符串图像也可以通过分别表示第一字符串以及第二字符串的多个图像的合成来生成。或者,字符串图像也可以使用第一字符串以及第二字符串而直接生成。
[0049]
以后,使用所生成的字符串,与检索方法m1同样地执行步骤s5、s7、以及s9。由此,能够得到与第一字符串以及第二字符串对应的其他字符串。
[0050]
在第一字符串的基础上使用第二字符串的情况下,与仅使用第一字符串的情况相比,转换所利用的信息增加。由于信息增加,因此能够提高转换的精度。
[0051]
在此,说明了使用两种字符串的例子。不限于该例子,也可以使用3种以上的字符串。在该情况下,检索装置10生成分别表示3种以上的字符串的3种以上的图像。各图像中的字符串以相互不同的颜色表示。检索装置10使用该3种以上的图像来生成字符串图像。检索装置10根据字符串图像的分类结果输出对应字符串。
[0052]
图9是表示实施方式的变形例的检索装置的输出例的图。
[0053]
检索装置10例如使显示装置30显示图9所示的用户界面(ui)200。ui200包括用于输入第一字符串的第一输入栏201、以及用于输入第二字符串的第二输入栏202。用户在向第一输入栏201输入了第一字符串之后,点击图标211而登记要检索的第一字符串。接着,用户在向第二输入栏202输入了第二字符串之后,点击图标212而执行检索。
[0054]
检索装置10受理由用户输入的第一字符串以及第二字符串,执行字符串图像的生成、字符串图像向分类器的输入以及分类结果的取得。检索装置10使ui200显示分类结果220。分类结果220包括排序221a~221j、分类222a~222j以及可信度223a~223j。可信度223a~223j分别表示分类222a~222j的可信度(概率)。可信度越高,则表示所输入的字符串与该分类(对应字符串)对应的可能性越高。排序221a~221j分别表示分类222a~222j的可信度的排序。用户根据分类结果220选择与所输入的第一字符串对应的对应字符串。
[0055]
根据图9所示的输出例,由于显示有多个对应字符串,因此用户能够容易地找到正确的字符串。能够提高用户的方便性。
[0056]
图10是表示硬件构成的示意图。
[0057]
检索装置10例如包括图10所示的硬件构成。图10所示的处理装置90包括cpu91、rom92、ram93、存储装置94、输入接口95、输出接口96、以及通信接口97。
[0058]
rom92存放对计算机的动作进行控制的程序。rom92存放用于使计算机实现上述各处理所需的程序。ram93作为供rom92所存放的程序展开的存储区域起作用。
[0059]
cpu91包括处理电路。cpu91将ram93作为工作存储器,执行rom92或者存储装置94的至少任一方所存储的程序。在程序的执行中,cpu91经由系统总线98对各构成进行控制,并执行各种处理。
[0060]
存储装置94存储程序的执行所需的数据、通过程序的执行而得到的数据。
[0061]
输入接口(i/f)95将处理装置90与输入装置95a连接。输入i/f95例如是usb等串行总线接口。cpu91经由输入i/f95从输入装置95a读入各种数据。
[0062]
输出接口(i/f)96将处理装置90与显示装置96a连接。输出i/f96例如是digital visual interface(dvi)、high-definition multimedia interface(hdmi(注册商标))等影像输出接口。cpu91经由输出i/f96,能够向显示装置96a发送数据而使显示装置96a显示图像。
[0063]
通信接口(i/f)97将处理装置90外部的服务器97a与处理装置90连接。通信i/f97例如是lan卡等网卡。cpu91经由通信i/f97,能够从服务器97a读入各种数据。
[0064]
存储装置94包括从hard disk drive(hdd)以及solid state drive(ssd)中选择出的一种以上。输入装置95a包括从鼠标、键盘、麦克风(语音输入)以及触摸板中选择出的一种以上。显示装置96a包括从监视器以及投影仪中选择出的一种以上。也可以使用触摸板那样具备输入装置95a与显示装置96a两方的功能的设备。输入装置95a、显示装置96a、存储装置94能够分别作为输入装置20、显示装置30、以及存储装置40来使用。
[0065]
上述各种数据的处理,也可以作为计算机可执行的程序而被记录于磁盘(软盘以及硬盘等)、光盘(cd-rom、cd-r、cd-rw、dvd-rom、dvd
±
r、dvd
±
rw等)、半导体存储器、或者其他非暂时的计算机可读取的记录介质(non-transitory computer-readable storage medium)。
[0066]
例如,记录介质所记录的信息能够由计算机(或者组装系统)读出。在记录介质中,记录形式(存储形式)是任意的。例如,计算机从记录介质读出程序,基于该程序使cpu执行程序所记载的指示。在计算机中,也可以经由网络进行程序的取得(或者读出)。
[0067]
本发明的实施方式能够包含以下的特征。
[0068]
(特征1)
[0069]
一种检索装置,其中,
[0070]
使用第一字符串来生成表示上述第一字符串的字符串图像,
[0071]
向与图像的输入相应地输出字符串的分类的分类器,输入上述字符串图像,
[0072]
基于上述分类器的分类结果,输出与上述第一字符串不同的其他字符串。
[0073]
(特征2)
[0074]
如特征1所述的检索装置,其中,
[0075]
在上述字符串图像的生成中,进一步使用第二字符串来生成表示上述第一字符串以及上述第二字符串的上述字符串图像。
[0076]
(特征3)
[0077]
如特征2所述的检索装置,其中,
[0078]
上述第一字符串是用于识别物品的字符串,
[0079]
上述第二字符串表示上述物品的属性。
[0080]
(特征4)
[0081]
如特征2或3所述的检索装置,其中,
[0082]
通过使上述第二字符串以与上述第一字符串的颜色不同的颜色与上述第一字符串重合,来生成上述字符串图像。
[0083]
(特征5)
[0084]
如特征2或3所述的检索装置,其中,
[0085]
通过将上述第二字符串与上述第一字符串并排,来生成上述字符串图像。
[0086]
(特征6)
[0087]
如特征1~5中任一项所述的检索装置,其中,
[0088]
上述分类结果包括包含上述其他字符串的多个字符串、以及分别针对上述多个字符串的多个可信度,
[0089]
输出上述分类结果。
[0090]
(特征7)
[0091]
如特征1~6中任一项所述的检索装置,其中,
[0092]
上述分类器包括卷积神经网络。
[0093]
(特征8)
[0094]
一种检索系统,具备:
[0095]
特征1~7中任一项所述的检索装置;
[0096]
输入装置,接受上述第一字符串的输入;以及
[0097]
显示装置,显示上述其他字符串。
[0098]
根据以上说明的实施方式,能够提供能够容易地检索与某个字符串对应的其他字符串的检索装置、检索系统、检索方法以及存储介质。
[0099]
以上,对本发明的几个实施方式进行了说明,但这些实施方式是作为例子提示的,不意图限定发明的范围。这些新的实施方式能够以其他各种方式来实施,在不脱离发明的主旨的范围内能够进行各种省略、置换、变更。这些实施方式及其变形包含于发明的范围、主旨,并且包含于权利要求书所记载的发明及其等同的范围。另外,上述各实施方式能够相互组合来实施。
技术特征:
1.一种检索装置,其中,使用第一字符串来生成表示上述第一字符串的字符串图像,向与图像的输入相应地输出字符串的分类的分类器,输入上述字符串图像,基于上述分类器的分类结果,输出与上述第一字符串不同的其他字符串。2.如权利要求1所述的检索装置,其中,在上述字符串图像的生成中,进一步使用第二字符串来生成表示上述第一字符串以及上述第二字符串的上述字符串图像。3.如权利要求2所述的检索装置,其中,上述第一字符串是用于识别物品的字符串,上述第二字符串表示上述物品的属性。4.如权利要求2或3所述的检索装置,其中,通过使上述第二字符串以与上述第一字符串的颜色不同的颜色与上述第一字符串重合,来生成上述字符串图像。5.如权利要求2或3所述的检索装置,其中,通过将上述第二字符串与上述第一字符串并排,来生成上述字符串图像。6.如权利要求1~3中任一项所述的检索装置,其中,上述分类结果包括包含上述其他字符串的多个字符串、以及分别针对上述多个字符串的多个可信度,输出上述分类结果。7.如权利要求1~3中任一项所述的检索装置,其中,上述分类器包括卷积神经网络。8.一种检索系统,具备:权利要求1~7中任一项所述的检索装置;输入装置,受理上述第一字符串的输入;以及显示装置,显示上述其他字符串。9.一种检索方法,其中,使处理装置:使用第一字符串来生成表示上述第一字符串的字符串图像,向与图像的输入相应地输出字符串数据的分类的分类器,输入上述字符串图像,基于上述分类器的分类结果,输出与上述第一字符串不同的其他字符串。10.一种存储介质,存储有程序,其中,该程序使处理装置:使用第一字符串来生成表示上述第一字符串的字符串图像,向与图像的输入相应地输出字符串数据的分类的分类器,输入上述字符串图像,基于上述分类器的分类结果,输出与上述第一字符串不同的其他字符串。
技术总结
本发明的实施方式涉及检索装置、检索系统、检索方法以及存储介质,能够更容易地检索与字符串对应的其他字符串。实施方式的检索装置使用第一字符串来生成表示上述第一字符串的字符串图像。上述检索装置进一步向与图像的输入相应地输出字符串的分类的分类器输入上述字符串图像。上述检索装置进一步基于上述分类器的分类结果输出与上述第一字符串不同的其他字符串。其他字符串。其他字符串。
技术研发人员:大岛宏友
受保护的技术使用者:株式会社东芝
技术研发日:2022.12.20
技术公布日:2023/7/11
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/