翻译方法、装置、设备及存储介质与流程
未命名
09-11
阅读:107
评论:0

1.本技术涉及语言翻译技术领域,尤其涉及一种翻译方法、装置、设备及存储介质。
背景技术:
2.在全球化和跨文化交流日益频繁的时代,翻译已经成为一项非常重要的技能,通过翻译不仅可以跨国交流,还可以通过翻译跨语言交流。
3.由于每个人对语言掌握程度不同,在遇到自己听不懂的语言时,优先想到是利用翻译设备或翻译转件进行翻译。但是,常用翻译设备或翻译软件翻译语言时,只能根据已经划分的语言种类进行翻译,对于未经过划分的语言不能精准识别,导致翻译的准确度下降。
技术实现要素:
4.本技术的主要目的在于提供一种翻译方法、装置、设备及存储介质,旨在解决现有技术中只能根据已经划分的语言种类进行翻译,对于未经过划分的语言不能精准识别,导致翻译的准确度下降的技术问题。
5.为实现上述目的,本技术提供一种翻译方法,所述翻译方法,包括:识别获取的待翻译数据所属的最小记录语种;从预设语言演变规律库中筛选出与所述最小记录语种对应地区的目标语言演变规律;基于所述目标语言演变规律,确定所述待翻译数据直属的目标语言种类,其中,所述目标语言种类属于所述最小记录语种中的细分类别;基于所述目标语言种类,翻译所述待翻译数据。
6.可选地,所述基于所述目标语言演变规律,确定所述待翻译数据直属的目标语言种类的步骤,包括:基于所述目标语言演变规律,模拟所述最小记录语种中语言的演变过程,根据模拟的所述演变过程确定各地区的直属语言;确定所述待翻译数据与各所述直属语言的相似度;基于所述相似度,确定所述待翻译数据的目标语言种类。
7.可选地,所述确定所述待翻译数据与各所述直属语言的相似度的步骤,包括:将所述待翻译数据输入至预设语言特征识别模型,获得所述待翻译数据的语言特征,其中,所述语言特征包括声调、重音、语法、语气与特有词汇中的至少一种,所述预设语言特征识别模型是通过标记有语言特征的语言样本进行模型训练后获得;将所述语言特征与所述直属语言的语言特征进行对比,确定所述待翻译数据与各所述直属语言的相似度。
8.可选地,所述基于所述相似度,确定所述待翻译数据的目标语言种类的步骤,包括:基于所述相似度,从所述直属语言中筛选出目标语言;
确定所述目标语言所属的最小地区;确定所述最小地区的语言种类为所述待翻译数据的目标语言种类。
9.可选地,所述从预设语言演变规律库中筛选出与所述最小记录语种对应地区的目标语言演变规律的步骤之前,还包括:获取每个所述最小记录语种对应地区的发展史;从所述发展史中查询出各所述地区的地域变迁信息与语言变化信息;基于所述地域变迁信息与所述语言变化信息,确定所述地区的语言演变规律;整合所有所述语言演变规律,得到预设语言演变规律。
10.可选地,所述基于所述地域变迁信息与所述语言变化信息,确定所述地区的语言演变规律的步骤,包括:从所述地域变迁信息中,筛选出所述地区每次变迁后的人口流动信息;基于所述人口流动信息,确定向所述地区流入的外地语言与所述地区的本地语言;从所述语言变化信息中,解析出所述外地语言融入所述本地语言时的融入规律;基于所述融入规律,确定所述地区的语言演变规律。
11.可选地,所述基于所述目标语言种类,翻译所述待翻译数据的步骤,包括:基于所述目标语言种类的目标语言特征,识别所述待翻译数据的含义;基于所述含义,翻译所述待翻译数据。
12.此外,为实现上述目的,本技术还提供一种翻译装置,翻译装置包括:识别模块,用于识别获取的待翻译数据所属的最小记录语种;筛选模块,用于从预设语言演变规律库中筛选出与所述最小记录语种对应地区的目标语言演变规律;第一确定模块,用于基于所述目标语言演变规律,确定所述待翻译数据直属的目标语言种类,其中,所述目标语言种类属于所述最小记录语种中的细分类别;翻译模块,用于基于所述目标语言种类,翻译所述待翻译数据。
13.此外,为实现上述目的,本技术还提出一种翻译设备,所述设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的翻译程序,所述翻译程序配置为实现如上文所述的翻译方法的步骤。
14.此外,为实现上述目的,本技术还提出一种存储介质,所述存储介质上存储有翻译程序,所述翻译程序被处理器执行时实现如上文所述的翻译方法的步骤。
15.本技术提供一种翻译方法、装置、设备及存储介质,与现有技术中只能根据已经划分的语言种类进行翻译,对于未经过划分的语言不能精准识别,导致翻译的准确度下降相比,在本技术中,识别获取的待翻译数据所属的最小记录语种;从预设语言演变规律库中筛选出与所述最小记录语种对应地区的目标语言演变规律;基于所述目标语言演变规律,确定所述待翻译数据直属的目标语言种类,其中,所述目标语言种类属于所述最小记录语种中的细分类别;基于所述目标语言种类,翻译所述待翻译数据。在本技术中,识别待翻译数据所属的已经划分的最小记录语种,并结合最小记录语种对应地区的语言演变规律,确定待翻译数据的直属地区,进而确定待翻译数据直属的目标语言种类,最后根据目标语言种类,翻译待翻译数据,即在本技术中,从经过划分的记录语言种类中识别出待翻译数据所属
的最低级的最小记录语种,并根据语言演变规律,确定待翻译数据所属的最小地区的目标语言种类,以减小对语言种类的识别误差,精准识别待翻译数据所表达的意思,进而精准的翻译待翻译数据,提高了翻译的准确度。
附图说明
16.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本技术的实施例,并与说明书一起用于解释本技术的原理。
17.为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
18.图1为本技术实施例方案涉及的硬件运行环境的设备机构示意图;图2为本技术翻译方法第一实施例的流程示意图;图3为本技术翻译方法第二实施例的流程示意图;图4为本技术翻译装置的结构配置示意图。
19.本技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
20.应当理解,此处所描述的具体实施例仅仅用以解释本技术,并不用于限定本技术。
21.参照图1,图1为本技术实施例方案涉及的硬件运行环境的翻译设备结构示意图。
22.如图1所示,该翻译设备可以包括:处理器1001,例如中央处理器(central processing unit,cpu),通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(display)、输入单元比如键盘(keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真(wireless-fidelity,wi-fi)接口)。存储器1005可以是高速的随机存取存储器(random access memory,ram)存储器,也可以是稳定的非易失性存储器(non-volatile memory,nvm),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
23.本领域技术人员可以理解,图1中示出的结构并不构成对翻译设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
24.如图1所示,作为一种存储介质的存储器1005中可以包括操作系统、数据存储模块、网络通信模块、用户接口模块以及翻译程序。
25.在图1所示的翻译设备中,网络接口1004主要用于与其他设备进行数据通信;用户接口1003主要用于与用户进行数据交互;本技术翻译设备中的处理器1001、存储器1005可以设置在翻译设备中,所述翻译设备通过处理器1001调用存储器1005中存储的翻译程序,并执行本技术实施例提供的翻译方法。
26.本技术实施例提供了一种翻译方法,参照图2,图2为本技术一种翻译方法第一实施例的流程示意图。
27.本实施例旨在:利用目标语言演变规律,精准确定待翻译数据直属的最低级别的语言种类,再基于该语言种类翻译待翻译数据,减小对语言种类的识别误差,提高翻译的准
确度。
28.在本实施例中,需要说明的是,翻译方法可以应用于翻译装置,该翻译装置从属于翻译设备,该翻译设备属于翻译系统。
29.本实施例中,所述翻译方法包括:步骤s10,识别获取的待翻译数据所属的最小记录语种;其中,最小记录语种可以是世界语言种类,也可以是地方的方言种类等,例如,英语、法语、日语、东北话、粤语、云南方言等,具体不做限定。
30.需要说明的是,最小记录语种可以是大众已知的、级别最低的语言分类种类,其中,最小记录语种可以是粤语、地方方言、闽南语、英式英语、美式英语或澳式英语等大众已知的、级别最低的语言分类种类;还可以是常用语言识别模型可以识别出的最低级别的语言种类。目标语言种类可以是不为大众所知的语言种类,其中,目标语言种类可以是具体某一个镇的方言,或者某一个区的方言,或者某一个市的方言,又或者是英语中的不同地区的俚语等只有当地人或周围地区的人知道,大众不知道的方言或语言,也即,没有被普及的方言或语言;还可以是常用语言识别模型识别不出的最低级别的语言种类。
31.其中,待翻译数据可以是文本数据,也可以是音频数据,其中,音频数据可以是录音音频,也可以是现场说话的收音音频。
32.步骤s20,从预设语言演变规律库中筛选出与所述最小记录语种对应地区的目标语言演变规律;在本实施例中,预设语言演变规律库中包含多种语言种类的语言演变规律,其中,语言演变规律可以包括语言种类所对应的地区中由高等级地区的语言向中低级别等级地区的语言演变的规律。例如,最小记录语种a对应的地区有地区b与地区c,地区b是由地区b1、地区b2、
……
、地区bn组成,地区bn由地区bn1、地区bn2、
……
、地区bnm组成,语言演变规律可以是从地区b的语言演变至地区b1、地区b2、
……
、地区bn的语言的规律,还可以是从地区bn的语言演变至地区bn1、地区bn2、
……
、地区bnm语言的规律,还可以是二者规律的叠加,也即,从地区b的语言演变至地区bn1、地区bn2、
……
、地区bnm语言的规律等,具体不做限定。
33.在本实施例中,通过目标语言演变规律可以将已知的最低级别的语言种类继续细分,得到不同分支地区的最小级别的语言,并从这些分支地区的语言中找出与待翻译数据相同或相似度最高的语言种类,再根据该语言种类的语言特征识别待翻译数据的意思,以减小对待翻译数据所表达意思的识别误差,进而可以提高翻译的精准度。
34.步骤s30,基于所述目标语言演变规律,确定所述待翻译数据直属的目标语言种类,其中,所述目标语言种类属于所述最小记录语种中的细分类别;在本实施例中,由于最小记录语种所对应的地域广阔,在该地域内可能还有众多不被大众所知的分支语言,例如,一个镇上的语言,且该分支语言的特定语义与最小记录语种对应语言的公知语义有差别,只通过最小记录语种翻译待翻译数据会使翻译结果的误差增大。所以在获取到待翻译数据后,先识别待翻译数据在大众所知的语言种类中的最低级别的种类(最小记录语种),再根据目标语言规律确定待翻译数据直属的分支语言种类(目标语言种类)。
35.在本实施例中,由于不同分支语言的语义也存在差别,所以利用目标语言演变规
律,判断最小记录语种的最小记录语言可以细分的方向,与细分后的分支语言种类,最后从分支语言种类中,识别出待翻译数据直属的目标语言种类,通过目标语言种类可以精准识别待翻译数据所表达的意思,并根据该意思翻译待翻译数据,以提高翻译的精准度。
36.例如,若待翻译数据是外语,则识别出的最小记录语种可以是美式英语、澳式英语、法语、日语等,若识别出的最小记录语种为美式英语,则先确定使用美式英语的所有地区,再从预设语言演变规律库中筛选出该地区的语言演变规律,也即,目标语言演变规律,根据目标演变规律,确定美式英语演变为该地区中所有细分地区的分支语言,将待翻译数据分别与各分支语言对比,从分支语言中找出与待翻译数据相似度最高的目标语言,确定目标语言直属的地区,并将该地区的名称作为待翻译数据的目标语言种类名称,例如,w镇语言。
37.需要说明的是,由于外语中也存在方言,且外语中不同方言的演变规律也会有迹可循的,所以当待翻译数据为外语时,也可以确定外语对应的目标语言演变规律。
38.具体的,所述基于所述目标语言演变规律,确定所述待翻译数据直属的目标语言种类的步骤,包括:步骤s31,基于所述目标语言演变规律,模拟所述最小记录语种中语言的演变过程,根据模拟的所述演变过程确定各地区的直属语言;步骤s32,确定所述待翻译数据与各所述直属语言的相似度;步骤s33,基于所述相似度,确定所述待翻译数据的目标语言种类。
39.在本实施例中,根据目标语言演变规律,模拟最小记录语种中的语言,向各县级地区或镇级地区使用语言的演变过程,根据演变过程确定各地区的直属语言(分支语言),可以减少对语言种类的收集,减少预先设置的语料库的数据量。
40.需要说明的是,一般最小记录语种都有对应的语料库,该语料库中储存有该最小记录语种中各词汇、句子等所表达的意思,通过目标语言演变规律,可以模拟最小记录语种中语言向下分支演变的过程,不需要收集大量的分支语言种类,不仅降低了对语料库的搭建难度,还能使用现有的语料库,更加精准的识别出待翻译数据所表达的意思。
41.在本实施例中,由于目标语言演变规律是根据最小记录语种对应地区的发展史整理总结得到的,所以直属语言的语义与实际中对应地区的语言语义之间可能会存在误差,也即,从直属语言可能找不出与待翻译数据完全相同的语言;在确定直属语言后,计算待翻译数据与所有直属语言的相似度,根据相似度从直属语言中找出与待翻译数据对应的目标语言,并确定目标语言的目标语言种类,以保证识别待翻译数据的准确度。
42.在本实施例中,确定待翻译数据与直属语言的相似度,可以是确定待翻译数据与直属语言之间语言特征的相似度。若待翻译数据为文本数据,则语言特征可以是特别词汇和/或语法等;若待翻译数据为音频数据,则语言特征可以是声调、语气和/或重音等。
43.具体的,所述基于所述相似度,确定所述待翻译数据的目标语言种类的步骤,包括:步骤a10,基于所述相似度,从所述直属语言中筛选出目标语言;步骤a20,确定所述目标语言所属的最小地区;步骤a30,确定所述最小地区的语言种类为所述待翻译数据的目标语言种类。
44.在本实施例中,筛选目标语言,可以是从各直属语言中筛选出与待翻译数据的相
似度最高的直属语言,作为待翻译数据的目标语言;还可以是将各直属语言中与待翻译数据的相似度大于预设相似门限的直属语言,作为待翻译数据的目标语言,此时目标语言可以为多种。
45.在本实施例中,使用预设相似门限,确定待翻译数据的目标语言,可以提高翻译的容错率,由于相似度高的两个或多个直属语言对应的地区也是相邻的,且相邻地区之间的语言基本是相通的,所以通过确定的多个目标语言,可以提高最终确定的目标语言种类的可信度。
46.需要说明的是,最小地区可以是语言特征相同的地区集合,由于语言特征相同,也即,最小地区中同一句话所表达的意思也相同,所以在目标语言直属的最小地区后,即可将该最小地区的语言种类作为待翻译数据的目标语言种类,以减小不必要的识别过程,进而在提高翻译准确率的前提下,提高翻译效率。
47.需要说明的是,目标语言种类也可以是最小记录语种,通过目标语言演变规律无法将最小记录语种继续细分时,可以将最小记录语种作为目标语言种类;或者将最小记录语种对应的语言与直属语言之间的语言特征完全相同时,也可以将最小记录语种作为目标语言种类。
48.步骤s40,基于所述目标语言种类,翻译所述待翻译数据。
49.在本实施例中,在识别出待翻译数据的意思后,还需要确定待翻译数据被翻译后的数据类型,根据该数据类型,确定是将待翻译数据翻译为书面化的文件数据,还是将待翻译数据翻译为口语化的音频数据,以满足用户对翻译数据的不同需求。
50.在本实施例中,待翻译数据可以是方言,翻译后的语言可以是外语,也即,将方言翻译成外语,还可以是将外语翻译成方言;也可以是,将外语翻译成另一种外语等,具体不做限定。
51.具体的,所述基于所述目标语言种类,翻译所述待翻译数据的步骤,包括:步骤s41,基于所述目标语言种类的目标语言特征,识别所述待翻译数据的含义;步骤s42,基于所述含义,翻译所述待翻译数据。
52.需要说明的是,在翻译待翻译数据时可以根据当前的流行词汇,选择是直译、还是意译、又或者是直译与意译同时使用,也即,根据待翻译数据的含义,将待翻译数据区分为直译词与意译词,将直译词进行直译,将意译词进行意译,以使用户可以更快理解待翻译数据的意思,提高翻译的效率,还可以提高翻译的灵活性。
53.在本实施例中,若待翻译数据的目标语言为直属方言时,可以将待翻译数据翻译为直属方言所属的最小记录语种的语言,再使用目标语言的语言演变规律,将该语言翻译为目标语言,以避免在语料库中没有记录目标语言,导致翻译失败。
54.本技术提供一种翻译方法、装置、设备及存储介质,与现有技术中只能根据已经划分的语言种类进行翻译,对于未经过划分的语言不能精准识别,导致翻译的准确度下降相比,在本技术中,识别获取的待翻译数据所属的最小记录语种;从预设语言演变规律库中筛选出与所述最小记录语种对应地区的目标语言演变规律;基于所述目标语言演变规律,确定所述待翻译数据直属的目标语言种类,其中,所述目标语言种类属于所述最小记录语种中的细分类别;基于所述目标语言种类,翻译所述待翻译数据。在本技术中,识别待翻译数据所属的已经划分的最小记录语种,并结合最小记录语种对应地区的语言演变规律,确定
待翻译数据的直属地区,进而确定待翻译数据直属的目标语言种类,最后根据目标语言种类,翻译待翻译数据,即在本技术中,从经过划分的记录语言种类中识别出待翻译数据所属的最低级的最小记录语种,并根据语言演变规律,确定待翻译数据所属的最小地区的目标语言种类,以减小对语言种类的识别误差,精准识别待翻译数据所表达的意思,进而精准的翻译待翻译数据,提高了翻译的准确度。
55.进一步地,基于本技术中上述实施例,提供本技术的另一实施例,在该实施例中,参考图3,所述从预设语言演变规律库中筛选出与所述最小记录语种对应地区的目标语言演变规律的步骤之前,还包括:步骤s01,获取每个所述最小记录语种对应地区的发展史;步骤s02,从所述发展史中查询出各所述地区的地域变迁信息与语言变化信息;步骤s03,基于所述地域变迁信息与所述语言变化信息,确定所述地区的语言演变规律;步骤s04,整合所有所述语言演变规律,得到预设语言演变规律。
56.在本实施例中,发展史可以是最小记录语种对应的所有地区的发展历史,以根据发展史,确定各地区的语言种类与最小记录语种之间的演变规律与每个地区语言的演变关系,也即,不仅可以根据发展史确定最小记录语种的细分规律, 还可以根据发展史确定细分后的分支种类内部的演变规律,最后根据细分规律与细分规律确定各地区的语言演变规律。
57.在本实施例中,由于地域变迁会使其他地区的语言特征融入当地的语言特征,以更新当地原有的语言特征,得到新的语言特征,所以可以根据发展史中各地的地域变迁信息与语言变化信息,确定各地区的语言演变规律,且根据发展史得到的语言演变规律更加权威。
58.在本实施例中,由于根据发展史确定语言演变规律,会包含每个词、语法、重音或特定词汇的变化,也即当地语言特征演变规律,所以在待翻译数据中存在无法根据目标种类的语言特征识别的词汇,或识别到不确定的词汇时,可以根据语言演变规律精准识别该词汇,以避免翻译失败,或将该词汇以同音字的形式翻译出来,进而使待翻译数据被翻译后得到目标语言更加精准。
59.具体的,所述基于所述地域变迁信息与所述语言变化信息,确定所述地区的语言演变规律的步骤,包括:步骤b10,从所述地域变迁信息中,筛选出所述地区每次变迁后的人口流动信息;步骤b20,基于所述人口流动信息,确定向所述地区流入的外地语言与所述地区的本地语言;步骤b30,从所述语言变化信息中,解析出所述外地语言融入所述本地语言时的融入规律;步骤b40,基于所述融入规律,确定所述地区的语言演变规律。
60.在本实施例中,由于随着地域变迁,各地区的人口也随之流动,所以根据地域变迁信息,可以得知当地的流动人口信息,随着人口的流动,当地的本地语言会融入外来的外地语言,改变本地语言,得到新的本地语言,根据语言变化信息,可以解析出外地语言流入本地语言时的融入规律,最终,根据融入规律确定语言演变规律,可以使语言演变规律更符合
历史对最小记录语种中语言发展的影响,也减小使用语言演变规律得到的目标语言与当地正在使用的语言之间误差,以减小翻译误差,提高翻译的精准度。
61.进一步地,基于本技术中上述实施例,提供本技术的另一实施例,在该实施例中,所述确定所述待翻译数据与各所述直属语言的相似度的步骤,包括:步骤c10,将所述待翻译数据输入至预设语言特征识别模型,获得所述待翻译数据的语言特征,其中,所述语言特征包括声调、重音、语法、语气与特有词汇中的至少一种,所述预设语言特征识别模型是通过标记有语言特征的语言样本进行模型训练后获得;步骤c20,将所述语言特征与所述直属语言的语言特征进行对比,确定所述待翻译数据与各所述直属语言的相似度。
62.在本实施例中,通过设置语言特征识别模型识别待翻译数据的声调、重音、语法、语气或特有词汇等语言特征,以提高识别待翻译数据的语言特征的准确度。
63.需要说明的是,语言特征识别模型可以在使用过程中,不断的进行学习更新,以提高识别语言特征的准确性与识别效率。
64.在本实施例中,利用由语言特征识别模型识别到的待翻译数据的语言特征与直属语言特征进行对比,可以降低待翻译数据与各所述直属语言的相似度的误差。
65.本技术还提供一种翻译装置,参考图4,翻译装置包括:识别模块401,用于识别获取的待翻译数据所属的最小记录语种;筛选模块402,用于从预设语言演变规律库中筛选出与所述最小记录语种对应地区的目标语言演变规律;第一确定模块403,用于基于所述目标语言演变规律,确定所述待翻译数据直属的目标语言种类,其中,所述目标语言种类属于所述最小记录语种中的细分类别;翻译模块404,用于基于所述目标语言种类,翻译所述待翻译数据。
66.可选地,所述第一确定模块403包括:模拟模块,用于基于所述目标语言演变规律,模拟所述最小记录语种中语言的演变过程,根据模拟的所述演变过程确定各地区的直属语言;第一确定子模块,用于确定所述待翻译数据与各所述直属语言的相似度;第二确定子模块,用于基于所述相似度,确定所述待翻译数据的目标语言种类。
67.可选地,所述第一确定子模块包括:第一获取模块,用于将所述待翻译数据输入至预设语言特征识别模型,获得所述待翻译数据的语言特征,其中,所述语言特征包括声调、重音、语法、语气与特有词汇中的至少一种,所述预设语言特征识别模型是通过标记有语言特征的语言样本进行模型训练后获得;对比模块,用于将所述语言特征与所述直属语言的语言特征进行对比,确定所述待翻译数据与各所述直属语言的相似度。
68.可选地,所述第二确定子模块包括:第一筛选子模块,用于基于所述相似度,从所述直属语言中筛选出目标语言;第一确定单元,用于确定所述目标语言所属的最小地区;第二确定单元,用于确定所述最小地区的语言种类为所述待翻译数据的目标语言种类。
69.可选地,所述翻译装置还包括:第二获取模块,用于获取每个所述最小记录语种对应地区的发展史;查询模块,用于从所述发展史中查询出各所述地区的地域变迁信息与语言变化信息;第二确定模块,用于基于所述地域变迁信息与所述语言变化信息,确定所述地区的语言演变规律;整合模块,用于整合所有所述语言演变规律,得到预设语言演变规律。
70.可选地,所述第二确定模块包括:第二筛选子模块,用于从所述地域变迁信息中,筛选出所述地区每次变迁后的人口流动信息;第一确定单元,用于基于所述人口流动信息,确定向所述地区流入的外地语言与所述地区的本地语言;解析模块,用于从所述语言变化信息中,解析出所述外地语言融入所述本地语言时的融入规律;第二确定单元,用于基于所述融入规律,确定所述地区的语言演变规律。
71.可选地,所述翻译模块404包括:识别子模块,用于基于所述目标语言种类的目标语言特征,识别所述待翻译数据的含义;翻译子模块,用于基于所述含义,翻译所述待翻译数据。
72.本技术翻译装置的具体实施方式与上述翻译方法各实施例基本相同,在此不再赘述。
73.本技术实施例提供了一种存储介质,且存储介质存储有一个或者一个以上程序,一个或者一个以上程序还可被一个或者一个以上的处理器执行以用于实现上述任一项的翻译方法的步骤。
74.本技术存储介质具体实施方式与上述翻译方法各实施例基本相同,在此不再赘述。
75.需要说明的是,在本文中,术语“包括”、“包含”或者其任何其它变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其它要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个等”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
76.上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
77.通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例的方法。
78.以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发
明说明书及附图内容所作的等效机构或等效流程变换,或直接或间接运用在其它相关的技术领域,均同理包括在本发明的专利保护范围内。
技术特征:
1.一种翻译方法,其特征在于,所述翻译方法,包括:识别获取的待翻译数据所属的最小记录语种;从预设语言演变规律库中筛选出与所述最小记录语种对应地区的目标语言演变规律;基于所述目标语言演变规律,确定所述待翻译数据直属的目标语言种类,其中,所述目标语言种类属于所述最小记录语种中的细分类别;基于所述目标语言种类,翻译所述待翻译数据。2.如权利要求1所述的翻译方法,其特征在于,所述基于所述目标语言演变规律,确定所述待翻译数据直属的目标语言种类的步骤,包括:基于所述目标语言演变规律,模拟所述最小记录语种中语言的演变过程,根据模拟的所述演变过程确定各地区的直属语言;确定所述待翻译数据与各所述直属语言的相似度;基于所述相似度,确定所述待翻译数据的目标语言种类。3.如权利要求2所述的翻译方法,其特征在于,所述确定所述待翻译数据与各所述直属语言的相似度的步骤,包括:将所述待翻译数据输入至预设语言特征识别模型,获得所述待翻译数据的语言特征,其中,所述语言特征包括声调、重音、语法、语气与特有词汇中的至少一种,所述预设语言特征识别模型是通过标记有语言特征的语言样本进行模型训练后获得;将所述语言特征与所述直属语言的语言特征进行对比,确定所述待翻译数据与各所述直属语言的相似度。4.如权利要求2所述的翻译方法,其特征在于,所述基于所述相似度,确定所述待翻译数据的目标语言种类的步骤,包括:基于所述相似度,从所述直属语言中筛选出目标语言;确定所述目标语言所属的最小地区;确定所述最小地区的语言种类为所述待翻译数据的目标语言种类。5.如权利要求1所述的翻译方法,其特征在于,所述从预设语言演变规律库中筛选出与所述最小记录语种对应地区的目标语言演变规律的步骤之前,还包括:获取每个所述最小记录语种对应地区的发展史;从所述发展史中查询出各所述地区的地域变迁信息与语言变化信息;基于所述地域变迁信息与所述语言变化信息,确定所述地区的语言演变规律;整合所有所述语言演变规律,得到预设语言演变规律。6.如权利要求5所述的翻译方法,其特征在于,所述基于所述地域变迁信息与所述语言变化信息,确定所述地区的语言演变规律的步骤,包括:从所述地域变迁信息中,筛选出所述地区每次变迁后的人口流动信息;基于所述人口流动信息,确定向所述地区流入的外地语言与所述地区的本地语言;从所述语言变化信息中,解析出所述外地语言融入所述本地语言时的融入规律;基于所述融入规律,确定所述地区的语言演变规律。7.如权利要求1至6任一项所述的翻译方法,其特征在于,所述基于所述目标语言种类,翻译所述待翻译数据的步骤,包括:基于所述目标语言种类的目标语言特征,识别所述待翻译数据的含义;
基于所述含义,翻译所述待翻译数据。8.一种翻译装置,其特征在于,所述翻译装置包括:识别模块,用于识别获取的待翻译数据所属的最小记录语种;筛选模块,用于从预设语言演变规律库中筛选出与所述最小记录语种对应地区的目标语言演变规律;第一确定模块,用于基于所述目标语言演变规律,确定所述待翻译数据直属的目标语言种类,其中,所述目标语言种类属于所述最小记录语种中的细分类别;翻译模块,用于基于所述目标语言种类,翻译所述待翻译数据。9.一种翻译设备,其特征在于,所述翻译设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的翻译程序,所述翻译程序配置为实现如权利要求1至7中任一项所述的翻译方法的步骤。10.一种存储介质,其特征在于,存储介质上存储有实现翻译方法的程序,实现翻译方法的程序被处理器执行以实现如权利要求1至7中任一项所述翻译方法的步骤。
技术总结
本申请公开了一种翻译方法、装置、设备及存储介质,涉及语言翻译技术领域,该方法包括:识别获取的待翻译数据所属的最小记录语种;从预设语言演变规律库中筛选出与所述最小记录语种对应地区的目标语言演变规律;基于所述目标语言演变规律,确定所述待翻译数据直属的目标语言种类,其中,所述目标语言种类属于所述最小记录语种中的细分类别;基于所述目标语言种类,翻译所述待翻译数据。在本申请中,从有记录的语言种类中识别出待翻译数据所属的最低级的记录种类,并根据语言演变规律,确定待翻译数据所属的最小地区的目标语言种类,以减小对语言种类的识别误差,精准识别待翻译数据所表达的意思,进而精准翻译待翻译数据,提高翻译的准确度。译的准确度。译的准确度。
技术研发人员:陈育添
受保护的技术使用者:深圳市微星智造科技有限公司
技术研发日:2023.08.07
技术公布日:2023/9/9
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/