用于植物中潜伏感染的收获前检测的系统和方法与流程
未命名
09-13
阅读:51
评论:0

用于植物中潜伏感染的收获前检测的系统和方法
1.相关申请的交叉引用
2.本技术要求于2020年11月5日提交的美国临时申请序列no.63/110,343的优先权,其公开内容通过引用整体并入。
技术领域
3.本文档描述了与不同类型植物(例如,农产品)的收获前潜伏感染预测相关的设备、系统和方法。
背景技术:
4.许多植物产品,例如果实,可以维持高感染率。当植物产品在生长过程中被病原体感染时,会发生植物产品的收获前感染。例如,鳄梨果园中大约20-40%的鳄梨树,以及它们生产的鳄梨,会在收获前感染炭疽病。未成熟的、收获前的植物产品会没有出现此类感染的症状。但是,植物产品在收获、成熟和衰老后,会变得出现感染症状。感染的症状可以包括茎端腐烂、霉菌、维管/内部褐变和其它可能导致植物产品质量有害损失的特征。
5.例如,收获可以涉及通过采摘或修剪从亲本树上切下果实,这两者都会使果实花梗的木质部元件暴露于感染,这可以促进真菌接种物转移到果实的木质部组织中。当果实仍未成熟时,真菌会在果实的木质部定殖但仍处于潜伏状态,并且可能会在果实成熟时积极侵入周围组织,导致细胞损伤和疾病症状。这使得诸如茎端腐烂(ser)之类的感染成为具有挑战性的收获后疾病:它起源于农场,但在植物产品(例如,农产品)到达消费者手中之前可能无法检测到。而且,诸如ser之类的感染可能具有依赖时间和空间的严重程度。这意味着同一棵树的早季收获与晚季收获可以具有不同的ser发生率,并且这种发生率在相邻树木之间可能不一定具有可比性。
6.一些收获前和收获后的减轻方法可以包括在收获前和/或收获后使用杀真菌剂化学品。重复施用杀菌剂会对环境产生负面影响,包括母树有益微生物群的退化。随着时间的推移,重复使用杀真菌剂也会导致病原体产生耐药菌株。
技术实现要素:
7.本公开一般而言涉及植物(例如,农产品)的收获前评估,以预测果实、蔬菜、种子和/或其它植物产品(例如,叶、茎、根等)中生长或以其它方式来源于被评估的植物的潜伏感染的发生。更具体而言,机器学习模型可以被用于使用有关植物的收获前数据和预测特征来预测植物潜伏感染的可能性。预测特征可以包括但不限于植物的地理区域、生长阶段、年龄、激素、干物质含量、环境条件等。
8.在所公开技术的示例性实施方式中,通过在整个季节调查来自同一棵树的果实,可以建立生理学和转录组学信息的数据集,其对产生具有一种或多种潜伏感染(诸如茎端腐烂(ser))的高或低发生的果实的树木进行概况分析。虽然果实(包括但不限于鳄梨)的此类潜伏感染可能直到果实在树上成熟并在收获后成熟时才会显现出来,但早在收获高峰季
节之前的6个月,果实就可能带有感染标志物。因此,所公开的技术可以提供一个平台,用于在收获前检测植物中的潜伏感染时使用预测性测定,有足够的时间对杀真菌剂应用、植物收获时间表和/或植物市场目的地进行修订(例如,减轻操作)以努力减轻植物中这种潜伏感染的表现。
9.本文描述的一个或多个实施例可以包括一种用于识别植物的收获前潜伏感染的方法。一方面,该方法可以包括以下动作:由一个或多个计算机获得描述植物中存在的一种或多种感染生物标志物的表达水平的数据,由一个或多个计算机将获得的数据编码成数据结构以输入到机器学习模型,由一个或多个计算机将编码的数据结构作为输入提供给机器学习模型,该模型已被训练为基于处理编码的数据结构生成指示植物具有潜伏感染的可能性的输出数据,由一个或多个计算机获得指示植物具有潜伏感染的可能性的生成的输出数据,由一个或多个计算机并基于生成的输出数据确定植物具有潜伏感染,并且由一个或多个计算机执行减轻植物中的潜伏感染的一个或多个操作。
10.其它方面可以包括对应的系统、装置和计算机程序以执行如本文公开的方法的动作,如由在计算机可读存储设备上编码的指令所定义的。这些和其它方面可以可选地包括以下特征中的一个或多个。例如,由一个或多个计算机执行减轻植物中的潜伏感染的一个或多个操作可以包括由一个或多个计算机确定植物和一个或多个其它类似来源的植物的收获时间表将由一个或多个计算机进行调整,并将定义调整后的收获时间表的数据存储在存储器设备中。
11.在一些实施方式中,由一个或多个计算机执行减轻植物中的潜伏感染的一个或多个操作可以包括由一个或多个计算机生成警报消息,该警报消息在被用户设备处理时可以使用户设备输出通知用户设备的用户该植物和一种或多种其它类似来源的植物将被收获的警报,并由一个或多个计算机将生成的警报传输到用户设备。由一个或多个计算机执行减轻植物中的潜伏感染的一个或多个操作还可以包括由一个或多个计算机并基于输出数据确定抗微生物处理剂可以针对一种或多种其它来源相似的植物开出。
12.在一些实施方式中,一种或多种其它类似来源的植物可以包括在与该植物相同地带内的植物。而且,由一个或多个计算机执行减轻植物中的潜伏感染的一个或多个操作可以包括由一个或多个计算机生成一个或多个指令,指令在由灌溉控制器处理时可以使灌溉控制器分散包括抗微生物处理剂的液体,并且由一个或多个计算机使用一个或多个网络将一个或多个指令传输到灌溉控制器。作为又一个示例,由一个或多个计算机执行减轻产品中的潜伏感染的一个或多个操作可以包括由一个或多个计算机生成一个或多个指令,指令在由机器人设备处理时,可以使机器人设备(i)导航到与植物相关联的位置,以及(ii)由机器人设备发起抗微生物操作,这可以使机器人设备分散液体,包括对植物和一个或多种其它本地来源的植物的抗微生物处理剂,并且由一个或多个计算机使用一个或多个网络将一个或多个指令传输到机器人设备。
13.在一些实施方式中,由一个或多个计算机执行减轻产品中的潜伏感染的一个或多个操作可以包括由一个或多个计算机生成一个或多个指令,指令在由机器人设备处理时可以使机器人设备(i)导航到与植物相关联的位置,以及(ii)由机器人设备发起收获操作,这可以使机器人设备从植物和一种或多种其它类似来源的植物收获植物产品,并且由一个或多个计算机使用一个或多个网络将一个或多个指令传输到机器人设备。
14.在一些实施方式中,获得的数据可以基于由核酸测序仪生成的输出数据生成,该输出数据基于核酸测序仪对(i)从植物提取的树皮样本或(ii)从植物的植物产品提取的植物产品的样本的测序。有时,获得的数据可以基于由核酸测序仪生成的输出数据生成,该输出数据基于核酸测序仪对(i)从植物中提取的树皮样本和(ii)从植物的植物产品提取的植物产品样本的测序。而且,描述植物中一种或多种感染生物标志物的表达水平的数据可以包括一种或多种变体的列表。一种或多种变体可以描述植物的读取序列与健康植物的参考基因组之间的差异。在一些实施方式中,机器学习模型可以包括二元逻辑回归模型、逻辑模型树、随机森林分类器、l2正则化、偏最小二乘或者一种或多种神经网络中的一个或多个。有时,植物产品可能不包括任何可见的感染迹象。
15.除了权利要求和上述实施例中的实施例外,下述实施例也具有创新性。
16.实施例1是一种用于识别植物收获前潜伏感染的方法,该方法包括:由处理器获得描述植物中存在的一种或多种感染生物标志物的表达水平的数据,感染生物标志物指示植物中感染的可能性,其中数据指示植物的读取序列与和该植物相同类型的健康植物的参考基因组之间的差异;由处理器基于获得的数据选择一个或多个机器学习模型,其中所述一个或多个机器学习模型先前使用与其它数据相关的数据以及确定的一种或多种其它植物的一种或多种感染生物标志物进行了训练,以生成指示植物在收获前发生潜伏感染的可能性的输出,其中使用包括以下的处理训练所述一个或多个机器学习模型从训练数据集并向所述一个或多个机器学习模型输入(i)所述一种或多种其它植物的非侵入性测量、(ii)所述一种或多种其它植物的侵入性测量、(iii)针对所述一种或多种其它植物的已知植物信息,以及(iv)针对所述一种或多种其它植物的肯定感染标识,以及基于将(i)-(iv)输入到所述一个或多个机器学习模型中,确定所述一种或多种其它植物在收获前发生潜伏感染的预测的可能性,以及输出所述一个或多个机器学习模型以供运行时使用;由处理器基于将所述一个或多个机器学习模型应用于数据,生成指示植物在收获前发生潜伏感染的可能性的输出;由处理器基于输出超出预定阈值范围而确定植物具有潜伏感染;由处理器确定减轻植物中的潜伏感染的一个或多个操作;以及由处理器输出植物具有潜伏感染的指示和所述一个或多个确定的操作。
17.实施例2是实施例1的方法,其中由处理器确定减轻植物中潜伏感染的一个或多个操作包括,对于所述植物和一种或多种其它类似来源的植物,确定以下至少一个:(i)在生长季节中较早的经修改的收获时间表,(ii)在收获前施用预定量的杀虫剂的指令,以及(iii)何时所述植物和所述一种或多种其它类似来源的植物接近各自健康生产寿命的尽头,其中所述一个或多个机器学习模型先前使用来自训练数据集的数据进行了训练,以确定(i)-(iii)。
18.实施例3是实施例1至2中的任一项的方法,其中所述一种或多种其它类似来源的植物包括与所述植物处于相同地带内的植物。
19.实施例4是实施例1至3中的任一项的方法,其中由处理器输出植物具有潜伏感染的指示和所述一个或多个确定的操作包括:生成警报消息,当由用户设备处理时,该警报消息使用户设备输出通知用户设备的用户执行所确定的操作中的一个或多个操作的警报;以及将生成的警报消息传输到用户设备。
20.实施例5是实施例1至4中的任一项的方法,其中由处理器确定减轻植物中的潜伏
感染的一个或多个操作包括:基于生成的输出,确定收获前应当对一种或多种其它类似来源的植物开具抗微生物处理剂。
21.实施例6是实施例1至5中的任一项的方法,其中由处理器确定减轻植物中的潜伏感染的一个或多个操作包括:生成指令,当由灌溉控制器处理时,使灌溉控制器自动分散包括抗微生物处理剂的液体;以及将指令传输到灌溉控制器。
22.实施例7是实施例1至6中的任一项的方法,其中由处理器确定减轻植物中的潜伏感染的一个或多个操作包括:生成指令,当由机器人设备处理时,使机器人设备(i)导航到植物所在的位置和(ii)将抗微生物处理剂分散到该植物和一种或多种其它类似来源的植物上;以及将指令传输到机器人设备。
23.实施例8是实施例1至7中的任一项的方法,其中由处理器确定减轻植物中的潜伏感染的一个或多个操作包括:生成指令,当由机器人设备处理时,使机器人设备(i)导航到植物的位置和(ii)在预期的收获时间表之前从该植物和一种或多种其它类似来源的植物收获一种或多种植物产品;以及将指令传输到机器人设备。
24.实施例9是实施例1至8中的任一项的方法,其中所获得的数据是由核酸测序仪基于对从植物中提取的植物产品进行测序而生成的。
25.实施例10是实施例1至9中的任一项的方法,其中植物产品包括树皮、叶、花和果实的样本中的至少一种。
26.实施例11是实施例1至10中的任一项的方法,其中植物产品是从植物中非破坏性地采样的。
27.实施例12是实施例1至11中的任一项的方法,其中植物产品包括由植物排出的挥发性成分。
28.实施例13是实施例1至12中的任一项的方法,其中所述一个或多个机器学习模型包括二元逻辑回归模型、逻辑模型树、随机森林分类器、l2正则化、偏最小二乘法和卷积神经网络(cnn)中的至少一种。
29.实施例14是实施例1至13中的任一项的方法,其中植物不包括可见的感染迹象。
30.实施例15为实施例1至14任一项所述的方法,还包括:由处理器将获得的数据编码到数据结构中以输入到所述一个或多个机器学习模型;以及由处理器提供编码的数据结构作为所述一个或多个机器学习模型的输入。
31.实施例16是实施例1至15中的任一项的方法,还包括由处理器执行所确定的操作中的一个或多个操作以减轻植物中的潜伏感染。
32.实施例17是实施例1至16中的任一项的方法,其中由处理器选择一个或多个机器学习模型还基于从获得的数据识别出的一个或多个预测特征,所述一个或多个预测特征包括植物的生长区域、环境条件、植物类型、植物的生长阶段、植物的非侵入性测量、植物的侵入性测量、干物质含量、基因表达、植物的脱气挥发性成分、生长地带和读取的植物的序列数据中的至少一个。
33.实施例18是实施例1至17中的任一项的方法,其中已知的植物信息包括关于所述一种或多种其它植物的历史生长信息、生长季节长度、土壤条件、降水量、日照量、环境温度、生长区域和植物类型中的至少一个。
34.实施例19是一种用于预测植物中的潜伏感染的系统,该系统包括:一个或多个处
理器;以及一个或多个计算机可读存储设备,其上存储有指令,指令在由所述一个或多个处理器执行时使所述一个或多个处理器执行操作实施例1至18中的任一项的方法。
35.本文描述的设备、系统和技术可以提供以下优点中的一个或多个。例如,受感染植物产品的早期检测可以使受感染植物产品与未受感染植物产品的处理和隔离成为可能。这可以减少感染的散布,减少植物产品的浪费,并且还提高顾客对植物产品的接受度。通过减少植物产品浪费和提高客户接受度,提供商和供应链中的其他相关用户可以提供更高质量的植物产品,从而使提供商能够从市场上的其他提供商中脱颖而出。所公开的技术还可以提供用于确定可以在植物生长早期应用以避免感染发展和植物产品浪费的有效减轻措施。及早确定潜伏感染发展可以为相关利益相关者(诸如农民)提供充足的时间来确定和应用减轻措施。此外,在收获前提前对植物进行采样可能不会给农民带来负担,即使植物(例如,树)损失了一些植物产品以进行采样,因为可以确定并应用减轻措施来消除或降低在植物成熟期间损失植物产品的可能性。
36.作为另一个示例,所公开的技术提供了关于植物产品的不同数据和/或特征的组合,这些可以被用于对潜伏感染做出准确和及时的收获前预测。人类在植物生长季节期间收集和评估关于植物的不同类型的数据(诸如侵入性收集的测量和非侵入性收集的测量)以预测潜伏感染的发展可能不是那么有效或准确。因此,所公开的技术提供了不同类型数据的收集、合成和分析,否则这可能是具有挑战性的、有错的和/或不可能由人类准确预测收获前植物中的潜伏感染。
37.而且,本公开可以减少需要被破坏以检测相似来源植物的地带中的潜伏感染的植物产品的量。在一些实施方式中,本公开可以通过仅对植物的地上部分进行采样而不是对植物产品本身进行采样来减少对植物产品的破坏。然后,可以使用植物地上部分的样本来执行本公开的操作。在这些或其它实施方式中,本公开还可以通过检测植物中的潜伏感染并发起一种或多种补救措施以在潜伏感染显现之前减轻并可能消除潜伏感染来提供保存植物产品的益处,从而允许用于销售植物产品并提高客户满意度。此类补救措施可以包括例如指示用户或机器人设备从植物收获(一个或多个)植物产品和从相似来源植物地带内的一种或多种其它植物收获(一个或多个)植物产品。在其它实施方式中,也可以更新收获时间表以获得相同或相似的好处。这可以为本公开的用户提供一种或多种经济利益。
38.一个或多个实施方式的细节在附图和下面的描述中阐述。从描述和附图以及从权利要求中,其它特征和优点将是显而易见的。
附图说明
39.图1a是用于检测植物中的潜伏感染的示例系统的上下文图。
40.图1b是用于检测植物中的潜伏感染的处理的流程图。
41.图2是用于预测植物中的感染可能性的概念图。
42.图3是用于训练一个或多个模型以预测植物中的感染可能性的概念图。
43.图4是用于预测植物中的感染可能性的处理的流程图。
44.图5是可以被用于执行本文描述的技术的一个或多个组件的系统图。
45.图6a-c描绘了与公开的技术一起使用的用于收集植物的数据的示例处理。
46.图7a-b描绘了可以在不同时间收集的图6的植物的示例物理属性的图形描述。
47.图8a-c描绘了跨越图6a-c的植物的所有数据收集时间的归一化基因表达的主成分分析的双标图。
48.图9a-c描绘了用于图6a-c的植物的归一化基因表达的火山图。
49.图10a-d描绘了在图6a-c的植物的每个收集时间分析的基因的归一化基因表达的聚类热图。
50.图11是可以被用于实现用于检测潜伏感染的系统的系统组件的框图。
51.各个图中相同的附图标记指示相同的元件。
具体实施方式
52.本公开一般而言针对用于检测植物中的潜伏感染的系统、方法和计算机程序。许多植物可以定期结出果实,并在几十年到几个世纪内富有成效地生存。在这漫长的生命周期中,植物可以与其周围的生态系统交互并对其作出反应,其中可以包括有益微生物和致病微生物。植物对病原微生物的检测和反应可以通过植物先天免疫系统相关基因表达的变化来观察。因此,所公开的技术可以通过分析来自不同类型植物的各种植物产物(例如来自树的果实)的转录组来研究收获后潜伏感染(诸如茎端腐烂(ser))表现的收获前转录组学标志物。虽然此类潜伏感染可能直到果实在树上成熟、被收获和/或成熟时才会显现出来,但早在收获高峰季节之前的6个月,果实和其它植物产品就可能带有感染标志物。充分利用这些信息进行检测分析,可以预测高发病率和低发病率的树木,并有足够的时间修改杀真菌剂应用、植物产品收获时间表和/或植物产品市场目的地信息,以减轻不同类型的植物中潜伏感染的表现。
53.本公开还可以提供经训练的机器学习模型,该模型可以基于机器学习模型对表示植物特征的输入数据的处理来生成指示植物具有潜伏感染的可能性的输出数据。在一些实施方式中,植物的特征可以包括表示在植物样本中检测到的一种或多种生物标志物的表达水平的数据。如果做出植物具有潜伏感染的预测,那么所公开的技术可以提供确定并且可选地执行旨在减轻检测到的潜伏感染的一个或多个操作。
54.参考附图,图1a是用于检测植物中的潜伏感染的示例系统100的背景图。系统100可以包括用户设备110、一个或多个机器人设备120、121、122、124、125、126、核酸测序仪130、计算机140(例如,计算机系统)、网络150、一个或多个机器人设备充电站160、162、164、灌溉系统170,和/或其任何组合。系统100可以用这些组件的任何子集、组合或布置来实现,以实现本文描述的检测植物、植物产品或两者中的潜伏感染的功能。在一些实施方式中,可能不要求核酸测序仪。代替地,可以使用qpcr机器代替测序仪130。在又一些实施方式中,测序仪130和计算机140可以是同一系统的一部分。
55.参考图1a,在一些实施方式中,系统100的执行可以是用户105提取地带2的植物202-1的植物产品的样本122、植物202-1的任何地上部分的样本,或两者兼而有之。采样可以在收获前进行,有时可以在采集和收获被采样植物的植物产品之前6个月或更长时间。因此,所公开的技术可以在被采样植物经历它们各自的成熟过程时并且在它们被收获之前(例如,达到完全成熟)执行。因此,可以执行所公开的技术以足够早地预测采摘前的被采样植物和其它类似来源的植物感染的可能性,从而可以努力减轻潜伏感染的发展。
56.样本122可以包括被采样植物的植物产品的遗传数据。在一些实施方式中,样本
122可以源自植物202-1的果实、叶子、树皮、(一种或多种)植物组织,或植物202-1的其它植物产品。样本122还可以包括关于样本植物202-1的植物产品的其它信息。例如,样本122可以包括硬度计和/或针入度计测量、挥发性代谢物和非破坏性和/或破坏性检测的其它化合物等。
57.在一些实施方式中,样本122可以由一架或多架无人机120或其它类型的收集设备或机构提取。示例收集设备可以包括固定探针设备和/或自动固定的样本。例如,人可以使用本文描述的一种或多种类型的收集设备来收集样本122。在一些实施方式中,样本122可以被预处理以准备样本122输入核酸测序仪130进行测序。预处理可以包括例如处理样本122以从样本122获得核酸样本、对样本进行条形码化或其任何组合。在一些实施方式中,样本122可以仅包括植物(诸如植物202-1)的地上部分。在此类实施方式中,可以使用本公开的技术分析植物的地上部分以确定源自植物202-1的样本122的核酸中一种或多种感染生物标志物的表达水平。然后可以预测植物产品(在图1a中使用植物上的黑点描绘,例如,在地带1至地带n中描绘的102-1至n02-z,其中n是任何正整数,x是任何正整数,y是任何正整数,其中z是任何正整数)基于仅处理特定植物(例如植物202-1)的地上部分具有或可能发展为潜伏感染。在一些实施方式中,可以使用来自植物地上部分和植物产品的样本。
58.核酸测序仪130可以处理接收到的源自样本122的核酸并生成输出数据,其可以被称为读取的序列数据132,其表示样本122的核酸(例如,dna)中的核苷酸的次序。在一些实施方式中,读取的序列数据132可以包括使用一个或多个核苷酸碱基的样本122的核酸中的核苷酸,所述核苷酸碱基可以包括任何组合的鸟嘌呤(g)、胞嘧啶(c)、腺嘌呤(a)和胸腺嘧啶(t)。在一些实施方式中,可以通过将由核酸测序仪130生成的读取的序列数据转录成cdna来生成读取的序列数据132以表示样本122的rna。在此类实施方式中,读取的序列数据可以使用包括任何组合的g、c、a和尿嘧啶(u)的碱基来表示。
59.可以使用一个或多个网络150将读取的序列数据132提供给计算机140。一个或多个网络150可以包括有线以太网网络、光学网络、无线网络、wan、lan、蜂窝网络、wi-fi网络、互联网或其任何组合。在一些实施方式中,核酸测序仪130可以使用以太网电缆、usb-c电缆或促进核酸测序仪130和计算机140之间的数据通信的任何其它形式的直接连接来直接连接到应用服务器。计算机140可以提供读取的序列数据132作为对生物标志物表达引擎151的输入。生物标志物表达引擎151可以是计算机140的一部分,如参考图5进一步描述的。
60.在一些实施方式中,由核酸测序仪130输出的数据可以是表观遗传数据。表观遗传数据可以包括对样本122的核酸的改变(例如,化学修饰、对dna结构的改变等),其可能不会导致由核酸测序仪130基于核酸测序仪130对样本122的测序生成的读取的序列数据132的碱基检出(或核苷酸)的改变。在一些实施方式中,此类表观遗传数据可以由例如长读测序仪生成。在一些实施方式中,如果不使用表观遗传数据,那么可以使用其它核酸测序仪,包括但不限于(一个或多个)短读测序仪。虽然这些仅仅是可以被用于检测表观遗传数据的测序仪的示例,但任何其它测序仪都可以被用于生成本文描述的表观遗传数据。
61.生物标志物表达引擎151可以被配置为接收读取的序列数据132并确定一种或多种感染生物标志物的表达水平、管家生物标志物的水平或两者,如in prediction of infection in plant products,国际公开号wo 2021/092251 a1中所描述的,其全部内容通过引用并入本文。生物标志物表达引擎151可以基于处理读取的序列数据132来生成输出
2021/092251 a1中描述,该文献通过引用整体并入本文。由潜伏感染预测引擎153生成的输出数据153a可以提供给潜伏感染检测模块154。在一些实施方式中,潜伏感染预测引擎153可以包括二元逻辑回归模型、逻辑模型树、随机森林分类器、l2正则化或一个或多个神经网络和/或偏最小二乘模型中的一个或多个。
67.潜伏感染检测模块154可以是计算机140的一部分并且可以评估输出数据153a以确定是否可能要求减轻措施。举例来说,可以针对一个或多个预定阈值测量输出数据153a以确定输出数据153a是否指示样本122所源自的植物202-1已经、正在发展和/或可能正在发展一种或多种潜伏感染。在一些实施方式中,潜伏感染检测模块154可以以与prediction of infection in plant products,国际公开号wo 2021/092251 a1中描述的相同或相似的方式评估输出数据153a,该文献通过引用整体并入本文。例如,如果潜伏感染检测模块154确定输出数据153a不指示潜伏感染的存在,那么本文描述的技术可以在156终止。可替代地,如果潜伏感染检测模块154确定输出数据153a指示存在潜伏感染,那么潜伏感染检测模块154可以向减轻引擎155提供确定、建议和/或执行一个或多个减轻操作的指令154a。
68.减轻引擎155可以是计算机140的一部分并且可以发起一个或多个减轻操作的确定、建议和/或执行(例如,执行)。这些操作可以以多种形式发生。举例来说,在一些实施方式中,减轻引擎155可以基于指令154a、输出数据153a、一种或多种感染生物标志物的表达水平、一种或多种管家生物标志物的表达水平或它们的组合确定可以调整被采样的植物202-1和/或一种或多种其它类似来源植物的收获时间表。在此类实施方式中,减轻引擎155可以访问存储被采样的植物202-1的收获时间表、植物的植物产品、类似来源的植物和/或植物产品或其组合的数据库,并且基于输出数据153a调整收获时间表。在此类实施方式中,减轻引擎155的输出155a可以包括写入数据库以调整收获时间表的数据。在一些实施方式中,调整收获时间表可以包括调整从被采样的植物202-1和/或类似来源的植物收获的植物产品的收获后运输路线。例如,与可以更长时间地保持新鲜并在进一步分布中存活的具有较低潜伏感染或无潜伏感染预测可能性的其它植物相比,来自被采样的植物202-1和/或具有较高潜伏感染预测可能性(例如,潜伏感染预测可能性超过某个预定阈值或范围)的其它类似来源植物的植物产品可以被调度交付给更接近植物产品收获地点的地理区域。在一些实施方式中,对收获时间表的调整可以由减轻引擎155确定并且被传输到用户设备110或另一个相关利益相关者的计算设备。然后,相关利益相关者可以审查调整并决定是否实现此类调整。调整可以由相关利益相关者和/或由减轻引擎155或贯穿本公开描述的一个或多个其它组件半自主地实现。
69.举例来说,在一些实施方式中,减轻引擎155可以基于指令154a、输出数据153a、一种或多种感染生物标志物的表达水平、一种或多种管家生物标志物的表达水平或其组合确定植物(例如,202-1)、植物产品、类似来源的植物或植物产品的区域应当立即收获以避免基于产品的浪费。在此类实施方式中,减轻引擎155可以生成警报消息,该警报消息在被用户设备处理时可以使用户设备输出警报,该警报通知用户设备110的用户105植物202-1、植物产品和/或一种或多种其它类似来源的植物或植物产品将被收获。在此类情况下,输出155a可以包括生成的警报。然后,计算机140可以将生成的警报传输到用户设备110。
70.减轻引擎155还可以确定可以由用户105、另一个相关利益相关者和/或另一个设备/机器人(例如,无人机120)采取的一个或多个其它动作。例如,如下文进一步描述的,减
轻引擎155可以确定可以将一种或多种产品喷洒在植物202-1、植物产品和/或一种或多种其它类似来源的植物或植物产品上以保护这(一个或多个)植物和/或(一个或多个)产品,并在收获之前的生长季节防止潜伏感染。
71.减轻引擎155还可以使同一地带中的植物202-1和其它类似来源的植物以多种方式被收获。例如,在一些实施方式中,减轻引擎155可以使得部署一个或多个机器人设备(例如,无人机120)以开始从同一地带(诸如图1中的地带-2)内的植物202-1和其它本地来源的植物收获植物产品。在此类实施方式中,减轻引擎155可以生成一个或多个指令,指令在由机器人设备处理时使机器人设备(i)导航到与植物相关联的位置和(ii)由机器人设备发起收获操作。由机器人设备发起收获可以包括使机器人设备开始执行与从地带2中的植物和一种或多种其它类似来源的植物收获至少一种植物产品相关的一个或多个操作。在此类实施方式中,减轻引擎155的输出155a可以包括使机器人设备导航到并发起收获的指令。在一些实施方式中,减轻引擎155可以使用对植物202-1进行采样的用户105的用户设备110或无人机120的位置数据来确定植物和地带2中的其它类似来源植物的位置。减轻引擎155可以使用网络150将一个或多个指令传输到机器人设备124、125和/或126和/或机器人设备120,或任何其它类型的自动收获收集设备。虽然被描绘为四旋翼机器人设备,但是本公开不限于此。代替地,机器人设备124、125和/或126可以包括任何机器人设备,包括在地面上作为漫游者导航的机器人设备、通过空中飞行导航的机器人设备或其任何组合。
72.作为又一个示例,在一些实施方式中,减轻引擎155可以基于指令154a、输出数据153a、一种或多种感染生物标志物的表达水平、一种或多种管家生物标志物的表达水平或其组合确定要对一种或多种其它类似来源的植物开具抗微生物处理剂。在一些实施方式中,可以如下文进一步(例如,参考表1)并在通过引用整体并入本文的prediction of infection in plant products,国际公开号wo 2021/092251 a1描述的。减轻引擎155可以以多种不同方式引起抗微生物处理剂的施用。
73.例如,在一些实施方式中,减轻引擎155可以生成一个或多个指令,该指令可以使用网络150传输到远程灌溉控制器171以使灌溉控制器171激活灌溉系统170以部署抗微生物处理剂。例如,灌溉控制器171或减轻引擎155可以指示阀门172关闭和阀门174打开。灌溉控制器171然后可以用抗微生物处理剂喷洒植物202-1和同一地带(诸如地带2)中的一种或多种本地来源的植物以减轻检测到的或预测的潜伏感染。在其它实施方式中,减轻引擎155可以基于指令154a、输出数据153a、一种或多种感染生物标志物的表达水平、一种或多种管家生物标志物的表达水平或其组合来确定植物202-1和地带-2中的其它类似来源的植物只需要浇水,并且可能不开具抗微生物溶液的处理剂。在此类实施方式中,减轻引擎155可以指示灌溉控制器171(例如,阀门174、172)被重新配置为仅分散来自水源178的水,水源178可以是水箱、公共水源、井水来源,或其组合。
74.减轻引擎155还可以使抗微生物溶液以其它方式散布。例如,在一些实施方式中,减轻引擎155可以指示一个或多个机器人设备发起抗微生物操作。在此类实施方式中,诸如机器人设备120之类的机器人设备可以分别配备有抗微生物溶液罐和喷洒设备121a、122a。在此类实施方式中,机器人设备120可以接收由减轻引擎155生成和传输的指令,处理指令,并且导航到与同一地带中的植物和其它相似来源的植物相关联的位置并且使用喷洒器121a、122a将抗微生物溶液施用到同一地带内的植物和其它类似来源的植物。
75.上述示例可以分析读取的序列以确定基因计数和/或使用qpcr机器检测一种或多种感染生物标志物、一种或多种管家生物标志物或两者来确定基因计数。本公开不限于此。代替地,系统100可以被用于识别和计数其它类型的生物标记,以输入到预测引擎153。例如,在一些实施方式中,系统100可以被用于检测和计数可指示干旱压力源的基因。可以被检测和计数为指示干旱压力的基因类型的示例在下文进一步描述,诸如在表1中。可以使用系统100以与感染生物标志物、管家生物标志物或两者的表达水平相同或相似的方式分析这些干旱压力物的表达水平。系统100检测到干旱压力源表达的阈值水平可以使得系统100使用减轻引擎155来指示灌溉系统171对特定植物和/或同一地带内部一种或多种相似来源的植物执行浇水。
76.图1b是用于检测植物中的潜伏感染的处理180的流程图。处理180可以由贯穿本公开内容描绘和描述的计算机系统140执行(例如,参考图1a、5)。处理180和/或处理180的一个或多个方框可以由其它计算系统、设备、计算机/设备网络、基于云的系统和/或基于云的服务来执行。为了说明的目的,处理180是从计算机系统的角度来描述的。
77.参考图1b中的处理180,计算机系统可以接收描述特定地带中植物中(一种或多种)感染生物标志物表达水平的数据(182)。如参考图1a和整个说明书所描述的,数据可以是由用户(例如,人类工人)在田间/农场收集的一种或多种植物的样本。样本也可以通过诸如无人机或其它自动收集设备之类的设备收集。
78.计算机系统可以对数据进行编码以输入到一个或多个模型(184)。可以将数据编码到数据结构中以输入到一个或多个机器学习模型。参考图1a中关于生物标记表达引擎151和输入生成引擎152的描述。
79.在186中计算机系统可以选择至少一个模型,该模型被训练以预测植物潜伏感染的可能性。如下文进一步描述的,可以基于植物的类型、植物的生长阶段和/或一种或多种环境条件来选择不同的模型用于应用。这些模型可以在应用中分层,使得它们按顺序应用。这些模型也可以并行应用。
80.在188中,计算机系统可以在(一个或多个)所选择的模型中输入编码的数据。然后计算机系统可以在190中从(一个或多个)模型接收输出。输出可以包括指示植物具有或将具有潜伏感染的可能性的值。该值可以是数值(例如,在1到100的范围内,1表示最不可能发展为潜伏感染,100表示最有可能发展为潜伏感染)。该值也可以是字符串值和/或布尔值。
81.在192中,计算机系统可以确定植物中潜伏感染的预测可能性(例如,(一个或多个)模型的输出)是否大于预定阈值范围。如果预测的可能性超过预定的阈值范围,那么计算机系统可以确定一个或多个减轻操作以减轻特定地带中植物和其它类似来源植物中的潜伏感染(194)。换句话说,计算机系统可以确定植物具有足够高的发展潜伏感染的可能性,以至于应当在植物生长期间的早期采取行动以避免在收获时间造成植物浪费和/或植物或其植物产品的损失。
82.在一些实施方式中,计算机系统可以向相关用户的用户设备提供一个或多个减轻操作作为建议。然后用户可以选择要实现的减轻操作。减轻操作可以由用户或其他用户手动执行。减轻操作也可以由计算机系统自动执行。一旦用户向计算机系统提供指示选择此类减轻操作的输入,减轻操作就也可以由计算机系统半自主地执行。
83.如果植物中潜伏感染的预测可能性不大于预定阈值范围,那么处理180可以结束。
换句话说,计算机系统可以确定特定植物没有足够高的发展潜伏感染的可能性以在植物生长期的当前时间调用某种类型的(一个或多个)减轻操作。
84.图2是用于预测植物中感染的可能性的概念图。计算机系统140、用户设备110、植物数据存储库230和模型数据存储库240可以经由(一个或多个)网络150进行通信(例如,有线、无线)。采样器105可以在步骤a中从田地/农场的地带中的植物收集收获前数据。收获前收集可以早在收获前6个月发生。收获前收集也可以在植物生长季节期间的一个或多个时间间隔确定。例如,收获前收集和随后的感染可能性预测可以每2个月进行一次,直到收获。作为另一个示例,收获前收集和预测感染的可能性可以在收获前6个月进行。此时,可以确定减轻操作并将其应用于植物和/或类似来源的植物。也可以在此时确定在收获前的剩余生长季节期间是否需要附加的收获前收集和/或预测。
85.收获前收集可以包括本文所述的任何技术(例如,参考图1a)。例如,采样器105(例如,用户)可以在植物周围走动并从植物中收集植物产品的子集。在一些实施方式中,采样器105可以从正在被采样并测试潜伏感染可能性的植物中取出4种植物产品。采样器105可以从植物中取出任何其它数量的植物产品,这对于预测潜伏感染的可能性可能是最佳的。取出的数量可以取决于植物的类型、植物生长的特定区域和/或一种或多种其它环境条件。因此,植物产品的收集可以被用于确定田地/农场中特定地带中的特定植物(例如,树木)是否可能被感染。
86.作为另一个示例,收集可以包括使用非破坏性技术检测植物的挥发性代谢物。此类数据还可以深入了解植物如何响应环境条件,这可以作为植物是否具有潜伏感染和/或可能发生潜伏感染的另一个指标。采样器105可以在植物产品附近保持挥发物收集设备(例如,nir设备、电子鼻或其它仪器)以收集排出的挥发物。其它可现场部署的仪器也可以被用于收集和测量植物产品排出的挥发性成分,包括但不限于电子鼻和/或半自主或自主机器人设备上的nir设备。
87.可以执行收获前收集的任何组合。收获前收集还可以取决于使用(一个或多个)什么模型来预测植物产品中潜伏感染的可能性,这可以进一步取决于植物的类型、生长区域和/或环境条件。例如,在一些实施方式中,可以收集植物的植物产品的挥发物,并且也可以从植物中取出一定量的植物产品并带到实验室或设施进行进一步分析。
88.一旦收集了收获前数据(步骤a),就可以将数据传输到计算机系统140(步骤b)。如本文所述,数据可以包括测序数据,该数据可以被传输到核酸测序仪或其它测序设备(例如,参考图1a)。数据还可以包括易失性测量。在一些实施方式中,数据可以包括以非破坏性和/或破坏性方式获得的从植物中收集和/或取出的植物产品的其它测量。
89.计算机系统140可以从植物数据存储库230接收植物信息(步骤c)。这些信息可以关于正在被收集和测试感染的植物类型是特定的。信息还可以关于所收集的植物和/或植物产品的生长区域是特定的。信息还可以包括当前环境条件和/或可以在收获前植物生长季节期间出现的未来环境条件。步骤c可以在图2中描述的一个或多个步骤之前、期间和/或之后的任何时间执行。例如,步骤c可以与步骤d同时执行。
90.计算机系统140可以在步骤d中处理数据。处理数据可以如图1a中所描述的那样执行。处理数据可以包括通过对其进行编码以作为输入提供给一个或多个模型来准备收集的收获前数据。处理数据还可以包括准备植物信息以输入到一个或多个模型。
91.计算机系统还可以基于植物信息从模型数据存储库240接收(一个或多个)模型(步骤e)。计算机系统可以确定应用多少模型来预测植物中感染的可能性。计算机系统还可以基于植物信息(诸如植物的类型和/或环境条件)确定选择哪个或哪些模型。
92.计算机系统可以在步骤f中应用(一个或多个)所选择的模型。例如,计算机系统可以向模型提供收集的收获前数据和/或植物信息作为输入(例如,在编码结构中)。
93.因而,计算机系统可以在步骤g中预测植物感染的可能性。例如,(一个或多个)模型可以提供指示植物中感染的可能性的值形式的输出。然后计算机系统可以确定该值是否超过某个预定阈值范围。超过阈值范围可以指示植物很可能在植物中发生感染。如果该值不超过阈值范围,那么植物发生感染的可能性较低。
94.基于步骤g中的预测,计算机系统140可以可选地确定步骤h中的(一个或多个)减轻操作。例如,参考下面的表1以获取关于可以确定、建议和/或实施(例如,手动、自主和/或半自主)。
95.计算机系统140可以将感染可能性的预测和/或确定的(一个或多个)减轻操作传输到用户设备110(步骤i)。用户设备110可以输出(一个或多个)预测和/或减轻操作,以呈现给相关用户(步骤j)。例如,用户设备110可以是具有显示屏的移动电话、计算机、膝上型计算机和/或平板电脑。(一个或多个)预测和/或减轻操作可以在图形用户界面(gui)的显示屏上呈现。相关用户可以查看此类信息并响应于查看信息而执行操作。例如,相关用户可以选择所呈现的(一个或多个)减轻操作中的一个或多个来执行。
96.用户设备110和/或计算机系统140然后可选地执行减轻操作(步骤k)。在一些实施方式中,相关用户可以选择要在用户设备110处执行的减轻操作。这个选择的通知可以被传输回计算机系统140。然后计算机系统可以向一个或多个机器人设备发送通知和指令以执行用户选择的减轻操作。在一些实施方式中,用户设备110可以在应当执行减轻操作时向一个或多个机器人设备传输指令。有时,指令可以被传输到一个或多个其它用户设备,通知此类设备的用户他们应当执行一个或多个减轻操作。但是在一些实施方式中,用户设备110和/或计算机系统140可以在步骤k中执行减轻操作而无需在用户设备110处接收来自相关用户的选择和/或批准。
97.表1:使用来自以下一个或多个基因类别(带有示例基因)的收获前生物标志物值和基于这些值的潜在结果动作的组合可以获得的信息或警报。
98.99.100.101.102.[0103][0104]
表1中的示例基因类别包括pal:苯丙素氨裂解酶;chs:查尔酮合酶;per:过氧化物酶;hsps:热休克蛋白;wrkys:wrky转录因子;nacs:nac转录因子;erfs:乙烯响应因子;etrs:乙烯转录因子;eins:乙烯不敏感蛋白;aba:脱落酸;nced:9-顺式-环氧类胡萝卜素双氧;zep:玉米黄质环氧酶;abi:脱落酸不敏感转录因子;jmt:茉莉酸甲基转移酶;samt:水杨酸甲基转移酶;以及pin:pin形成的蛋白质。一个或多个其它基因类别也可以与所公开的技术一起使用。
[0105]
图3是用于训练一个或多个模型以预测植物中感染的可能性的概念图。可以使用多种技术中的任何一种来训练模型,例如,包括本文档中描述的任何技术以及通过引用整体并入本文并由一位或多位相同的发明人提交的prediction of infection in plant products,国际公开号wo 2021/092251 a1中描述的任何技术。
[0106]
虽然一个或多个模型的训练被示为由计算机系统140执行,但是训练也可以由一个或多个其它计算机系统、设备、网络、基于云的系统和/或基于云的服务执行。
[0107]
参考图3,计算机系统140可以从一个或多个源接收训练数据302(步骤a)。训练数据302(或其部分)可以从相关用户的用户设备、挥发物收集设备、机器人设备、nir设备、一个或多个其它计算设备和/或一个或多个数据存储库接收。在一些实施方式中,计算机系统140可以选择一种或多种类型的训练数据302来接收。
[0108]
训练数据302可以包括非侵入性测量304、侵入性测量306、已知植物信息308和阳性感染标识310中的一个或多个。非侵入性测量304可以用诸如nir设备、电子鼻和其它挥发物收集设备之类的设备来收集。非侵入性测量304可以包括例如指示植物的挥发物组成的数据,因为它们被植物脱气。可以对田地(例如,农场)中植物上的植物产品进行非侵入性测量304。因此,植物产品可能不会从植物中去除。在一些实施方式中,非侵入性测量304可以在植物产品从植物中被移除/采摘并且用于在实验室或其它分析环境中进行进一步分析时
进行。非侵入性测量304还可以包括正在分析的植物产品的核酸样本。
[0109]
侵入性测量306可以用诸如针入度计和硬度计之类的设备来收集。相关用户可以收集仍然是植物的一部分的植物产品和/或从植物中移除并用于进一步分析的植物产品的侵入性测量306。例如,相关用户可以从植物(例如,树)中取出一定数量的植物产品(例如,果实),并将该数量的植物产品带回实验室或其它分析环境。在实验室中,相关用户可以通过例如挤压植物产品来识别硬度测量、去除植物产品的某些部分的皮肤、通过刺穿植物产品来测量皮肤的厚度来获取植物产品的测量结果等。侵入性测量可以被用于确定干物质百分比、脂肪酸、糖含量/概况和/或酸含量/概况。而且,此类信息可以使用各种其它类型的分析方法来确定,包括但不限于挥发性分析和代谢组学。
[0110]
已知植物信息308可以包括关于特定植物的历史生长信息,诸如生长季节的长度和支持特定植物生长、成熟和/或催熟的环境条件。环境条件可以包括降水水平、日照量和/或特定植物生长、成熟和催熟的优选温度。
[0111]
阳性感染标识310可以指示特定植物已被识别为具有潜伏感染或以其它方式发展潜伏感染的情况。例如,标识310可以指示生物标志物的什么水平或表达与特定植物的一种或多种类型的潜伏感染正相关。这些关联可以由相关用户进行。这些关联也可以由计算机进行,诸如计算机系统140。阳性感染标识310还可以指示生物标志物的水平或表达、环境条件和关于植物的一个或多个其它信息的组合,这些信息已经与特定植物的一种或多种类型的潜伏感染正相关。
[0112]
一旦计算机系统140接收到训练数据(步骤a),计算机系统140就可以基于预测特征关联训练数据(步骤b)。换句话说,计算机系统140可以在非侵入性测量304、侵入性测量306、已知植物信息308和/或阳性感染标识310之间建立关联。关联可以指示特定植物中潜伏感染的可能性。例如,特定植物产品释放的特定挥发性废气与生长季节异常降水模式和温度的组合可以指示特定植物和类似来源的植物在生长季节收获前发生了潜伏感染。这个信息组合可以与特定植物的阳性感染标识310相关联。
[0113]
如前面所讨论的,训练数据可以根据预测特征进行关联。预测特征可以包括但不限于植物类型、生长区域、生长阶段、催熟条件、催熟阶段、环境条件等。预测特征因此可以表示在生长、成熟和/或催熟期间可能影响潜伏感染的发展的特定植物和类似来源的植物的不同特征。在一些实施方式中,可以为每个预测特征生成模型。例如,可以生成一个基于鳄梨的种植地点预测鳄梨的潜伏感染的模型。作为另一个示例,可以生成另一个基于由特定类型的鳄梨在生长阶段预测这样的鳄梨中的潜伏感染(例如,特定类型的潜伏感染,诸如ser,或任何类型的潜伏感染)的模型。还可以生成另一个基于收集植物基因表达的收获前时间预测特定类型农产品的潜伏感染的模型。例如,一种模型可以用于预测鳄梨在生长0-3个月期间的潜伏感染,另一种模型可以被用于预测鳄梨自生长开始后3-6个月的潜伏感染。这可以是有益的,因为基因表达可以根据植物产品的年龄而变化,因此可以基于是否在0-3个月的生长期间和3-6个月的生长期间收集和分析基因表达来提供不同的潜伏感染指示。一个或多个其它时间间隔可以用于生成模型。
[0114]
在一些实施方式中,可以组合预测特征中的一个或多个来生成模型。例如,可以生成一个基于鳄梨释放的挥发物和环境条件的组合来预测鳄梨的潜伏感染的模型。作为另一个示例,可以生成另一个基于环境条件(例如,温度、降水)、酸橙的生长阶段和生长区域的
组合来预测这种酸橙中的潜伏感染的模型。预测特征的一种或多种其它组合也是可能的。作为另一个示例,可以生成基于相应的植物类型、生长区域、排放的挥发物和环境条件来预测不同类型植物中的潜伏感染的模型。因此,同一模型可以被用于预测不同植物中的潜伏感染,包括但不限于鳄梨、酸橙、柠檬、苹果、柑橘类果实等。
[0115]
在另外一些实施方式中,可以针对每个生长区域生成模型。然后可以根据年龄、生长阶段、环境条件和其它信息为每个区域生成其它模型。因此,可以在模型内开发模型,以便在收获时间之前的早期更准确地预测植物中的潜伏感染。因此,可以在收获前足够早地确定和实现减轻措施,以减少或以其它方式消除收获期的基于植物的废物。
[0116]
计算机系统140可以训练(一个或多个)模型以使用相关数据预测感染的可能性(步骤c)。例如,相关数据可以作为输入提供给模型。(一个或多个)模型可以生成作为值的输出,该值指示与输入的相关数据相关联的特定植物感染的可能性。计算机系统140可以将(一个或多个)模型的输出与阳性感染标识310进行比较,以进一步细化和提高由(一个或多个)模型做出的预测确定的准确性。一旦达到期望的准确度水平,计算机系统140就可以输出(一个或多个)模型(步骤d)。随着(一个或多个)模型在运行时期间部署和使用,计算机系统140还可以在反馈循环中持续改进(一个或多个)模型。
[0117]
总的来说,植物产品中的一些生物标志物可以决定在运行时期间生成和/或使用哪些模型。在不同生长季节的不同年龄收集的生物标志物可以被用于核实模型预测收获前潜伏感染发展可能性的准确性。激素、基因表达、干物质(例如,含油量、成熟度)等的侵入性和/或非侵入性收集也可以被用于确定在运行时期间生成和/或使用什么模型。
[0118]
可以训练(一个或多个)模型以生成指示特定植物和/或类似来源的植物是否将发展或当前正在发展特定类型的潜伏感染或任何类型的潜伏感染的可能性的输出。在一些实施方式中,还可以训练(一个或多个)模型以确定相关用户可以采取的防止预测的潜伏感染的发展的一种或多种减轻操作。例如,可以训练(一个或多个)模型以从通常由相关用户执行的已知减轻操作的存储库中选择一个或多个减轻操作。可以训练(一个或多个)模型以选择最优的减轻操作,以减少或防止收获时的植物性废物。这可以节省相关用户的时间,因为这样相关用户就不必考虑在特定情况下可能更喜欢哪种类型的减轻操作。代替地,相关用户可以查看建议的减轻操作,选择一个或多个,并手动或半自动地实施此类减轻操作。
[0119]
在一些实施方式中,可以使用基于分类的层次聚类分析来构建(一个或多个)模型。例如,k均值聚类技术可以被用于构建和训练(一个或多个)模型。聚类分析可以是有益的,因为基因表达可以有相似的趋势,因此为分析和预测确定提供更清晰的聚类。因此,这些模型可以更准确地预测感染的发展。一种或多种其它技术也可以被用于构建和/或训练(一个或多个)模型,包括但不限于随机森林建模。决策树也可以被用于关联/关联基因表达数据、植物信息和其它侵入性和/或非侵入性植物测量/数据。因此,本文描述并通过引用并入的任何技术都可以被用于训练(一个或多个)模型以将非侵入性测量304与侵入性测量306相关联以确定收获前感染的发展。在一些实施方式中,(一个或多个)模型的训练和使用可能不要求侵入性测量306,而是代替地可以依赖于使用非侵入性测量304(诸如挥发性成分、基因表达和其它生物标志物)对收获前潜伏感染发展的预测。
[0120]
图4是用于预测植物感染可能性的处理400的流程图。处理400可以被用于预测特定植物和/或类似来源的植物中潜伏感染的发展。这种预测可以在收获前进行,有时在收获
前6个月进行。处理400也可以在收获植物和/或类似来源的植物之前的任何其它时间进行,使得可以在收获之前充分地进行减轻操作以减少或防止基于植物的废物。
[0121]
处理400可以由贯穿本公开(例如,参考图1a、5)描绘和描述的计算机系统140执行。处理400和/或处理400的一个或多个块可以由其它计算系统、设备、计算机/设备网络、基于云的系统和/或基于云的服务来执行。为了说明的目的,从计算机系统的角度来描述处理400。
[0122]
参考图4中的处理400,在402中计算机系统可以接收植物数据。有关接收植物数据的进一步讨论,参考图1-2。在404中,计算机系统可以基于植物数据识别植物的预测特征。换句话说,对植物数据的分析会导致识别一种或多种特征,这些特征可以被用于选择适档的模型来预测对应植物中感染的可能性。预测特征可以包括但不限于植物类型、生长阶段、地理区域/位置、土壤类型、年龄、激素、基因表达、干物质和环境条件。如本文所述,不同的预测模型可以被用于每种植物类型、生长阶段、地理区域/位置、土壤类型、年龄、激素、基因表达、干物质和/或环境条件。通过识别基于植物数据的预测特征,计算机系统因此可以确定有多少预测模型和哪些预测模型适合于预测相应植物中的潜伏感染。有时,从植物数据中识别出的地理区域/位置特征可以被用于选择被训练为预测那个地理区域/位的置植物中的潜伏感染的模型的子集。环境条件或也基于植物数据识别出的一个或多个其它预测特征然后可以被用于从基于地理区域/位置特征选择的模型的子集中选择一个或多个模型。因而,计算机系统可以在406中基于预测特征来识别一个或多个模型来应用。
[0123]
在408,计算机系统可以检索识别出的(一个或多个)模型。然后在410中计算机系统可以将(一个或多个)模型应用于植物数据。植物数据可以作为输入提供给(一个或多个)模型。植物数据的一个或多个不同部分可以输入到(一个或多个)模型中的每个模型中。例如,一个模型可以接收环境条件数据作为输入以预测潜伏感染的可能性和/或特定类型的潜伏感染的可能性。另一个模型可以从植物数据中接收植物基因表达、挥发性成分和/或硬度测量值作为输入以预测潜伏感染的可能性和/或特定类型的潜伏感染的可能性。另一种模型可以接收不同输入的组合,诸如环境条件和基因表达,以预测植物中潜伏感染的可能性。可以训练模型以接收一个或多个其它输入和/或输入的组合。
[0124]
在412中计算机系统可以基于(一个或多个)模型对植物数据的应用来确定植物的收获前质量。例如,计算机系统可以确定来自一个或多个模型的单独和/或组合的输出是否超过某个预定阈值范围或值。如果输出超过预定阈值范围或值,那么计算机系统可以确定植物即将发生潜伏感染和/或将发生潜伏感染。另一方面,如果输出没有超过预定阈值范围或值,那么计算机系统可以确定基于植物和/或环境的当前状况植物没有任何潜伏感染和/或不太可能发展为感染。
[0125]
作为另一个示例,计算机系统可以对来自所应用的模型的输出求平均,并确定求平均的输出是否超过预定阈值范围或值。计算机系统还可以识别模型的平均输出。在一些实施方式中,计算机系统可以执行多数表决裁决并识别针对大多数应用模型类似地表达的输出。然后计算机系统可以采用那个输出作为412中植物的收获前质量。而且,在412中,计算机系统可以确定类似来源植物的收获前质量。类似来源的植物可以是与在402中接收植物数据的植物相同的树木、地带和/或农场或其它生长区域域的区域的一部分。在一些实施方式中,类似来源的植物也可以位于另一个生长区域,但可能经历与其植物数据在402中被
接收的植物相似的环境条件、土壤和/或其它预测特征。
[0126]
在414中,计算机系统可以生成关于确定的植物收获前质量的输出。计算机系统还可以存储所确定的植物的收获前质量。计算机系统可以将输出传输到用户设备以呈现给相关用户,诸如农民或供应链中的其他用户。输出可以指示植物的收获前质量和/或直到植物被收获之前植物的可能质量。输出还可以指示类似来源植物的收获前质量。计算机系统还可以建议为了减轻收获前潜伏感染的发展而可以执行的一个或多个操作。可选地,计算机系统可以自动执行一个或多个减轻操作。建议和/或执行的减轻操作可以包括上面表1中列出的任何操作。还可以建议和/或执行一个或多个其它减轻操作。
[0127]
图5是可以被用于执行本文描述的技术的一个或多个组件的系统图。如本文所述,计算机系统140、(一个或多个)用户设备110a-n、植物数据存储230和模型数据存储库240可以经由(一个或多个)网络150进行通信。(一个或多个)收集设备500也可以经由(一个或多个)网络150与本文所述的组件进行通信。(一个或多个)收集设备500可以包括本文描述的任何收集设备,特别是参考图1a,包括但不限于用户105的手持采样器、采样器机器人设备120、收获器机器人设备160、162、164、电子鼻/嗅探器,和/或其它可以从植物和植物产品中收集样本的自动化机器人设备。
[0128]
计算机系统140可以包括模型训练模块502、数据处理引擎504、潜伏感染预测引擎153、潜伏感染检测模块154、减轻引擎155、输出生成器506和通信接口508。计算机系统140可以可选地包括一个或多个可以用于执行贯穿本公开描述的技术的附加的、更少的或不同的组件。
[0129]
模型训练引擎502可以被配置为训练预测模型510a-n。引擎502可以接收训练数据,其可以存储在植物数据存储库230和/或模型数据存储库240中。引擎502可以使用训练数据来训练(一个或多个)预测模型510a-n以预测收获前植物中的潜伏感染发展。引擎502可以训练基于生长区域、植物类型、植物生长阶段和/或环境条件的预测模型510a-n。引擎502还可以训练一个或多个附加的、更少的或不同的预测模型510a-n,如贯穿本公开所描述的。而且,引擎502可以训练模型内的模型。引擎502还可以使用在运行时期间做出的预测确定来连续地训练和/或验证预测模型510a-n。由引擎502生成和训练的模型可以作为预测模型510a-n存储在模型数据存储库240中。
[0130]
数据处理引擎504可以被配置为处理从收集设备500接收的植物数据,如贯穿本公开所描述的。在一些实施方式中,由收集设备500收集的植物数据可以作为植物信息512a-n存储在植物数据存储库230中。引擎504然后可以从植物数据存储库230检索植物信息512a-n并且如本文所述处理该信息。植物信息512a-n可以包括但不限于(一个或多个)感染预测、生长区域、环境条件、群体阶段、非侵入性测量、侵入性测量、田地、农场或其它生长位置中的生长地带,和/或读取的序列数据。
[0131]
生物标志物表达引擎151可以被配置为执行图1a中描述的技术。输入生成引擎152还可以被配置为执行图1a中描述的技术。
[0132]
潜伏感染预测引擎153可以被配置为预测植物和/或类似来源的植物正在发展、发展和/或可能在收获前发展潜伏感染的可能性。有关潜伏感染预测引擎153的进一步讨论,参考图1a。简而言之,潜伏感染预测引擎153可以从(一个或多个)收集设备500、植物数据存储器230和/或数据处理引擎504接收植物数据。使用植物数据,潜伏感染预测引擎153可以
从模型数据存储库240中选择一个或多个预测模型510a-n以应用于植物数据。基于应用所选择的模型510a-n,潜伏感染预测引擎153可以预测植物在收获前发生、可能发生和/或已经发生潜伏感染的可能性。潜伏感染预测引擎153可以将这个预测存储在植物数据存储库230中作为植物信息512a-n的一部分。
[0133]
如参考图1a所述,潜伏感染检测模块154可以被配置为确定可以响应于收获前潜伏感染的预测可能性而执行的一项或多项减轻措施。有关潜伏感染检测模块154的进一步讨论,参考图1a。
[0134]
减轻引擎155可以被配置为确定是否可以和/或应当执行一个或多个操作以在收获前减轻植物和/或类似来源的植物中潜伏感染的潜伏发展。引擎155还可以确定要执行的减轻操作的一个或多个建议。引擎155可以从潜伏感染预测引擎153接收预测(或从植物数据存储230中的植物信息512a-n检索预测)以确定一个或多个减轻操作。在一些实施方式中,减轻引擎155可以在(一个或多个)用户设备110a-n处的用户批准或不批准的情况下可选地执行一个或多个减轻操作。例如,在植物和/或类似来源的植物已经发生潜伏感染并且很可能在收获时继续发生感染以达到基于植物的废物的程度的情况下,减轻引擎155可以自动实现一项或多项减轻措施,以尝试减少感染的持续发展。
[0135]
输出生成器506可以被配置为生成用于在用户设备110a-n处呈现的输出。输出生成器506可以从潜伏感染预测引擎153接收(一个或多个)预测确定和/或从减轻引擎155接收减轻操作。使用这个信息,输出生成器506可以生成输出,诸如消息、通知、警告和/或警报。生成的输出例如可以包括指示植物和/或类似来源的植物中潜伏感染的预测可能性的值。生成的输出还可以包括可以被选择和执行(例如,手动和/或自动)的一个或多个减轻操作。输出还可以包括如本文所述的一个或多个其它消息、通知、警报和/或警告。输出生成器506可以将输出传输到用户设备110a-n以呈现给(一个或多个)用户。输出生成器506还可以将输出传输到植物数据存储库230以存储在植物信息512a-n中。
[0136]
最后,通信接口508可以提供本文描述的一个或多个组件之间的通信。
[0137]
用户设备110a-n可以包括相关用户可以使用的计算机、膝上型计算机、平板电脑、移动设备、智能电话、电话等中的任何一种或多种。用户设备110a-n可以包括(一个或多个)输入设备、(一个或多个)输出设备、(一个或多个)处理器和通信接口。此类组件可以允许用户向计算机系统140提供信息,查看和/或访问来自本文描述的组件中的一个或多个组件的信息,和/或基于本文提供的信息采取行动。
[0138]
图6a-c描绘了用于收集植物的数据以与公开的技术一起使用的示例处理600。图6-10提供了所公开的技术如何可以应用于一种类型的植物的说明性示例。图6-10仅仅是说明性的,并不限制所公开的技术对其它类型的植物的应用,包括但不限于其它多年生果树(例如,芒果树、柑橘树、梨树、苹果树和核果树)、藤本植物(例如,葡萄藤)和灌木丛(例如,黑莓、覆盆子和/或草莓丛)。
[0139]
参考图6-10,鳄梨树(persea americana)可以是一种长寿的多年生植物,可以在数十年内大量生产其非常期望的果实作物。在鳄梨树的整个生命周期中,它可以不断地与微生物种群交互并做出反应。虽然这些微生物关系中有许多可以是共生的或相互的,但也存在许多鳄梨树和/或果实寄生的示例,它们会造成树木健康、果实产量和果实质量的严重损失。茎端腐烂(ser)可以是鳄梨果实常见的质量缺陷,这是由于随着果实在收获后成熟,
寄生虫侵入靠近茎端的鳄梨果实果肉而造成的。导致这种疾病的真菌可以在收获和成熟之前以生物养分的方式生活在果实的花梗中,通常不会对果实或树木造成疾病症状。
[0140]
因此,所公开的技术可以被用于将早季、中季和晚季鳄梨果实的物理和分子属性与收获和成熟时ser的低或高发生率相关联。使用rna-seq,可以生成表达剖面,这可以说明,在收获高峰期成熟之前的所有时间点,来自高ser发生率的树木的果实可以通过增加典型的相关基因表达来识别和响应增加的真菌压力病原体反应途径。充分利用这信息进行检测测定的生产可以启用对高发病率和低发病率的树木的预测,并有足够的时间对杀菌剂应用、果实收获时间表或果实市场目的地进行修改,以减轻鳄梨中ser或其它潜伏感染的表现。
[0141]
在处理600中,602是可以被采样的鳄梨树的鸟瞰图(例如,参考图6a)。热图604表示每棵树在每个收集时间点的平均ser发生率(例如,参考图6b)。在热图604的每个方框中图示了每个时间点每棵树的发生率的值。而且,空白方框指示由于果实量少或正在进行的树木管理/修剪,特定树木在时间点无法进行采样。图像数据606表示t1(开花后330天,daf)与t3(520daf)发生率低(c2)与高(c1)的树木之间的差异(例如,参见图6c)。
[0142]
鳄梨果实可以从农场或其它生长区域的树上收集。如图6a中的鸟瞰图602中所示,样本是从位于农场第7区的13棵树收集的。可以在整个生长季节周期性地收集果实。所有果实都可以通过用不锈钢剪刀轻轻剪下果实来收集,这些剪刀在整个收获过程中经常用70%etoh喷雾消毒,留下~2-4cm的花梗。在示例处理600中,在每个收集时间点,可以从每棵树收获30个果实并用板条箱运输到研究中心(具有近似15分钟的运输时间)。从这些树上总共可以收集到1,050个果实。收获日期的气候数据也可以从数据存储库中检索,如图7a中的曲线图702和704所示。在示例处理600中分析的时间点可以来自~330daf、~430daf和~520daf。
[0143]
在到达研究中心后,可以将果实放在生产平台上,并使其与环境温度平衡过夜。在收获之后近似24小时,可以单独测量所有样本的果实质量(g)和呼吸速率(ml co2/kg-hr)(每个时间点每棵树n=30)。可以通过将果实密封在配备co2传感器的定制气密豆荚中4分钟,每5秒测量一次co2浓度来测量果实呼吸。每种果实的干物质百分比可以使用手持式近红外光谱仪和自定义干物质预测算法来确定。也可以拍摄果实的外部质量图像。在这一点上,果实的一个子集(每个时间点每棵树n=4)也可以被破坏性地采样用于rna提取,而果实的其余部分(n=24)可以在环境条件下成熟。果实达到50度(shore)(用手持式硬度计测量)所需的时间长度(以天为单位)可视为成熟时间。当达到50岸时,果实可以切成两半,检查质量缺陷(包括ser)并成像,如图像数据606所示。
[0144]
在所有收集结束时,可以确定每个时间点单个树中成熟果实中ser的发生率。在整个季节结出ser发生率显著增加的果实的树木可被指定为“高发生率”,而结出具有低ser发生率的果实的树木可以被选为对照或“低发生率”以进行比较。可以选择三个“高发生率”(a1、c1和d1)和三个“低发生率”(a4、c2和d2)树进行深入的转录组学分析。参考图6b中的热图604。
[0145]
如前面所提到的,在每个时间点,可以在收获之后24小时通过切割果实的横截面(可以包括种子、内果皮、中果皮和外果皮)并在液氮下研磨成细粉来对每棵树的4个果实进行破坏性采样。这些横截面可以包括果皮、果肉和种子。样本可以储存在-80℃直到用于rna
提取。
[0146]
然后可以使用十六烷基三甲基溴化铵(ctab)基于缓冲液的提取方案和珠子清理,从在每个时间点收集的“高发生率”和“低发生率”树的每个样本中提取rna。然后可以按时间点准备和汇集rnaseq文库以进行测序。在一些实施方式中,库可以以75个周期(高输出)运行。可以评估文件质量并将其与特定鳄梨的参考基因组对齐。还可以执行bam文件生成和索引。
[0147]
序列读数也可以指派给基因组特征。可以为每个时间点单独准备读取计数表。可以在每个时间点确定高发生率树与和低发生率树之间的差异表达。可以针对低计数(仅保留计数大于10的基因)和p值小于0.05的差异表达基因进行过滤。
[0148]
主成分分析也可以在变换后的归一化的deseq矩阵上执行和可视化。在准备热图可视化时,每个时间点顶部调节、上调和下调基因的倍数变化值矩阵(针对p值《0.05)可以归一化为样本中每个基因的值。r函数hclust可以用于通过每个时间点内的表达模式对基因进行聚类(使用方法=完成)。在一些实施方式中可以使用r函数pheatmap来可视化各个样本如何基于基因表达模式进行聚类。
[0149]
可以通过随着时间的推移的表达趋势对差异表达的基因进行聚类并进行可视化。这些函数可以计算在一定条件下和一段时间内跨样本的基因相似性。相对基因表达可以被归一化为z分数,其中值可以以平均值为中心并缩放到每个基因的标准偏差。在一些实施方式中,针对随着时间的推移的变化趋势分析的基因可以限于p值《0.05的前500个上调差异表达基因和前500个下调差异表达基因。检查的基因簇可以限于基因计数》20的基因簇。
[0150]
可以使用每个鳄梨转录物的拟南芥(arabidopsis)中预先确定的同源基因,按时间点或表达簇对最受差异调节的鳄梨基因列表进行基因本体论分析。这些列表可以被用作富集分析工具的输入,该工具可以将提供的基因列表映射到已知的功能信息源,从而检测具有统计学意义的富集的生物处理、途径、调节基序和蛋白质复合物。可以确定并输出(例如,报告)每个富集分类的调整后的富集p值。
[0151]
总体而言,图6a-c展示了采样树的位置(例如,区域)以及在每个时间点从每棵树收集的果实中ser的发生率百分比。在第一个收集日期,330daf,没有观察到ser。在接下来的两个系列中,ser发生率平均增加,并且在树a1、c1和d1的果实中增加最显著。来自这些树的样本可以相应地指派给“高发生率”组。附近的树在集合a4、c2和d2中具有最小甚至没有ser,可以指派给“低发生率”组作为对照比较。
[0152]
图7a-b描绘了可以在不同时间被收集的图6的植物的示例物理属性的图形描绘。图7a中的曲线图702是本文描述的整个果实收集过程中最高和最低温度的图表,采样时间点标记为1、2和3。图7a中的曲线图704是在本文所述果实的整个收集过程中测量的降水图,采样时间点标记为1、2和3。图7b中的曲线图706描绘了在330daf、430daf和520daf下收集的每个果实的平均初始呼吸。图7b中的曲线图708描绘了在每个时间点从所选择的高ser发生率树和低ser发生率树收集的果实的平均质量,标准偏差绘制为误差条。
[0153]
参考图7a-b两者,收获之后24小时的呼吸率对于所有树的果实在2月的第一个时间点可以是最高的,330daf(例如,参考图7b中的曲线图706)。这可以归因于平均温度在年初较低(例如,参考图7a中的曲线图702)和/或当时果实的发育阶段,因为快速生长和/或细胞分裂可能需要增加新陈代谢以及因此增加呼吸。在ser高发生率与低发生率的树木之间,
平均干物质或呼吸率可能没有观察到显著差异,但是在单个果实的平均质量和ser发生率百分比之间可以观察到趋势。随着开花后天数的增加,果实质量也会增加(例如,参考图7b中的曲线图708),但是,来自高发生率ser组的果实的平均果实质量可以始终较高。这种趋势在第三次收集(520daf)时最为显著,其中a1、c1和d1的平均果实质量大于250g,而a4、c2和d2的平均果实质量均小于200g(例如,参考图7b中的曲线图708)。
[0154]
图8a-c描绘了跨越图6a-c的植物的所有数据收集时间的归一化的基因表达的主成分分析(pca)的双标图。特别地,双标图800描绘了来自低ser发生率组和高ser发生率组的330daf基因表达数据的pca的前两个主要成分。双标图802描绘了来自低ser发生率组和高ser发生率组的430daf基因表达数据的pca的前两个主要成分。双标图804描绘了来自低ser发生率组和高ser发生率组的520daf基因表达数据的pca的前两个主要成分。
[0155]
参考图8a-c中的双标图800-804,在所有三个测序运行中,每个样本可以获得5-6百万个读数,其中识别出的读数百分比(%pf)和qscore百分比》30(%》=q30)超过分别90%和95%。在与persea americana cv.hass基因组对齐后,平均81.4、80.8和80.9%的读数可以被成功指派给分别用于t1(330daf)、t2(430daf)和t3(520daf)数据集的基因组注释区域。
[0156]
使用配对图对所有时间点的归一化的表达的pca进行可视化可以说明pca的最强分离发生在时间点之间,特别是在pc1
–
pc2中。pc3和pc4中的低ser组和高ser组可能会有一些细微的分离。但是,当在每个单独的时间点内执行pca并使用双标图可视化时,可以在pc1和pc2上观察到低ser样本和高ser样本之间稍微更明确的分离,如图8a-c中所示。这种分离在520daf的最新时间点处显得最为明显。
[0157]
图9a-c描绘了图6a-c的植物的归一化的基因表达的火山图。图9a中的火山图900示出在330daf时低发生率树组与高发生率树组之间的差异基因表达,图9b中的火山图902示出在430daf时低发生率树组与高发生率树组之间的差异基因表达,而图9c中的火山图904示出在520daf时低发生率树组与高发生率树组之间的差异基因表达。因此,图900-904描绘了归一化的基因表达(log2倍改变)与统计显著性(-log
10
p)的关系。在图900-904中的每个图中,差异表达的基因具有log2倍改变》|2|和p值《0.05落入构图的象限。这些象限中的数字表示满足这些条件的基因的数量。因此,在图9a中,7个基因满足第一象限的条件,并且11个基因满足第二象限的条件,在图9b中,分别有25个基因和12个基因,而在图9c中,分别有8个基因和22个基因。
[0158]
参考图9a-c,在所有三个时间点,将高发生率树组(a1、c1和d1)与低发生率树组(a4、c2和d2)进行比较可以示出基因表达中的差异。在t1,在高发生率树中,863个基因可以上调(4%的基因被识别),并且963个可以被下调(4.4%的基因被识别)。在t2,在高发生率树中,1012个基因可以被上调(4.8%的基因被识别)并且786个可以被下调(3.7%的基因被识别)。在t3,在高发生率树中,234个基因可以被上调(1%的基因被识别),并且166个可以被下调(0.08%的基因被识别)。当这些deg被过滤为《0.05的p值和《-2或》2的倍数改变时,t1、t2和t3中高发生率树中的上调和下调基因可以分别是11上和7下,12上和25下,以及22上和8下。
[0159]
在一些实施方式中,每个时间点前30个上调和下调基因的热图可视化(未描绘)(在按倍数改变排序之前针对《0.05的p值进行预过滤)可以示出来自被标记为高发生率的
树的各个果实表达模式聚集在一起。这可以表明,早在2月的第一个时间点、330daf和晚季收获前6个月,就可以基于这些基因在果实中的基因表达模式将这些树指定为高或低发生率。值得注意的是,这些基因在三个时间点上可以几乎没有重叠。在这三个组中只有4个基因可以被保存:maker-ctg1243-augustus-gene-0.16-mrna-1、maker-ctg0870-augustus-gene-0.10-mrna-1、augustus_masked-ctg0285-processed-gene-0.0-mrna-1和maker-ctg0255-augustus-gene-4.16-mrna-1。可以通过blast分析来识别这些基因中每一个的预测的最接近番茄(s.lycopersicum)和拟南芥(a.thaliana)同系物。这些结果可以表明,在树上果实发育的整个阶段,转录组水平对潜伏真菌发病机制的反应都会发生改变。
[0160]
每个时间点前30个上调和下调基因的统计富集分析可以使用拟南芥同源物列表作为输入。可以针对p值小于或等于0.05且错误发现率(fdr)小于1的基因本体项过滤结果。在图6a-c的示例中,可以有20、35和79个基因本体项分别满足t1、t2和t3时间点的这些标准。这个分析可以提供对这个转录物子集中最显著表示的生物处理、分子功能和细胞成分分类的高级洞察,这些子集可以在低ser树与高ser树之间表现出强烈的差异。
[0161]
如从前30个上调和下调基因组的时间点之间特定基因的有限重叠所预期的那样,最重要的基因本体分类之间可以存在有限的重叠,t1和t2包含的重叠比t3的任何一个时间点都多。例如,t1和t2重要的go数据集都可以包含生物处理项对其它生物体的反应(go:0051707)和反应外部生物刺激(go:0043207)以及细胞成分项细胞外周(go:0071944)和分子功能项转运蛋白活性(go:0005215),而这些项中没有一个会与t3重叠。除了这些项之外,t2还可以具有与氧化还原酶活性(go:0016491)、氧化应激反应(go:0006979)、植物器官发育(go:0099402)、渗透压反应(go:0006970)相关的其它项,对其它生物体的防御反应(go:0098542),以及t1数据集中可能不存在的芳香族化合物生物合成过程(go:0019438)。t3重要go列表还可以包含项氧化还原酶活性(go:0016491)和芳香族化合物生物合成处理(go:0019438),以及与植物器官发育相关的项(go:0099402),例如胚后发育(go:0009791)和可以与t2重叠的生殖结构发育(go:0048608)。在很大程度上,t3可能不会与t1或t2重叠。代替地,t3 go列表可以包含与激素信号相关的项,包括对激素的反应(go:0009725)、细胞对激素刺激的反应(go:0032870)和激素介导的信号通路(go:0009755)。此外,t3数据集可以包含许多与转录调控相关的go项,这些项没有出现在t1或t2数据集中。这些包括但不限于转录(go:0006351)、转录调控(go:0006355)、dna结合(go:0003677)、rna生物合成处理(go:0032774)和rna生物合成处理的调节(go:2001141)。
[0162]
图10a-d描绘了对于图6a-c的植物具有强烈时间和条件趋势的所选择的基因簇随着时间的推移的归一化的基因表达。参考所有图10a-d,x轴上的数字1、2和3指示在330daf、430daf和520daf的每个采样时间点。可以使用已知的计算技术根据随着时间的推移的表达趋势对差异表达的基因进行聚类并使其可视化。此类种技术可以计算在一定条件下和随着时间的推移的跨样本的基因相似性。相对表达可以被归一化为z分数,其中值可以以平均值为中心并缩放到每个基因的标准偏差。随着时间的推移的分析趋势的基因可以限制在p值《0.05的前500个上调和前500个下调的差异表达基因。可视化的基因簇可以被限制为带基因计数》20的基因簇。16个基因簇满足这些准则,如图10a-d中所示。g:gost可以被用于使用与分类到每个簇中的p.americana基因是同系物的拟南芥的列表执行统计富集分析。表2中示出了每个组的顶级go类别的摘要。
[0163]
表2:图10a-d中绘制的每个基因组的最重要的生物过程、分子功能和细胞成分基因本体论(go)项
[0164]
[0165]
[0166]
[0167][0168]
值得注意的是,如图10a-d和表2中所示,可以有几个组随着时间的推移呈现出增加的趋势并且在高感染率树的果实中具有更高的相对基因量(组9、组11、组12和组18)。可以检查这些组的基因和go注释以了解植物病原体反应的途径特征,并且可以发现组11具有大量与这些途径相关的项。例如,组11中p值远小于0.05的一些顶级生物过程go类别可以是对刺激的反应(go:0050896)、对化学物质的反应(go:0042221)和对其它生物体的反应(go:0051707),这些类别的基因示例包括但不限于在图10a-d中绘制的预测的内切壳多糖酶4(maker-ctg0022-augustus-gene-3.7)、发病相关蛋白pr1前体(augustus_masked-ctg0281-processed-gene-0.6),和渗透素样发病机制相关蛋白r(augustus_masked-ctg2009-processed-gene-0.2)。组18还可以包含参与应激反应的go组,诸如活性氧代谢过程(go:0072593)和超氧自由基清除的调节(go:2000121)。此外,组12中参与茉莉酸(go:0009753)反应的基因可能过多,可以确定其参与植物防御信号传导。因此,随着时间的推移,高ser树组与低ser树组之间会存在基因表达的关键差异,这可以归因于特征性病原体反应途径的变化。
[0169]
在许多基因组中,与低ser组(组1、组2和组4)相比,高ser样本表现出表达减少,可能存在参与细胞发育和分化的基因的普遍过度表达。例如,组1中最重要的生物过程go项可以是花器官身份的说明(go:0010093)和植物器官身份的说明(go:0090701),而组4中前两个可以是木质部和韧皮部模式形成(go:0010051)和区域化(go:0003002)。这可以表明具有更多ser的树的果实在发育模式上可能存在差异。此外,组5包含参与苯丙素生物合成过程的基因的高度代表性(go:0009699)。已知苯丙烷化合物参与植物防御。因此,参与苯丙素生物合成的酶的更高表达可以使低ser果实不易受ser感染。而且,苯丙烷途径可以产生木质素生物合成的前体,因此可以与组1、2和4中发育基因表达的差异有关。
[0170]
图6-10表明,差异基因表达分析可以揭示来自按高ser发生率和低ser发生率分组的树木的果实样本中显著不同的上调和下调基因。基于收获成熟期催熟果实中ser症状的表现,这些树可以被分类为高ser发生率组或低ser发生率组。可以观察到,当在前两个时间点收获较低成熟度的果实(干物质少于30%)并允许催熟时,可能很少或没有ser表现出来,而在最后一个时间点较成熟的果实会显著发展ser的水平。这种趋势可以归因于导致最终时间点的平均温度升高。基因表达数据可以表明,即使在出现症状之前的这些早期时间点,高发病率树的果实转录组学景观也存在可测量的差异,这可以促进潜伏感染的收获前预测。
[0171]
而且,如本文关于图6-10所描述的,受感染树木中变化最大的特定基因和过程可以随果实发育的时间过程而变化。这可以通过前30个上调与前30个下调基因之间的最小重叠来说明,这些基因能够将果实表达趋势聚类到预期的高ser组和低ser组中。基因组的分析可以随着时间的推移进行差异调节,这可以进一步证明在采样的三个时间点上基因转录本的相对丰度的动态变化。即便如此,随着时间的推移,对这些分组表达趋势的基因本体分析也可以分离出已知病原体反应基因组,包括渗透蛋白样蛋白和几丁质酶,它们随着时间的推移可以在高ser树组中示出差异表达的一致和/或增加趋势。而且,参与茉莉酸信号和活性氧代谢的基因可以被识别为在早期时间点在高发病率树的果实中上调(例如,参考图10a-d中的组12和组18,表2)。活性氧和茉莉酸信号转导事件可以是部署在宿主针对真菌病原体的早期防御反应中的已知机制。这可能表明,实际上,ser发生率较高的树木的果实在感染症状出现之前很久就对ser真菌病原体的存在表现出增强的反应。
[0172]
即使在发生率高的树木中,收获后ser的平均发生率也可以在c1树中最大观察到17%。每棵树有4个单独的果实样本,这些特定果实成为出现ser症状的个体的可能性低。因此,在所选择的样本中观察到的低发病率树与高发病率树的果实之间的基因表达差异可以被解释为整个树对ser真菌存在的系统反应。
[0173]
此外,随着时间的推移按差异表达分组的基因分析(例如,参见图10a-d,表2)附加地可以表明来自高ser发生率树与低ser发生率树的果实之间的果实发育差异。具体而言,高ser果实可以表现出参与细胞发育和分化的基因组表达减少。高ser组与低ser组之间测得的物理差异可以是三个时间点上收获果实的平均质量略有差异(例如,参考图7b),高ser树生产的果实平均质量更高。
[0174]
图11是可以被用于实现检测潜伏感染的系统的系统组件的框图。计算设备1100旨在表示各种形式的数字计算机,诸如膝上型计算机、台式计算机、工作站、个人数字助理、服务器、刀片服务器、大型机和其它适当的计算机。计算设备1150旨在表示各种形式的移动设备,诸如个人数字助理、蜂窝电话、智能电话和其它类似的计算设备。此外,计算设备1100或1150可以包括通用串行总线(usb)闪存驱动器。usb闪存驱动器可以存储操作系统和其它应用。usb闪存驱动器可以包括输入/输出组件,诸如可以插入另一个计算设备的usb端口的无线发送器或usb连接器。此处所显的组件、它们的连接和关系以及它们的功能仅仅是示例,并不意味着限制本文档中描述和/或要求保护的发明的实施方式。
[0175]
计算设备1100包括处理器1102、存储器1104、存储设备1108、连接到存储器1104和高速扩展端口1110的高速接口1108,以及连接到低速总线1114和存储设备1108的低速接口1112。组件1102、1104、1108、1108、1110和1112中的每一个都使用各种总线互连,并且可以
安装在共用的母板上或以其它适当的方式安装。处理器1102可以处理用于在计算设备1100内执行的指令(包括存储在存储器1104中或存储设备1108上的指令),以在外部输入/输出设备(诸如耦合到高速接口1108的显示器1116)上显示用于gui的图形信息。在其它实施方式中,可以适当地使用多个处理器和/或多个总线,以及多个存储器和多种类型的存储器。而且,可以连接多个计算设备1100,其中每个设备(例如,作为服务器组、刀片式服务器群组或多处理器系统)提供必要操作的一部分。
[0176]
存储器1104存储计算设备1100内的信息。在一种实施方式中,存储器1104是一个或多个易失性存储器单元。在另一种实施方式中,存储器1104是一个或多个非易失性存储器单元。存储器1104也可以是另一种形式的计算机可读介质,诸如磁盘或光盘。
[0177]
存储设备1108能够为计算设备1100提供大容量存储。在一种实施方式中,存储设备1108可以是或包含计算机可读介质,诸如软盘设备、硬盘设备、光盘设备或磁带设备、闪存或其他类似的固态存储器设备、或者包括存储区域网络中的设备或其他配置的设备阵列。计算机程序产品可以有形地实施在信息载体中。计算机程序产品还可以包含在被执行时执行一种或多种方法(诸如上述那些)的指令。信息载体是计算机或机器可读介质,诸如存储器1104、存储设备1108或处理器1102上的存储器。
[0178]
高速控制器1108管理计算设备1100的带宽密集型操作,而低速控制器1112管理较低带宽密集型操作。功能的这种分配只是个示例。在一种实施方式中,高速控制器1108例如通过图形处理器或加速器耦合到存储器1104、显示器1116,并且耦合到可以接受各种扩展卡(未示出)的高速扩展端口1110。在该实施方式中,低速控制器1112耦合到存储设备1108和低速扩展端口1114。可以包括各种通信端口(例如usb、蓝牙、以太网、无线以太网)的低速扩展端口可以耦合到一个或多个输入/输出设备,诸如键盘、指点设备、麦克风/扬声器对、扫描仪或例如通过网络适配器耦合到联网设备(诸如交换机或路由器)。计算设备1100可以以多种不同的形式实现,如图所示。例如,它可以被实现为标准服务器1120,或者在一组这样的服务器中多次实现。它还可以作为机架服务器系统1124的一部分来实现。此外,也可以在诸如膝上型计算机1122之类的个人计算机上实现。
[0179]
可替代地,来自计算设备1100的组件可以与移动设备(未示出)中的其它组件(诸如设备1150)组合。此类设备中的每一个可以包含计算设备1100、1150中的一个或多个,并且整个系统可以由彼此通信的多个计算设备1100、1150组成。
[0180]
计算设备1100可以以多种不同的形式实现,如图所示。例如,它可以被实现为标准服务器1120,或者在一组这样的服务器中多次实现。它还可以作为机架服务器系统1124的一部分来实现。此外,也可以在诸如膝上型计算机1122之类的个人计算机中实现。
[0181]
可替代地,来自计算设备1100的组件可以与移动设备(未示出)中的其它组件(诸如设备1150)组合。此类设备中的每一个可以包含计算设备1100、1150中的一个或多个,并且整个系统可以由彼此通信的多个计算设备1100、1150组成。
[0182]
计算设备1150包括处理器1152、存储器1164和诸如显示器1154的输入/输出设备、通信接口1166和收发器1168,以及其它组件。设备1150还可以设有存储设备,诸如微型驱动器或其它设备,以提供附加的存储。组件1150、1152、1164、1154、1166和1168中的每一个都使用各种总线互连,并且组件中的几个可以安装在共用主板上或适当地以其它方式安装。
[0183]
处理器1152可以在计算设备1150内执行指令,包括存储在存储器1164中的指令。
处理器可以被实现为包括独立的且多个模拟和数字处理器的芯片组。此外,处理器可以使用多种体系架构中的任何一种来实现。例如,处理器1110可以是cisc(复杂指令集计算机)处理器、risc(精简指令集计算机)处理器或misc(最小指令集计算机)处理器。处理器可以提供例如设备1150的其它组件的协调,诸如用户界面的控制、由设备1150运行的应用以及设备1150的无线通信。
[0184]
处理器1152可以通过耦合到显示器1154的控制接口1158和显示接口1156与用户通信。显示器1154可以是例如tft(薄膜晶体管液晶显示器)显示器或oled(organic light emitting diode,有机发光二极管)显示器,或其它合适的显示技术。显示接口1156可以包括用于驱动显示器1154以向用户呈现图形信息和其它信息的适当电路系统。控制接口1158可以从用户接收命令,并将它们转换以提交给处理器1152。此外,外部接口1162可以提供与处理器1152的通信,以便使得设备1150能够与其它设备进行近区域通信。
[0185]
外部接口1162可以例如在一些实施方式中提供有线通信,或者在其它实施方式中提供无线通信,并且也可以使用多个接口。
[0186]
存储器1164存储计算设备1150内的信息。存储器1164可以被实现为一个或多个计算机可读介质、一个或多个易失性存储器单元或一个或多个非易失性存储器单元中的一个或多个。还可以提供扩展存储器1174并通过扩展接口1172连接到设备1150,扩展接口1172可以包括例如simm(单列直插式存储器模块)卡接口。这种扩展存储器1174可以为设备1150提供额外的存储空间,或者也可以为设备1150存储应用或其它信息。具体而言,扩展存储器1174可以包括执行或补充上述处理的指令,并且还可以包括安全信息。因此,例如,扩展存储器1174可以作为设备1150的安全模块提供,并且可以用允许设备1150的安全使用的指令来编程。此外,可以经由simm卡提供安全应用以及附加信息,诸如以不可破解的方式在simm卡上放置识别信息。
[0187]
存储器可以包括例如闪存和/或非易失性随机存取存储器(nvram),如下面所讨论的。在一种实施方式中,计算机程序产品有形地实施在信息载体中。计算机程序产品包含指令,这些指令在被执行时执行一种或多种方法,诸如上面描述的方法。信息载体是计算机或机器可读介质,诸如可以例如通过收发器1168或外部接口1162接收的存储器1164、扩展存储器1174或处理器1152上的存储器。
[0188]
设备1150可以通过通信接口1166进行无线通信,通信接口1166可以在必要时包括数字信号处理电路系统。通信接口1166可以提供各种模式或协议下的通信,诸如gsm语音呼叫、sms、ems或mms消息传递、cdma、tdma、pdc、wcdma、cdma2000或gprs等。这种通信可以例如通过射频收发器1168发生。此外,可以进行短程通信,诸如使用蓝牙、wi-fi或其它此类收发器(未示出)。此外,gps(全球定位系统)接收器模块1170可以向设备1150提供附加的导航和位置相关的无线数据,这些数据可以由在设备1150上运行的应用酌情使用。
[0189]
设备1150还可以使用音频编解码器1160进行有声通信,音频编解码器1160可以从用户接收语音信息并将其转换成可使用的数字信息。音频编解码器1160同样可以诸如通过例如设备1150的电话中的扬声器为用户生成可听声音。这样的声音可以包括来自语音电话呼叫的声音,可以包括录制的声音,例如语音消息、音乐文件等,并且还可以包括由在设备1150上运行的应用生成的声音。
[0190]
如图所示,计算设备1150可以以多种不同的形式实现。例如,它可以被实现为蜂窝
电话1180。它还可以作为智能电话1182、个人数字助理或其它类似移动设备的一部分来实现。
[0191]
这里描述的系统和方法的各种实施方式可以在数字电子电路系统、集成电路系统、专门设计的asic(application specific integrated circuit,专用集成电路)、计算机硬件、固件、软件和/或此类实施方式的组合中实现。这些不同的实施方式可以包括在可编程系统上可执行和/或可解释的一个或多个计算机程序中的实施方式,该可编程系统包括至少一个可编程处理器,该可编程处理器(其可以是专用的或通用的)耦合成从存储系统、至少一个输入设备和至少一个输出设备接收数据和指令,以及向存储系统、至少一个输入设备和至少一个输出设备发送数据和指令。
[0192]
这些计算机程序(也称为程序、软件、软件应用或代码)包括用于可编程处理器的机器指令,并且可以以高级过程和/或面向对象的编程语言和/或以汇编/机器语言来实施。如本文所使用的,术语机器可读介质和计算机可读介质指的是用于向可编程处理器提供机器指令和/或数据的任何计算机程序产品、装置和/或设备(例如,磁盘、光盘、存储器、可编程逻辑设备(programmable logic devices,pld)),包括接收机器指令作为机器可读信号的机器可读介质。术语机器可读信号指的是用于向可编程处理器提供机器指令和/或数据的任何信号。
[0193]
为了提供与用户的交互,这里描述的系统和技术可以在计算机上实施,该计算机具有用于向用户显示信息的显示设备(例如crt(cathode ray tube,阴极射线管)或lcd(liquid crystal display,液晶显示器)以及用户可以通过其向计算机提供输入的键盘和指示设备(例如鼠标或轨迹球)。其它类型的设备也可以被用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的感官反馈,例如视觉反馈、听觉反馈或触觉反馈;并且可以以任何形式接收来自用户的输入,包括声学输入、语音输入或触觉输入。
[0194]
这里描述的系统和技术可以在计算系统中实施,该计算系统包括后端组件(例如,作为数据服务器),或者包括中间件组件(例如,应用服务器),或者包括前端组件(例如,具有图形用户界面或网络浏览器的客户端计算机,用户可以通过该图形用户界面或网络浏览器与这里描述的系统和技术的实施方式进行交互),或者这种后端、中间件或前端组件的任意组合。系统的组件可以通过任何形式或介质的数字数据通信(例如通信网络)互连。通信网络的示例包括局域网(local area network,lan)、广域网(wide area network,wan)和互联网。
[0195]
计算系统可以包括客户端和服务器。客户端和服务器通常彼此远离,并且通常通过通信网络进行交互。客户端和服务器的关系由于在各个计算机上运行并且彼此具有的客户端-服务器关系的计算机程序而产生。
[0196]
虽然本说明书包含许多具体实施细节,但这些不应当被解释为对所公开技术的范围或可能要求保护的内容的限制,而是对可以特定于特定公开的技术的特定实施例的特征的描述。在本说明书中在单独实施例的上下文中描述的某些特征也可以部分或全部结合在单个实施例中来实现。相反,在单个实施例的上下文中描述的各种特征也可以在多个实施例中单独或以任何合适的子组合来实现。而且,虽然特征可以在本文中被描述为以某些组合起作用和/或最初这样要求保护,但在一些情况下,要求保护的组合中的一个或多个特征可以从组合中删除,并且要求保护的组合可以针对子组合或子组合的变化。类似地,虽然可
以按特定次序描述操作,但这不应当被理解为要求以特定次序或按顺序次序执行此类操作,或者执行所有操作以获得期望的结果。已经描述了本主题的特定实施例。其它实施例在以下权利要求的范围内。
技术特征:
1.一种用于识别植物收获前潜伏感染的方法,该方法包括:由处理器获得描述植物中存在的一种或多种感染生物标志物的表达水平的数据,感染生物标志物指示植物中感染的可能性,其中数据指示植物的读取序列与和该植物相同类型的健康植物的参考基因组之间的差异;由处理器基于获得的数据选择一个或多个机器学习模型,其中所述一个或多个机器学习模型先前使用与其它数据相关的数据以及确定的一种或多种其它植物的一种或多种感染生物标志物进行了训练,以生成指示植物在收获前发生潜伏感染的可能性的输出,其中使用包括以下的处理训练所述一个或多个机器学习模型:从训练数据集并向所述一个或多个机器学习模型输入(i)所述一种或多种其它植物的非侵入性测量、(ii)所述一种或多种其它植物的侵入性测量、(iii)针对所述一种或多种其它植物的已知植物信息,以及(iv)针对所述一种或多种其它植物的肯定感染标识,以及基于将(i)-(iv)输入到所述一个或多个机器学习模型中,确定所述一种或多种其它植物在收获前发生潜伏感染的预测的可能性,以及输出所述一个或多个机器学习模型以供运行时使用;由处理器基于将所述一个或多个机器学习模型应用于数据,生成指示植物在收获前发生潜伏感染的可能性的输出;由处理器基于输出超出预定阈值范围而确定植物具有潜伏感染;由处理器确定减轻植物中的潜伏感染的一个或多个操作;以及由处理器输出植物具有潜伏感染的指示和所述一个或多个确定的操作。2.如权利要求1所述的方法,其中由处理器确定减轻植物中潜伏感染的一个或多个操作包括对于所述植物和一种或多种其它类似来源的植物,确定以下至少一个:(i)在生长季节中较早的经修改的收获时间表,(ii)在收获前施用预定量的杀虫剂的指令,以及(iii)何时所述植物和所述一种或多种其它类似来源的植物接近各自健康生产寿命的尽头,其中所述一个或多个机器学习模型先前使用来自训练数据集的数据进行了训练,以确定(i)-(iii)。3.如权利要求2所述的方法,其中所述一种或多种其它类似来源的植物包括与所述植物处于相同地带内的植物。4.如权利要求1所述的方法,其中由处理器输出植物具有潜伏感染的指示和所述一个或多个确定的操作包括:生成警报消息,当由用户设备处理时,该警报消息使用户设备输出通知用户设备的用户执行所确定的操作中的一个或多个操作的警报;以及将生成的警报消息传输到用户设备。5.如权利要求1所述的方法,其中由处理器确定减轻植物中的潜伏感染的一个或多个操作包括:基于生成的输出,确定收获前应当对一种或多种其它类似来源的植物开具抗微生物处理剂。6.如权利要求5所述的方法,其中由处理器确定减轻植物中的潜伏感染的一个或多个操作包括:生成指令,当由灌溉控制器处理时,该指令使灌溉控制器自动分散包括抗微生物处理
剂的液体;以及将指令传输到灌溉控制器。7.如权利要求1所述的方法,其中由处理器确定减轻植物中的潜伏感染的一个或多个操作包括:生成指令,当由机器人设备处理时,该指令使机器人设备(i)导航到植物所在的位置和(ii)将抗微生物处理剂分散到该植物和一种或多种其它类似来源的植物上;以及将指令传输到机器人设备。8.如权利要求1所述的方法,其中由处理器确定减轻植物中的潜伏感染的一个或多个操作包括:生成指令,当由机器人设备处理时,该指令使机器人设备(i)导航到植物的位置和(ii)在预期的收获时间表之前从该植物和一种或多种其它类似来源的植物收获一种或多种植物产品;以及将指令传输到机器人设备。9.如权利要求1所述的方法,其中所获得的数据是由核酸测序仪基于对从植物中提取的植物产品进行测序而生成的。10.如权利要求9所述的方法,其中植物产品包括树皮、叶、花和果实的样本中的至少一种。11.如权利要求9所述的方法,其中植物产品是从植物中非破坏性地采样的。12.如权利要求9所述的方法,其中植物产品包括由植物排出的挥发性成分。13.如权利要求1所述的方法,其中所述一个或多个机器学习模型包括二元逻辑回归模型、逻辑模型树、随机森林分类器、l2正则化、偏最小二乘法和卷积神经网络(cnn)中的至少一种。14.如权利要求1所述的方法,其中植物不包括可见的感染迹象。15.如权利要求1所述的方法,还包括:由处理器将获得的数据编码到数据结构中以输入到所述一个或多个机器学习模型;以及由处理器提供编码的数据结构作为所述一个或多个机器学习模型的输入。16.如权利要求1所述的方法,还包括由处理器执行所确定的操作中的一个或多个操作以减轻植物中的潜伏感染。17.如权利要求1所述的方法,其中由处理器选择一个或多个机器学习模型还基于从获得的数据识别出的一个或多个预测特征,所述一个或多个预测特征包括植物的生长区域、环境条件、植物类型、植物的生长阶段、植物的非侵入性测量、植物的侵入性测量、干物质含量、基因表达、植物的脱气挥发性成分、生长地带和读取的植物的序列数据中的至少一个。18.如权利要求1所述的方法,其中已知的植物信息包括关于所述一种或多种其它植物的历史生长信息、生长季节长度、土壤条件、降水量、日照量、环境温度、生长区域和植物类型中的至少一个。19.一种用于预测植物中的潜伏感染的系统,该系统包括:一个或多个处理器;以及一个或多个计算机可读存储设备,其上存储有指令,指令在由所述一个或多个处理器
执行时使所述一个或多个处理器执行操作,所述操作包括:获得描述植物中存在的一种或多种感染生物标志物的表达水平的数据,感染生物标志物指示植物中感染的可能性,其中数据指示植物的读取序列与和该植物相同类型的健康植物的参考基因组之间的差异;基于获得的数据选择一个或多个机器学习模型,其中所述一个或多个机器学习模型先前使用与其它数据相关的数据以及确定的一种或多种其它植物的一种或多种感染生物标志物进行了训练,以生成指示植物在收获前发生潜伏感染的可能性的输出,其中使用包括以下的处理训练所述一个或多个机器学习模型:从训练数据集并向所述一个或多个机器学习模型输入(i)所述一种或多种其它植物的非侵入性测量、(ii)所述一种或多种其它植物的侵入性测量、(iii)针对所述一种或多种其它植物的已知植物信息,以及(iv)针对所述一种或多种其它植物的肯定感染标识,以及基于将(i)-(iv)输入到所述一个或多个机器学习模型中,确定所述一种或多种其它植物在收获前发生潜伏感染的预测的可能性,以及输出所述一个或多个机器学习模型以供运行时使用;基于将所述一个或多个机器学习模型应用于数据,生成指示植物在收获前发生潜伏感染的可能性的输出;基于输出超出预定阈值范围而确定植物具有潜伏感染;确定减轻植物中的潜伏感染的一个或多个操作;以及输出植物具有潜伏感染的指示和所述一个或多个确定的操作。20.如权利要求1所述的系统,其中确定减轻植物中潜伏感染的一个或多个操作包括对于所述植物和一种或多种其它类似来源的植物,确定以下至少一个:(i)在生长季节中较早的经修改的收获时间表,(ii)在收获前施用预定量的杀虫剂的指令,以及(iii)何时所述植物和所述一种或多种其它类似来源的植物接近各自健康生产寿命的尽头,其中所述一个或多个机器学习模型先前使用来自训练数据集的数据进行了训练,以确定(i)-(iii)。
技术总结
本文公开了用于识别植物中收获前潜伏感染的系统和方法。在一个方面,一种方法能够包括以下操作:获得描述植物中存在的一种或多种感染生物标志物的表达水平的数据,将获得的数据编码到数据结构中以输入到机器学习模型,由所述一个或多个计算机将编码的数据结构作为输入提供给机器学习模型,该机器学习模型已经被训练以基于处理编码的数据结构生成指示植物具有潜伏感染的可能性的输出数据,获得生成的指示植物具有潜伏感染的可能性的输出数据,基于生成的输出数据确定植物具有潜伏感染,以及执行减轻植物中的潜伏感染的一个或多个操作。作。作。
技术研发人员:C
受保护的技术使用者:阿比尔技术公司
技术研发日:2021.11.05
技术公布日:2023/9/9
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/