用于筛查受试者的疾病的系统、方法和设备与流程
未命名
09-17
阅读:68
评论:0

1.本发明整体涉及癌症筛查解决方案。特别地,本发明涉及一种非侵入性和非辐射性疾病筛查系统、设备和方法。
背景技术:
2.早在罗马时代,医学就已特别关注人类的生理代谢物,例如,历史上通过尿液中的甜味诊断出了不受控制的糖尿病,肝脏衰竭产生鱼腥味。然而,直到1989年4月,来自伦敦国王学院医院(king's college hospital,london)的hywel williams博士和andres pembroke博士在柳叶刀(the lancet)杂志上报告了关于到他们诊所就诊的柯利-杜宾犬主人的病例,人类代谢研究才进入肿瘤学领域。她声称她的狗对舔她腿上的痣表现出越来越大的兴趣。该痣然后被证明是癌症并被除去,从而挽救了患者的生命。
3.这个转折点清楚地表明,癌症在人类生理上产生代谢变化,从而改变了身体的味道、质感、气味。自此以后发布了若干出版物,旨在寻找生物样品中警示体内存在癌症的特定分子或代谢物,即癌症生物标志物。这类研究的示例包括寻找患者呼吸物中的肺癌生物标志物、尿液中的卵巢癌生物标志物以及—事实上—尿液中的乳腺癌生物标志物。
4.现有技术具有一项共同的特点:出版物通常基于这样的原则:测试样品中特定代谢物的存在与疾病(例如,乳腺癌)的诊断相关。然而,所述的发明不仅关注样品中特定成分的存在,而且还关注特定组分之间的比例关系,以及最近的样品与先前分析和诊断的样品之间的比较。
5.同样,美国癌症协会(american cancer society)预测,在2020年,乳腺癌占美国所有已诊断癌症的30%。乳腺癌被认为是妇女死亡的主要原因。然而,专门针对乳腺癌的研究与乳腺癌的发病率不成比例。实际上,美国国立卫生研究院(national institutes of health,nih)认识到医学研究中对妇女代表不足。在尤其考虑到目前的乳腺癌筛查的肿瘤学领域可观察到这种趋势。事实上,美国疾病控制和预防中心(cdc)的研究指出,在过去2年中,只有65%的妇女参与乳腺癌筛查,这可能导致1/3的乳腺癌被发现得太晚,因此妇女的预后和存活机会更差。增加治愈疾病的机会的许多因素中的一个因素是疾病的早期检测。在早期阶段检测到疾病的存在是非常重要的,这有助于管控和治愈该疾病。
6.乳房x光检查目前是乳腺癌筛查的黄金标准,该检查使用低能量的x射线来检查人类乳房,以进行诊断和筛查。然而,虽然辐射剂量很小,但持续暴露于乳房x光检查可能会引发癌症。此外,46%的乳房x光检查缺勤是由于疼痛。此外,据加泰罗尼亚卫生保健系统(catalan healthcare system)报道,93%的阳性结果是假阳性。所有这些缺点,概括起来就是乳房x光检查是痛苦的、有辐射且不敏感,这就引发了对改善用于乳腺癌诊断的方法的需求。
7.另外,存在市场上可购得的其他乳腺癌筛查解决方案,诸如磁共振成像(mri)和回波描记术。然而,这两种基于图像的技术都无法检测出所有类型的乳腺癌。事实上,基于图像的技术在区分乳腺肿瘤与具有纤维囊性乳腺的妇女的健康致密组织方面经常面临困难
(全世界有》40%的妇女确实具有纤维囊性乳腺)。最后,基因检测也可诊断出一个人患有某种类型乳腺癌的概率,但此方法极为昂贵。
8.本发明旨在改善乳房x光检查筛查方法和市场上可购得的其他癌症筛查解决方案的缺点。
9.本领域中的其他方法和设备通过以下专利和专利申请已知。
10.wo 2019095790a1公开了用于检测和区分指示疾病的各种类型的气体分子或挥发性有机化合物(voc)的方法和设备。包括多个感测电极和一个参考电极的传感器阵列用于测量指示来自呼出气体样品的voc的存在或浓度的电信号。算法处理从该阵列中收集的数据并且生成与来自健康受试者的反应模式比较的反应模式。
11.us 8366630b2涉及一种用于检测源自呼吸物样品的voc的系统,该系统包括:装置,该装置包括具有涂覆有非极性小有机分子的单壁碳纳米管的化学敏感传感器阵列;和处理单元,该处理单元包括学习和模式识别分析器,其中该学习和模式识别分析器接收传感器输出信号并且将其与所存储的数据进行比较。
12.us 20120326092a1公开了一种用于借助于以下方式来诊断受试者的结肠癌的方法:从测试样品中收集测试呼吸物样品;确定测试样品中来自指示结肠癌的一组voc的至少一种voc的水平;并且将来自测试样品的至少一种voc的水平与控制对照样品中的所述至少一种voc的水平进行比较,其中测试样品中所述至少一种voc的水平与对照样品中的所述化合物的水平显著不同则表明患有结肠癌。
13.us 2019271685a1涉及一种系统,该系统包括所选确定的传感器组和处理单元,该确定的传感器组包括对测试受试者呼出气体中voc的存在有反应的至少三个传感器,这些传感器包括选自涂覆有第一有机涂层的金属纳米颗粒和涂覆有第二有机涂层的单壁碳纳米管(swcnt)的纳米材料,该处理单元包括模式识别分析器,其中该模式识别分析器例如接收该传感器组的输出信号。
14.us 10011481b2提供了一种基于特异性化学敏感场效应晶体管的电子鼻设备。特别地,该电子鼻设备的传感器由可检测到voc的非氧化、功能化硅纳米线构成。公开了用于诊断包括各种类型的癌症的疾病的方法。
15.尽管有上述情况,单本领域已知的筛查和检测方法和设备是昂贵且复杂的,因为这些方法和设备并未被设计为用户友好型。此外,由于相关费用和复杂性,发现个体很难获得早期癌症筛查。2017年,世界卫生组织(world health organization)发表了“who关于乳房x光检查的立场文件(who position paper on mammography screening)”,指出迫切需要新的乳腺癌筛查解决方案。另外,乳腺癌已被欧盟委员会(european commission)鉴定为研究重点中的一个重点。因此,存在对非侵入性、便宜的、敏感的和对居家疾病(例如,癌症)的筛查解决方案的需求。
技术实现要素:
16.本发明的目的是提供一种非侵入性和非辐射性疾病筛查解决方案,以改善本领域已知的筛查方法和设备。
17.本发明基于应用于人类样品分析的人工智能(ai),该ai提供了一种低成本、用户友好、非侵入性的和可持久的癌症筛查解决方案,可用于诸如在用户的家庭环境中或在临
床环境中等多种环境。此外,本发明能够以例如以不需要医院或经过训练的人员的特异性自我筛查等许多方式运行无痛和无辐射的快速测试,或由医疗保健专业人员(例如,护士或妇科医生)运行。此外,由于嵌入式分类算法依赖于ai和/或机器学习(ml),因此分析的样品越多,分类率就越高,因此可更早地预测疾病。
18.本发明能够在不增强患癌风险的情况下诊断癌症,这与乳房x光检查不同。此外,该方法是无辐射和非侵入性的,因为癌症可从常规的尿液样品收集中诊断出,具有高敏感性(很少有病例未被诊断出来)、精确性、准确性,并且提高可靠性(在对转移性-晚期-乳腺癌进行分类时超过95%)。
19.与现有技术相比,另一个优点是提供了一种适用于居家诊断的便携式医疗筛查设备,从而因其早期检测而降低了人群中乳腺癌的严重程度。本发明的目的是提供一种能够通过简单的尿液收集来诊断乳腺癌的便携式乳腺癌诊断设备,该便携式乳腺癌诊断设备可由用户随时随地轻松携带以解决上述问题。特别地,该便携式乳腺癌诊断设备潜在地对早期乳腺癌的筛查有效果。
20.用户可通过诸如移动应用程序等用户界面与该便携式医疗筛查设备交换数据,这使得该便携式医疗筛查设备用户友好并且在不需要有医学或生物工程背景的情况下也能方便地使用。该设备可由不同的用户不定期地使用并且随着时间的推移无限期地使用,使其成为可重复使用的医疗设备。最后,与目前涉及非常高的医疗费用的筛查方法相比,该设备的成本很低并且可由许多用户多次使用。
21.本发明由所附独立权利要求限定。在从属权利要求中描述了实施方案。
22.为此,根据第一方面,本发明提供了一种用于筛查受试者的疾病(特别是癌症,诸如乳腺癌)的系统。该系统包括便携式医疗筛查设备和基于人工智能的分类软件。
23.该便携式医疗筛查设备具有收集室,该收集室用于收集受试者的测试样品,诸如但不限于尿液、血液、汗液、阴道分泌物、呼吸物、唾液、眼泪、粘液、粪便、耳垢、脓液、屁液、皮脂等;一组化学敏感传感器;分析室,该分析室用于分配该组化学敏感传感器,该组化学敏感传感器被适配成检测测试样品中的挥发性有机化合物(voc)并且生成指示测试样品中voc的存在或缺失的输出信号作为检测的结果;和第一处理单元,该第一处理单元操作性地连接到该组化学敏感传感器以接收所生成的输出信号。
24.基于人工智能的分类软件可由第一处理单元、安装在计算机设备(例如,基于互联网的设备,诸如智能手机、平板计算机或pc等)上的软件应用程序或远程处理单元(例如,基于云的服务器)执行并且被配置为通过处理所生成的输出信号并对其进行分类来确定关于疾病的结果。
25.在基于人工智能的分类软件由软件应用程序或远程处理单元执行的情况下,便携式医疗筛查设备还包括通信单元,该通信单元操作性地连接到第一处理单元并且被配置为例如经由蓝牙、wifi、有线连接等建立与远程处理单元和/或软件应用程序的通信。因此,便携式医疗筛查设备可连接到远程处理单元,或者连接到具有该软件应用程序的另一设备。远程处理单元可经由其中安装有软件应用程序的所引用的计算机设备来访问。
26.根据第二方面,本发明还提供了一种用于筛查受试者的疾病,特别是癌症的方法。该方法包括:由便携式医疗筛查设备的收集室收集受试者的至少一个测试样品;由分配在便携式医疗筛查设备的分析室上的一组化学敏感传感器检测测试样品中的voc并且生成指
示所述测试样品中voc的强度水平(浓度)的输出信号作为检测的结果;由便携式医疗筛查设备的第一处理单元接收所生成的输出信号;并且由第一处理单元、安装在计算机设备处的软件应用程序或远程处理单元执行的基于人工智能的分类软件通过处理所生成的输出信号并对其进行分类来确定关于疾病的结果,其中如果基于人工智能的分类软件由软件应用程序或远程处理单元执行,则软件应用程序或远程处理单元操作性地连接到便携式医疗筛查设备的通信单元。
27.根据第三方面,本发明还提供了一种便携式医疗筛查设备,该便携式医疗筛查设备包括收集室,该收集室用于收集受试者的至少一个测试样品;一组化学敏感传感器;分析室,该分析室用于分配该组化学敏感传感器,该组化学敏感传感器被适配成检测测试样品中的voc并且生成指示测试样品中voc的存在或缺失的输出信号作为检测的结果;和第一处理单元,该第一处理单元操作性地连接到该组化学敏感传感器以接收所生成的输出信号。
28.术语“受试者”、“用户”和“患者”在本文中可互换使用并且指代任何哺乳动物受试者,特别是人类受试者,其样品由本发明的系统、设备和方法进行筛查。
29.根据本发明,第一处理单元(或计算部件)可在边上(即在便携式医疗筛查设备本身上)处理信息或将信息(即,所生成的输出信号)传递给通信单元,该通信单元将该信息发送到远程处理单元或软件应用程序,该软件应用程序也可连接到远程处理单元。因此,该信息可在所公开的便携式医疗筛查设备本身上或在软件应用程序或远程处理单元上进行分类。数据分类的结果可经由例如便携式医疗筛查设备上的输出屏幕、经由医疗设备处的任何用户界面(诸如颜色编码的led系统、发出的声音)或在安装了软件应用程序的计算机设备上显示。在一些实施方案中,第一处理单元可微处理器和/或微控制器,诸如arduino。
30.系统配置
31.在实施方案中,根据第一方面的系统包括便携式医疗筛查设备和基于人工智能(ai)的分类软件,其中基于ai的分类软件由设备的第一处理单元执行。
32.在实施方案中,该系统包括便携式医疗筛查设备(包括上文提及的通信单元)、基于ai的分类软件和安装在计算机设备上的软件应用程序,其中基于ai的分类软件由软件应用程序执行。通信单元操作性地连接到该设备的第一处理单元并且被配置为建立与软件应用程序的通信。
33.在实施方案中,该系统包括便携式医疗筛查设备(包括通信单元)、基于ai的分类软件和远程处理单元,其中基于ai的分类软件由远程处理单元执行。通信单元操作性地连接到该设备的第一处理单元并且被配置为建立与远程处理单元的通信。
34.在实施方案中,该系统包括便携式医疗筛查设备(包括通信单元)、基于ai的分类软件、安装在计算机设备上的软件应用程序和远程处理单元,其中基于ai的分类软件由软件应用程序执行。通信单元操作性地连接到该设备的第一处理单元并且被配置为建立与远程处理单元和软件应用程序的通信。类似地,软件应用程序和远程处理单元可操作性地连接并在彼此之间进行通信。
35.在实施方案中,该系统包括便携式医疗筛查设备(包括通信单元)、基于ai的分类软件、安装在计算机设备上的软件应用程序和远程处理单元,其中基于ai的分类软件由远程处理单元执行。通信单元操作性地连接到该设备的第一处理单元并且被配置为建立与远程处理单元和软件应用程序的通信。类似地,软件应用程序和远程处理单元可操作性地连
接并在彼此之间进行通信。
36.在一些实施方案中,便携式医疗筛查设备包括硬件板,该硬件板由第一处理单元和通信单元组成。
37.存储器或数据库、健康状况数据和/或人口统计数据
38.在一些实施方案中,该系统还包括至少一个存储器或数据库,该至少一个存储器或数据库被配置为存储受试者和/或多个健康和/或不健康个体的健康状况数据和/或人口统计数据。该存储器或数据库由基于ai的分类软件使用并且与第一处理单元、远程处理单元和/或软件应用程序进行通信。包含在存储器或数据库中的任何数据都可被使用、从存储器或数据库组中使用、提取和/或更新,而不改变整个存储器或数据库组。此存储器或数据库允许将其中的数据与受试者自己的数据进行比较,以便将比较结果转化为结果。
39.在实施方案中,存储器或数据库包括在远程处理单元中。在其他实施方案中,存储器或数据库是远程的并且与远程处理单元和/或软件应用程序相关联。在其他实施方案中,存储器或数据库包括在软件应用程序中。在另一实施方案中,存储器或数据库包括在第一处理单元中。
40.在实施方案中,该系统由至少两个实体/元件(即便携式医疗筛查设备和至少一个存储器或数据库)构成。
41.在实施方案中,该系统由至少三个实体/元件(即便携式医疗筛查设备、软件应用程序和至少一个存储器或数据库)构成。
42.在实施方案中,该系统由至少三个实体/元件(即便携式医疗筛查设备、远程处理单元和至少一个存储器或数据库)构成。
43.在实施方案中,该系统由至少四个实体/元件(即便携式医疗筛查设备、远程处理单元、软件应用程序和至少一个存储器或数据库)构成。
44.如前文所述,存储器或数据库可存储受试者和/或多个健康和/或不健康个体的健康状况数据和/或人口统计数据。在实施方案中,基于ai的分类软件还被配置为至少考虑到多个健康和/或不健康个体和/或受试者的所存储的健康状况数据和/或人口统计数据,确定关于疾病的结果(即,数据分类结果)。存储器/数据库还可存储关于疾病的所确定的结果,以便在以后的筛查过程中予以考虑。
45.在本发明的上下文中,术语“健康状况数据”是指与个体生理或精神健康有关的任何信息,并且还指与健康状况、关于选择治疗的个人选择、健康保障或政策号码、各种治疗报告、关于健康和保健的社会经济参数或过去几年的诸如疾病等历史医疗保健背景有关的各种类型的数据。健康状况数据是指但不限于用户或个体的病史、受试者的家族病史、药物摄入量、吸烟习惯或药物消费。
46.在本发明的上下文中,术语“人口统计数据”是指与基于诸如年龄、种族、性别等因素的人群研究有关的任何信息。人口统计数据还指以统计学方式表示的社会经济信息,包括就业、教育、收入、结婚率、出生率、死亡率等。人口统计数据是指但不限于年龄、性别认同、性别、民族、出生地/居住地或其他习惯/生活事实,诸如体育锻炼的频率。
47.在特定实施方案中,用户/多个健康和/或不健康个体的健康状况数据和/或人口统计数据可包括但不限于年龄、性别、性别认同、民族、出生地/居住地、体重、身高、体重指数、与药物消费(例如,烟草、酒精、大麻和其他有毒物质)有关的习惯、用户的病史、家族病
史、家族癌症史、用户自己的癌症史(例如,乳腺癌、肺癌、前列腺癌、结直肠癌、黑色素瘤、膀胱癌、肾癌、非霍奇金淋巴瘤)、肿瘤的组织学类型、肿瘤行为(原位或浸润)、肿瘤概况(管腔a型、管腔b型her2/neu+、管腔b型her2/neu-、her2/neu+或triple-)、肿瘤大小、肿瘤tnm分类、肿瘤分期(i、ii、iii或iv)、癌症检测方法(经由筛查或临床)、肿瘤组织学程度(g1、g2或g3)、月经、月经初潮和绝经特征(例如,周期、时间)、足月分娩的孩子数量、早产数量、流产数量、在世的孩子数量、生育状况(例如,正在接受生育药物治疗、怀孕、哺乳、产后)、乳房疾病史(例如,月经周期过程中的乳房疼痛、荷尔蒙变化、乳房肿胀、肿块或触痛、囊肿、纤维腺瘤、常见肿块、乳头溢液、乳头疼痛/破裂/瘙痒、乳头内陷)、内分泌失调(例如,糖尿病、甲状腺疾病、多囊卵巢综合征、低睾酮、骨质疏松症)或饮食类型(例如,杂食主义、弹性素食主义、“鸡”素主义(“chicken
”‑
arianism)、鱼素主义、素食主义、奶素食主义、蛋素食主义、蜜蜂素食主义(apivegetarianism)、素食主义、原始素食主义、谷物主义(granivorianism)、果食主义(frugivorism)、生酮饮食)。
48.特别地,用户/多个健康和/或不健康个体的健康状况数据和/或人口统计数据包括年龄、性别、与药物消费有关的习惯、用户的病史、家族病史、家族癌症史、用户自己的癌症史和/或乳腺疾病史。
49.存储器或数据库可根据筛查配置包括不同种类的信息。例如,在受试者的数据尚未被存储在存储器或数据库中的情况下,例如,在受试者第一次筛查的情况下,存储器或数据库可仅包括多个健康和/或不健康个体的健康状况数据和/或人口统计数据。在另一示例中,例如,当受试者已经从先前筛查中引入自己的数据并且所述数据已经存储在存储器或数据库中时,存储器或数据库可包括多个健康和/或不健康个体的健康状况数据和/或人口统计数据以及受试者的健康状况数据和/或人口统计数据。
50.在特定实施方案中,存储器或数据库包括多个健康和/或不健康个体的健康状况数据和/或人口统计数据。
51.在特定实施方案中,存储器或数据库包括受试者和多个健康和/或不健康个体的健康状况数据和/或人口统计数据。
52.在本发明中,应当理解的是,存储在存储器或数据库中的数据可以是原始数据和/或经过处理的数据。在一些实施方案中,包括在存储器或数据库中的数据可以是原始数据,即未被基于ai的分类软件处理的数据。在一些实施方案中,包括在存储器或数据库中的数据可以是经过处理的数据,诸如从经过若干筛查后的数据中提取的模式。
53.在一些实施方案中,存储器或数据库包括存储在其中的多个健康和/或不健康个体的健康状况数据和/或人口统计数据,其中基于ai的分类软件包括考虑到所存储的健康状况数据和/或人口统计数据确定关于疾病的结果。
54.在一些实施方案中,该方法还包括:获取受试者的健康状况数据和/或人口统计数据以及将所获取的数据存储在存储器或数据库中,其中基于ai的分类软件包括考虑到受试者的所存储的健康状况数据和/或人口统计数据确定关于疾病的结果。
55.在一些实施方案中,健康状况数据和/或人口统计数据是经由软件应用程序或便携式医疗筛查设备的用户界面获得的。
56.便携式医疗筛查设备
57.在本发明中,便携式医疗筛查设备可被适配成包围用于执行筛查的不同元件。包
围该组元件的便携式医疗筛查设备的尺寸和配置使得其可被个体轻易地处理和使用,从而实现了居家筛查。
58.在实施方案中,便携式医疗筛查设备包括通信单元,该通信单元操作性地连接到第一处理单元并且被配置为建立与远程处理单元和/或安装在计算机设备上的软件应用程序的通信。
59.在实施方案中,便携式医疗筛查设备包括定位在收集室上方的网格和/或用于打开、关闭和支撑收集室的抽屉。
60.在一些实施方案中,便携式医疗筛查设备可由箱体构成,该箱体被适配成包围收集室、网格、分析室、第一处理单元和通信单元,其中箱体具有用于引入抽屉的中空部分。
61.特别地,便携式医疗筛查设备包括定位在收集室上方的网格和/或用于打开、关闭和支撑收集室的抽屉,其中便携式医疗筛查设备由箱体构成,该箱体被适配成包围收集室、网格、分析室、第一处理单元和通信单元,该箱体具有用于引入抽屉的中空部分。
62.在实施方案中,该设备包括收集室,该收集室收集诸如尿液样品等人类样品。测试样品可直接收集到设备中,也可收集在单独的装置或容器中,然后引入到所公开的设备中。
63.在一些实施方案中,抽屉可填充有绝缘材料。另外,抽屉可包括孔(该孔被配置为分配收集室),孔壁被配置为在可收集测试样品的地方向样品照射热量。在特定实施方案中,孔壁借助于覆盖墙壁的保温毯向样品照射热量。
64.在本发明中,便携式医疗筛查设备是受试者用于执行筛查的元件。另外,根据上文提及的系统配置,安装在计算机设备,特别是移动手机或平板计算机等上的软件应用程序还可包括在系统中并且被配置为建立与设备的第一处理单元的通信。类似地,远程处理单元还可包括在该系统中。远程处理单元可位于云中或诸如pc、平板计算机或膝上型计算机等计算机设备上。不同系统元件之间的通信可为有线或无线(例如,经由蓝牙、wifi、卫星或5g)的。本文使用的术语“计算机设备”是指具有中央处理单元(cpu)的任何计算机硬件,包括但不限于计算机、膝上型计算机、平板计算机、个人数字议程(pda)、智能手机或智能手表。
65.在实施方案中,远程处理单元位于例如云、网络浏览器、计算机、膝上型计算机、智能手机或平板计算机中。
66.在实施方案中,该软件应用程序位于例如网络浏览器、计算机、膝上型计算机、智能手机、pda、平板计算机或智能手表中。
67.在实施方案中,软件应用程序和/或远程处理单元与第一处理单元无线操作性地连接。在特定实施方案中,无线连接是经由蓝牙和/或wifi进行的。
68.在特定实施方案中,医疗设备可在远程位置操作。在该情况下,医疗设备有能力经由卫星或5g使用专门为此目的嵌入在设备中的特殊连接模块直接连接到云。在特定实施方案中,无线连接是经由卫星和/或5g进行的。
69.用户界面
70.在本发明中,受试者的健康状况数据和/或人口统计数据是经由用户界面收集的,然后由基于ai的分类软件处理和/或存储在存储器/数据库中。用户界面可由软件应用程序或便携式医疗筛查设备显示。例如,用户界面由安装在计算机设备上的软件应用程序显示,其中计算机设备是智能手机。
71.软件应用程序可使用不同的编程语言开发,包括但不限于xml、javascript、swift、python、sql、php、ruby、c、c++或c sharp。软件应用程序可在不同的操作系统上运行,包括但不限于安卓(android)、ios、linux、mac os、windows ms、ubuntu、安卓、fedora、solaris、free bsd或chrome os。在特定实施方案中,软件应用程序在安卓智能手机上运行,并且该软件应用程序是使用xml和/或java开发的。在特定实施方案中,该软件应用程序在ios智能手机上运行,并且该软件应用程序是使用swift开发的。
72.一旦软件应用程序安装在计算机设备上,受试者可注册(即,创建账户),引入其个人数据,诸如姓名或昵称、电子邮件、生日、性别和密码。在登录后,软件应用程序显示不同的界面,诸如个人信息界面(例如,受试者的健康状况数据和人口统计数据)(图9小图a)、筛查历史界面(图9小图c和小图d)、筛查测试性能界面(图10小图a至小图f)、配置/设置界面(图9小图b)等。
73.通过筛查测试性能界面,软件应用程序可直观地引导受试者和/或医疗保健专业人员完成筛查过程,直到显示诊断结果。受试者可决定何时开始筛查测试性能,并且界面为用户显示指令,以例如启用蓝牙、wifi和/或蜂窝设置(图10小图a)并且将测试样品引入到便便携式医疗筛查设备(图10小图c)中。在完成这些指令后,数据将得到自动处理并发送回计算机设备(如果数据是在不位于计算机设备中的处理单元中处理的),该计算机设备将以可理解的方式显示关于疾病的结果(图10小图f)。在一些实施方案中,软件应用程序可引导受试者完成筛查过程。
74.该软件应用程序还可包括便于用户接收关于疾病的结果的若干选项,包括在计算机设备中显示结果,接收来自医疗保健专业人员(诸如医生、护士或心理学家)的手机呼叫,或者诊断结果可作为通知或肿瘤报告到达医疗人员。
75.通过个人信息界面,用户可引入健康状况数据和/或人口统计数据,这些数据将被基于ai的软件进一步考虑以生成准确的结果。
76.在一些实施方案中,受试者的健康状况数据和/或人口统计数据是经由软件应用程序的用户界面收集的,然后存储在存储器/数据库中。
77.另外,软件应用程序可并入嵌入式虚拟代理,即由自然语言处理(nlp)提供动力的聊天机器人,该聊天机器人在输送结果的同时不断地对用户进行心理评估。该虚拟代理分析用户基于文本的反应(例如,经由软件应用程序中内置的聊天机器人),并且确定用户是否在相应地处理他们的情绪或遵循回避行为模式,从而需要心理援助。可替代地或另外,虚拟代理可分析用户的面部表情(由计算机的相机捕获),并且使用卷积神经网络进行处理以将这些表情与用户可能感受到的情绪联系起来。
78.根据进行筛查的环境,可使用不同的软件应用程序。在实施方案中,当筛查旨在是居家进行时,软件应用程序针对受试者并且包括例如用于多个目的的论坛(例如,社交网络、科学文章分享或医疗保健数据分享)。在另一实施方案中,筛查旨在由it能力有限的受试者(例如,老年人)居家进行,其中软件应用程序是简化的并且主要包括结果显示。在又一实施方案中,筛查旨在是居家进行的,软件应用程序针对受试者并且不包括结果显示,而是包括受试者的筛查历史(结果发送到医疗保健专业人员)。在另一实施方案中,筛查旨在是在临床环境(例如,医院、疗养院、药房、救护车)中进行的,软件应用程序安装在pda或平板计算机中,由医疗保健专业人员管理并且主要包括结果显示。
79.化学敏感传感器
80.在本发明中,便携式医疗筛查设备包括一组化学敏感传感器,该组化学敏感传感器检测测试样品中voc的存在或缺失,第一处理单元操作性地连接到该组化学敏感传感器,以便接收所生成的输出信号。在特定实施方案中,第一处理单元经由有线连接与该组化学敏感传感器连接。
81.本发明基于这样的原理:疾病(例如,乳腺癌)的存在不是由在测试样品(例如,尿液)中发现的某种化合物表示的,而是由在例如尿液中发现的所有化合物之间的比例来表示。
82.位于分析室处的一组化学敏感传感器对一些生物标志物(例如,乳腺癌生物标志物)不具有特异性,而是对多个样品特征或成分敏感。另外,样品分类并不简单地依赖于一组特定的例如癌症生物标志物的存在或缺失。
83.由化学敏感传感器捕获的化合物并不是直接的例如癌症代谢物。相反,这些化合物是由细胞新陈代谢产生的残留代谢物。因为例如癌症会导致身体的生理变化,所以上述代谢物会因为癌症而改变浓度。针对化学物质之间的比例而不是针对特定生物标志物的这个策略是受到狗的嗅皮质的启发。
84.根据本发明,所生成的输出信号指示测试样品中voc的存在或缺失。在实施方案中,所生成的输出信号包括电信号,其电压与voc的浓度成比例。例如,如果voc不存在,则输出信号为“0”,如果测试样品中充满voc,则输出信号为“1023”,并且如果存在一定数量的voc,则该信号将取中间值。也就是说,输出信号特别是模拟信号。
85.在实施方案中,该组化学敏感传感器包括光离子化检测器(pid)、火焰电离检测器(fid)、金属氧化物传感器(mos)和/或硅光子环形共振器(sprr)或对挥发性有机化合物敏感并且由使用与浓度无关的指纹的自组装单层涂层传感器阵列组成的任何类型的气体感测结构。在实施方案中,该组化学敏感传感器包括金属氧化物传感器和/或有机化合物敏感传感器(诸如基于半导体的化学电阻式传感器、电化学传感器、金属氧化物传感器和pid传感器)。在特定实施方案中,mos是氧化锡传感器。
86.这些传感器可与纳米技术或微流控技术结合使用或不结合使用,诸如在分析之前或期间使人类液体通过微流控电路循环,并且除了测量人类液体的气味还测量其流经微流控电路的能力。在实施方案中,该组化学敏感传感器与微流控技术结合使用。在实施方案中,该组化学敏感传感器与纳米技术结合使用。
87.在实施方案中,便携式医疗筛查设备由至少一个化学敏感传感器构成。特别地,便携式医疗筛查设备由1至20个化学敏感传感器构成。更特别地,便携式医疗筛查设备由5至10个化学敏感传感器构成。更特别地,便携式医疗筛查设备由9个化学敏感传感器构成。
88.该组化学敏感传感器可被配置为同时检测所有voc。在其他实施方案中,化学敏感传感器中的每个化学敏感传感器都可被配置为以给定的时间间隔检测voc。同样,在一些实施方案中化学敏感传感器中的每个化学敏感传感器都可对一种或多种voc反应。
89.在实施方案中,该组化学敏感传感器检测voc的时间为数分钟,优选地在45分钟以下。在特定实施方案中,该组化学敏感传感器在10分钟至120分钟的时间间隔,优选地25分钟至35分钟的时间间隔内检测voc。
90.测试样品
91.在一个实施方案中,除了检测voc的存在或缺失,便携式医疗筛查设备还检测测试样品的一些特性,诸如化学成分、气味、温度、粘度(即,雷诺数)、密度、颜色、电导率、电容、沸腾时间、它们的重量或半透明性、折射率、任何化学/物理特性沿时间或在样品被加热时的变化、以及其他物理/化学特性。
92.在一些实施方案中,可能需要对样品施加一些化学或物理刺激物,诸如但不限于化学试剂或任何其他物质、物理振动(诸如超声处理)、热量、压力、移动(诸如基质的倾析)、以及其他刺激物。另外,还可基于上述观察的变化或变化发生的速度来进行观察。
93.在另一实施方案中,鉴于测试样品的性质或鉴于测试样品的特殊气味,便携式医疗筛查设备生成特定反应(即,模式)。
94.本发明可分析至少一个测试样品,以生成指示存在或不存在voc的输出信号。
95.测试样品可以是但不限于尿液、血液、汗液、眼泪、阴道粘液、阴道分泌物、经血、经期粘液、呼吸物、唾液、血清、粪便、精子、眼泪、粘液、粪便、耳垢、脓液、屁、皮脂。特别地,测试样品可为尿液、呼吸物、阴道分泌物、经血、粪便和唾液。更特别地,测试样品是尿液。
96.在一些实施方案中,该系统、设备和方法收集并分析两个测试样品,例如,尿液和呼吸物、尿液和经血或呼吸物和经血。在一些实施方案中,该系统、设备和方法收集并分析三个测试样品,例如,尿液、呼吸物和经血。
97.在一些实施方案中,抽屉填充有绝缘材料并且包括孔(该孔被配置为分配收集室),因此,包含样品的收集室可被引入到孔中并且被更好地保留。此外,孔壁还可向样品照射热量。在一些实施方案中,这是通过在孔壁的内侧覆盖保温毯(即,将电能转化为热量的耗散性电阻)来实现的。因此保温毯可加热直接与样品接触或者与收集室接触的孔壁,从而将热量传递给收集室和样品。为了控制样品加热过程,在实施方案中,第一处理单元操作性地连接到继电器,该继电器可机械地启动系统并且停止系统向保温毯和与孔壁接触的温度传感器馈送电压。温度传感器可集成在保温毯内、被放置成直接与孔壁接触、与收集室接触或直接与样品接触。温度传感器与第一处理单元操作性地连接,第一处理单元以连续的方式报告样品在每个瞬间所处的温度(或近似值)。基于此信息,第一处理单元被配置为决定接通还是断开保温毯,从而控制样品的温度以及样品的加热速度。通过这样做,保温毯、温度传感器、继电器和第一处理单元形成反馈控制回路以设定样品的温度。
98.在实施方案中,一旦测试样品的温度达到至少25℃,该组化学敏感传感器就被配置为检测测试样品中的voc。特别地,测试样品的温度达到至少40℃。特别地,测试样品的温度达到至少50℃。在又一特定实施方案中,测试样品的温度达到25℃与90℃之间。在又一特定实施方案中,测试样品的温度达到40℃与90℃之间。当测试样品达到这样的温度时,筛查的准确性和优化性得到了提高。一旦测试样品中的温度达到例如80℃至95℃的温度(具体取决于用于加热样品的所选温度),化学敏感传感器就会停止检测voc。
99.测试样品可直接收集到便携式医疗筛查设备中,也可收集在单独的装置或容器中,然后引入到所公开的设备中。在特定实施方案中,该容器是收集室。
100.基于人工智能的分类软件
101.基于人工智能的分类软件可包括一个或多个基于机器学习/人工智能(ml/ai)的分类算法或统计学分类算法,包括但不限于,人工循环神经网络(rnn)(诸如长短期记忆(lstm))、人工神经网络(ann)、卷积神经网络(cnn或convnet)、主成分分析(pca)、多层感知
(mlp)、广义回归神经网络(grnn)、模糊推理系统(fis)、自组织地图(som)、径向偏置函数(rbf)、遗传算法(gas)、神经模糊系统(nfs)、自适应共振理论(art)、偏最小二乘法(pls)、多元线性回归(mlr)、主成分回归(pcr)、判别函数分析(dfa)、线性判别分析(lda)、集群分析以及最近邻。特别地,ai/ml分类算法是rnn,诸如lstm和/或ann。
102.适用于识别voc模式和量化其浓度的附加算法可包括但不限于fisher线性判别分析(flda)、类比法的软独立建模(simca)、k-最邻近(knn)以及模糊逻辑算法。在一些实施方案中,flda和典型判别分析(cda)以及它们的组合用于比较输出签名和数据库中的可用数据。
103.算法中的许多算法是基于神经网络的算法。神经网络具有输入层、处理层和输出层。传感器从样品中提取的数据作为输入被馈送到输入层,并流经处理层,直到到达输出层。在每个处理层处,该信息被修改并且被传递到下一层。到达输出层的信息产生分类的结果。处理层是由节点组成的,这些节点通过与神经元的节点的相互连接模拟神经元。在操作中,当神经网络与传感器阵列相结合时,传感器数据通过网络传播。以这种方式,进行一系列向量矩阵乘法,并且可容易地识别和确定未知的分析物。神经网络是通过纠正来自给定输入的错误或不期望的输出来训练的。类似于统计分析揭示数据集合中的基本模式,神经网络基于预定标准在数据集合中找到一致的模式。
104.关于疾病的结果
105.在本发明中,一旦基于ai的分类软件处理了所有的输入(例如,由传感器获得的数据和由软件应用程序引入的用户数据),软件应用程序或便携式医疗筛查设备可向用户显示结果。
106.本文中的术语“结果”是指对疾病的确定或检测(例如,对疾病的诊断),可包括关于疾病的存在或缺失的指示、患有疾病的风险概率、对疾病的程度和/或类型(或亚型)和/或肿瘤的大小的指示、对某种治疗的建议、对某种疾病的演变的预测等。
107.在一些实施方案中,在样品分类由托管在软件应用程序上的基于ai的分类软件执行时,结果在计算机设备上显示。在另一实施方案中,在样品分类由托管在软件应用程序上的基于ai的分类软件执行的情况下,结果经由互联网、蓝牙或其他装置发送并且在便携式筛查设备处显示。在另一实施方案中,在样品分类由托管在筛查设备或基于云的服务器上的基于ai的分类软件执行的情况下,结果可例如经由互联网或蓝牙从这种筛查设备或从云服务器发送到软件应用程序,结果将在该软件应用程序上显示。在另一实施方案中,在样品分类由托管在基于云的服务器上的基于ai的分类软件执行的情况下,结果可例如经由互联网或蓝牙从这种筛查设备发送到便携式筛查设备,结果将在该便携式筛查设备上显示。在又一实施方案中,在样品分类由托管在第一处理单元上的基于ai的分类软件执行的情况下,结果将在筛查设备上显示。这使得用户可在分类完成后立即检查结果。
108.在实施方案中,基于ai的分类软件被配置为通过处理所生成的输出信号并对其进行分类来确定关于疾病的结果。在一些实施方案中,关于疾病的结果包括关于疾病的存在或缺失的指示。例如,该结果可能是报告或二元结果的形式,例如,相对于“癌症”和“健康”,数值为“0”或“1”等。基于ai的分类软件可通过患有疾病的风险概率来确定结果。在一些实施方案中,关于疾病的结果是患有疾病的风险概率。
109.此外,还实施了人工智能,以便提供关于被分析的测试样品的信息:肿瘤大小(如
果适用)、癌症类型(如果适用)和其他信息。在特定实施方案中,结果包括对疾病的程度和/或类型(或亚型)的指示和/或当疾病是癌症时,结果包括对肿瘤大小的指示。术语“疾病”还可包括受试者的任何病状、病症、综合征或与健康受试者相比改变的状态并且是指对全部或部分生物体的结构或功能产生负面影响的特定异常病状。受试者的病状或状态改变通常与特定迹象和症状有关,这些迹象和症状可引发疾病、病症、综合征或严重病状。
110.许多疾病可通过本发明进行诊断、预测或监测,包括但不限于癌症、糖尿病、压力、癫痫、阿尔茨海默病(alzheimer's disease)、口腔感染、牙周病、口臭、酮症、酵母菌感染、尿路感染、肺炎、肺部感染、性传播疾病、阴道炎、肾炎、胆红素产生、肾病、尿毒症、三甲胺尿症、心血管疾病、高胆固醇症和胃肠道感染。
111.本发明还可帮助诊断其他医学病症,包括但不限于急性哮喘、肝昏迷、类风湿性关节炎、精神分裂症、酮症、心肺疾病、尿毒症、糖尿病、痢疾/肌无力、胱氨酸尿症、肝硬化、组氨酸血症、酪氨酸血症、口臭和苯丙酮尿症。
112.可通过本发明检测的癌症的非限制性示例是脑癌、卵巢癌、胰腺癌、肝癌、结肠癌、前列腺癌、肾癌、膀胱癌、乳腺癌、肺癌、口腔癌以及皮肤癌。癌症的具体示例为:腺癌、肾上腺肿瘤、成釉细胞瘤、间变性肿瘤、甲状腺细胞未分化癌、血管纤维瘤、血管瘤、血管肉瘤、apud瘤、嗜银细胞瘤、男性细胞瘤、腹水瘤细胞、腹水瘤、成星形细胞瘤、星形细胞瘤、路-巴综合征(ataxia-telangiectasia)、心房粘液瘤、基底细胞癌、良性肿瘤、骨癌、骨肿瘤、脑干胶质瘤、脑瘤(brain tumor)、乳腺癌、阴道肿瘤、伯基特淋巴瘤(burkitt's lymphoma)、癌、小脑星形细胞瘤、宫颈癌、樱桃血管瘤、胆管癌、胆管瘤、软骨母细胞瘤、软骨瘤、软骨肉瘤、成绒膜细胞瘤、绒毛膜瘤、喉癌、结肠癌、普通型急性淋巴细胞性白血病、颅咽管瘤、囊性癌、囊性纤维瘤、囊瘤、细胞瘤、导管原位癌、导管乳头状瘤、无性细胞瘤、脑瘤(encephaloma)、子宫内膜癌、内皮瘤、室管膜瘤、上皮瘤、红细胞白血病、尤文肉瘤(ewing's sarcoma)、结外淋巴瘤、猫肉瘤、纤维腺瘤、纤维肉瘤、甲状腺滤泡性癌、神经节神经胶质瘤、胃泌素瘤、胶质母细胞瘤、胶质瘤、性腺胚细胞瘤、血管母细胞瘤(haemangioblastoma)、血管内皮母细胞瘤(haemangioendothelioblastoma)、血管内皮瘤(haemangioendothelioma)、血管外皮瘤(haemocytoblastoma)、血管淋巴管瘤(haematolymphangioma)、成血细胞瘤(haemocytoblastoma)、血细胞瘤(haemocytoma)、毛细胞白血病、错构瘤、肝癌(hepatocarcinoma)、肝细胞癌、肝细胞瘤、组织瘤、霍奇金病(hodgkin's disease)、肾上腺样瘤、浸润性癌、浸润性导管细胞癌、胰岛素瘤、青年鼻咽血管纤维瘤、卡波西肉瘤(kaposi sarcoma)、肾脏肿瘤、大细胞淋巴瘤、白血病、慢性白血病、急性白血病、脂肪瘤、肝癌、肝转移瘤、吕克癌(lucke carcinoma)、淋巴瘤、淋巴管瘤、淋巴细胞白血病、淋巴细胞性淋巴瘤、淋巴细胞瘤、淋巴水肿、淋巴瘤、肺癌、恶性间皮瘤、恶性畸胎瘤、肥大细胞瘤、髓母细胞瘤、黑色素瘤、脑膜瘤、间皮瘤、转移性癌症、摩顿氏神经瘤(morton's neuroma)、多发性骨髓瘤、成髓细胞瘤、骨髓性白血病、骨髓脂肪瘤、骨髓瘤、成肌细胞瘤、粘液瘤、鼻咽癌、肾胚细胞瘤、成神经细胞瘤、神经纤维瘤、神经纤维瘤病、神经胶质瘤、神经瘤、非霍奇金淋巴瘤、少突胶质瘤、视神经胶质瘤、骨软骨瘤、骨原性肉瘤、骨肉瘤、卵巢癌、乳头佩吉特病(paget's disease of the nipple)、肺沟癌、胰腺癌、嗜黄细胞瘤、嗜铬细胞瘤、浆细胞瘤、原发性脑瘤、突变瘤、泌乳素瘤、肾细胞癌、视网膜母细胞瘤、横纹肌肉瘤(rhabdomyosarcoma)、横纹肌肉瘤(rhabdosarcoma)、实体瘤、肉瘤、继发性肿瘤、精原细胞瘤、皮肤癌、小细胞癌、鳞状
细胞癌、草莓状血管瘤(strawberry haemangioma)、t细胞淋巴瘤、畸胎瘤、睾丸癌、胸腺瘤、滋养细胞肿瘤、肿瘤性、前庭神经鞘瘤、威尔姆氏瘤(wilm's tumor)或它们的组合。
113.在一些实施方案中,该疾病选自由癌症、糖尿病和压力组成的组。在特定实施方案中,该疾病是癌症。在特定实施方案中,癌症可选自由以下组成的组:乳腺癌、胰腺癌、肝癌、卵巢癌、结肠癌、脑癌、子宫癌或肺癌。在更特定的实施方案中,癌症是乳腺癌。
114.本发明还涉及到识别参与癌症进展的模式。特别地,本发明能够在其阶段内和阶段之间识别不同的癌症等级。广义上的定义,这些阶段是指非恶性与恶性的,但也可视为正常与不正常的(可选地包括反应性和肿瘤前)与癌性。对该阶段的另一个定义是正常与癌前(例如,非典型导管增生(adh)或非典型乳小叶增生(alh))与癌性(例如,原位癌,诸如dcis和/或lcis)与侵袭性(例如,癌,诸如idc和/或ilc)。本发明也可应用于正常和非正常(包括癌细胞和其他非正常细胞)之间的判别。
115.对例如乳腺癌的分级通常是针对浸润性导管癌(idc)的病例进行的,也可针对浸润性小叶癌(ilc)进行,其中诸如诺丁汉bsr、核形态、组织结构、增殖指数(诸如对pcna或ki67的检测)和分化程度等细胞学标准用于为特定乳腺癌样品分配i级、ii级或iii级。i级通常是指细胞仍然分化良好并且通常对雌激素受体(er)呈阳性。iii级通常是指细胞分化不良并且通常对er呈阴性。ii级通常是指细胞具有介于i级与iii级之间的特征并且可占所有检测样品大约60%。
116.例如乳腺癌的一个或多个“阶段”(或其等效物)是指例如乳腺癌的由已知的细胞学或组织学程序(包括免疫组织学、组织化学和免疫组织化学)定义的生理状态。非限制性示例包括正常与不正常、非癌性与癌性、本文所述的不同阶段(例如,增生性、癌和浸润性)以及不同阶段内的等级(例如,i级、ii级或iii级或它们在癌性阶段内的等效物)。
117.在实施方案中,关于疾病的结果包括对疾病的程度的指示,诸如疾病的阶段、组织学等级、组织学类型、行为、概况、tnm分期(肿瘤/结节/转移)。在特定实施方案中,关于疾病的阶段可为i、ii、iii或iv。在特定实施方案中,关于疾病的行为可为增生性、癌性或浸润性。在特定实施方案中,关于疾病的组织学等级可为i级、ii级或iii级。在特定实施方案中,关于疾病的概况可为管腔a型、管腔b型her2/neu+、管腔b型her2/neu-、her2/neu+或triple-。
118.受试者可使用本发明在一次筛查中诊断出若干疾病。因此,在实施方案中,关于疾病的结果包括至少一种疾病。在特定实施方案中,该结果包括对疾病类型的指示。在特定实施方案中,可诊断出乳腺癌、胰腺癌、肺癌、结肠癌、卵巢癌、肝癌以及子宫癌。在特定实施方案中,可诊断出乳腺癌、胰腺癌和肺癌。
119.肿瘤体积对治疗计划和评估肿瘤消退程度及疾病预后很重要。因此,本发明也能够确定肿瘤本身的大小和体积。在实施方案中,关于疾病的结果包括关于对肿瘤大小的指示。在特定实施方案中,该疾病是癌症,而结果包括对肿瘤大小的指示。
120.另外,结果可包括基于对过去进行的治疗及其成功率的观察的治疗建议。在实施方案中,关于疾病的结果包括治疗建议。
121.在一些实施方案中,关于疾病的结果是基于当前样品与先前分析的样品之间的比较对疾病演变的预测。
122.本发明可用于筛查疾病和监测目的。例如,被诊断患有乳腺癌的患者可定期进行
筛查,以获得关于疾病在不同时间点的阶段/等级的诊断。在一些实施方案中,本发明可用于监测受试者的疾病进展、消退、复发和/或对治疗的反应。
123.在特定实施方案中,本发明还用于监测受试者的肿瘤复发情况。在一个实施方案中,本发明提供了一种用于对给定患者的肿瘤过程及其治疗进行个性化监测的临床算法。该监测可在治疗之前、治疗期间或治疗之后(例如,在外科手术、放疗和/或化疗之后)进行。因此,本发明的系统和方法可用于监测肿瘤的进展、扩散、治疗、转移和/或复发。
124.在实施方案中,关于疾病的结果的准确性(即,分类率)为至少75%。在特定实施方案中,关于疾病的结果的准确性为75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。在特定实施方案中,关于疾病的结果的准确性为至少95%。在特定实施方案中,关于疾病的结果的准确性为95%、96%、97%、98%、99%或100%。在另一实施方案中,准确性%为100%。
125.在实施方案中,关于疾病的结果的敏感性为至少75%。在特定实施方案中,关于疾病的结果的敏感性为75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。在特定实施方案中,关于疾病的结果的敏感性为至少95%。在特定实施方案中,关于疾病的结果的敏感性为95%、96%、97%、98%、99%或100%。在另一实施方案中,敏感性%为100%。
126.在实施方案中,关于疾病的结果的特异性为至少75%。在特定实施方案中,关于疾病的结果的特异性为75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。在特定实施方案中,关于疾病的结果的特异性为至少95%。在特定实施方案中,关于疾病的结果的特异性为95%、96%、97%、98%、99%或100%。在另一实施方案中,特异性%为100%。
127.筛查方法的实施方案
128.检测测试样品中的voc的步骤是指根据voc的浓度,即一些voc在测试样品中存在的强度及其强度之间的比例来确定voc的存在或缺失。一组化学敏感传感器中的每个传感器都输出电信号,该电信号的强度与样品中各种voc的浓度成比例。每个传感器对一系列voc具有不同的亲和力。一些voc可被多于一个传感器检测到。因此,所有传感器的组合反应是关于样品成分的信息。在感测期的每个时间点分析voc的浓度,该感测期可持续例如30分钟,同时样品被加热。样品顶空是样品容器内(或抽屉内,如果没有使用样品容器的话)没有被样品占据的所有空间,即分析室。在分析开始之前,样品顶空填充有室温下的环境空气。在分析期间,当保温毯将热量传递给样品容器和/或样品时,样品中包含的voc在其特定的蒸发温度下蒸发。因此随着voc从样品中蒸发并在样品顶空中出现,样品和样品顶空的成分随时间而变化。因此传感器的反应随时间而变化。通常,由较小的挥发性分子组成的voc会先蒸发。电输出信号是根据在感测期期间提取的信息作为检测的结果生成的,该信息指示测试样品中voc的浓度。例如,如果voc不存在,则输出信号为“0”,如果测试样品中充满voc,则输出信号为“1023”,并且如果存在一定数量的voc,则该信号将取中间值。也就是说,电输出信号特别是模拟信号。
129.然后,所生成的电输出信号经由有线或无线连接发送到第一处理单元。一旦第一处理单元接收到从测试样品中提取的voc数据,就需要对此信息进行处理,以通过处理所生成的输出信号并且通过基于ai的分类软件对所生成的输出信号进行分类来确定关于疾病的结果。
130.在使用基于ai的分类软件之前,系统会在版本桶处检查分类软件的最新版本。在进行任何分类之前,系统要确保安装了最新版本的分类算法。基于ai的分类软件会定期接收实时更新。
131.基于ai的分类软件包括使用不同的数据来生成结果的不同的算法。例如,算法负责处理受试者的从安装在计算机设备上的软件应用程序中获取的健康状况数据和人口统计数据;算法负责处理从一组化学敏感传感器获得的数据;以及算法,该算法合并所有输入数据并识别存储在存储器或数据库中的信息当中的模式。
132.在实施方案中,基于al的分类软件包括至少一个基于ml/ai的分类算法。在特定实施方案中,基于al的分类软件包括将受试者的健康状况数据和人口统计数据作为输入的ann。在特定实施方案中,基于al的分类软件包括将传感器数据作为输入的lstm网络。
133.该输入例如由2d数据阵列组成。阵列的每一行是包含一个传感器的反应的1d向量。每一列中的每个元件都与瞬间相关。因此,数据阵列具有9行(每个传感器一个)和与样品被臭化的次数相同的列,例如,100列。
134.在本发明中,所确定的结果可存储在存储器或数据库中。在这种情况下,基于ai的分类软件在后续筛查操作中也可考虑到受试者的第一个或初始筛查结果,以确定其进一步的筛查结果。因此,在实施方案中,该方法还包括:将所确定的关于疾病的结果存储在存储器或数据库中,其中基于人工智能的分类软件包括考虑到所存储的结果确定关于疾病的结果。
135.对于每个新的分析,分类算法达到输出,该输出是由输入信号是与先前分析的疾病样品更相似还是与对照(健康)样品更相似决定的。这是可能的,因为分类软件中的ai算法已被事先训练过了:网络中每个神经元的权重都被调整为最大程度减小判别误差,即,所预测的患有癌症的概率与绝对真理(对于每个样品均为0%或100%,由在便携式医疗筛查设备分析后执行的活检确定)之间的差异。
136.另外,不是唯一地基于其成分生成关于测试样品的知识,而是本发明在一些实施方案中提出,每当分析新测试样品,并且由筛查设备从人类样品获得一些数据时,所获得的数据就会与数据库中的所有数据,即,来自所有先前分析的样品的传感器数据、用户先前经由用户界面输入的患者数据和/或来自其他用户的传感器/患数据。特别地,新测试样品的分类是基于其与先前分析的数据的相似度来评估的。该分类的等级取决于新测试样品与先前分析的癌症样品的相似程度,以及新测试样品与先前分析的对照(健康)样品的相似程度。换句话说,实施机器学习,以便对测试样品进行分类。
137.因此,本发明提供了一种可用于使用来自受试者的不同类型的测试样品来诊断癌症的便携式筛查解决方案方案。所公开的设备可由一个单一受试者或多个受试者多次使用。
138.通过下面的实施例和对实施方案的详细描述,参考附图,先前和其他优点和特征将得到更充分的理解,附图必须以说明性和非限制性的方式考虑。
附图说明
139.图1示出了根据实施方案的便携式医疗筛查设备的示例。
140.图2a示出了根据实施方案的便携式医疗筛查设备的内部结构的示例。图2b和图2c示出了根据实施方案的、化学敏感传感器在便携式医疗筛查设备的内部结构内的定位的示例。
141.图3示出了根据实施方案的用于筛查受试者的疾病的系统。
142.图4示出了可执行基于ai的分类软件的不同示例。
143.图5示出了所提出的系统的另一示例。
144.图6小图a示出了得分图,该得分图包括投射在使类别之间的样品变异性最大化的假想平面上对照组(十字形)和乳腺癌(三角形)人类尿液样品。该假想平面由两个向量限定:主成分(pc)1和pc 2。这两个向量表示具有不同特征的线性组合。这些样品已使用气相色谱仪-质谱仪进行了分析。图6小图b示出了放大到大多数样品所处的区域。象限i(左上)包含60个样品,其中49个样品是对照组(81.7%)。象限ii和iii(分别为右上和右下)包含12个乳腺癌样品,总共有14个乳腺癌样品(85.7%)。iv象限(左下)呈现了16个乳腺癌样品。
145.图7小图a示出了设备发臭后的对照组和乳腺癌人类尿液样品的分布。这些样品已经用本发明的便携式医疗筛查设备进行了分析。该假想平面由两个向量限定:pc 1和pc 3。样品已被投射到其最高变异性平面上。图7小图b示出了对感兴趣区域的放大。观察到乳腺癌样品聚集在灰色虚线以下的趋势。对照样品示出更大的分散性和更高的变异性。
146.图8小图a和小图b分别示出了根据用于训练cnn模型的样品数量的准确性和损失。准确性是指所有所收集的样品中正确分类的样品的比例。损失函数是计算算法的当前输出与预期输出之间的距离的函数。因此,该函数描述了分类算法对样品的分类程度。当更多的样品用于训练模型时,准确性提高,并且损失降低。样品每次都是一批地进入模型,并且模型预测其类别。损失函数用于计算预测与现实的距离。然后,模型会根据损失值按比例进行调整。因此,当下一批样品进入模型时,样品预测会更准确(因此准确性会更高),并且损失值会降低。这些图示出了在每一批进入模型时这些数值的演变。
147.图9描绘了根据实施方案的软件应用程序的不同界面。a)示出了个人信息界面(例如,受试者的健康状况数据和人口统计数据);b)示出了配置/设置界面;c)和d)示出了筛查历史界面。
148.图10描绘了引导用户通过不同步骤来进行筛查的测试界面。这些步骤如下:a)将便携式医疗筛查设备连接到例如计算机设备;b)采集测试样品;c)引入测试样品;d)关闭抽屉e)启动筛查程序;以及f)显示筛查结果并且根据结果提出建议。
具体实施方式
149.本发明提供了一种用于筛查受试者的疾病,特别是诸如乳腺癌等癌症的系统、设备和方法。
150.参考图1和图2a至图2c,其中示出了所提出的便携式医疗筛查设备(或简称筛查设备)100的示例。根据本实施方案,筛查设备100由箱体101构成,该箱体具有用于引入抽屉102的中空部分。用户/受试者可打开抽屉102并且在筛查设备100的收集室104中引入待筛查/分析的测试样品。用户可通过拉动和推动附接到抽屉102的旋钮或其他这样的装置来打
开和关闭抽屉102。应当注意的是,在图中未示出的其他实施方案中,筛查设备100可不包括抽屉102。
151.图2a示出了筛查设备100的内部结构103的示例,包括收集室104、网格105(不是限制性的,因为在其他实施方案中,筛查设备可能没有此部件)以及分析室107。筛查设备100还包括一组化学敏感传感器201-209(在图2b和图2c中被描述为本发明的特定实施方案)、计算部件(或第一处理单元)和可选地通信单元。在其他实施方案中,该组化学敏感传感器的传感器数量和类型可不同(特别地,该组化学敏感传感器可包括5个至20个)。内部结构103包含在箱体101内部。
152.当测试样品(例如,人类样品,诸如尿血、汗液、阴道分泌物等)被引入收集室104中时,化学成分从样品中蒸发,穿过网格105(如果存在),到达分析室107所在的上部隔室,在上部隔室处,该组化学敏感传感器201-209,特别是金属氧化物传感器(例如,氧化锡传感器等)和/或有机化合物敏感传感器可检测到测试样品中的voc并且生成指示测试样品中这样的voc的存在或缺失的输出信号作为检测的结果。特别地,所生成的输出信号是(模拟)电信号,其电压与voc的浓度成比例。
153.特别地,第一处理单元和通信单元(如果存在)被放置在筛查设备100的下部处、位于内部结构103内和收集室104后面。第一处理单元经由有线或无线连接操作性地连接到该组化学敏感传感器201-209以接收所生成的输出信号。在一些实施方案中,第一处理单元可为微处理器。
154.虽然未示出,但在一些实施方案中,抽屉102(如果存在)可填充有绝缘材料并且并包括孔,以将包含待筛查/分析的测试样品的收集室插入其中。然而,孔的内壁可附加地用保温毯覆盖。为了控制样品加热过程,第一处理单元可操作性地连接到继电器,该继电器可机械地启动设备并且停止设备向保温毯和与孔壁接触的温度传感器馈送电压。
155.图3示出了可包括在所提出的用于筛查用户/受试者的疾病,特别是癌症的系统中的不同元件/实体的示例。此特定实施方案的系统包括所公开的筛查设备100、安装在用户的计算机设备120上的软件应用程序121(参见图4)、远程处理单元130、和数据库(或存储器)140。应当注意的是,在其他实施方案中,该系统不需要包括所有上述元件。此外,在其他实施方案中,系统可包括多于一个存储器/数据库和存储器/数据库140(而非远程的)可包括在其他系统元件中的任何其他系统元件中,即软件应用程序121、第一处理单元和/或远程处理单元130。
156.如图3所示,筛查设备100、软件应用程序121、远程处理单元130(例如基于云的服务器)、和存储器或数据库140可操作性地连接并在这些元件之间交换数据(例如,输出信号或传感器数据、受试者的数据、存储在存储器或数据库中的数据,即受试者和/或多个健康和不健康个体的健康状况数据或人口统计数据或关于疾病的结果)。在一些实施方案中,筛查设备100是经由用户的计算机设备120访问的,该计算机设备进而连接到可从存储器/数据库140发送和接收数据的远程处理单元130。替代地或作为补充,数据还可从软件应用程序121流向远程处理单元130,并且从远程处理单元130流向软件应用程序121。类似地,数据可直接从连接到远程处理单元130的用户的计算机设备120评估并且交换信息。此外,远程处理单元130可连接到存储器/数据库140,其中数据从远程处理单元130流向存储器/数据库140,反之亦然。
157.因此,分类可借助于基于ai的分类软件150在所提出的解决方案的许多地方进行,诸如在筛查设备100上、在软件应用程序121上和/或在远程处理单元130上(参见图4中的虚线框)。用户/受试者可例如经由输出显示器在筛查设备100本身上看到他们的结果,或者在用户的计算机设备120上使用软件应用程序121查看。用户的计算机设备120可为任何设备,诸如智能手机、膝上型计算机、pda、平板计算机、可穿戴设备或上述设备的任何组合等。
158.存储器/数据库140也可包括受试者和多个健康和/或不健康个体的健康状况数据和/或人口统计数据。例如,用户/多个健康和/或不健康个体的健康状况数据和/或人口统计数据可包括年龄、性别认同、性别、民族、出生地/居住地、药物消费(例如,烟草习惯、酒精习惯、大麻习惯、其他毒品习惯)、饮食习惯、用户或个体的病史、受试者的家族病史、药物摄入量、家族乳腺癌史(例如,母亲、姐妹、女儿、祖母、姑姑)、个人癌症史(例如,乳腺癌、肺癌、卵巢癌、结直肠癌、黑色素瘤、膀胱癌、非霍奇金淋巴瘤、肾癌)、体重、身高、糖尿病史、甲状腺病症、多囊卵巢综合征、骨质疏松症、其他内分泌疾病、初潮时间、月经、绝经、足月分娩的孩子数量、早产数量、流产数量、在世分娩的孩子数量、生育状况(例如,怀孕、哺乳、产后、正在接受生育药物治疗)、乳房疾病史(例如,月经周期过程中的乳房疼痛、荷尔蒙变化、囊肿、纤维腺瘤、常见肿块、乳头溢液、乳头疼痛、破裂和瘙痒、乳头内陷)、初潮年龄、第一次生育的年龄、开始绝经的年龄、乳房x光检查和放射线检查次数等。
159.特别地,为了执行这种分类,本发明提供了所引用的基于人工智能的分类软件150,该基于人工智能的分类软件由利用机器学习(ml)和/或人工智能(ai)技术的处理算法和分类算法组成。分类是基于人类样品的性质。因此,基于ai的分类软件150可通过处理所生成的输出信号并对其进行分类来确定关于疾病的结果。在一些其他实施方案中,基于ai的分类软件150还可考虑到多个健康和/或不健康个体以及用户/受试者的健康状况数据和/或人口统计数据,确定关于疾病的结果。
160.在一些实施方案中,关于疾病的结果由关于疾病的存在或缺失的指示组成。例如,结果可只是“0”或“1”或断言筛查结果是好或坏的词语(例如,“健康”或“不健康”)。在其他实施方案中,结果还可指示疾病的程度(例如,ii级)、疾病的类型(或亚型)(例如,疾病的类型为乳腺癌,或例如,疾病的亚型为乳腺癌的类型)、治疗建议,甚至是肿瘤大小。
161.根据特定实施方案,基于ai的分类软件150包括将用户/受试者的人口统计数据作为输入的人工神经网络(ann)。此ann用作用于提取关于受试者的医疗状况的信息的编码器并且将此信息编码成使得该信息可读并且具有信息量以进行下一个数据处理步骤。此外,长短期记忆(lstm)网络可用传感器数据(即,所生成的输出信号)馈送。lstm网络的输入层由两种类型的神经元组成:1)将经编码的受试者(已被ann编码)的数据作为输入的神经元;2)将来自化学敏感传感器201-209的数据作为输入的神经元。因此lstm由两组单独的神经元(两个子网)组成。这些神经元在其内部以及彼此之间是完全连接的,即,这些神经元基本上是密集网络。
162.在实施方案中,基于ai的分类软件150由软件应用程序121执行。因此,在这种情况下,数据(例如,输出信号或传感器数据)从筛查设备100流向计算机设备120。根据此特定实施方案,由基于ai的分类软件150生成的结果借助于软件应用程序121在计算机设备120中显示。为了生成结果,基于ai的分类软件150可考虑多个健康和/或不健康个体以及用户/受试者的健康状况数据和/或人口统计数据,如上文所述。
163.在另一实施方案中,基于ai的分类软件150由远程处理单元130执行。因此,数据(例如,输出信号)从筛查设备100流向远程处理单元130。此外,由计算机设备120收集的附加数据(例如,受试者的数据)可从计算机设备流向远程处理单元130。类似地,存储在存储器/数据库140中的数据可从该存储器/数据库流向远程处理单元130,反之亦然。由基于ai的分类软件150生成的结果可借助于软件应用程序121在计算机设备120中显示、由远程处理单元130本身或筛查设备100显示。
164.在又一实施方案中,基于ai的分类软件150由位于筛查设备100中的第一处理单元执行。在这种情况下,由基于ai的分类软件150生成的结果可由筛查设备100、计算机设备120或远程处理单元130根据系统/方法配置直接显示。为了生成所述结果,基于ai的分类软件150可考虑多个健康和/或不健康个体以及用户/受试者的健康状况数据和/或人口统计数据,如上文所述。
165.图5示出了系统的另一实施方案。在这种情况下,第一处理单元和通信单元在硬件板110中实施,该硬件板包括在筛查设备100中。上述两个部件接收在分析室107处从样品获取的数据(即,所生成的输出信号)。该数据可在筛查设备100上进行分类,或者可发送到软件应用程序121或远程处理单元130。软件应用程序121和远程处理单元130两者都可分配基于ai的分类软件150。在使用筛查设备100之前需要下载软件应用程序121,并且从测试样品获得的数据可在通信单元接收到数据后立即传送到软件应用程序121上。软件应用程序121随后可对数据进行分类或将数据发送到远程处理单元130以在其中进行分类。
166.在使用基于ai的分类软件150之前,系统会在版本桶131处检查分类软件150的最新版本。在进行任何分类之前,系统要确保安装了最新版本的分类算法150。基于ai的分类软件150会定期接收实时更新。一旦从某个测试样品获得的一条数据被分析和分类,这些数据就会被储存在数据库140中。此外,当基于ai的分类软件150确定诊断时,这就可显示出来,如前文所述。
167.软件应用程序121可用python开发并且可使用终端会话在linux上运行。软件应用程序121可充当用户指南来完成筛查过程。在一些实施方案中,对软件应用程序121的访问是经由用户登录通过给定的用户界面进行的(参见图9和图10)。软件应用程序121还可提供欢迎屏幕、菜单、个人数据屏幕以及应用程序的筛查历史屏幕,提供应用程序的用户将看到的各种屏幕。软件应用程序121可用于获取用户/受试者的健康状况数据和/或人口统计数据。
168.实施例
169.实施例1:第一设备原型的乳腺癌筛查设置
170.目的是寻找来自对照受试者和转移性乳腺癌患者的合成尿液和人类尿液两者中的voc模式,以训练筛查设备原型,最终能够筛查真实人类尿液样品中的乳腺癌。
171.1.1方法
172.1.1.1合成尿液制备和人类尿液收集
173.制备了6种单一voc溶液和30种合成尿液样品,并且收集了90个人类尿液样品。
174.首先,针对第一种理论方法制备了6个voc样品,包含对照voc(ctr)(即,通常在健康人类尿液中找到的voc)或与乳腺癌有关的voc(bc)于11ml蒸馏水中(表1)。
175.表1:单一voc样品。8-oxodg是8-氧代-2'-脱氧鸟苷。
176.voc样品浓度(pg)丙酮8.662-丁酮0.462-壬酮32.62苯甲酸288-oxodg0.4308-oxodg0.687
177.在对单一voc溶液取等分后,制备了30个合成尿液样品,以进一步测试分类算法。为了使合成尿液尽可能接近现实,模拟了10种尿液,在预期范围内采取不同的voc浓度值(表2)。11ml尿液中的voc浓度与100ml人类尿液中的预期浓度对应。
178.表2:合成尿液的成分。数值以先前制备的表1中的样品的ml表示。
[0179][0180]
一旦制备了单一voc溶液和合成尿液样品,就收集了人类尿液样品。为了确保研究中参与者的匿名性,每个参与者都被随机分配了在分析期间用于指代样品的号码。
[0181]
对90名成年妇女进行了人类采样。如果患者有除乳腺癌以外的任何癌症类型、尿路感染或可能影响尿液成分的其他病理的历史,则患者被排除在外。不鼓励在样品提取前12h内饮酒。关于患者的民族和烟草、药物或食物的消费,没有排除标准。月经不是排除标准。然而,月经与采样事件的接近程度被记录下来,以了解未来可能发生的任何错误分类。将等分的尿液转移到11ml的顶空小瓶并在分析前冷冻。将人类尿液样品储存在0℃下持续24h至48h。
[0182]
在雷乌斯圣胡安大学医院(hospital universitari sant joan,reus)(西班牙)对处于晚期的39名转移性乳腺癌患者进行乳腺癌患者的尿液采样。患者的年龄在29岁至75岁的范围内(平均年龄为54.9
±
12.0岁)。患者是由该医院的乳腺癌肿瘤学小组随机选择的。其方案、患者同意书和法律-伦理方面都由遗产基金会佩尔维吉利医院伦理委员会(fundacio institut d’lnvestigacio sanitaria pere virgili ethics committee)(ceim)审查和批准。
[0183]
对来自塔拉戈纳(tarragona)、巴塞罗那(barcelona)和雷乌斯的年龄在18岁至78岁(平均年龄为29.7
±
15.8)的51名均匀采样的受试者进行了对照组人类尿液收集,这些受试者没有出现任何类型的癌症或不知道有这种疾病。所有受试者均排除患有糖尿病、心血管疾病和其他类型的癌症,并且在参与前给予口头知情同意。
[0184]
1.1.2气相色谱-质谱(gc-ms)样品分析
[0185]
气相色谱-质谱(cg-ms)数据检查首先要考虑的是测试正在研究中的voc是否的确通过分析检测出来。进行了gc-ms真空设置和机器校准。
[0186]
用gc-ms分析了单一voc溶液、合成尿液和人类样品,以便更好地了解其成分。至于人类样品,对51个对照样品和39个乳腺癌样品分析了3次。gc-ms被编程为在20分钟内进行2052次分析。
[0187]
1.1.3分类算法的训练和测试
[0188]
在此步骤中,检查了先前获得的样品读数。目的如下:
[0189]
1)检查单一voc溶液的读数,以确定gc-ms和正在研究中的设备是否能够正确检测voc。
[0190]
2)检查合成尿液的读数,以确定gc-ms和正在研究中的设备是否能够正确区分模拟的疾病尿液和模拟的对照尿液。换句话说,评估当多种voc同时存在时,尿液成分是否显著。
[0191]
3)检查人类尿液的读数,以确定gc-ms和正在研究中的设备是否能够辨别类别之间的差异。
[0192]
一旦样品制备和gc-ms分析完成,使用预处理算法、处理算法和预测算法对样品进行分类。输入数据是gc-ms的原始数据文件,其中包含了voc溶液、合成尿液和人类尿液的气味概况。
[0193]
实施信号预处理程序的目的是将复杂的原始数据转化为无噪音、可读的有效数据。这是通过实施插值、色谱设计、去除基线、平滑过滤、归一化和3倍样品平均化来尝试实现的。此步骤是通过使用基于r的代码完成的,该代码将原始gm-ms文件作为输入并对其进行处理,以输出其总离子色谱图(tic)。
[0194]
对于处理步骤,使用了基于python的处理代码,该代码将tic作为输入并对其进行统计处理,以输出样品分类。在这种情况下使用的算法是主成分分析(pca),并且进行了拓扑学检查。
[0195]
接下来,该算法的执行被设计用于预测目的。分别评估了其关于单一voc制剂、合成样品和人类尿液的结果。使用基于r的代码和k最近邻(knn)算法获得voc模式比较器,以评估gc-ms是否能够检测到所靶向的voc。
[0196]
1.1.4设备原型设计和测试
[0197]
下一步像之前一样继续进行样品程序,但此时用正在研究中的设备原型而不是使用gc-ms来分析尿液。该设备的第一原型是基于具有四个voc化学敏感传感器(金属氧化物传感器)的arduino板进行设计和建立的,以捕获尿液的“嗅觉气味”(称为tic)。所使用的金属氧化物传感器如下:
[0198]-tgs 2600,费加罗公司(figaro inc.)(对气态空气污染物敏感)
[0199]-tgs 2602,费加罗公司(对voc、nh3、甲基苯等敏感)
[0200]-tgs 2610,费加罗公司(对丙烷、丁烷等敏感)
[0201]-tgs 2620,费加罗公司(对酒精、有机蒸气、voc敏感)
[0202]
该设备原型闻到90个人类尿液样品味,并且先前设计的软件被实施到arduino微控制器中。每个样品都被所有四个化学敏感传感器以每秒一次的速度闻到气味,持续30秒。因此,样品记录的输出是用于每个样品的120维特征向量。
[0203]
进行分类的输入数据是设备原型所闻到的合成尿液和人类样品的气味概况。pca算法和knn算法用作模板来设计分类算法。
[0204]
因为arduino微处理器没有足够的存储区来托管pca代码,所以此代码是在线工程化处理的,随后被实施到arduino中,从而使该代码能够通过实施到设备中的另一代码自主地离线进行。此代码包含使得设备能够基于voc概况将样品分类为对照组或乳腺癌的分类算法。
[0205]
一旦该算法被实施到arduino微处理器中,就从整个数据集(n=90)中随机选择54个样品,用于训练算法,即定义分数-参数,这些分数-参数定义pca。剩余的36个测试样品用于通过对样品进行分类来测试设备原型。最后,为了验证由设备原型获得的分类结果,将结果与所获得的gc-ms数据(通过使用pca和knn获得的分类)进行比较。
[0206]
1.2结果
[0207]
1.2.1gc-ms筛查和样品分类
[0208]
本章节专门评估用gc-ms分析的人类尿液样品的分类成功率。如图6(a)所示,通过pca降维后的gc-ms数据直观地示出了对照组(十字形)与转移性乳腺癌(三角形)尿液样品之间的差异。图6(b)是图6(a)的放大图。主成分(pc)1和2解释了类别当中很大比例的变化。pc是新特征,这些新特征被构建为初始特征的线性组合或混合物,即化学敏感传感器在每个瞬间的反应的线性组合或混合物。从几何学上讲,pc表示解释最大变异量的数据方向,即,捕或数据的最大信息量的线。
[0209]
图6中的得分图示出了象限i中81.7%的样品是对照组(左上),象限ii和iii中85.7%的样品(右)是乳腺癌,而象限iv中100%的样品(左下)也是乳腺癌。因此,可指出,降维对样品空间变异性进行了强有力的优化,并且前两个pc解释的变异性很可能是由给定样品所属的类别导致的。
[0210]
此程序旨在确定gc-ms是否足以敏感以区分乳腺癌样品与对照样品,从而获得两类样品之间存在足够差异的证据。因此,样品分类的第一步用gc-ms数据进行。
[0211]
在获得由pca为被分析的人类尿液样品建立的得分图后,还使用了knn算法来获得另一种分类。使用了46个训练样品和44个测试样品。在19个实际的乳腺癌样品中,11个样品被分类为乳腺癌。在25个对照样品中,24个对照样品被如此分类。因此,执行此精确的示例的分类率为79.55%。
[0212]
接下来要考虑的模型验证点是关于样品聚类和分类。因为此模型操纵的人类样品会影响患者的治疗和结果,所以不仅要评估分类率,还要评估假阴性(敏感性)和假阳性(特异性)的比率。结果在表3中示出。
[0213]
表3:当用gc-ms分析时,对人类样品的分类(pca)和聚类(knn)模型在分类率、敏感性和特异性方面进行验证。
[0214] pca(%)knn(%)分类率77.1179.55敏感性75.0579.04特异性68.3398.18
[0215]
通过上文的结果,可得出结论,knn分类方法导致了比pca更好的类别预测:knn不仅在分类率上有优势,而且在敏感性上也有优势,敏感性是在用医疗保健应用程序验证模型时最重要的参数中的一个参数。
[0216]
1.2.2设备原型筛查
[0217]
本章节专门评估用设备原型分析的人类尿液样品的分类成功率。每个样品读数都以四列(每个传感器一列)和30行的形式呈现,因为每个传感器在每次分析时都会读取每个样品30次。一旦通过使用voc化学敏感传感器对样品进行分析获得了voc模式,就对所得数据进行分类。90个样品中的54个样品用于训练模型,而剩余36个样品用于测试模型。
[0218]
图7中更详细地示出了样品投射到平面的得分图pc 1至pc 3。通过观察此投射,33个样品聚集在假想线下,其中29个样品(87.9%)是乳腺癌样品。在此阈值以上有40个对照样品,其中85.1%是对照样品。发现乳腺癌样品与对照样品有显著不同。
[0219]
在表4中示出了训练模型的验证结果。
[0220]
表4:当用该设备分析时,对人类样品(n=90)的分类(pca)训练模型在分类率、敏感性和特异性方面进行验证。
[0221] pca(%)分类率58.3敏感性75.0特异性45.0
[0222]
从测试样品来看,真阳性(tp)、真阴性(tn)、假阳性(fp)和假阴性(fn)的数量分别为12、9、11和4。
[0223]
这个基于气味的癌症筛查设备的早期模型在实施例2中得到进一步发展。
[0224]
实施例2:通过使用改进的设备原型的乳腺癌筛查
[0225]
2.1方法
[0226]
2.1.1数据收集和处理
[0227]
使用从实施例1提取的数据(从四个化学敏感传感器获得的尚未预处理的原始数据)执行工作实施例。因此,使用改进的分类算法对来自对照受试者的51个尿液样品和来自乳腺癌受试者的39个尿液样品的数据进行了分析和分类。
[0228]
在对数据进行分类之前,对数据进行预处理,以确保以后的分类将依赖于癌症的特征,而不是不相关的假象。首先,对数据进行归一化。
[0229]
2.1.2软件设计和测试
[0230]
在样品预处理后,将数据馈送到卷积神经网络(cnn)。此网络由大小为32、64、128、128的四个卷积过滤器和线性激活组成。神经网络的输出层利用softmax激活函数提供两个单元(两个输出)。具体地,此模型用65个尿液样品进行训练,用12个样品进行测试,并且用13个样品进行验证。
[0231]
被实施了其他分类方法,诸如pca、决策树、knn和使用pca的knn。
[0232]
2.1.3改进的设备原型设计和测试
[0233]
与前一原型相比,这个第二设备具有9个voc化学敏感传感器和一个更强大的微处理器。基于统计学的算法也被ai算法所取代。前一微处理器是arduino uno,而这个第二原型具有mkr arduino wifi,包括wifi连接。另外,此原型的分类算法在基于云的服务器中运行,这使得计算能力比前一原型更大,在前一原型中,分类算法在边缘上(arduino板上)运行。
[0234]
2.2结果
[0235]
如图8(a)所示,cnn模型的准确性(y轴)随着训练的进行而增加,因为使用更多的
样品来训练——每个样品被多次使用(x轴)。因为准确性在训练(“*”线)和测试(
“‑”
线)数据集两者中都遵循类似的方式,所以可得出结论,该模型并没有过度拟合。类似的逻辑(但这次适用于损失函数)可适用于损失函数图(图8(b)):随着模型训练的进行,损失函数减少——因此分类会更好。数值结果在表5中显示。
[0236]
表5:对人类样品的cnn分类模型在准确性和损失方面进行训练、测试和验证。
[0237] 训练(n=65)测试(n=12)验证(n=13)准确性1.01.01.0损失0.00190.07420.0230
[0238]
还实施了其他分类方法(pca、决策树、knn和使用pca的knn),但这些方法均未比ai模型表现得更好(表6)。
[0239]
表6:对各种生物统计学方法(pca、决策树、knn和knn的组合)与基于ai的方法(卷积神经网络)的可检测能力进行比较。
[0240][0241]
在整个说明书和权利要求书中,词语“包括(comprise)”和“包含(include)”及其变体并不旨在排除其它技术特征、添加剂、组分或步骤。在审阅本说明书时,本发明的另外的目的、优点和特征对于本领域的技术人员而言将变得显而易见,或可以通过本发明的实践来获悉。此外,本发明涵盖本文所述的具体实施例和优选实施例的所有可能的组合。
[0242]
尽管已经参考特定示例实施方案描述了本发明实施方案,但是显而易见的是,在不脱离各种实施方案的更广泛的精神和范围的情况下,可对这些实施方案进行各种修改和改变。
技术特征:
1.一种用于筛查受试者的疾病的系统,所述系统包括:-便携式医疗筛查设备(100),所述便携式医疗筛查设备包括:收集室(104),所述收集室被配置为收集受试者的至少一个测试样品;一组化学敏感传感器(201-209);分析室(107),所述分析室被配置为分配所述一组化学敏感传感器(201-209),所述一组化学敏感传感器被适配成检测所述测试样品中的挥发性有机化合物并且生成指示所述测试样品中挥发性有机化合物的存在或缺失的输出信号作为检测的结果;和第一处理单元,所述第一处理单元操作性地连接到所述一组化学敏感传感器(201-209)以接收所生成的输出信号;和-基于人工智能的分类软件(150),所述基于人工智能的分类软件被配置为通过处理所生成的输出信号并对其进行分类来确定关于所述疾病的结果,其中所述基于人工智能的分类软件(150)由所述第一处理单元、安装在计算机设备(120)上的软件应用程序(121)或远程处理单元(130)执行,其中在所述基于人工智能的分类软件(150)由所述软件应用程序(121)或所述远程处理单元(130)执行的情况下,所述便携式医疗筛查设备(100)还包括通信单元,所述通信单元操作性地连接到所述第一处理单元并且被配置为建立与所述远程处理单元(130)和/或所述软件应用程序(121)的通信。2.根据权利要求1所述的系统,其中所述系统包括所述远程处理单元(130)、所述软件应用程序(121)和至少一个存储器或数据库(140),所述至少一个存储器或数据库被配置为存储所述受试者和/或多个健康和/或不健康个体的健康状况数据和/或人口统计数据。3.根据权利要求2所述的系统,其中所述基于人工智能的分类软件(150)还被配置为至少考虑到所述多个健康和/或不健康个体的所存储的健康状况数据和/或人口统计数据确定关于所述疾病的所述结果。4.根据前述权利要求中任一项所述的系统,其中所述基于人工智能的分类软件(150)包括至少一个基于机器学习和/或人工智能的分类算法。5.根据前述权利要求中任一项所述的系统,其中所述便携式医疗筛查设备(100)包括定位在所述收集室(104)上方的网格(105)和/或用于打开、关闭和支撑所述收集室(104)的抽屉(102)。6.根据权利要求5所述的系统,其中所述便携式医疗筛查设备由箱体(101)构成,所述箱体被适配成包围所述收集室(104)、所述网格(105)、所述分析室(107)、所述第一处理单元和所述通信单元,所述箱体(101)具有用于引入所述抽屉(102)的中空部分。7.根据前述权利要求中任一项所述的系统,其中所生成的输出信号包括电信号,所述电信号的电压与挥发性有机化合物的浓度成比例。8.根据前述权利要求中任一项所述的系统,其中所述一组化学敏感传感器(201-209)包括金属氧化物传感器和/或有机化合物敏感传感器。9.根据前述权利要求中任一项所述的系统,其中所述第一处理单元经由无线连接连接到所述一组化学敏感传感器(201-209)。10.根据前述权利要求中任一项所述的系统,其中所述疾病是癌症。11.根据前述权利要求中任一项所述的系统,其中所述测试样品选自由以下组成的组:
尿液、呼吸物、阴道分泌物、经血、粪便和唾液。12.一种用于筛查受试者的疾病的方法,所述方法包括:由便携式医疗筛查设备(100)的收集室(104)收集受试者的至少一个测试样品;由分配在所述便携式医疗筛查设备(100)的分析室(107)上的一组化学敏感传感器(201-209)检测所述测试样品中的挥发性有机化合物并且生成指示所述测试样品中挥发性有机化合物的存在或缺失的输出信号作为检测的结果;由所述便携式医疗筛查设备(100)的第一处理单元接收所生成的输出信号;以及由基于人工智能的分类软件(150)通过处理所生成的输出信号并对其进行分类来确定关于所述疾病的结果,其中所述基于人工智能的分类软件(150)由所述第一处理单元、安装在计算机设备(120)上的软件应用程序(121)或远程处理单元(130)执行,其中在所述基于人工智能的分类软件(150)由所述软件应用程序(121)或所述远程处理单元(130)执行的情况下,所述软件应用程序(121)或所述远程处理单元(130)操作性地连接到所述便携式医疗筛查设备(100)的通信单元。13.根据权利要求12所述的方法,其中存储器或数据库(140)包括存储在其中的多个健康和/或不健康个体的健康状况数据和/或人口统计数据,并且其中所述基于人工智能的分类软件(150)包括考虑到所存储的健康状况数据和/或人口统计数据确定关于所述疾病的所述结果。14.根据权利要求13所述的方法,所述方法还包括:获取所述受试者的健康状况数据和/或人口统计数据以及将所获取的数据存储在存储器或数据库中,其中所述基于人工智能的分类软件(150)包括考虑到所述受试者的所存储的健康状况数据和/或人口统计数据确定关于所述疾病的所述结果。15.根据权利要求12至14中任一项所述的方法,所述方法还包括:将所确定的关于所述疾病的结果存储在存储器或数据库(140)中,其中所述基于人工智能的分类软件(150)包括考虑到所存储的结果确定关于所述疾病的所述结果。16.根据权利要求12至15中任一项所述的方法,其中所述基于人工智能的分类软件(150)包括至少一个基于机器学习和/或人工智能的分类算法。17.根据权利要求12至16中任一项所述的方法,其中关于所述疾病的所述结果包括对所述疾病的存在或缺失的指示。18.根据权利要求12至17中任一项所述的方法,其中所述结果包括对所述疾病的程度和/或类型以及/或者肿瘤大小的指示。19.根据权利要求12至18中任一项所述的方法,其中所述疾病是癌症。20.根据权利要求12至19中任一项所述的方法,其中所述测试样品选自由以下组成的组:尿液、呼吸物、阴道分泌物、经血、粪便和唾液。21.一种便携式医疗筛查设备,所述便携式医疗筛查设备包括:-收集室(104),所述收集室被配置为收集受试者的至少一个测试样品;-一组化学敏感传感器(201-209);-分析室(107),所述分析室被配置为分配所述一组化学敏感传感器(201-209),所述一组化学敏感传感器被适配成检测所述测试样品中的挥发性有机化合物并且生成指示所述
测试样品中挥发性有机化合物的存在或缺失的输出信号作为检测的结果;和-第一处理单元,所述第一处理单元操作性地连接到所述一组化学敏感传感器(201-209)以接收所生成的输出信号。22.根据权利要求21所述的设备,所述设备包括通信单元,所述通信单元操作性地连接到所述第一处理单元并且被配置为建立与远程处理单元(130)和/或安装在计算机设备(120)上的软件应用程序(121)的通信。23.根据权利要求22所述的设备,所述设备包括定位在所述收集室(104)上方的网格(105)和/或用于打开、关闭和支撑所述收集室(104)的抽屉(102),其中所述便携式医疗筛查设备(100)由箱体(101)构成,所述箱体被适配成包围所述收集室(104)、所述网格(105)、所述分析室(107)、所述第一处理单元和所述通信单元,所述箱体(101)具有用于引入所述抽屉(102)的中空部分。
技术总结
提供了一种用于筛查受试者的疾病的系统、方法和设备。该系统包括便携式医疗筛查设备,该便携式医疗筛查设备包括:收集室,该收集室用于收集受试者的测试样品;一组化学敏感传感器;分析室,该分析室用于分配该组化学敏感传感器以检测测试样品中的VOC并且生成指示测试样品中VOC的存在或缺失的输出信号;和第一处理单元,该第一处理单元操作性地连接到该组化学敏感传感器以接收所生成的输出信号。该系统还包括基于人工智能的分类软件以通过处理所生成的输出信号并对其进行分类来确定关于疾病的结果。分类软件可由第一处理单元、安装在计算机设备上的软件应用程序或远程处理单元执行。执行。执行。
技术研发人员:胡迪特
受保护的技术使用者:蓝盒生物医疗解决方案有限公司
技术研发日:2021.12.27
技术公布日:2023/9/14
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/
上一篇:丝网掩模清洁装置的制作方法 下一篇:用于公共TCI状态更新的DCI的制作方法