一种基于赋形剂分类的药物增溶性能的预测方法
未命名
08-26
阅读:132
评论:0

1.本发明涉及一种药物增溶性能的预测方法,尤其涉及一种基于赋形剂分类的药物增溶性能的预测方法。
背景技术:
2.大多数药物都存在水溶性差,溶解度低,导致生物利用度低、生理相容性弱、患者依从性差的问题,严重阻碍并限制了大部分药物的临床治疗和应用。已有研究人员为克服药物溶解度低所引起的一系列问题做了大量相关研究并取得突破性进展。目前提高低溶性药物溶解度的各种技术包括药物物理修饰、化学修饰等,如减小粒径、晶体工程、形成盐、固体分散技术、表面活性剂及络合技术等(international scholarly research notices,2012.195727,(10))。络合技术是提高水溶性差或水不溶性药物溶解度和生物利用度的一种良好策略和方法。与原料药相比,包合物的药物溶解度大大提高。
3.但由于药物种类繁多,不同辅料性质复杂、并且操作条件多样又不固定。即使对于相同包合物,若操作条件不同,包合物中赋形剂灵活多样且性能不一,仍会导致增溶效果差异性巨大,实验耗时且成本高。大量相关文献同时对药物溶解百分比和溶解效率进行实验测定。其中,药物溶解百分比(dp)定义为在给定时间内溶解药物量到包合物的总量。溶解效率(de)定义为溶解曲线下到一定时间(t)的面积,表示为药物具体某一时间(t)溶解矩形面积与药物100%溶解是矩形面积的百分比。
[0004][0005]
q是溶解百分比,t是对应溶解时间。
[0006]
现阶段已有相关文献报道通过结合不同机器学习方法(决策树、随机森林和人工神经网络等)预测具体药物在不同环境下的体内外溶解度,如使用盐酸小檗碱(bbr)作为脂质给药系统(lbdds)的模型药物,通过机器学习方法预测药物-磷脂复合物在体内外传递的抑制效率(international scholarly research notices,2012(10),195727)。目前已成功利用多种机器学习方法预测12种抗癌药物在超临界二氧化碳中的溶解度(pharmaceutics,2022,14(8):1632),验证了利用机器学习方法预测药物溶出度是可行且有效的。药物溶解百分比和溶解效率在反映药物增溶效果中同样重要,但传统研究主要是关注在不同溶剂(包括但不局限于水或有机溶剂)中的药物溶解度,针对不同辅料增溶后药物溶解度提升没有便捷且准确的研究方法。
技术实现要素:
[0007]
发明目的:本发明的目的在于提供一种基于赋形剂分类的药物增溶性能的便捷且准确的预测方法。
[0008]
技术方案:本发明的一种基于赋形剂分类的药物增溶性能的预测方法,包括如下步骤:
[0009]
(1)数据收集处理:收集不同赋形剂作为主要增溶剂条件下的药物溶解百分比和溶解效率数据值进行处理,去除多种赋形剂共同提高药物溶解度的数据值;
[0010]
(2)等级划分:根据步骤(1)得到的药物溶解百分比和溶解效率数据值划分为药物组成或复杂操作条件的特征变量数据集,并将数据集按6~8:2~4划分为训练集和测试集;
[0011]
(3)相关性和特征重要性计算:针对不同赋形剂作为药物主要增溶剂条件下的特征变量,分别与药物溶解百分比和溶解效率进行相关性计算和特征重要性排序;
[0012]
(4)建立模型:采用机器学习算法分别建立赋形剂作为药物主要增溶剂条件下,药物溶解百分比和溶解效率的定量预测模型;
[0013]
(5)预测:用于将不同赋形剂作为药物主要增溶剂条件下,多种药物组成或复杂操作条件的特征变量,分别代入药物溶解百分比和溶解效率的定量预测模型进行预测。
[0014]
优选的,步骤(1)中,所述赋形剂,包括聚乙二醇peg、聚乙烯吡咯烷酮pvp、羟丙基甲基纤维素hpmc或环糊精作为药物主要增溶剂条件下对药物溶解百分比和溶解效率进行预测。
[0015]
优选的,步骤(1)具体包括如下步骤:
[0016]
(11)对不同赋形剂作为药物主要增溶剂环境下收集的药物组成和复杂操作条件的数据值进行换算至相同单位;
[0017]
(12)对统一过的数据进行核实验证确保数据有效真实;
[0018]
(13)在不同赋形剂作为药物主要增溶剂条件下对上述所有数据值进行逐一排查,去除多种赋形剂共同提高药物溶解度的数据值;若收集的数据值中某一具体药物的特征变量值超出绝大多数数据值存在范围过高或过低,则选择去除该异常数据值。
[0019]
优选的,步骤(2)中,所述数据集按7:3划分为训练集和测试集。
[0020]
优选的,步骤(2)中,所述药物组成,包括药物含量dc、药物分子量m或赋形剂与药物的摩尔比molar ratio。
[0021]
优选的,步骤(2)中,所述复杂操作条件,包括药物浓度c、压力p、ph值、温度t或溶解时间t。
[0022]
优选的,所述步骤(3)具体为,采用python软件分别计算在不同赋形剂作为药物主要增溶剂条件下,八个特征变量与dp和de数据集之间的相关系数r和p假设检验值验证相关性,同时并计算他们的特征重要性。
[0023][0024]
其中,和表示变量x和y的平均值,r是两个输入变量之间的相关系数值。其取值在[-1,1]之间时确定数据之间的线性相关性相对容易。此外,当相关系数值在[0,1]之间时两变量呈正相关,在[-1,0]之间呈负相关。这意味着任意两个不同变量之间的线性关系随着绝对值的增大而增大。
[0025][0026]
式中,n为样本量;p为任意两个变量之间的p假设检验值,通过n-2个自由度的双截断分布得到。p假设检验值仅反映二者之间是否存在显著统计学差异,一般情况下,p《0.05为有统计学差异,p《0.01为有显著统计学差异,p《0.001为有极其显著的统计学差异。
[0027]
优选的,步骤(4)中,所述机器学习方法,包括随机森林、决策树或k折交叉验证。
[0028]
优选的,步骤(4)中,用以评估所述定量预测模型的预测能力的参数为:可决策系数r2和均方根误差rmse;其中,rmse是误差指标,值越小说明预测误差越小,模型越好;r2为相关性指标,越接近1,模型拟合性越好;
[0029]
r2:提供有关模型拟合优度,在回归中,是回归预测与实际数据点的近似程度的统计度量。描述实际值与预测值的相关性趋势,不是预测误差的直接描述,当数据存在非常大偏离分布时,只分析r2可能会导致模型评价错误,rmse也称为预测误差的标准差,可用于量化模型质量。预测误差直接描述,更关注不利预测,灵敏度高:
[0030][0031]
rmse:误差指标,用于量化模型质量,
[0032]yiexp
是实际值,y
ipred
是预测值,是实际值的平均值,n代表化合物的数量。
[0033]
优选的,步骤(4)具体为,根据本发明提供的基于不同赋形剂作为药物主要增溶剂条件下药物溶解百分比和溶解效率预测方法,同时对特征变量:药物含量、药物分子量、赋形剂与药物的摩尔比、药物浓度、压力、ph值、溶解时间或温度与目标变量药物溶解百分比和溶解效率的数据集进行平均数、中位数和方差的计算,并根据预测结果分别对影响药物溶解百分比和溶解效率的特征进行重要性排序和分析。
[0034]
发明原理:本发明基于不同赋形剂作为药物主要增溶剂条件下针对药物溶解百分比和溶解效率同时展开建模预测,提高药物增溶性能预测准确性,减少新药设计研发耗费成本和面临风险,指导现有药物通过络合技术制备包合物以提高药物溶解度的研究发明,增加机器学习预测方法应用性。
[0035]
与传统研究某一药物在不同溶剂中溶解度不同,本发明专注于辅料增溶药物性能准确预测的问题,尤其是涉及一种基于不同赋形剂作为药物的主要增溶剂条件下,针对药物组成(药物含量、药物分子量和赋形剂与药物的摩尔比)与复杂操作条件(药物浓度、压力、ph值、温度和溶解时间)的药物溶解百分比和溶解效率预测方法及系统。
[0036]
有益效果:与现有技术相比,本发明具有如下显著优点:利用机器学习方法对不同赋形剂,在复杂增溶剂条件下,基于多种药物不同组成和复杂操作条件,分别对药物溶解百分比和溶解效率进行预测并分析不同特征变量对两个目标变量的具体影响情况,以提高药物溶解百分比和溶解效率预测准确性,减少新药设计研发耗费成本和面临风险。
附图说明
[0037]
图1为本发明基于赋形剂分类的药物增溶性能预测方法的流程图;
[0038]
图2为以peg作为药物主要增溶剂条件下多种不同药物组成和复杂操作条件对应的八个特征变量及两个目标变量的数据值统计分析;
[0039]
图3为以peg作为药物主要增溶剂条件下药物溶解百分比和溶解效率的特征重要性排序结果;
[0040]
图4为根据python软件得到的以peg作为药物主要增溶剂条件下药物溶解百分比和溶解效率的模型预测分析结果;
[0041]
图5为得到的以peg作为药物主要增溶剂条件下药物溶解百分比和溶解效率的实际值与预测值对应分布状态和相对误差计算结果;
[0042]
图6为根据python软件得到的以peg作为药物主要增溶剂条件下药物溶解百分比的重要特征分析结果;
[0043]
图7为根据python软件得到的以peg作为药物主要增溶剂条件下药物溶解效率的重要特征分析结果。
具体实施方式
[0044]
下面结合附图和实施例对本发明的技术方案作进一步说明。
[0045]
实施例1
[0046]
本实施例提供一种基于peg作为药物主要增溶剂条件下不同药物组成和复杂操作条件的药物溶解百分比和溶解效率预测方法,如图1所示,包括:
[0047]
步骤1,数据的收集处理;
[0048]
(1)通过查阅文献和数据库收集含有不同药物组成:药物含量(dc)、药物分子量(m)和摩尔比(molar ratio(peg/drug),与复杂操作条件:药物浓度(c)、压力(p)、ph值、温度(t)和溶解时间(t)、药物溶解百分比(dp)和溶解效率(de)数据值以及相对应的药物名称。
[0049]
(2)对收集数据进行预处理,将文献及数据库中不同特征变量换算统一至同一单位。
[0050]
(3)去除含有除peg以外其他赋形剂作为药物主要增溶剂的数据值,最后据统计发现,当peg作为药物主要增溶剂时共收集了1489个含有33种药物(表1)的药物溶解百分比和溶解效率数据值。
[0051]
表1.以peg为主要增溶剂条件下包含的药物
[0052][0053]
(4)对所收集得到的以peg作为药物主要增溶剂条件下基于不同药物组成和复杂操作条件的八个特征变量及两个目标变量(dp和de)分别计算其平均值,中位数,上四分位数和下四分位数,如图2所示,药物含量dc在2.75-87%的范围内,其相对集中于25%;此外,目标变量dp和de的平均值分别为56.91%和47.69%。
[0054]
步骤2,等级划分;
[0055]
根据步骤(1)得到的药物溶解百分比和溶解效率数据值,划分为药物组成或复杂
操作条件的特征变量数据集,采用机器学习算法中的随机森林(rf)方法,基于peg作为药物主要增溶剂条件下得到的数据集划分为7:3的训练集和测试集。
[0056]
步骤3,计算相关性和特征重要性;
[0057]
(1)计算相关性;
[0058]
使用python软件计算在peg作为主要增溶剂条件下药物组成(dc、m和molar ratio)、操作条件(c、p、ph、t和t)和目标变量(dp和de)之间的p假设检验值并绘制pearson图呈现他们之间的相关性。
[0059]
(2)计算特征重要性;
[0060]
使用python软件计算出以peg作为药物主要增溶剂条件下药物组成(dc、m和molar ratio)与复杂操作条件(c、p、ph、t和t)的八个特征变量分别对dp和de的特征重要性顺序并按降序排序。
[0061]
使用origin软件根据上述计算结果分别绘制不同特征变量对dp和de的特征重要性影响顺序。
[0062]
如图3所示,当peg作为药物主要增溶剂时,摩尔比(molar ratio)和药物含量(dc)对药物溶解百分比的影响较大,其中相比于摩尔比,药物含量对溶解效率的影响尤为显著。此外,可以看出相比于操作条件,药物组成对溶解百分比的影响更大,这与溶解效率的结果相反。
[0063]
步骤4,建立模型;
[0064]
构建药物溶解百分比和溶解效率的定量预测模型,当对不同药物的药物溶解百分比和溶解效率进行预测时,首先根据药物性质确定具体基于哪一种赋形剂作为药物主要增溶剂(以本实施例为例,确定peg作为药物主要增溶剂)后将多种药物不同组成和复杂操作条件的8个数据集分别代入已建立的药物溶解百分比和溶解效率定量预测模型中进行拟合预测。
[0065]
如图4所示,当peg为药物主要增溶剂时,基于步骤4的药物溶解百分比和溶解效率的r2分别为0.86和0.95;rmse分别为0.13和0.08;证明所建立的定量预测模型是可以被接受的。
[0066]
步骤5,预测;
[0067]
(1)实际值和预测值结果分析;
[0068]
如图5a和5b所示,利用随机森林模型,基于步骤3随机抽取的实际值和预测值之间的可视化,阐明了药物溶解百分比和溶解效率的预测精度。预测结果表明,在peg作为药物主要增溶剂条件下,预测值与实际值基本一致,证明随机森林算法适用于药物溶解百分比和溶解效率的预测,且预测性能很好。
[0069]
(2)相对误差分析;
[0070]
如图5c和5d所示,是基于图5a和5b的实际值与预测值分别得到的药物溶解百分比和溶解效率相对误差的计算结果。结果表明,在peg作为药物主要增溶剂条件下,药物溶解百分比的大部分实际值与预测值的相对误差均在10%以内,只有少数相对误差分布超过10%。而溶解效率的大部分相对误差值在5%以内,这与步骤4中r2和rmse计算结果相符,进一步说明药物溶解百分比和溶解效率的预测结果具有一定普适性和稳定性。
[0071]
(3)重要特征结果分析;
[0072]
如图6a-6d和7a-7d所示,基于图3分别取前四个对药物溶解百分比和溶解效率的不同重要特征逐一进行详细分析。当分析一个特征变量对药物溶解百分比和溶解效率的影响时,其他特征变量均为平均值。其中e(dp)和e(de)分别为药物溶解百分比和溶解效率的平均值。如图6和7纵坐标所示,当溶解百分比和溶解效率的pdp值(粗线)高于e(dp)和e(de)时,对应的特征变量为有利条件,反之为不利条件。
[0073]
结果表明,在peg作为药物主要增溶剂条件下,相较于其他特征变量,摩尔比、药物含量、药物浓度和溶解时间对药物溶解百分比更重要;药物含量、溶解时间、摩尔比和药物分子量对溶解效率更重要。其中以溶解时间为例:当溶解时间在0-100分钟时,药物溶解百分比持续增加(图6d);当溶解时间在55分钟时溶解效率急剧上升并保持120分钟不变,而当溶解时间在175分钟时再次急剧上升并不再发生变化(图7d)。
技术特征:
1.一种基于赋形剂分类的药物增溶性能的预测方法,其特征在于,所述预测方法包括如下步骤:(1)数据收集处理:收集不同赋形剂作为主要增溶剂条件下的药物溶解百分比和溶解效率数据值进行处理,去除多种赋形剂共同提高药物溶解度的数据值;(2)等级划分:根据步骤(1)得到的药物溶解百分比和溶解效率数据值,划分为药物组成或复杂操作条件的特征变量数据集,并将数据集按6~8:2~4划分为训练集和测试集;(3)相关性和特征重要性计算:针对不同赋形剂作为药物主要增溶剂条件下的特征变量,分别与药物溶解百分比和溶解效率进行相关性计算和特征重要性排序;(4)建立模型:采用机器学习算法分别建立赋形剂作为药物主要增溶剂条件下药物溶解百分比和溶解效率的定量预测模型;(5)预测:用于将不同赋形剂作为药物主要增溶剂条件下多种药物组成或复杂操作条件的特征变量分别代入药物溶解百分比和溶解效率的定量预测模型进行预测。2.根据权利要求1所述的预测方法,其特征在于,步骤(1)中,所述赋形剂,包括聚乙二醇、聚乙烯吡咯烷酮、羟丙基甲基纤维素或环糊精作为药物增溶剂条件下对药物溶解百分比和溶解效率进行预测。3.根据权利要求1所述的预测方法,其特征在于,步骤(1)具体包括如下步骤:(11)对不同赋形剂作为药物主要增溶剂环境下收集的药物组成和复杂操作条件的数据值进行换算至相同单位;(12)对统一过的数据进行核实验证确保数据有效真实;(13)在不同赋形剂作为药物主要增溶剂条件下对上述所有数据值进行逐一排查,去除多种赋形剂共同提高药物溶解度的数据值;若收集的数据值中某一具体药物的特征变量值超出绝大多数数据值存在范围过高或过低,则选择去除该异常数据值。4.根据权利要求1所述的预测方法,其特征在于,步骤(2)中,所述数据集按7:3划分为训练集和测试集。5.根据权利要求1所述的预测方法,其特征在于,步骤(2)中,所述药物组成,包括药物含量dc、药物分子量m或赋形剂与药物的摩尔比molar ratio。6.根据权利要求1所述的预测方法,其特征在于,步骤(2)中,所述复杂操作条件,包括药物浓度c、压力p、ph值、温度t或溶解时间t。7.根据权利要求1所述的预测方法,其特征在于,所述步骤(3)具体为,采用python软件分别计算在不同赋形剂作为药物主要增溶剂条件下,八个特征变量与dp和de数据集之间的相关系数r和p假设检验值验证相关性,同时并计算他们的特征重要性;其中,和表示变量x和y的平均值,r是两个输入变量之间的相关系数值,其取值在[-1,1]之间,当相关系数值在[0,1]之间时两变量呈正相关,在[-1,0]之间呈负相关;其中,n为样本量;p为任意两个变量之间的p假设检验值,通过n-2个自由度的双截断分布得到,p假设检验值反映二者之间是否存在显著统计学差异,p<0.05为有统计学差异,p<
0.01为有显著统计学差异,p<0.001为有极其显著的统计学差异。8.根据权利要求1所述的预测方法,其特征在于,步骤(4)中,所述机器学习方法,包括随机森林、决策树或k折交叉验证。9.根据权利要求1所述的预测方法,其特征在于,步骤(5)中,用以评估所述定量预测模型的预测能力的参数为:可决策系数r2和均方根误差rmse;其中r2为相关性指标,提供有关模型拟合优度;rmse:误差指标,用于量化模型质量,y
iexp
是实际值,y
ipred
是预测值,是实际值的平均值,n代表化合物的数量。10.根据权利要求1所述的预测方法,其特征在于,步骤(5)具体为,根据本发明提供的基于不同赋形剂作为药物主要增溶剂条件下药物溶解百分比和溶解效率预测方法,同时对特征变量:药物含量、药物分子量、赋形剂与药物的摩尔比、药物浓度、压力、ph值、溶解时间或温度与目标变量药物溶解百分比和溶解效率的数据集进行平均数、中位数和方差的计算,并根据预测结果分别对影响药物溶解百分比和溶解效率的特征进行重要性排序和分析。
技术总结
本发明公开了一种基于赋形剂分类的药物增溶性能的预测方法,包括以下步骤:数据收集和处理,组成划分,相关性和特征重要性计算,建立模型和预测;本发明基于不同赋形剂作为药物主要增溶剂条件下,分别对药物溶解百分比和溶解效率进行预测并分析不同特征变量对两个目标变量的具体影响情况,提高药物增溶性能预测准确性,减少新药设计研发耗费成本和面临风险,指导现有药物通过络合技术制备包合物以提高药物溶解度的研究发明,以提高药物溶解百分比和溶解效率预测准确性,减少新药设计研发耗费成本和面临风险。费成本和面临风险。费成本和面临风险。
技术研发人员:钱红亮 王聪 冯婕 黄德春 陈维 钟伊南
受保护的技术使用者:中国药科大学
技术研发日:2023.05.30
技术公布日:2023/8/23
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/