一种基于土壤参数的中药产地判别系统及方法与流程

专利2022-05-09  75


本发明涉及中药产地溯源
技术领域
,更具体的说是涉及一种基于土壤参数的中药产地判别系统及方法。
背景技术
:目前,因产地冒充导致中药质量难以保障的问题日益突显,为此,通过生物活性检测法对道地药材进行产地判别的方法应运而生,但是,生物检测方法繁琐复杂,故短期内难以在中药行业中推行,具体地,生物活性检测方法存在如下几个缺陷:1、样本预处理过程繁琐以黄精为例,对样本的多糖、总皂苷、总酚、总黄酮等生物活性物质进行检测需要采集新鲜根茎,洗净、切片,同时需要经过烘干、磨粉、过筛处理。这一系列处理流程多、耗时长,增大了产地鉴别难度。2、产地鉴别成本高、难度大现有技术需要利用大量仪器,如色谱仪、旋转蒸发器、分光光度计等。此外,为了提取各生物活性物质还需要配置多种溶剂。由于不同中药种类的重要生物活性物质往往不同,难以对这些生物活性物质构建统一的快速检测方法。只有在特定实验室中进行操作获取数据后才能进行进一步的产地鉴别分析。这使得黄精产地鉴别的成本较高,且鉴别难度较大。3、实用性较差目前多数中药的主要生物活性物质以及测定方法并没有明确的结论或者标准,并且现有资料中产地鉴别样本量较少,无真正鉴别大多数中药产地的实质性内容的详细描述,因此不具有普适性,不能够广泛使用,实用性较差。同时,目前还出现了基于区块链技术的中药饮片质量追溯系统,该系统通过构建整合全供应链的方式,以行业监管的形式获取中药种植、销售的全流程信息,但施行起来十分困难,短期内可行性不高。不难发现,上述中药产地判别方法因不够便捷、实施困难等原因,难以满足实际中药产地溯源需求。因此,如何提供一种便捷、高效、可靠的中药产地判别系统是本领域技术人员亟需解决的问题。技术实现要素:有鉴于此,本发明提供了一种基于土壤参数的中药产地判别系统及方法,有效解决了现有的中药产地判别方法不够便捷、可行性不强等问题。为了实现上述目的,本发明采用如下技术方案:一方面,本发明提供了一种基于土壤参数的中药产地判别系统,该系统包括:输入测定模块,所述输入测定模块获取用户输入的中药种类信息,并对从中药上刮取的土壤进行测量,获得土壤测定结果;识别判断模块,所述识别判断模块获取所述中药种类信息和所述土壤测定结果,对所述土壤测定结果进行预处理和特征选择,并通过预先构建的神经网络模型、线性判别模型和xgboost模型对预处理和特征选择后的数据进行判别分析,获得相应种类中药的产地判别结果;以及反馈模块,所述反馈模块用于输出所述产地判别结果。考虑到根茎类中药长有许多根节,即使经过普通清洗,仍会有一定的泥土残留。并且很多野生中药并未经过清洗处理,直接附着大量泥土。对于土壤而言,某地的土壤参数成分一般不会有太大变化,且一次采集后就可以方便加入到数据库,可以作为中药产地判别的数据依据。进一步地,所述输入测定模块包括中药种类输入单元和土壤测定单元;所述中药种类输入单元用于获取用户输入的中药种类信息,所述土壤测定单元用于对从中药上刮取的土壤进行测量,获得土壤测定结果。更进一步地,所述输入测定模块还包括合理性判断单元,所述合理性判断单元用于判断所述土壤测定结果是否合理,若合理,则传输至所述识别判断模块;若不合理,则提示重新测量。对于输入测定模块而言,需要输入中药的具体种类,然后通过检测刮取土壤,并使用仪器直接进行接触测量。随后可以得到土壤测定结果。为了保证得到的测定结果有更高的数据参考价值,本发明还设置了合理性判断单元,对土壤测定结果进行合理性判断,若检测合理则将数据传入下一个模块。若识别发现数据不合理则提示重新测量。进一步地,所述识别判断模块包括:数据获取单元,用于获取所述中药种类信息和所述土壤测定结果;数据预处理单元,用于对所述土壤测定结果进行预处理和特征选择;神经网络识别单元,用于将预处理后的所有数据输入神经网络模型,获得中药产地第一预测概率;线性识别单元,用于将预处理且特征选择后的数据输入线性判别模型,获得中药产地第二预测概率;xgboost识别单元,用于将预处理且特征选择后的数据输入xgboost模型,获得中药产地预测结果;以及分析判别单元,用于将所述中药产地第一预测概率以及所述中药产地第二预测概率进行均等加权,将均等加权结果与预设阈值进行比对,并结合所述中药产地预测结果获得产地判别结果。对于识别判断模块,首先获取输入测定模块得到的数据,其中包括土壤测定结果以及中药种类。系统内预先构建的模型是对已知中药种类数据库匹配算法的使用,若中药种类未知则使用国家土壤数据库,但正确率会因此而降低。将数据送入识别判断模块后,首先对数据进行标准化的处理,然后使用神经网络模型、线性判别模型、xgboost模块进行判别分析。随后对神经网络模型和线性判别模型得到的预测结果以及概率值进行均等加权。若判定为高度可信结果或中高度可信结果,则返回判断产地并标注高可信度或中高可信度,否则给出可能的几个结果并标注非高可信度。进一步地,上述的一种基于土壤参数的中药产地判别系统,还包括升级模块,所述升级模块用于对所述识别判断模块进行数据更新。对于升级模块而言,用户可以定期对该系统进行升级,获取更新版本的识别判断模块。同时,此刻用户会将其各次分析结果以脱敏形式上传云端,便于识别判断模块内各模型升级,对于模型而言,其使用新入库的土壤数据和已经入库的土壤数据以监督学习和半监督学习的方式进行新模型训练,若通过稳健度测试且确认提升,则进行迭代升级,并等待用户升级。另一方面,本发明还提供了一种基于土壤参数的中药产地判别方法,该方法包括:数据获取:获取用户输入的中药种类信息,并对从中药上刮取的土壤进行测量,获得土壤测定结果;数据处理:对所述土壤测定结果进行预处理和特征选择,并通过预先构建的神经网络模型、线性判别模型和xgboost模型对预处理和特征选择后的数据进行判别分析,获得相应种类中药的产地判别结果;以及结果输出:输出所述产地判别结果。进一步地,所述数据处理的过程,具体包括:获取所述中药种类信息和所述土壤测定结果,并对所述土壤测定结果进行预处理和特征选择;将预处理后的所有数据输入神经网络模型,获得中药产地第一预测概率;将预处理且特征选择后的数据输入线性判别模型,获得中药产地第二预测概率;将预处理且特征选择后的数据输入xgboost模型,获得中药产地预测结果;将所述中药产地第一预测概率以及所述中药产地第二预测概率进行均等加权,将均等加权结果与预设阈值进行比对,并结合所述中药产地预测结果获得产地判别结果。进一步地,上述的一种基于土壤参数的中药产地判别方法,还包括:数据升级:对所述识别判断模块进行数据更新。本发明中结果输出过程中,主要显示分析的结果,并形成文字保存结果。对于上述系统而言,文字保存结果可以本地下载或者云端上传。经由上述的技术方案可知,与现有技术相比,本发明公开提供了一种基于土壤参数的中药产地判别系统及方法,通过对中药附着土壤参数的测量,判断中药所属产地,通过神经网络模型、线性判别模型以及xgboost模型的组合判别方法构建了土壤参数与中药产地间的关系,中药产地判别过程更加便捷高效,判定结果更加准确可靠。附图说明为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1为本发明提供的一种基于土壤参数的中药产地判别系统的结构架构示意图;图2为输入测定模块的结构架构示意图;图3为识别判断模块的结构架构示意图;图4为升级模块的内部工作原理示意图;图5为反馈模块的内部工作原理示意图;图6为本发明提供的一种基于土壤参数的中药产地判别方法的实现流程示意图。具体实施方式下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。一方面,参见附图1,本发明实施例公开了一种基于土壤参数的中药产地判别系统,该系统包括:输入测定模块1,输入测定模块1获取用户输入的中药种类信息,并对从中药上刮取的土壤进行测量,获得土壤测定结果;识别判断模块2,识别判断模块2获取中药种类信息和土壤测定结果,对土壤测定结果进行预处理和特征选择,并通过预先构建的神经网络模型、线性判别模型和xgboost模型对预处理和特征选择后的数据进行判别分析,获得相应种类中药的产地判别结果;以及反馈模块3,反馈模块3用于输出产地判别结果。具体地,参见附图2,输入测定模块1包括中药种类输入单元101和土壤测定单元102;中药种类输入单元102用于获取用户输入的中药种类信息,土壤测定单元102用于对从中药上刮取的土壤进行测量,获得土壤测定结果。更优地,输入测定模块1还包括合理性判断单元103,合理性判断单元103用于判断土壤测定结果是否合理,若合理,则传输至识别判断模块2;若不合理,则提示重新测量。对于土壤成分的测定值,各元素应有其合理的上下限值,这个值的得来,一般由数据库中已采集数据的最大值并乘以特定系数后确定。本实施例设置合理性判断单元,是为了防止由于仪器的错误测量而导致分类结果失败,影响系统可靠性。当然,是否按照该测量值上传,或者对异常值进行中位数或者截断处理可以根据实际应用需求合理设置,在此不做过多限定。具体地,参见附图3,识别判断模块2包括:数据获取单元201,用于获取中药种类信息和土壤测定结果;数据预处理单元202,用于对土壤测定结果进行预处理和特征选择;神经网络识别单元203,用于将预处理后的所有数据输入神经网络模型,获得中药产地第一预测概率;线性识别单元204,用于将预处理且特征选择后的数据输入线性判别模型,获得中药产地第二预测概率;xgboost识别单元205,用于将预处理且特征选择后的数据输入xgboost模型,获得中药产地预测结果;以及分析判别单元206,用于将中药产地第一预测概率以及中药产地第二预测概率进行均等加权,将均等加权结果与预设阈值进行比对,并结合中药产地预测结果获得产地判别结果。当然,识别判断模块2内部也可以设置合理性判断的单元组件,从而对分别判别单元206获得的产地判别结果进行合理性判断,保证产地判别结果的真实性和可靠性。其中,对于模型的建立而言,需要确定合理的参数集,包括常见的重金属元素和非金属元素以及ph值,例如:ph、li、be、b、na、mg、al、si、p、s、k、ca、sc、ti、v、cr、mn、fe、co、ni、cu、zn、ga、ge、as、se、rb、sr、y、nb、mo、cd、sb、cs、ba、la、ce、pr、nd、sm、eu、gd、tb、dy、ho、er、tm、yb、lu、tl、pb、th。对于各中药种类,以selectkbest方法或lasso方法进行参数重要性选择,即特征选择,本实施例选择6-10个参数即可。随后进行样本集的类内增强,同时进行标准化处理。将所有参数导入神经网络模型,将选择过后的重要参数导入线性判别模型以及xgboost模型,由此生成常见中药种类的模型参数并保存至数据库。以线性判别模型为例,lda(lineardiscriminantanalysis,线性判别分析)又称为fisher线性判别,是一种监督学习的降维技术,也就是说,它的数据集的每个样本都是有类别输出的。具体的线性判别模型建立方法如下:设数据集为,其中任意为q维数据,,共有k类样本。其中为第类样本的个数,为第类样本的集合,为第类样本的均值向量,为第类样本的协方差矩阵。(1)对样本数据进行预处理。预处理是指:针对无效值滤除,针对缺失值进行填充,进行标准化处理;填充的方法为:为每一个缺失位置,选择该产地其余样本的该列值的中位数进行填充。标准化处理为:将样本划分为训练样本以及测试样本后,对训练样本中的各值进行标准化处理,即:其中,为数据集中第个数据的第列的值,为数据集第列的平均值,为数据集第列的标准差。(2)假设投影到的低维空间的维度为,对应的基向量为,基向量组成的矩阵为,该矩阵是一个的矩阵。定义类间散度矩阵为:其中,为所有样本均值向量。定义类内散度矩阵为:(3)由于希望同类样例的投影点的协方差尽可能小;异类样例的投影点尽可能远离,使得类中心之间的距离尽可能大,可以让优化目标为如下函数:由于该函数难以求解,本实施例用以下替代优化目标来实现:其中,有:的闭式解是的个最大非零广义特征值所对应特征值向量所组成的矩阵,满足。(4)lda(即线性判别模型)假设各个类别的样本数据符合高斯分布,利用已经完成变换的数据,可以利用极大似然估计计算各个类别投影数据的均值和方差,进而得到该类别高斯分布的概率密度函数。(5)当新的样本到来后,本实施例用已经求得的w将新数据进行投影,然后将投影后的样本特征分别带入各个类别的高斯分布概率密度函数,计算新样本属于该类别的概率,获得各个类别的概率值,即:对于线性判别分析,可被视为有如下分布的多元高斯分布:更优地,参见附图1,上述的一种基于土壤参数的中药产地判别系统,还包括升级模块4,升级模块4用于对识别判断模块2进行数据更新。对于升级模块4而言,参见附图4,用户可以定期对该系统进行升级,获取更新版本的识别判断模块。同时,此刻用户会将其各次分析结果以脱敏形式上传云端,便于识别判断模块内各模型升级,对于模型而言,其使用新入库的土壤数据和已经入库的土壤数据以监督学习和半监督学习的方式进行新模型训练,若通过稳健度测试且确认提升,则进行迭代升级,并等待用户升级。对于反馈模块3而言,参见附图5,其主要显示分析的结果,并形成文字保存结果。文字保存结果可以本地下载或者云端上传。另一方面,参见附图6,本发明实施例还公开了一种基于土壤参数的中药产地判别方法,该方法包括:s1:数据获取:获取用户输入的中药种类信息,并对从中药上刮取的土壤进行测量,获得土壤测定结果;s2:数据处理:对土壤测定结果进行预处理和特征选择,并通过预先构建的神经网络模型、线性判别模型和xgboost模型对预处理和特征选择后的数据进行判别分析,获得相应种类中药的产地判别结果;以及s3:结果输出:输出产地判别结果。上述数据处理的过程,具体包括:获取中药种类信息和土壤测定结果,并对土壤测定结果进行预处理和特征选择;将预处理后的所有数据输入神经网络模型,获得中药产地第一预测概率;将预处理且特征选择后的数据输入线性判别模型,获得中药产地第二预测概率;将预处理且特征选择后的数据输入xgboost模型,获得中药产地预测结果;将中药产地第一预测概率以及中药产地第二预测概率进行均等加权,将均等加权结果与预设阈值进行比对,并结合中药产地预测结果获得产地判别结果。更优地,上述基于土壤参数的中药产地判别方法,还包括:s4:数据升级:对识别判断模块进行数据更新。下面以黄精中药为例,对上述方法中构建神经网络模型、线性判别模型和xgboost模型的实现过程进行详细说明:现有来自于安徽六安、安徽池州、湖南怀化、陕西汉中、陕西商洛、山西长治、辽宁抚顺、辽宁本溪、辽宁鞍山九个产地的144个黄精中药土壤样本,以训练集测试集3:1的比例进行随机划分,共有108个训练样本以及36个测试样本。首先对108个样本进行异常值排除、标准化处理。通过selectkbest方法选择最相关的7个参数,本例为土壤中的be、mg、p、s、ti、na、sr元素。将所有参数放入神经网络模型中,输入数据为52维浮点数向量,神经网络设置优化算法为rmsprop,损失函数为catogoricalcrossentropy,训练轮次为500轮,批处理数为8,其余参数设置如下表1所示:表1神经网络模型设置参数将上述7个参数放入线性判别模型中,输入数据为7维浮点数向量,使用默认设置得到线性判别模型。同理,将上述7个参数放入xgboost分类模型中,输入数据为7维浮点数向量,xgboost分类模型参数如下表2所示:表2xgboost分类模型设置参数在本实施例中,具体的权重投票、合理性判断方法是:若均等加权值大于等于1.6,则认为是高度可信结果并返回预测产地;若均等加权值小于1.6但大于1.3且与xgboost模型预测结果相同,则认为是高度可信结果并返回预测产地;若加权值为1至1.3之间,三个模型预测产地相同,则同样返回预测产地并认为是高度可信结果;当单模型概率值大于等于0.9且与xgboost模型预测结果相同时,返回预测产地并认为是中高度可信结果;其余所有情况都返回可能性较高的产地,并提醒可能存在的误判情况。最后将得到的预测结果保存以供使用。对于36个测试样本,以测试样本例1、7、35举例,结果如下表3所示:表3测试样本例1、7、35参数数据测试样本例产地phli……1陕西商洛7.57128.77……7辽宁本溪7.2647.48……35辽宁抚顺7.3260.90……对于样本例1,神经网络模型认为有98%的概率来自于陕西商洛,线性判别模型认为有99%的概率来自于陕西商洛,同时xgboost分类模型认为该样本例来自于陕西商洛,则最终认为该产地为陕西商洛并为高度可信结果。对于样本例7,神经网络模型认为有99%的概率来自于辽宁本溪,线性判别模型认为有99%的概率来自于辽宁抚顺,同时xgboost分类模型认为该样本例来自于辽宁本溪,则最终认为该产地为辽宁本溪并为中高度可信结果。对于样本例35,神经网络模型认为有91%的概率来自于辽宁抚顺,线性判别模型认为有94%的概率来自于辽宁抚顺,则虽然xgboost分类模型认为该样本例来自于山西长治,仍认为该产地为辽宁抚顺并为高度可信结果。之后,可以利用构建好的上述神经网络模型、线性判别模型和xgboost模型,对实测得到的土壤测定结果进行产地判别。综上所述,本发明实施例公开的基于土壤参数的中药产地判别系统及方法,与现有技术相比,具有如下优点:1、提出了以中药附着土壤中的参数成分鉴别中药产地的方法,拓展了中药产地的鉴别方法,提升了产地鉴别速度,降低了产地鉴别成本;2、该系统可以通过对中药附着土壤参数的测量判断中药所属产地;3、根据中药产地的数据库,考虑到鉴别正确率以及鉴别方便程度,通过神经网络模型、线性判别模型以及xgboost模型的组合判别方法构建了土壤参数与中药产地间的关系,对通过附着土壤判别产地的中药鉴别方法提供了理论支撑。本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。当前第1页1 2 3 
技术特征:

1.一种基于土壤参数的中药产地判别系统,其特征在于,包括:

输入测定模块,所述输入测定模块获取用户输入的中药种类信息,并对从中药上刮取的土壤进行测量,获得土壤测定结果;

识别判断模块,所述识别判断模块获取所述中药种类信息和所述土壤测定结果,对所述土壤测定结果进行预处理和特征选择,并通过预先构建的神经网络模型、线性判别模型和xgboost模型对预处理和特征选择后的数据进行判别分析,获得相应种类中药的产地判别结果;以及

反馈模块,所述反馈模块用于输出所述产地判别结果。

2.根据权利要求1所述的一种基于土壤参数的中药产地判别系统,其特征在于,所述输入测定模块包括中药种类输入单元和土壤测定单元;

所述中药种类输入单元用于获取用户输入的中药种类信息,所述土壤测定单元用于对从中药上刮取的土壤进行测量,获得土壤测定结果。

3.根据权利要求2所述的一种基于土壤参数的中药产地判别系统,其特征在于,所述输入测定模块还包括合理性判断单元,所述合理性判断单元用于判断所述土壤测定结果是否合理,若合理,则传输至所述识别判断模块;若不合理,则提示重新测量。

4.根据权利要求1所述的一种基于土壤参数的中药产地判别系统,其特征在于,所述识别判断模块包括:

数据获取单元,用于获取所述中药种类信息和所述土壤测定结果;

数据预处理单元,用于对所述土壤测定结果进行预处理和特征选择;

神经网络识别单元,用于将预处理后的所有数据输入神经网络模型,获得中药产地第一预测概率;

线性识别单元,用于将预处理且特征选择后的数据输入线性判别模型,获得中药产地第二预测概率;

xgboost识别单元,用于将预处理且特征选择后的数据输入xgboost模型,获得中药产地预测结果;以及

分析判别单元,用于将所述中药产地第一预测概率以及所述中药产地第二预测概率进行均等加权,将均等加权结果与预设阈值进行比对,并结合所述中药产地预测结果获得产地判别结果。

5.根据权利要求1所述的一种基于土壤参数的中药产地判别系统,其特征在于,还包括升级模块,所述升级模块用于对所述识别判断模块进行数据更新。

6.一种基于土壤参数的中药产地判别方法,其特征在于,包括:

数据获取:获取用户输入的中药种类信息,并对从中药上刮取的土壤进行测量,获得土壤测定结果;

数据处理:对所述土壤测定结果进行预处理和特征选择,并通过预先构建的神经网络模型、线性判别模型和xgboost模型对预处理和特征选择后的数据进行判别分析,获得相应种类中药的产地判别结果;以及

结果输出:输出所述产地判别结果。

7.根据权利要求6所述的一种基于土壤参数的中药产地判别方法,其特征在于,所述数据处理的过程,具体包括:

获取所述中药种类信息和所述土壤测定结果,并对所述土壤测定结果进行预处理和特征选择;

将预处理后的所有数据输入神经网络模型,获得中药产地第一预测概率;

将预处理且特征选择后的数据输入线性判别模型,获得中药产地第二预测概率;

将预处理且特征选择后的数据输入xgboost模型,获得中药产地预测结果;

将所述中药产地第一预测概率以及所述中药产地第二预测概率进行均等加权,将均等加权结果与预设阈值进行比对,并结合所述中药产地预测结果获得产地判别结果。

8.根据权利要求6所述的一种基于土壤参数的中药产地判别方法,其特征在于,还包括:

数据升级:对所述识别判断模块进行数据更新。

技术总结
本发明公开了一种基于土壤参数的中药产地判别系统及方法,包括输入测定模块,输入测定模块获取用户输入的中药种类信息,对从中药上刮取的土壤进行测量,获得土壤测定结果;识别判断模块,识别判断模块获取中药种类信息和土壤测定结果,对土壤测定结果进行预处理和特征选择,通过预先构建的神经网络模型、线性判别模型和XGBoost模型对预处理和特征选择后的数据进行判别分析,获得相应种类中药的产地判别结果;以及反馈模块,反馈模块输出产地判别结果。该系统通过对中药附着土壤参数的测量判断中药产地,通过神经网络模型、线性判别模型以及XGBoost模型构建土壤参数与中药产地间的关系,产地判别更加便捷高效,判定结果更加准确可靠。

技术研发人员:牟松波
受保护的技术使用者:北京微芯区块链与边缘计算研究院
技术研发日:2021.07.05
技术公布日:2021.08.03

转载请注明原文地址:https://doc.8miu.com/read-7159.html

最新回复(0)