HLA与肽结合亲和力预测模型的训练方法、预测方法及装置与流程

专利2025-03-03  27


本公开实施例涉及但不限于生物信息,尤其涉及一种hla与肽结合亲和力预测模型的训练方法、hla与肽结合亲和力预测方法及装置。


背景技术:

1、抗原呈递的过程中,细胞通过hla将抗原呈递到细胞表面,以用于t细胞的识别,当t细胞识别该肽段为“异体”肽段时,会激发相应的免疫反应。在人体内除了红细胞以外,几乎所有的细胞表面均存在人类白细胞抗原(human leukocyte antigen,hla),hla和抗原呈递细胞呈递肽段的有效结合,是机体能产生免疫反应的前提,因此,有效评估hla和肽段结合的亲和力高低,在临床研究、药物开发等方面均具有十分重要的意义。


技术实现思路

1、以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。

2、本公开实施例提供了一种hla与肽结合亲和力预测模型的训练方法,包括:

3、获取样本数据,所述样本数据包括:hla基因信息、肽段信息以及hla基因与肽段结合的亲和力数据;

4、根据所述hla基因信息生成hla伪序列矩阵,使用锚定残基位点对肽段进行填充,并将填充后的肽段转换为肽段锚定残基矩阵;

5、使用所述hla伪序列矩阵、所述肽段锚定残基矩阵以及所述hla基因与肽段结合的亲和力数据对预设的亲和力预测模型进行训练,得到训练好的亲和力预测模型,所述亲和力预测模型包括第一分支处理层、第二分支处理层、合并层和全连接层,所述第一分支处理层用于对所述hla伪序列矩阵进行特征提取,所述第二分支处理层用于对所述肽段锚定残基矩阵进行特征提取,所述合并层用于对所述第一分支处理层和所述第二分支处理层的处理结果进行合并,所述全连接层用于对所述合并层的合并结果进行回归计算。

6、本公开实施例还提供了一种hla与肽结合亲和力预测模型的训练装置,包括存储器;和连接至所述存储器的处理器,所述存储器用于存储指令,所述处理器被配置为基于存储在所述存储器中的指令,执行本公开任一实施例所述的hla与肽结合亲和力预测模型的训练方法的步骤。

7、本公开实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本公开任一实施例所述的hla与肽结合亲和力预测模型的训练方法。

8、本公开实施例还提供了一种hla与肽结合亲和力预测方法,包括:

9、获取待检测的hla基因分型和肽段氨基酸序列;

10、根据所述hla基因分型生成hla伪序列矩阵,使用锚定残基位点对肽段进行填充,并将填充后的肽段转换为肽段锚定残基矩阵;

11、将所述hla伪序列矩阵和肽段锚定残基矩阵输入训练好的亲和力预测模型,得到亲和力预测结果,所述亲和力预测模型通过如本公开任一实施例所述的hla与肽结合亲和力预测模型的训练方法进行训练。

12、本公开实施例还提供了一种hla与肽结合亲和力预测装置,包括存储器;和连接至所述存储器的处理器,所述存储器用于存储指令,所述处理器被配置为基于存储在所述存储器中的指令,执行本公开任一实施例所述的hla与肽结合亲和力预测方法的步骤。

13、本公开实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本公开任一实施例所述的hla与肽结合亲和力预测方法。

14、在阅读理解了附图和详细描述后,可以明白其他方面。



技术特征:

1.一种hla与肽结合亲和力预测模型的训练方法,其特征在于,包括:

2.根据权利要求1所述的训练方法,其特征在于,所述第一分支处理层包括依次连接的第一输入层、第一卷积层、第一池化层、第一自注意力层、第一展平层和第一全连接层,其中:

3.根据权利要求2所述的训练方法,其特征在于,一个所述第一卷积层和一个所述第一池化层组成一个第一卷积池化单元,所述第一分支处理层包括多个所述第一卷积池化单元。

4.根据权利要求1所述的训练方法,其特征在于,所述第二分支处理层包括依次连接的第二输入层、第二卷积层、第二池化层、第二自注意力层、第二展平层和第二全连接层,其中:

5.根据权利要求4所述的训练方法,其特征在于,一个所述第二卷积层和一个所述第二池化层组成一个第二卷积池化单元,所述第二分支处理层包括多个所述第二卷积池化单元。

6.根据权利要求1所述的训练方法,其特征在于,所述全连接层包括多个第三全连接层,其中:

7.根据权利要求1所述的训练方法,其特征在于,所述使用锚定残基位点对肽段进行填充,包括:

8.根据权利要求1所述的训练方法,其特征在于,所述根据所述hla基因信息生成hla伪序列矩阵,包括:

9.根据权利要求1所述的训练方法,其特征在于,所述使用所述hla伪序列矩阵、所述肽段锚定残基矩阵以及所述hla基因与肽段结合的亲和力数据对预设的亲和力预测模型进行训练,得到训练好的亲和力预测模型,包括:

10.一种hla与肽结合亲和力预测模型的训练装置,其特征在于,包括存储器;和连接至所述存储器的处理器,所述存储器用于存储指令,所述处理器被配置为基于存储在所述存储器中的指令,执行如权利要求1至9中任一项所述的hla与肽结合亲和力预测模型的训练方法的步骤。

11.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,该程序被处理器执行时实现如权利要求1至9中任一项所述的hla与肽结合亲和力预测模型的训练方法。

12.一种hla与肽结合亲和力预测方法,其特征在于,包括:

13.一种hla与肽结合亲和力预测装置,其特征在于,包括存储器;和连接至所述存储器的处理器,所述存储器用于存储指令,所述处理器被配置为基于存储在所述存储器中的指令,执行如权利要求12所述的hla与肽结合亲和力预测方法的步骤。

14.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,该程序被处理器执行时实现如权利要求12所述的hla与肽结合亲和力预测方法。


技术总结
一种HLA与肽结合亲和力预测模型的训练方法、HLA与肽结合亲和力预测方法及装置,包括:获取样本数据,样本数据包括:HLA基因信息、肽段信息以及HLA基因与肽段结合的亲和力数据;根据HLA基因信息生成HLA伪序列矩阵,使用锚定残基位点对肽段进行填充,并将填充后的肽段转换为肽段锚定残基矩阵;使用HLA伪序列矩阵、肽段锚定残基矩阵以及所述亲和力数据对预设的亲和力预测模型进行训练,得到训练好的亲和力预测模型,亲和力预测模型包括用于对HLA伪序列矩阵进行特征提取的第一分支处理层、用于对肽段锚定残基矩阵进行特征提取的第二分支处理层、用于合并第一分支处理层和第二分支处理层的合并层以及用于对合并层的合并结果进行回归计算的全连接层。

技术研发人员:宋阳,丁丁
受保护的技术使用者:京东方科技集团股份有限公司
技术研发日:
技术公布日:2024/6/26
转载请注明原文地址:https://doc.8miu.com/read-1816816.html

最新回复(0)