生成能力逼近未公开AI生成模型的模型确定方法及系统与流程

专利2026-03-03 35

本发明涉及人工智能ai以及人工智能生成内容aigc，尤其涉及一种生成能力逼近未公开ai生成模型的模型确定方法及系统。

背景技术：

1、随着人工智能算法、算力和算据的不断发展，生成式人工智能(generativeartificial intelligence)取得突破性进展，使得人工智能生成内容(ai generatedcontent，aigc)得以实现。以gpt4为代表的自然语言大模型展现出强大的自然语言加工、荟萃、整合和生成能力。同时以生成式对抗网络(generative adversarial networks，gans)模型、diffusion扩散模型为代表的生成式人工智能在图像、音频、视频领域表现出优异的内容合成、修复、预测和生成性能，引发当前网络信息环境下aigc的爆炸式增长。

2、和ai创作方法方式的迅猛发展相比，对于ai生产内容的评价方式并无较明显进步。使用ai生成内容和现实已有内容作比较是最早期的做法。还是以ai作画为例，把文本对应的现实照片和使用该文本ai生成的图片相比，计算差距就是这种评价方法。这种方法在早期ai生图内容质量不高的时候非常有用，因为这个时候ai生成的图片和现实照片越相近就说明生成质量越好。但当ai生成的图片质量达到一定程度以后，和现实图片的计算差距的这种方法往往限制了创作力，因为现实中的某张图肯定不是该文本的唯一解。令人惊艳的ai生成图片往往和现有照片的差距很大，所以这种方法不太适合评价富有创作力的图片。

3、近期的ai作图论文中开始大量采用人工标注的方法来评价生成图片的好坏。由于人工标注的情况下，看一张图并标注图片质量分数的难度高，标注一致性低，所以论文中采取了相对评价的方案，即看两张图让标注人判断哪张图的更好。虽然这种相对评价方案解决了标注难度和数据一致性问题，但由于标注次数的增加，标注效率也随之降低了。尤其在需要大量比较的时候人工标注更是需要大量的时间去进行重复性的标注。并且相对评价标注一致性已经比绝对评价的标注一致性要高，但不同的标注人员的标注一致性还是影响评测结果可信度的重要障碍，往往需要更多更精细的标注来缓解一致性差的问题。

4、目前现有技术中已经具有大量训练成熟的ai生成模型，然而很多开发公司对ai生成模型的模型架构和内核仍然采用“黑匣子”的不公开模式，对于后续新的生成能力更高的ai生成模型开发造成了一定的困难和障碍，大幅提高了开发成本，并且也无法借鉴其中成熟模型参数和架构，造成ai生成能力的劣化。

5、因此，存在寻找生成能力更高的ai生成模型高效开发方式的技术需求。

技术实现思路

1、为了解决现有技术中存在的问题，本发明提供了一种生成能力逼近未公开ai生成模型的模型确定方法及系统，用于实现一个新的ai生成模型，其生成能力能够逼近某个未公开的ai生成模型。该方案可以应用在诸多领域，如艺术创作、科学研究等，尤其适用于模仿学习和知识转移的场景。具体地，通过未公开ai生成模型的输出来训练一个新的ai生成模型，使其生成能力逼近一个未公开的ai生成模型。这可以通过使用相同的数据集和训练过程，或者通过对未公开模型生成的内容进行模仿学习，使新模型能够生成与未公开模型相似的内容。

2、本发明一方面提供了一种生成能力逼近未公开ai生成模型的模型确定方法，包括：

3、s1，获取训练数据，所述训练数据用于训练所述生成能力逼近未公开ai生成模型的模型；

4、s2，训练所述生成能力逼近未公开ai生成模型的模型。

5、优选的，所述获取训练数据包括：

6、获取未公开ai生成模型的输出样本以及与所述输出样本匹配的输入数据，所述输入数据和输出样本构成训练数据；所述输出样本从在线平台和合作机构获得；所述输入数据的获取方式包括：将所述未公开ai生成模型的输出样本作为逆输入，再次生成的对应逆输出作为所述输入数据。

7、优选的，所述获取训练数据还包括：

8、使用与已公开ai生成模型输入数据相同情况下的输出数据作为所述训练数据的辅助训练数据；或除了将所述辅助训练数据纳入训练数据中，将所述已公开ai生成模型在推理过程中产生的所有数值均纳入到所述训练数据中。

9、优选的，所述s2包括：

10、s21，选择和设计所述生成能力逼近未公开ai生成模型的模型；包括：

11、(1)确定问题类型：确定要解决的问题类型从而选择适当的生成能力逼近未公开ai生成模型的模型类型；

12、(2)选择生成能力逼近未公开ai生成模型的模型类型：根据问题类型和数据集，选择适当的生成能力逼近未公开ai生成模型的模型类型；

13、(3)设计生成能力逼近未公开ai生成模型的模型结构：包括选择适当的特征，确定生成能力逼近未公开ai生成模型的模型层数和节点数；

14、s22，基于训练数据以及选择和设计的所述生成能力逼近未公开ai生成模型的模型，对所述生成能力逼近未公开ai生成模型的模型进行训练。

15、优选的，所述方法还包括：

16、s3，评估所述生成能力逼近未公开ai生成模型的模型性能；所述评估通过使用测试数据集来完成，包括：通过评估指标来衡量经过若干次训练的生成能力逼近未公开ai生成模型的模型的生成能力是否逼近未公开模型从而得到评估结果；以及根据评估结果调整经过若干次训练的生成能力逼近未公开ai生成模型的模型架构和参数，以逼近未公开ai生成模型的生成能力。

17、优选的，所述方法还包括：

18、s4，实际应用，包括：在经过若干次训练的生成能力逼近未公开ai生成模型的模型训练和优化后，将其部署到实际应用场景中。

19、本发明的第二方面提供一种生成能力逼近未公开ai生成模型的模型确定系统，包括：

20、数据获取模块，获取训练数据，所述训练数据用于训练所述生成能力逼近未公开ai生成模型的模型；

21、模型训练模块，训练所述生成能力逼近未公开ai生成模型的模型。

22、优选的，所述系统还包括：模型性能评估模块，评估所述生成能力逼近未公开ai生成模型的模型性能；以及实际应用模块，用于在经过若干次训练的生成能力逼近未公开ai生成模型的模型训练和优化后，将其部署到实际应用场景中。

23、本发明的第三方面提供一种电子设备，包括处理器和存储器，所述存储器存储有多条指令，所述处理器用于读取所述指令并执行如第一方面所述的方法。

24、本发明的第四方面提供一种计算机可读存储介质，所述计算机可读存储介质存储有多条指令，所述多条指令可被处理器读取并执行如第一方面所述的方法。

25、本发明提供的生成能力逼近未公开ai生成模型的模型确定方法、系统和电子设备，具有如下有益效果：即使无法获取未公开模型的具体架构和参数，仍然可以通过模仿学习的方式，训练出一个生成能力接近未公开模型的新模型；这种方法不仅能够促进知识和技术的传播，而且还能够推动不同领域间的协作和创新。

技术特征：

1.一种生成能力逼近未公开ai生成模型的模型确定方法，其特征在于，包括：

2.根据权利要求1所述的一种生成能力逼近未公开ai生成模型的模型确定方法，其特征在于，所述获取训练数据包括：

3.根据权利要求2所述的一种生成能力逼近未公开ai生成模型的模型确定方法，其特征在于，所述获取训练数据还包括：

4.根据权利要求3所述的一种生成能力逼近未公开ai生成模型的模型确定方法，其特征在于，所述s2包括：

5.根据权利要求4所述的一种生成能力逼近未公开ai生成模型的模型确定方法，其特征在于，所述方法还包括：

6.根据权利要求5所述的一种生成能力逼近未公开ai生成模型的模型确定方法，其特征在于，所述方法还包括：

7.一种生成能力逼近未公开ai生成模型的模型确定系统，用于实施权利要求1-6任一所述的方法，其特征在于，包括：

8.根据权利要求7所述的一种生成能力逼近未公开ai生成模型的模型确定系统，其特征在于，所述系统还包括：模型性能评估模块(103)，评估所述生成能力逼近未公开ai生成模型的模型性能；以及

9.一种电子设备，其特征在于，包括处理器和存储器，所述存储器存储有多条指令，所述处理器用于读取所述指令并执行如权利要求1-6任一所述的方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有多条指令，所述多条指令可被处理器读取并执行如权利要求1-6任一所述的方法。

技术总结
本发明公开了一种生成能力逼近未公开AI生成模型的模型确定方法，包括获取训练数据，所述训练数据用于训练所述生成能力逼近未公开AI生成模型的模型；训练所述生成能力逼近未公开AI生成模型的模型；评估所述生成能力逼近未公开AI生成模型的模型性能；在新模型训练和优化到一定程度后，将其部署到实际应用场景中。还公开了对应系统、电子设备及计算机可读存储介质。即使无法获取未公开模型的具体架构和参数，仍然可以通过模仿学习的方式，训练出一个生成能力接近未公开模型的新模型；这种方法不仅能够促进知识和技术的传播，而且还能够推动不同领域间的协作和创新。

技术研发人员：杨熙,玄日成
受保护的技术使用者：北京智源人工智能研究院
技术研发日：
技术公布日：2024/6/26

转载请注明原文地址:https://doc.8miu.com/read-1828394.html

专利

最新回复(0)