本公开属于数据处理,具体涉及一种pdf格式电子档案自动拆分方法、系统、电子设备、存储介质。
背景技术:
1、科技档案整理单位或部门在组卷时往往是按卷归档,将档案扫描为一份pdf电子档案,但这样不便于文件检索和利用。因此,为了方便检索和利用,需要对移交的pdf格式电子档案进行拆分,目前的拆分方法大多为输入需要拆分电子文件的对应页码,以实现对电子档案进行拆分,由于这类电子档案的数量很大,手工输入页码需要大量人工并难以保证拆分的准确性,并且,操作一次只能拆分其中的一个电子文件,在需要对pdf电子文档中的所有电子文件拆分时,需要操作多次,耗时较长且工作量较大。另外,还有拆分方法是对pdf电子文档整体拆分,例如,获取该pdf电子文档的全部页面参数,根据页面参数对其包括的电子文件进行全部拆分,虽然实现了批量拆分,但该方法无法根据实际需要选择待拆分电子文件,应用灵活性较差。
技术实现思路
1、本公开旨在至少解决现有技术中存在的技术问题之一,提供一种pdf格式电子档案自动拆分方法、系统、电子设备、存储介质。
2、本公开的一方面,提供一种pdf格式电子档案自动拆分方法,所述方法包括:
3、获取与pdf格式电子档案对应的文件清单,所述pdf格式电子档案包括多个电子文件,所述文件清单包括多个文件信息,所述多个电子文件与所述多个文件信息一一对应;
4、根据至少一个所述文件信息,从所述pdf格式电子档案中拆分出与所述文件信息对应的至少一个所述电子文件;
5、拆分出的至少一个所述电子文件存储至目录文件夹。
6、可选地,所述文件信息包括文件序号、文件编号、文件责任者、文件名称、文件日期、文件页码中的至少一者。
7、可选地,所述文件页码包括文件开始页码与文件结束页码。
8、可选地,所述方法还包括:
9、在从所述pdf格式电子档案中拆分出与所述文件信息对应的至少一个所述电子文件时,对所述电子文件的名称进行重命名,以及对所述电子文件的页码进行重排。
10、本公开的另一方面,提出一种pdf格式电子档案自动拆分系统,包括获取模块、拆分模块以及存储模块;其中,
11、所述获取模块,用于获取与pdf格式电子档案对应的文件清单,所述pdf格式电子档案包括多个电子文件,所述文件清单包括多个文件信息,所述多个电子文件与所述多个文件信息一一对应;
12、所述拆分模块,用于根据至少一个所述文件信息,从所述pdf格式电子档案中拆分出与所述文件信息对应的至少一个所述电子文件;
13、所述存储模块,用于拆分出的至少一个所述电子文件存储至目录文件夹。
14、可选地,所述文件信息包括文件序号、文件编号、文件责任者、文件名称、文件日期、文件页码中的至少一者。
15、可选地,所述系统还包括文件重命名模块与页码重排模块;其中,
16、所述文件重命名模块,用于在从所述pdf格式电子档案中拆分出与所述文件信息对应的至少一个所述电子文件时,对所述电子文件的名称进行重命名;
17、所述页码重排模块,用于在从所述pdf格式电子档案中拆分出与所述文件信息对应的至少一个所述电子文件时,对所述电子文件的页码进行重排。
18、可选地,所述系统还包括关联模块,用于对pdf格式电子档案中的多个电子文件与文件清单中的多个文件信息相关联。
19、本公开的另一方面,提出一种电子设备,其特征在于,包括:
20、一个或多个处理器;
21、存储器,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,能使得所述一个或多个处理器实现根据前文记载的所述的pdf格式电子档案自动拆分方法。
22、本公开的另一方面,提出一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时能实现根据前文记载的所述的pdf格式电子档案自动拆分方法。
23、本公开提出一种pdf格式电子档案自动拆分方法、系统、电子设备、存储介质,方法包括:获取与pdf格式电子档案对应的文件清单,所述pdf格式电子档案包括多个电子文件,所述文件清单包括多个文件信息,所述多个电子文件与所述多个文件信息一一对应;根据至少一个所述文件信息,从所述pdf格式电子档案中拆分出与所述文件信息对应的至少一个所述电子文件;拆分出的至少一个所述电子文件存储至目录文件夹。该拆分方法可基于与待拆分电子档案相关联的文件清单进行拆分,无需人工输入页码信息,且一次可拆分多个电子文件,拆分效果良好且拆分效率高,有效降低人工操作的工作量,提高拆分数据的准确性。
1.一种pdf格式电子档案自动拆分方法,其特征在于,所述方法包括:
2.根据权利要求1所述的pdf格式电子档案自动拆分方法,其特征在于,所述文件信息包括文件序号、文件编号、文件责任者、文件名称、文件日期、文件页码中的至少一者。
3.根据权利要求2所述的pdf格式电子档案自动拆分方法,其特征在于,所述文件页码包括文件开始页码与文件结束页码。
4.根据权利要求1至3任一项所述的pdf格式电子档案自动拆分方法,其特征在于,所述方法还包括:
5.一种pdf格式电子档案自动拆分系统,其特征在于,包括获取模块、拆分模块以及存储模块;其中,
6.根据权利要求5所述的pdf格式电子档案自动拆分系统,其特征在于,所述文件信息包括文件序号、文件编号、文件责任者、文件名称、文件日期、文件页码中的至少一者。
7.根据权利要求5所述的pdf格式电子档案自动拆分系统,其特征在于,所述系统还包括关联模块,用于对pdf格式电子档案中的多个电子文件与文件清单中的多个文件信息相关联。
8.根据权利要求5所述的pdf格式电子档案自动拆分系统,其特征在于,所述系统还包括文件重命名模块与页码重排模块;其中,
9.一种电子设备,其特征在于,包括:
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,
