本发明涉及自动程序设计领域,尤其涉及一种电子文档中敏感数据的脱敏处理方法及装置。
背景技术:
本部分旨在为权利要求书中陈述的本发明实施例提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
电子文档存在容易被复制、传播速度快等特点,若处理不当,容易导致电子文档中的敏感数据泄密。因此对电子文档中敏感数据进行脱敏处理,能够有效保护电子文档中的敏感数据不被泄密。
ofd(全称为openfixed-layoutdocument)是我国自主研发的版式格式标准,能够方便地对各类电子文档进行存储、读取以及编辑。在当今的电子时代,无论是电子商务、电子公务,还是信息发布、数字出版、档案管理、电子交换等都不可避免地涉及到了版式应用,因此也就不可避免地依赖于版式文档格式。
作为我国自主研发的电子版式文档,ofd文档具有独立于创建它的应用软件、硬件、操作系统、显示或打印它的输出设备,可有效保留原始文档的外观和完整性,还具有跨平台、自由共享特点,被广泛应用于电子文档的信息存储与传递。ofd文档存储信息的类型也变得多样化,覆盖了文字、图形、二维码等。对ofd文档内容中包含的敏感数据进行脱敏处理,能够对ofd文档内容起到有效保护。
目前,市面上对pdf文档内容中敏感数据的脱敏处理方案是使用adobe公司提供的开源sdk对pdf文档内容进行解析处理或使用其它解析方法或软件对pdf文档进行解析处理。在解析处理时,通过字符串匹配算法实现pdf文档中敏感数据的定位和确认,并进行脱敏。由于pdf文档具有特殊的编码格式,直接将对pdf文档内容中敏感数据进行脱敏时采用的字符串匹配算法应用ofd文档内容,存在效果较差的问题;且由于现有的脱敏功能及算法要依托于第三方的软件或者解析程序,存在安全隐患问题。
针对上述问题,目前尚未提出有效的解决方案。
技术实现要素:
本发明实施例中提供了一种电子文档中敏感数据的脱敏处理方法,用以解决现有技术直接将对pdf文档内容中敏感数据进行脱敏处理的方法应用于ofd文档,字符匹配效果较差,且存在安全隐患的技术问题,该方法包括:获取待脱敏电子文档对应的模板文件内容;对所述模板文件内容进行分解,定位模板文件内容中待脱敏的数据项;根据所述模板文件内容中待脱敏的数据项,查找所述待脱敏电子文档中相应数据项的数据内容;对查找出的数据内容进行脱敏处理;将脱敏处理后的数据内容与所述待脱敏电子文档中未进行脱敏处理的数据内容进行整合;根据整合后的数据,合成脱敏后的电子文档。
进一步地,在对所述模板文件内容进行分解,定位模板文件内容中待脱敏的数据项之前,所述方法还包括:获取自定义配置的待脱敏的数据项。
进一步地,获取自定义配置的待脱敏的数据项,包括:在可视化界面中显示所述模板文件内容中的各个数据项;接收用户对一个或多个数据项的选定指令;根据接收到的选定指令,获取自定义配置的待脱敏的数据项。
进一步地,在根据整合后的数据,合成脱敏后的电子文档之后,所述方法还包括:以预览的形式,输出脱敏后的电子文档。
进一步地,在根据整合后的数据,合成脱敏后的电子文档之后,所述方法还包括:接收文档保存指令;根据所述文档保存指令,保存脱敏后的电子文档。
进一步地,在根据整合后的数据,合成脱敏后的电子文档之后,所述方法还包括:接收文档输出指令;根据所述文档输出指令,输出脱敏后的电子文档。
进一步地,对查找出的数据内容进行脱敏处理,包括:将待脱敏的数据内容中的部分数据内容隐藏,输出剩余部分的数据内容。
进一步地,所述待脱敏电子文档为板式格式文档。
进一步地,所述板式格式文档为ofd文档。
进一步地,对所述模板文件内容进行分解,定位模板文件内容中待脱敏的数据项,包括:利用java中zip解析工具类,对ofd模板文件内容进行分解,定位ofd模板文件内容中待脱敏的数据项。
进一步地,根据所述模板文件内容中待脱敏的数据项,查找所述待脱敏电子文档中相应数据项的数据内容,包括:利用java中zip解析工具类,对待脱敏ofd文档进行分解,查找所述待脱敏ofd文档中相应数据项的数据内容。
本发明实施例中还提供了一种电子文档中敏感数据的脱敏处理装置,用以解决现有技术直接将对pdf文档内容中敏感数据进行脱敏处理的方法应用于ofd文档,字符匹配效果较差,且存在安全隐患的技术问题,该装置包括:模本内容获取模块,用于获取待脱敏电子文档对应的模板文件内容;待脱敏数据项确定模块,用于对所述模板文件内容进行分解,定位模板文件内容中待脱敏的数据项;待脱敏数据获取模块,用于根据所述模板文件内容中待脱敏的数据项,查找所述待脱敏电子文档中相应数据项的数据内容;脱敏处理模块,用于对查找出的数据内容进行脱敏处理;数据整合模块,用于将脱敏处理后的数据内容与所述待脱敏电子文档中未进行脱敏处理的数据内容进行整合;文档合成模块,用于根据整合后的数据,合成脱敏后的电子文档。
进一步地,所述装置还包括:数据项配置模块,用于获取自定义配置的待脱敏的数据项。
进一步地,所述数据项配置模块包括:可视化显示单元,用于在可视化界面中显示所述模板文件内容中的各个数据项;指令接收单元,用于接收用户对一个或多个数据项的选定指令;指令执行单元,用于根据接收到的选定指令,获取自定义配置的待脱敏的数据项。
进一步地,所述装置还包括:文档预览模块,用于以预览的形式,输出脱敏后的电子文档。
进一步地,所述装置还包括:文档保存模块,用于接收文档保存指令;以及根据所述文档保存指令,保存脱敏后的电子文档。
进一步地,所述装置还包括:文档输出模块,用于接收文档输出指令;以及根据所述文档输出指令,输出脱敏后的电子文档。
进一步地,所述脱敏处理模块还用于将待脱敏的数据内容中的部分数据内容隐藏,输出剩余部分的数据内容。
进一步地,所述待脱敏电子文档为板式格式文档。
进一步地,所述板式格式文档为ofd文档。
进一步地,所述待脱敏数据项确定模块还用于利用java中zip解析工具类,对ofd模板文件内容进行分解,定位ofd模板文件内容中待脱敏的数据项。
进一步地,所述待脱敏数据获取模块还用于利用java中zip解析工具类,对待脱敏ofd文档进行分解,查找所述待脱敏ofd文档中相应数据项的数据内容。
本发明实施例中还提供了一种电子设备,用以解决现有技术直接将对pdf文档内容中敏感数据进行脱敏处理的方法应用于ofd文档,字符匹配效果较差,且存在安全隐患的技术问题,该电子设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述电子文档中敏感数据的脱敏处理方法。
本发明实施例中还提供了一种计算机可读存储介质,用以解决现有技术直接将对pdf文档内容中敏感数据进行脱敏处理的方法应用于ofd文档,字符匹配效果较差,且存在安全隐患的技术问题,该计算机可读存储介质存储有执行上述电子文档中敏感数据的脱敏处理方法的计算机程序。
本发明实施例中提供的电子文档中敏感数据的脱敏处理方法、装置、电子设备及计算机可读存储介质,首先对待脱敏电子文档对应的模板文件内容进行分解,定位出模板文件内容中待脱敏的数据项,进而根据模板文件内容中待脱敏的数据项,查找待脱敏电子文档中相应数据项的数据内容,然后对查找出的数据内容进行脱敏处理,并将脱敏处理后的数据内容与待脱敏电子文档中未进行脱敏处理的数据内容进行整合,最后根据整合后的数据,合成脱敏后的电子文档。
通过本发明实施例,能够对ofd等板式格式文档中包含的敏感信息进行脱敏处理,以保护用户的敏感信息不被泄露。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1为本发明实施例中提供的一种电子文档中敏感数据的脱敏处理方法流程图;
图2为本发明实施例中提供的一种ofd文档格式的结构示意图;
图3为本发明实施例中提供的一种可选的电子文档中敏感数据的脱敏处理方法流程图;
图4为本发明实施例中待脱敏数据项的自定义配置流程图;
图5为本发明实施例中提供的一种电子文档中敏感数据的脱敏处理装置示意图;
图6为本发明实施例中提供的一种可选的电子文档中敏感数据的脱敏处理装置示意图;
图7为本发明实施例中提供的一种电子设备示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚明白,下面结合附图对本发明实施例做进一步详细说明。在此,本发明的示意性实施例及其说明用于解释本发明,但并不作为对本发明的限定。
本发明实施例中提供了一种电子文档中敏感数据的脱敏处理方法,用以解决现有技术直接将对pdf文档内容中敏感数据进行脱敏处理的方法应用于ofd文档,字符匹配效果较差,且存在安全隐患的技术问题,图1为本发明实施例中提供的一种电子文档中敏感数据的脱敏处理方法流程图,如图1所示,该方法包括如下步骤:
s101,获取待脱敏电子文档对应的模板文件内容。
需要说明的是,本发明实施例中的待脱敏电子文档可以是但不限于板式格式文档,例如,各种电子证件照。进一步地,当本发明实施例中的待脱敏电子文档为板式格式文档的情况下,一个实施例中,本发明实施例中的待脱敏电子文档为ofd文档。
ofd文档是采用xml技术,采用“容器 文档”的方式描述和存储数据。容器是一个虚拟存储系统,将各类数据描述文件聚合起来,并提供相应的访问接口和数据压缩方法。如图2所示为一种ofd文档格式的结构,包括三层:
第一层,虚拟存储系统:包括包组织结构及包内目录组织结构;
第二层,文档模型:包括文档、页面、大纲、文件级资源等组织结构;
第三层,页面内容描述:包括页面级资源、图形、图像和文字等。
需要注意的是,ofd文档是基于xml对版式格式进行描述,其脱敏功能的实现原理主要是对xml数据文件进行解析。
s102,对模板文件内容进行分解,定位模板文件内容中待脱敏的数据项。
需要说明的是,本发明实施例中待脱敏的数据项可以是但不限于电子文档中包含的姓名、身份证号码、地址、电话号码、银行账号、邮箱地址、所属城市、邮编、组织机构名称、营业执照号码、银行帐号等敏感信息的数据项。
当本发明实施例中的待脱敏电子文档为ofd文档的情况下,上述s102中,可以利用java中zip解析工具类,对ofd模板文件内容进行分解,定位ofd模板文件内容中待脱敏的数据项。
s103,根据模板文件内容中待脱敏的数据项,查找待脱敏电子文档中相应数据项的数据内容。
当本发明实施例中的待脱敏电子文档为ofd文档的情况下,上述s103中,可以利用java中zip解析工具类,对待脱敏ofd文档进行分解,查找待脱敏ofd文档中相应数据项的数据内容。
需要说明的是,本发明实施例中使用java中zip解析工具类对ofd文档进行解析仅为一种示例,由于对ofd文件进行解析主要是对xml数据文件的解析,因而其他对xml文件解析及对结构化数据的脱敏算法,都可应用于本发明实施例中。本发明旨在保护在对板式格式文档进行脱敏处理时,首先对模板文件的内容进行分解,得到各个数据项,进而根据脱敏需求,指定待脱敏的数据项,进而根据模板文件待脱敏的数据项,查找待脱敏文档中相应数据项的数据内容,并进行脱敏处理。
s104,对查找出的数据内容进行脱敏处理。
在具体实施时,在查找出的待脱敏处理的数据内容后,可以对待脱敏处理的数内容进行如下处理:将待脱敏的数据内容中的部分数据内容隐藏,输出剩余部分的数据内容。
s105,将脱敏处理后的数据内容与待脱敏电子文档中未进行脱敏处理的数据内容进行整合。
由于待脱敏电子文档中包含需要脱敏处理的第一数据内容和不需要脱敏处理的第二数据内容,在对需要脱敏处理的第一数据内容进行脱敏处理后,需要将脱敏处理后的第三数据内容与第二数据内容进行整合。需要注意的是,不同的电子文档类型,整合方式也不同。
s106,根据整合后的数据,合成脱敏后的电子文档。
在将脱敏处理后的数据内容与待脱敏电子文档中未进行脱敏处理的数据内容进行整合后,需要进一步合成脱敏后的电子文档,以方便数据使用方进行预览等后续处理。
由上可知,本发明实施例中提供的电子文档中敏感数据的脱敏处理方法,首先对待脱敏电子文档对应的模板文件内容进行分解,定位出模板文件内容中待脱敏的数据项,进而根据模板文件内容中待脱敏的数据项,查找待脱敏电子文档中相应数据项的数据内容,然后对查找出的数据内容进行脱敏处理,并将脱敏处理后的数据内容与待脱敏电子文档中未进行脱敏处理的数据内容进行整合,最后根据整合后的数据,合成脱敏后的电子文档。
通过本发明实施例中提供的电子文档中敏感数据的脱敏处理方法,能够对ofd等板式格式文档中包含的敏感信息进行脱敏处理,以保护用户的敏感信息不被泄露。
在一个实施例中,如图3所示,在根据整合后的数据,合成脱敏后的电子文档之后,本发明实施例中提供的电子文档中敏感数据的脱敏处理方法还可以包括如下步骤:
s107,以预览的形式,输出脱敏后的电子文档。
在一个实施例中,如图3所示,在根据整合后的数据,合成脱敏后的电子文档之后,本发明实施例中提供的电子文档中敏感数据的脱敏处理方法还可包括如下步骤:
s108,接收文档保存指令;
s109,根据文档保存指令,保存脱敏后的电子文档。
在具体实施时,根据电子文档的格式不同,可将脱敏后的电子文档保存为不同的格式。
在一个实施例中,如图3所示,在根据整合后的数据,合成脱敏后的电子文档之后,本发明实施例中提供的电子文档中敏感数据的脱敏处理方法还可包括如下步骤:
s110,接收文档输出指令;
s111,根据文档输出指令,输出脱敏后的电子文档。
由于目前大多数的ofd文档的阅览,都是通过客户端或者网页在线进行浏览的,因而,根据文档输出指令,可以将脱敏后的电子文档输出值客户端或网页应用中。本发明实施例中,通过对ofd文档进行敏感数据脱敏处理,能够消除在实际业务中对ofd文件在线预览的情况下,用户敏感信息被泄露的风险。
为了满足更多的文档脱敏需求,在一个实施例中,如图4所示,在对模板文件内容进行分解,定位模板文件内容中待脱敏的数据项之前,本发明实施例中提供的电子文档中敏感数据的脱敏处理方法还可以包括如下步骤:
s100,获取自定义配置的待脱敏的数据项。
通过上述实施例,用户能够自定义配置电子文档中待脱敏的数据项,以满足不同类型电子文档的不同脱敏需求。例如,对于身份证件照,可能需要对身份证号码进行脱敏处理;而对于营业执照,则可能需要对营业执照号码进行脱敏处理。显然,身份证号码和营业执照号码为不同的数据项。
进一步地,为了简化用户的数据项配置操作,在一个实施例中,如图4所示,上述s100可以通过如下步骤来实现:
s1001,在可视化界面中显示模板文件内容中的各个数据项;
s1002,接收用户对一个或多个数据项的选定指令;
s1003,根据接收到的选定指令,获取自定义配置的待脱敏的数据项。
通过上述实施例,用户能够通过可视化的方式实现待脱敏数据项的配置,不仅简化了用户操作,而且提高了配置效率。
基于同一发明构思,本发明实施例中还提供了一种电子文档中敏感数据的脱敏处理装置,用以解决现有技术直接将对pdf文档内容中敏感数据进行脱敏处理的方法应用于ofd文档,字符匹配效果较差,且存在安全隐患的技术问题,如下面的实施例。由于该装置解决问题的原理与电子文档中敏感数据的脱敏处理方法相似,因此该装置的实施可以参见电子文档中敏感数据的脱敏处理方法的实施,重复之处不再赘述。
图5为本发明实施例中提供的一种电子文档中敏感数据的脱敏处理装置示意图,如图5所示,该装置包括:模本内容获取模块51、待脱敏数据项确定模块52、待脱敏数据获取模块53、脱敏处理模块54、数据整合模块55和文档合成模块56。
其中,模本内容获取模块51,用于获取待脱敏电子文档对应的模板文件内容;待脱敏数据项确定模块52,用于对模板文件内容进行分解,定位模板文件内容中待脱敏的数据项;待脱敏数据获取模块53,用于根据模板文件内容中待脱敏的数据项,查找待脱敏电子文档中相应数据项的数据内容;脱敏处理模块54,用于对查找出的数据内容进行脱敏处理;数据整合模块55,用于将脱敏处理后的数据内容与待脱敏电子文档中未进行脱敏处理的数据内容进行整合;文档合成模块56,用于根据整合后的数据,合成脱敏后的电子文档。
此处需要说明的是,上述模本内容获取模块51、待脱敏数据项确定模块52、待脱敏数据获取模块53、脱敏处理模块54、数据整合模块55和文档合成模块56对应于方法实施例中的s101~s106,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述方法实施例所公开的内容。需要说明的是,上述模块作为装置的一部分可以在诸如一组计算机可执行指令的计算机系统中执行。
由上可知,本发明实施例中提供的电子文档中敏感数据的脱敏处理装置,首先对待脱敏电子文档对应的模板文件内容进行分解,定位出模板文件内容中待脱敏的数据项,进而根据模板文件内容中待脱敏的数据项,查找待脱敏电子文档中相应数据项的数据内容,然后对查找出的数据内容进行脱敏处理,并将脱敏处理后的数据内容与待脱敏电子文档中未进行脱敏处理的数据内容进行整合,最后根据整合后的数据,合成脱敏后的电子文档。
通过本发明实施例提供的电子文档中敏感数据的脱敏处理装置,能够对ofd等板式格式文档中包含的敏感信息进行脱敏处理,以保护用户的敏感信息不被泄露。
在一个实施例中,如图6所示,本发明实施例中提供的电子文档中敏感数据的脱敏处理装置还可包括:文档预览模块57,用于以预览的形式,输出脱敏后的电子文档。
此处需要说明的是,上述数据项配置模块57对应于方法实施例中的s107,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述方法实施例所公开的内容。需要说明的是,上述模块作为装置的一部分可以在诸如一组计算机可执行指令的计算机系统中执行。
在一个实施例中,如图6所示,本发明实施例中提供的电子文档中敏感数据的脱敏处理装置还可包括:文档保存模块58,用于接收文档保存指令;以及根据文档保存指令,保存脱敏后的电子文档。
此处需要说明的是,上述数据项配置模块58对应于方法实施例中的s108~s109,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述方法实施例所公开的内容。需要说明的是,上述模块作为装置的一部分可以在诸如一组计算机可执行指令的计算机系统中执行。
在一个实施例中,如图6所示,本发明实施例中提供的电子文档中敏感数据的脱敏处理装置还可包括:文档输出模块59,用于接收文档输出指令;以及根据文档输出指令,输出脱敏后的电子文档。
此处需要说明的是,上述文档输出模块59对应于方法实施例中的s110~s111,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述方法实施例所公开的内容。需要说明的是,上述模块作为装置的一部分可以在诸如一组计算机可执行指令的计算机系统中执行。
在一个实施例中,本发明实施例中提供的电子文档中敏感数据的脱敏处理装置中,脱敏处理模块54还用于将待脱敏的数据内容中的部分数据内容隐藏,输出剩余部分的数据内容。
在一个实施例中,本发明实施例中提供的电子文档中敏感数据的脱敏处理装置中,待脱敏电子文档为板式格式文档。
进一步地,上述板式格式文档为ofd文档。
在一个实施例中,本发明实施例中提供的电子文档中敏感数据的脱敏处理装置中,待脱敏数据项确定模块52还用于利用java中zip解析工具类,对ofd模板文件内容进行分解,定位ofd模板文件内容中待脱敏的数据项。
在一个实施例中,本发明实施例中提供的电子文档中敏感数据的脱敏处理装置中,待脱敏数据获取模块53还用于利用java中zip解析工具类,对待脱敏ofd文档进行分解,查找待脱敏ofd文档中相应数据项的数据内容。
在一个实施例中,如图6所示,本发明实施例中提供的电子文档中敏感数据的脱敏处理装置还可包括:数据项配置模块50,用于获取自定义配置的待脱敏的数据项。
此处需要说明的是,上述数据项配置模块50对应于方法实施例中的s100,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述方法实施例所公开的内容。需要说明的是,上述模块作为装置的一部分可以在诸如一组计算机可执行指令的计算机系统中执行。
进一步地,如图6所示,数据项配置模块50可包括:可视化显示单元501、指令接收单元502和指令执行单元503。
其中,可视化显示单元501,用于在可视化界面中显示模板文件内容中的各个数据项;指令接收单元502,用于接收用户对一个或多个数据项的选定指令;指令执行单元503,用于根据接收到的选定指令,获取自定义配置的待脱敏的数据项。
此处需要说明的是,上述可视化显示单元501、指令接收单元502和指令执行单元503对应于方法实施例中的s1001~s1003,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述方法实施例所公开的内容。需要说明的是,上述模块作为装置的一部分可以在诸如一组计算机可执行指令的计算机系统中执行。
基于同一发明构思,本发明实施例中还提供了一种用于实现上述电子文档中敏感数据的脱敏处理方法中的全部或部分内容的电子设备实施例。该电子设备具体包含有如下内容:
处理器(processor)、存储器(memory)、通信接口(communicationsinterface)和总线;其中,所述处理器、存储器、通信接口通过所述总线完成相互间的通信;所述通信接口用于实现相关设备之间的信息传输;该电子设备可以是台式计算机、平板电脑及移动终端等,本实施例不限于此。在本实施例中,该电子设备可以参照实施例用于实现上述电子文档中敏感数据的脱敏处理方法的实施例及用于实现上述电子文档中敏感数据的脱敏处理装置的实施例进行实施,其内容被合并于此,重复之处不再赘述。
图7为本发明实施例中提供的一种电子设备的系统组成结构示意图。如图7所示,该电子设备70可以包括处理器701和存储器702;存储器702耦合到处理器701。值得注意的是,该图7是示例性的;还可以使用其他类型的结构,来补充或代替该结构,以实现电信功能或其他功能。
在一个实施例中,电子文档中敏感数据的脱敏处理方法实现的功能可以被集成到处理器701中。其中,处理器701可以被配置未进行如下控制:获取待脱敏电子文档对应的模板文件内容;对模板文件内容进行分解,定位模板文件内容中待脱敏的数据项;根据模板文件内容中待脱敏的数据项,查找待脱敏电子文档中相应数据项的数据内容;对查找出的数据内容进行脱敏处理;将脱敏处理后的数据内容与待脱敏电子文档中未进行脱敏处理的数据内容进行整合;根据整合后的数据,合成脱敏后的电子文档。
由上可知,本发明的实施例中提供的电子设备,首先对待脱敏电子文档对应的模板文件内容进行分解,定位出模板文件内容中待脱敏的数据项,进而根据模板文件内容中待脱敏的数据项,查找待脱敏电子文档中相应数据项的数据内容,然后对查找出的数据内容进行脱敏处理,并将脱敏处理后的数据内容与待脱敏电子文档中未进行脱敏处理的数据内容进行整合,最后根据整合后的数据,合成脱敏后的电子文档。
通过本发明实施例提供的电子设备,能够对ofd等板式格式文档中包含的敏感信息进行脱敏处理,以保护用户的敏感信息不被泄露。
在另一个实施例中,电子文档中敏感数据的脱敏处理装置可以与处理器701分开配置,例如可以将电子文档中敏感数据的脱敏处理装置配置为与处理器701连接的芯片,通过处理器的控制来实现电子文档中敏感数据的脱敏处理方法的功能。
如图7所示,该电子设备70还可以包括:通信模块703、输入单元704、音频处理单元705、显示器706、电源707。值得注意的是,电子设备70也并不是必须要包括图7中所示的所有部件;此外,电子设备70还可以包括图7中没有示出的部件,可以参考现有技术。
如图7所示,处理器701有时也称为控制器或操作控件,可以包括微处理器或其他处理器装置和/或逻辑装置,该处理器701接收输入并控制电子设备70的各个部件的操作。
其中,存储器702,例如可以是缓存器、闪存、硬驱、可移动介质、易失性存储器、非易失性存储器或其它合适装置中的一种或更多种。可储存上述与失败有关的信息,此外还可存储执行有关信息的程序。并且处理器701可执行该存储器702存储的该程序,以实现信息存储或处理等。
输入单元704向处理器701提供输入。该输入单元704例如为按键或触摸输入装置。电源707用于向电子设备70提供电力。显示器706用于进行图像和文字等显示对象的显示。该显示器例如可为lcd显示器,但并不限于此。
该存储器702可以是固态存储器,例如,只读存储器(rom)、随机存取存储器(ram)、sim卡等。还可以是这样的存储器,其即使在断电时也保存信息,可被选择性地擦除且设有更多数据,该存储器的示例有时被称为eprom等。存储器702还可以是某种其它类型的装置。存储器702包括缓冲存储器7021(有时被称为缓冲器)。存储器702可以包括应用/功能存储部7022,该应用/功能存储部7022用于存储应用程序和功能程序或用于通过处理器701执行电子设备70的操作的流程。
存储器702还可以包括数据存储部7023,该数据存储部7023用于存储数据,例如联系人、数字数据、图片、声音和/或任何其他由电子设备使用的数据。存储器702的驱动程序存储部7024可以包括电子设备的用于通信功能和/或用于执行电子设备的其他功能(如消息传送应用、通讯录应用等)的各种驱动程序。
通信模块703即为经由天线708发送和接收信号的发送机/接收机。通信模块(发送机/接收机)703耦合到处理器701,以提供输入信号和接收输出信号,这可以和常规移动通信终端的情况相同。
基于不同的通信技术,在同一电子设备中,可以设置有多个通信模块703,如蜂窝网络模块、蓝牙模块和/或无线局域网模块等。通信模块(发送机/接收机)703还经由音频处理单元705耦合到扬声器709和麦克风710,以经由扬声器709提供音频输出,并接收来自麦克风710的音频输入,从而实现通常的电信功能。音频处理单元705可以包括任何合适的缓冲器、解码器、放大器等。另外,音频处理单元705还耦合到处理器701,从而使得可以通过麦克风710能够在本机上录音,且使得可以通过扬声器709来播放本机上存储的声音。
本发明的实施例中还提供了一种用于实现上述实施例中电子文档中敏感数据的脱敏处理方法中全部步骤的一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述实施例中的电子文档中敏感数据的脱敏处理方法的全部步骤,例如,该处理器执行该计算机程序时实现下述步骤:获取待脱敏电子文档对应的模板文件内容;对模板文件内容进行分解,定位模板文件内容中待脱敏的数据项;根据模板文件内容中待脱敏的数据项,查找待脱敏电子文档中相应数据项的数据内容;对查找出的数据内容进行脱敏处理;将脱敏处理后的数据内容与待脱敏电子文档中未进行脱敏处理的数据内容进行整合;根据整合后的数据,合成脱敏后的电子文档。
由上可知,本发明的实施例中提供的计算机可读存储介质,首先对待脱敏电子文档对应的模板文件内容进行分解,定位出模板文件内容中待脱敏的数据项,进而根据模板文件内容中待脱敏的数据项,查找待脱敏电子文档中相应数据项的数据内容,然后对查找出的数据内容进行脱敏处理,并将脱敏处理后的数据内容与待脱敏电子文档中未进行脱敏处理的数据内容进行整合,最后根据整合后的数据,合成脱敏后的电子文档。
通过本发明实施例提供的计算机可读存储介质,能够对ofd等板式格式文档中包含的敏感信息进行脱敏处理,以保护用户的敏感信息不被泄露。
虽然本发明提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的装置或客户端产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境)。
本领域技术人员应明白,本说明书的实施例可提供为方法、装置(系统)或计算机程序产品。因此,本说明书实施例可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、装置(系统)和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。术语“上”、“下”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。本发明并不局限于任何单一的方面,也不局限于任何单一的实施例,也不局限于这些方面和/或实施例的任意组合和/或置换。可单独使用本发明的每个方面和/或实施例,或者与一个或更多其他方面和/或其他实施例结合使用。
以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例中所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围,其均应涵盖在本发明的权利要求和说明书的范围当中。
1.一种电子文档中敏感数据的脱敏处理方法,其特征在于,包括:
获取待脱敏电子文档对应的模板文件内容;
对所述模板文件内容进行分解,定位模板文件内容中待脱敏的数据项;
根据所述模板文件内容中待脱敏的数据项,查找所述待脱敏电子文档中相应数据项的数据内容;
对查找出的数据内容进行脱敏处理;
将脱敏处理后的数据内容与所述待脱敏电子文档中未进行脱敏处理的数据内容进行整合;
根据整合后的数据,合成脱敏后的电子文档。
2.如权利要求1所述的方法,其特征在于,在对所述模板文件内容进行分解,定位模板文件内容中待脱敏的数据项之前,所述方法还包括:
获取自定义配置的待脱敏的数据项。
3.如权利要求2所述的方法,其特征在于,获取自定义配置的待脱敏的数据项,包括:
在可视化界面中显示所述模板文件内容中的各个数据项;
接收用户对一个或多个数据项的选定指令;
根据接收到的选定指令,获取自定义配置的待脱敏的数据项。
4.如权利要求1所述的方法,其特征在于,在根据整合后的数据,合成脱敏后的电子文档之后,所述方法还包括:
以预览的形式,输出脱敏后的电子文档。
5.如权利要求1所述的方法,其特征在于,在根据整合后的数据,合成脱敏后的电子文档之后,所述方法还包括:
接收文档保存指令;
根据所述文档保存指令,保存脱敏后的电子文档。
6.如权利要求1所述的方法,其特征在于,在根据整合后的数据,合成脱敏后的电子文档之后,所述方法还包括:
接收文档输出指令;
根据所述文档输出指令,输出脱敏后的电子文档。
7.如权利要求1所述的方法,其特征在于,对查找出的数据内容进行脱敏处理,包括:
将待脱敏的数据内容中的部分数据内容隐藏,输出剩余部分的数据内容。
8.如权利要求1至7任一项所述的方法,其特征在于,所述待脱敏电子文档为板式格式文档。
9.如权利要求8所述的方法,其特征在于,所述板式格式文档为ofd文档。
10.如权利要求9所述的方法,其特征在于,对所述模板文件内容进行分解,定位模板文件内容中待脱敏的数据项,包括:
利用java中zip解析工具类,对ofd模板文件内容进行分解,定位ofd模板文件内容中待脱敏的数据项。
11.如权利要求10所述的方法,其特征在于,根据所述模板文件内容中待脱敏的数据项,查找所述待脱敏电子文档中相应数据项的数据内容,包括:
利用java中zip解析工具类,对待脱敏ofd文档进行分解,查找所述待脱敏ofd文档中相应数据项的数据内容。
12.一种电子文档中敏感数据的脱敏处理装置,其特征在于,包括:
模本内容获取模块,用于获取待脱敏电子文档对应的模板文件内容;
待脱敏数据项确定模块,用于对所述模板文件内容进行分解,定位模板文件内容中待脱敏的数据项;
待脱敏数据获取模块,用于根据所述模板文件内容中待脱敏的数据项,查找所述待脱敏电子文档中相应数据项的数据内容;
脱敏处理模块,用于对查找出的数据内容进行脱敏处理;
数据整合模块,用于将脱敏处理后的数据内容与所述待脱敏电子文档中未进行脱敏处理的数据内容进行整合;
文档合成模块,用于根据整合后的数据,合成脱敏后的电子文档。
13.如权利要求12所述的装置,其特征在于,所述装置还包括:
数据项配置模块,用于获取自定义配置的待脱敏的数据项。
14.如权利要求13所述的装置,其特征在于,所述数据项配置模块包括:
可视化显示单元,用于在可视化界面中显示所述模板文件内容中的各个数据项;
指令接收单元,用于接收用户对一个或多个数据项的选定指令;
指令执行单元,用于根据接收到的选定指令,获取自定义配置的待脱敏的数据项。
15.如权利要求12所述的装置,其特征在于,所述装置还包括:
文档预览模块,用于以预览的形式,输出脱敏后的电子文档。
16.如权利要求12所述的装置,其特征在于,所述装置还包括:
文档保存模块,用于接收文档保存指令;以及根据所述文档保存指令,保存脱敏后的电子文档。
17.如权利要求12所述的装置,其特征在于,所述装置还包括:
文档输出模块,用于接收文档输出指令;以及根据所述文档输出指令,输出脱敏后的电子文档。
18.如权利要求12所述的装置,其特征在于,所述脱敏处理模块还用于将待脱敏的数据内容中的部分数据内容隐藏,输出剩余部分的数据内容。
19.如权利要求12至18任一项所述的装置,其特征在于,所述待脱敏电子文档为板式格式文档。
20.如权利要求19所述的装置,其特征在于,所述板式格式文档为ofd文档。
21.如权利要求20所述的装置,其特征在于,所述待脱敏数据项确定模块还用于利用java中zip解析工具类,对ofd模板文件内容进行分解,定位ofd模板文件内容中待脱敏的数据项。
22.如权利要求21所述的装置,其特征在于,所述待脱敏数据获取模块还用于利用java中zip解析工具类,对待脱敏ofd文档进行分解,查找所述待脱敏ofd文档中相应数据项的数据内容。
23.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至11任一项所述电子文档中敏感数据的脱敏处理方法。
24.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有执行权利要求1至11任一项所述电子文档中敏感数据的脱敏处理方法的计算机程序。
技术总结