CN113378231A - 一种大数据应用开放平台的隐私计算方法及应用 - Google Patents
一种大数据应用开放平台的隐私计算方法及应用 Download PDFInfo
- Publication number
- CN113378231A CN113378231A CN202110770882.XA CN202110770882A CN113378231A CN 113378231 A CN113378231 A CN 113378231A CN 202110770882 A CN202110770882 A CN 202110770882A CN 113378231 A CN113378231 A CN 113378231A
- Authority
- CN
- China
- Prior art keywords
- privacy
- data
- software
- item
- open platform
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004364 calculation method Methods 0.000 title claims abstract description 28
- 230000000694 effects Effects 0.000 claims abstract description 27
- 238000004088 simulation Methods 0.000 claims abstract description 15
- 238000000034 method Methods 0.000 claims abstract description 7
- 238000012163 sequencing technique Methods 0.000 claims abstract description 4
- 238000012545 processing Methods 0.000 claims description 10
- 230000010354 integration Effects 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 3
- 230000002349 favourable effect Effects 0.000 abstract 1
- 238000005516 engineering process Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/70—Software maintenance or management
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- Pure & Applied Mathematics (AREA)
- Computational Mathematics (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Bioethics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Computer Hardware Design (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Operations Research (AREA)
- Probability & Statistics with Applications (AREA)
- Computer Security & Cryptography (AREA)
- Algebra (AREA)
- Medical Informatics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种大数据应用开放平台的隐私计算方法及应用,包括以下步骤:获取需要进行隐私计算的大数据应用开放平台软件信息,并建立隐私等级参数,同时计算隐私等级参数,将其按照隐私等级进行排序;按照排列的顺序,依次对软件中各项目数据进行模拟操作,本发明通过对需要进行隐私计算的大数据应用开放平台软件进行模拟活动,从而计算模拟活动中隐私数据出现的概率,并根据软件的性质与作用,确定软件上架的隐私度要求指标,将软件模拟活动中隐私数据出现的概率与软件上架的隐私度要求指标进行对比,从而计算软件是否能够上架大数据应用开放平台,进而保证大数据应用开放平台上的软件对隐私的保护程度,有利于实际的应用。
Description
技术领域
本发明属于隐私计算领域,具体为一种大数据应用开放平台的隐私计算方法及应用。
背景技术
现有生活中,随着移动互联网的发展,智能终端设备成为用户最主要的沟通工具,很多金融科技的利用依赖于智能终端设备上产生的大量数据,传统的大数据应用依赖于云计算,即在移动终端采集数据,并把这些数据全部上传到集中的云服务器,然后利用大数据、机器学习、人工智能等技术对这些数据加以计算、加工和利用,而随着移动终端上的大数据应用开放平台对个人隐私和数据安全越来越重视,并且移动终端上的大数据应用开放平台获得的数据多为重度个人隐私,这些数据的传输、存储都存在技术或者管理因素可能导致信息泄漏,最终可能导致隐私被非法使用,无论用户个人隐私保护意识还是相关信息保护政策都会要求尽量避免第三方收集传输存储这些隐私数据。
而现有技术中缺乏一种基于大数据应用开放平台的隐私计算方法,从而导致移动终端设备在大数据应用开放平台上架软件时,无法对这些上架软件的隐私要求进行计算,从而确定其是否符合上架标准,进而导致大数据应用开放平台上的软件对隐私的保护程度参差不齐,不利于实际的应用。
发明内容:
本发明的目的就在于为了解决上述问题而提供一种大数据应用开放平台的隐私计算方法及应用,解决了背景技术中提到的问题。
为了解决上述问题,本发明提供了一种技术方案:
一种大数据应用开放平台的隐私计算方法,包括以下步骤:
S1、获取需要进行隐私计算的大数据应用开放平台软件信息,并建立隐私等级参数,同时计算隐私等级参数,将其按照隐私等级进行排序;
S2、按照排列的顺序,依次对软件中各项目数据进行模拟操作,进行模拟操作的同时统计操作中需要使用的个人隐私信息;
S3、根据个人隐私信息出现的次数以及各项目数据操作进行各项目数据隐私度计算;
S4、对获取的各项目数据隐私度进行数据整合与处理,同时对其进行数据集划分;
S5、根据划分的数据集分别对软件的整体隐私度H2进行计算;
S6、根据软件的性质与作用,确定软件上架的隐私度要求指标H1,并将计算得到的软件整体隐私度H2与上架隐私度要求指标H1进行对比,若H1>H2,则软件给予上架,若H1<H2,则软件不予上架。
作为优选,所述步骤S1中的软件信息包括软件注册基本信息、软件适用设备配置信息、软件登录账户信息、隐私信息、社会关系信息和网络行为信息。
作为优选,所述步骤S1中的隐私等级参数计算方法包括以下步骤:
S11、对获得的各项信息中的分项信息进行评估,涉及个人隐私参数的项目标记为1,不涉及个人隐私参数的项目标记为0;
S12、标记完成之后,对标记之后的数据进行归一化处理,遍历标记的每一个数据,将同一项目数据中标记1的数据量x和标记0的数据量y进行相加,得到所有项目的整体数据信息量n;
S13、根据不同项目数据计算各项目数据的隐私涉及程度M,M=(x/n)100%;
S14、比较各项目数据的M值大小,并将其由大到小进行逐一排列。
作为优选,所述步骤S2中对软件中各项目数据进行模拟操作的具体操作步骤为:
S21、获取软件中各项目数据在进行操作时的各项活动;
S22、根据获取的各项活动,通过操作步骤以及操作语义调取软件中对应的各项构件;
S23、根据各项活动的具体操作步骤与执行各步骤需要使用的各项构件,获取各项目数据在进行操作时的活动路径。
作为优选,所述步骤S3中各项目数据隐私度计算的具体操作步骤为:
S31、根据步骤S23中得到的各项目数据在进行操作时的活动路径,进行项目执行操作,并按照执行要求录入相应的数据;
S32、根据进行的项目执行操作,获取操作中使用的各项数据,并按照数据中的标记,识别涉及个人隐私的数据参数与不涉及个人隐私的数据参数,并将涉及个人隐私的数据参数记为A1,将不涉及个人隐私的数据参数记为A2;
S33、同时统计各项目执行操作在进行时,A1出现的次数D以及A2出现的次数E;
S34、计算各项目执行操作在进行时,A1出现的概率K,K=【D/(D+E)】100%,K即为各项目数据隐私度。
作为优选,所述步骤S4中的数据整合与处理的具体操作步骤为:
S41、对步骤S34中计算得到的各项目数据隐私度K1、K2、K3……Kn进行获取;
S42、当各项目数据隐私度之间出现一个或者多个项目缺失时,返回上述步骤S3,重新对该项目数据隐私度进行计算,从而对缺失值数据进行填充;
S43、数据填充完成之后,按照由小到大的排列顺序对数据隐私度进行排列;
S44、去除各项目数据隐私度K1、K2、K3……Kn中的最大值与最小值。
作为优选,所述步骤S4中的数据集划分是将步骤S44中得到的去除最大值与最小值之后K1、K2、K3……Kn划分为代表集和误差集,即将各项目数据隐私度按照不平衡比例以8:2随机划分为两份,从数据隐私度排列样本中段抽取80%作为代表集样本,其余的作为误差集样本。
作为优选,所述步骤S5中对软件的整体隐私度H2进行计算的具体操作步骤为:
S51、将步骤S4中得到的代表集样本各项数据进行相加,然后除以代表集样本数据量I1,得到代表集样本数据整体隐私度H2(1),H2(1)=【K(n-2)、K(n-1)……K(n+n)】/I1;
S52、将步骤S4中得到的误差集样本各项数据进行相加,然后除以代表集样本数据量I2,得到代表集样本数据整体隐私度H2(2),H2(2)=【K(n-2)、K(n-1)……K(n+n)】/I2;
S53、将步骤S51中得到的H2(1)与步骤S52中得到的H2(2)相加再除以2即得软件整体隐私度H2,H2=【H2(1)+H2(2)】/2。
所述的隐私计算方法能用于评估大数据应用开放平台软件是否符合上架标准。
本发明的有益效果是:本发明通过对需要进行隐私计算的大数据应用开放平台软件进行模拟活动,从而计算模拟活动中隐私数据出现的概率,并根据软件的性质与作用,确定软件上架的隐私度要求指标,将软件模拟活动中隐私数据出现的概率与软件上架的隐私度要求指标进行对比,从而计算软件是否能够上架大数据应用开放平台,进而保证大数据应用开放平台上的软件对隐私的保护程度,有利于实际的应用。
附图说明:
为了易于说明,本发明由下述的具体实施及附图作以详细描述。
图1是本发明大数据应用开放平台的隐私计算方法流程图。
具体实施方式:
如图1所示,本具体实施方式采用以下技术方案:
实施例:
一种大数据应用开放平台的隐私计算方法,包括以下步骤:
S1、获取需要进行隐私计算的大数据应用开放平台软件信息,并建立隐私等级参数,同时计算隐私等级参数,将其按照隐私等级进行排序;
S2、按照排列的顺序,依次对软件中各项目数据进行模拟操作,进行模拟操作的同时统计操作中需要使用的个人隐私信息;
S3、根据个人隐私信息出现的次数以及各项目数据操作进行各项目数据隐私度计算;
S4、对获取的各项目数据隐私度进行数据整合与处理,同时对其进行数据集划分;
S5、根据划分的数据集分别对软件的整体隐私度H2进行计算;
S6、根据软件的性质与作用,确定软件上架的隐私度要求指标H1,并将计算得到的软件整体隐私度H2与上架隐私度要求指标H1进行对比,若H1>H2,则软件给予上架,若H1<H2,则软件不予上架。
其中,所述步骤S1中的软件信息包括软件注册基本信息、软件适用设备配置信息、软件登录账户信息、隐私信息、社会关系信息和网络行为信息。
其中,所述步骤S1中的隐私等级参数计算方法包括以下步骤:
S11、对获得的各项信息中的分项信息进行评估,涉及个人隐私参数的项目标记为1,不涉及个人隐私参数的项目标记为0;
S12、标记完成之后,对标记之后的数据进行归一化处理,遍历标记的每一个数据,将同一项目数据中标记1的数据量x和标记0的数据量y进行相加,得到所有项目的整体数据信息量n;
S13、根据不同项目数据计算各项目数据的隐私涉及程度M,M=(x/n)100%;
S14、比较各项目数据的M值大小,并将其由大到小进行逐一排列。
其中,所述步骤S2中对软件中各项目数据进行模拟操作的具体操作步骤为:
S21、获取软件中各项目数据在进行操作时的各项活动;
S22、根据获取的各项活动,通过操作步骤以及操作语义调取软件中对应的各项构件;
S23、根据各项活动的具体操作步骤与执行各步骤需要使用的各项构件,获取各项目数据在进行操作时的活动路径。
其中,所述步骤S3中各项目数据隐私度计算的具体操作步骤为:
S31、根据步骤S23中得到的各项目数据在进行操作时的活动路径,进行项目执行操作,并按照执行要求录入相应的数据;
S32、根据进行的项目执行操作,获取操作中使用的各项数据,并按照数据中的标记,识别涉及个人隐私的数据参数与不涉及个人隐私的数据参数,并将涉及个人隐私的数据参数记为A1,将不涉及个人隐私的数据参数记为A2;
S33、同时统计各项目执行操作在进行时,A1出现的次数D以及A2出现的次数E;
S34、计算各项目执行操作在进行时,A1出现的概率K,K=【D/(D+E)】100%,K即为各项目数据隐私度。
其中,所述步骤S4中的数据整合与处理的具体操作步骤为:
S41、对步骤S34中计算得到的各项目数据隐私度K1、K2、K3……Kn进行获取;
S42、当各项目数据隐私度之间出现一个或者多个项目缺失时,返回上述步骤S3,重新对该项目数据隐私度进行计算,从而对缺失值数据进行填充;
S43、数据填充完成之后,按照由小到大的排列顺序对数据隐私度进行排列;
S44、去除各项目数据隐私度K1、K2、K3……Kn中的最大值与最小值。
其中,所述步骤S4中的数据集划分是将步骤S44中得到的去除最大值与最小值之后K1、K2、K3……Kn划分为代表集和误差集,即将各项目数据隐私度按照不平衡比例以8:2随机划分为两份,从数据隐私度排列样本中段抽取80%作为代表集样本,其余的作为误差集样本。
其中,所述步骤S5中对软件的整体隐私度H2进行计算的具体操作步骤为:
S51、将步骤S4中得到的代表集样本各项数据进行相加,然后除以代表集样本数据量I1,得到代表集样本数据整体隐私度H2(1),H2(1)=【K(n-2)、K(n-1)……K(n+n)】/I1;
S52、将步骤S4中得到的误差集样本各项数据进行相加,然后除以代表集样本数据量I2,得到代表集样本数据整体隐私度H2(2),H2(2)=【K(n-2)、K(n-1)……K(n+n)】/I2;
S53、将步骤S51中得到的H2(1)与步骤S52中得到的H2(2)相加再除以2即得软件整体隐私度H2,H2=【H2(1)+H2(2)】/2。
所述的隐私计算方法能用于评估大数据应用开放平台软件是否符合上架标准。
具体的,在进行实际的计算操作时:
首先获取需要进行隐私计算的大数据应用开放平台软件信息,包括软件注册基本信息、软件适用设备配置信息、软件登录账户信息、隐私信息、社会关系信息和网络行为信息,并建立隐私等级参数,同时计算隐私等级参数,即对获得的各项信息中的分项信息进行评估,涉及个人隐私参数的项目标记为1,不涉及个人隐私参数的项目标记为0,标记完成之后,对标记之后的数据进行归一化处理,遍历标记的每一个数据,将同一项目数据中标记1的数据量x和标记0的数据量y进行相加,得到所有项目的整体数据信息量n,根据不同项目数据计算各项目数据的隐私涉及程度M,M=(x/n)100%,将其按照隐私等级进行排序,比较各项目数据的M值大小,并将其由大到小进行逐一排列;
按照排列的顺序,依次对软件中各项目数据进行模拟操作,获取软件中各项目数据在进行操作时的各项活动,根据获取的各项活动,通过操作步骤以及操作语义调取软件中对应的各项构件,根据各项活动的具体操作步骤与执行各步骤需要使用的各项构件,获取各项目数据在进行操作时的活动路径,进行模拟操作的同时统计操作中需要使用的个人隐私信息;
根据个人隐私信息出现的次数以及各项目数据操作进行各项目数据隐私度计算,根据上述步骤中得到的各项目数据在进行操作时的活动路径,进行项目执行操作,并按照执行要求录入相应的数据,根据进行的项目执行操作,获取操作中使用的各项数据,并按照数据中的标记,识别涉及个人隐私的数据参数与不涉及个人隐私的数据参数,并将涉及个人隐私的数据参数记为A1,将不涉及个人隐私的数据参数记为A2,同时统计各项目执行操作在进行时,A1出现的次数D以及A2出现的次数E,计算各项目执行操作在进行时,A1出现的概率K,K=【D/(D+E)】100%,K即为各项目数据隐私度;
对获取的各项目数据隐私度进行数据整合与处理,同时对其进行数据集划分,对上述步骤中计算得到的各项目数据隐私度K1、K2、K3……Kn进行获取,当各项目数据隐私度之间出现一个或者多个项目缺失时,返回上述步骤S3,重新对该项目数据隐私度进行计算,从而对缺失值数据进行填充,数据填充完成之后,按照由小到大的排列顺序对数据隐私度进行排列,去除各项目数据隐私度K1、K2、K3……Kn中的最大值与最小值,将得到的去除最大值与最小值之后K1、K2、K3……Kn划分为代表集和误差集,即将各项目数据隐私度按照不平衡比例以8:2随机划分为两份,从数据隐私度排列样本中段抽取80%作为代表集样本,其余的作为误差集样本;
根据划分的数据集分别对软件的整体隐私度H2进行计算,将步骤S4中得到的代表集样本各项数据进行相加,然后除以代表集样本数据量I1,得到代表集样本数据整体隐私度H2(1),H2(1)=【K(n-2)、K(n-1)……K(n+n)】/I1,将步骤S4中得到的误差集样本各项数据进行相加,然后除以代表集样本数据量I2,得到代表集样本数据整体隐私度H2(2),H2(2)=【K(n-2)、K(n-1)……K(n+n)】/I2,将步骤S51中得到的H2(1)与步骤S52中得到的H2(2)相加再除以2即得软件整体隐私度H2,H2=【H2(1)+H2(2)】/2;
根据软件的性质与作用,确定软件上架的隐私度要求指标H1,并将计算得到的软件整体隐私度H2与上架隐私度要求指标H1进行对比,若H1>H2,则软件给予上架,若H1<H2,则软件不予上架。
在本发明的描述中,需要理解的是,术语“同轴”、“底部”、“一端”、“顶部”、“中部”、“另一端”、“上”、“一侧”、“顶部”、“内”、“前部”、“中央”、“两端”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
此外,术语“第一”、“第二”、“第三”、“第四”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量,由此,限定有“第一”、“第二”、“第三”、“第四”的特征可以明示或者隐含地包括至少一个该特征。
在本发明中,除非另有明确的规定和限定,术语“安装”、“设置”、“连接”、“固定”、“旋接”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系,除非另有明确的限定,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
Claims (9)
1.一种大数据应用开放平台的隐私计算方法,其特征在于,包括以下步骤:
S1、获取需要进行隐私计算的大数据应用开放平台软件信息,并建立隐私等级参数,同时计算隐私等级参数,将其按照隐私等级进行排序;
S2、按照排列的顺序,依次对软件中各项目数据进行模拟操作,进行模拟操作的同时统计操作中需要使用的个人隐私信息;
S3、根据个人隐私信息出现的次数以及各项目数据操作进行各项目数据隐私度计算;
S4、对获取的各项目数据隐私度进行数据整合与处理,同时对其进行数据集划分;
S5、根据划分的数据集分别对软件的整体隐私度H2进行计算;
S6、根据软件的性质与作用,确定软件上架的隐私度要求指标H1,并将计算得到的软件整体隐私度H2与上架隐私度要求指标H1进行对比,若H1>H2,则软件给予上架,若H1<H2,则软件不予上架。
2.根据权利要求1所述的一种大数据应用开放平台的隐私计算方法,其特征在于,所述步骤S1中的软件信息包括软件注册基本信息、软件适用设备配置信息、软件登录账户信息、隐私信息、社会关系信息和网络行为信息。
3.根据权利要求1所述的一种大数据应用开放平台的隐私计算方法,其特征在于,所述步骤S1中的隐私等级参数计算方法包括以下步骤:
S11、对获得的各项信息中的分项信息进行评估,涉及个人隐私参数的项目标记为1,不涉及个人隐私参数的项目标记为0;
S12、标记完成之后,对标记之后的数据进行归一化处理,遍历标记的每一个数据,将同一项目数据中标记1的数据量x和标记0的数据量y进行相加,得到所有项目的整体数据信息量n;
S13、根据不同项目数据计算各项目数据的隐私涉及程度M,M=(x/n)100%;
S14、比较各项目数据的M值大小,并将其由大到小进行逐一排列。
4.根据权利要求1所述的一种大数据应用开放平台的隐私计算方法,其特征在于,所述步骤S2中对软件中各项目数据进行模拟操作的具体操作步骤为:
S21、获取软件中各项目数据在进行操作时的各项活动;
S22、根据获取的各项活动,通过操作步骤以及操作语义调取软件中对应的各项构件;
S23、根据各项活动的具体操作步骤与执行各步骤需要使用的各项构件,获取各项目数据在进行操作时的活动路径。
5.根据权利要求4所述的一种大数据应用开放平台的隐私计算方法,其特征在于,所述步骤S3中各项目数据隐私度计算的具体操作步骤为:
S31、根据步骤S23中得到的各项目数据在进行操作时的活动路径,进行项目执行操作,并按照执行要求录入相应的数据;
S32、根据进行的项目执行操作,获取操作中使用的各项数据,并按照数据中的标记,识别涉及个人隐私的数据参数与不涉及个人隐私的数据参数,并将涉及个人隐私的数据参数记为A1,将不涉及个人隐私的数据参数记为A2;
S33、同时统计各项目执行操作在进行时,A1出现的次数D以及A2出现的次数E;
S34、计算各项目执行操作在进行时,A1出现的概率K,K=【D/(D+E)】100%,K即为各项目数据隐私度。
6.根据权利要求5所述的一种大数据应用开放平台的隐私计算方法,其特征在于,所述步骤S4中的数据整合与处理的具体操作步骤为:
S41、对步骤S34中计算得到的各项目数据隐私度K1、K2、K3……Kn进行获取;
S42、当各项目数据隐私度之间出现一个或者多个项目缺失时,返回上述步骤S3,重新对该项目数据隐私度进行计算,从而对缺失值数据进行填充;
S43、数据填充完成之后,按照由小到大的排列顺序对数据隐私度进行排列;
S44、去除各项目数据隐私度K1、K2、K3……Kn中的最大值与最小值。
7.根据权利要求6所述的一种大数据应用开放平台的隐私计算方法,其特征在于,所述步骤S4中的数据集划分是将步骤S44中得到的去除最大值与最小值之后K1、K2、K3……Kn划分为代表集和误差集,即将各项目数据隐私度按照不平衡比例以8:2随机划分为两份,从数据隐私度排列样本中段抽取80%作为代表集样本,其余的作为误差集样本。
8.根据权利要求7所述的一种大数据应用开放平台的隐私计算方法,其特征在于,所述步骤S5中对软件的整体隐私度H2进行计算的具体操作步骤为:
S51、将步骤S4中得到的代表集样本各项数据进行相加,然后除以代表集样本数据量I1,得到代表集样本数据整体隐私度H2(1),H2(1)=【K(n-2)、K(n-1)……K(n+n)】/I1;
S52、将步骤S4中得到的误差集样本各项数据进行相加,然后除以代表集样本数据量I2,得到代表集样本数据整体隐私度H2(2),H2(2)=【K(n-2)、K(n-1)……K(n+n)】/I2;
S53、将步骤S51中得到的H2(1)与步骤S52中得到的H2(2)相加再除以2即得软件整体隐私度H2,H2=【H2(1)+H2(2)】/2。
9.根据权利要求1-8任一所述方法获得的隐私计算方法的应用,其特征在于,所述的隐私计算方法能用于评估大数据应用开放平台软件是否符合上架标准。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110770882.XA CN113378231A (zh) | 2021-07-08 | 2021-07-08 | 一种大数据应用开放平台的隐私计算方法及应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110770882.XA CN113378231A (zh) | 2021-07-08 | 2021-07-08 | 一种大数据应用开放平台的隐私计算方法及应用 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113378231A true CN113378231A (zh) | 2021-09-10 |
Family
ID=77581424
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110770882.XA Pending CN113378231A (zh) | 2021-07-08 | 2021-07-08 | 一种大数据应用开放平台的隐私计算方法及应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113378231A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115687329A (zh) * | 2022-11-15 | 2023-02-03 | 联洋国融(北京)科技有限公司 | 基于隐私计算处理多数据源缺失值的填充方法及装置 |
CN116226908A (zh) * | 2022-12-27 | 2023-06-06 | 北京市大数据中心 | 基于大数据的数据安全应急管理分析方法及系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104200155A (zh) * | 2014-08-12 | 2014-12-10 | 中国科学院信息工程研究所 | 基于苹果手机操作系统iOS保护用户隐私的监测装置和方法 |
CN111417121A (zh) * | 2020-02-17 | 2020-07-14 | 西安电子科技大学 | 具有隐私保护的多恶意软件混合检测方法、系统、装置 |
US20200244674A1 (en) * | 2019-01-28 | 2020-07-30 | Microsoft Technology Licensing, Llc | Methods and systems for scalable privacy-preserving compromise detection in the cloud |
CN111859371A (zh) * | 2020-07-22 | 2020-10-30 | 广州大学 | 一种应用程序的隐私风险评估方法、装置及存储介质 |
CN112257114A (zh) * | 2020-12-02 | 2021-01-22 | 支付宝(杭州)信息技术有限公司 | 一种应用程序隐私合规检测方法、装置、设备和介质 |
CN112817868A (zh) * | 2021-02-22 | 2021-05-18 | 北京小米移动软件有限公司 | 信息处理方法、装置及介质 |
-
2021
- 2021-07-08 CN CN202110770882.XA patent/CN113378231A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104200155A (zh) * | 2014-08-12 | 2014-12-10 | 中国科学院信息工程研究所 | 基于苹果手机操作系统iOS保护用户隐私的监测装置和方法 |
US20200244674A1 (en) * | 2019-01-28 | 2020-07-30 | Microsoft Technology Licensing, Llc | Methods and systems for scalable privacy-preserving compromise detection in the cloud |
CN111417121A (zh) * | 2020-02-17 | 2020-07-14 | 西安电子科技大学 | 具有隐私保护的多恶意软件混合检测方法、系统、装置 |
CN111859371A (zh) * | 2020-07-22 | 2020-10-30 | 广州大学 | 一种应用程序的隐私风险评估方法、装置及存储介质 |
CN112257114A (zh) * | 2020-12-02 | 2021-01-22 | 支付宝(杭州)信息技术有限公司 | 一种应用程序隐私合规检测方法、装置、设备和介质 |
CN112817868A (zh) * | 2021-02-22 | 2021-05-18 | 北京小米移动软件有限公司 | 信息处理方法、装置及介质 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115687329A (zh) * | 2022-11-15 | 2023-02-03 | 联洋国融(北京)科技有限公司 | 基于隐私计算处理多数据源缺失值的填充方法及装置 |
CN115687329B (zh) * | 2022-11-15 | 2023-05-30 | 联洋国融(北京)科技有限公司 | 基于隐私计算处理多数据源缺失值的填充方法及装置 |
CN116226908A (zh) * | 2022-12-27 | 2023-06-06 | 北京市大数据中心 | 基于大数据的数据安全应急管理分析方法及系统 |
CN116226908B (zh) * | 2022-12-27 | 2024-03-29 | 北京市大数据中心 | 基于大数据的数据安全应急管理分析方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3418910A1 (en) | Big data-based method and device for calculating relationship between development objects | |
CN113849702B (zh) | 一种确定目标数据的方法、装置、电子设备及存储介质 | |
CN113378231A (zh) | 一种大数据应用开放平台的隐私计算方法及应用 | |
CN110610431A (zh) | 基于大数据的智能理赔方法及智能理赔系统 | |
CN109324960A (zh) | 基于大数据分析的自动测试方法及终端设备 | |
CN115222303B (zh) | 基于大数据的行业风险数据分析方法、系统及存储介质 | |
CN112419074A (zh) | 一种车险欺诈团伙识别方法及装置 | |
CN113362191A (zh) | 设备投保数据处理方法、装置、计算机设备和存储介质 | |
CN107423222B (zh) | 一种确定测试覆盖率的方法及设备 | |
CN107818390A (zh) | 一种考核要求生成方法及装置 | |
CN116886440A (zh) | 一种威胁情报生产方法、装置、设备及存储介质 | |
CN115829371A (zh) | 一种应用于政务领域的数据质量评估方法及相关装置 | |
CN112907009B (zh) | 标准化模型的构建方法、装置、存储介质及设备 | |
CN114511174A (zh) | 一种业务指标图谱构建方法及装置 | |
CN113642669A (zh) | 基于特征分析的防欺诈检测方法、装置、设备及存储介质 | |
CN113450010A (zh) | 数据对象的评价结果的确定方法、装置和服务器 | |
Gencel et al. | Exploring the convertibility between IFPUG and COSMIC function points: preliminary findings | |
CN112418600A (zh) | 一种基于指标集的企业政策评分方法及系统 | |
CN109685638A (zh) | 一种审计覆盖率测量方法、装置及存储介质 | |
CN117892703B (zh) | 一种理化表单自动联想录入功能的实现方法及系统 | |
CN112990670B (zh) | 一种面向电力信息系统应用能效评价的关联分析方法及装置 | |
CN115564332B (zh) | 基于大数据的政务风险分析方法及系统 | |
CN114926012B (zh) | 一种研发项目智慧验收评审方法、系统及可读存储介质 | |
CN113159915A (zh) | 基于大数据的智能金融信用动态评估方法及系统 | |
CN117494702B (zh) | 一种结合rpa和ai的数据推送方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210910 |
|
RJ01 | Rejection of invention patent application after publication |