隐私保护数据挖掘方法的研究

隐私保护数据挖掘方法的研究

您的论文得到两院院士关注

文章编号:1008-0570(2006)07-3-0239-03

数据库数据仓库数据挖掘

隐私保护数据挖掘方法的研究

StudyonMethodsofPrivacyPreservingDataMining

(1.江苏信息职业技术学院;2.江南大学)陈

1,2

张伟

Chen,YunZhang,Wei

摘要:介绍了隐私保护数据挖掘的国内外研究概况,提出了对数据挖掘中隐私保护技术的分类,分析和评价相关典型算法,并对隐私保护数据挖掘的未来研究方向进行了展望。关键词:隐私保护,数据挖掘,随机扰动,安全多方计算

文献标识码:中图分类号:TP

Abstract:ThispaperpresentsanoverviewoftheresearchonPrivacyPreservingDataMining,introducestheclassificationof

PrivacyPreservingdataminingtechnology,andanalizesandevaluatesrepresentativealgorith.Then,itcoversaninitialstudyonthefuturedirectionsforprivacypreservingintheareaofdatamining.

Keywords:privacypreserving,datamining,randomperturbation,securemultipartycomputation

引言

随着数据挖掘技术的日益发展,数据隐私和信息安全逐渐引起人们的关注。为了保护数据的隐私,人们不愿提供正确的信息给服务商。例如,网上购物者不愿意提供自身的信息给相关网站,以免个人信息泄露造成不必要的麻烦,然而数据挖掘结果准确的重要前提是提供的数据正确。由于数据挖掘主要任务是对汇总数据的模式开发,这使得构造一个不需要访问精确的单个信息而获得准确的模式的挖掘技术成为可能。目前,保护隐私的数据挖掘已经成为数据挖掘研究中一个新颖的研究方向,吸引了密码学、统计学等相关学科的学者参与其中。本文对隐私保护数据挖掘技术进行了分类,同时对典型技术进行分析比较,最后对隐私保护数据挖掘技术进行展望。

集,则A支持事务T当且仅当

的蕴涵式,其中,则

关联规则是形如。

且。规

在事务中成立,具有支持度s(support),其中s

是数据库D事务中包含的百分比,即support

()=*100%。规则具有置信度c

术创新

(confidence),其中c是指包含A的事务中包含B的百分比,即confidence()=*100%。支持度是统计意义上的衡量,而置信度是对规则强度的衡量。同时满足最小支持度和最小置信度的规则被认为是有趣规则。

1.3数据挖掘中的隐私

隐私在不同的应用环境下有不同的解释。数据挖掘过程中所涉及的隐私一般指的是用户的基本信息(如姓名,年龄,家庭住址)或用户某些行为产生的信息(如购物信息,医疗信息,网页浏览信息等些信息的有意或无意泄露可能会给用户带来麻烦)。例如,医药公司希望客户泄露所患疾病目的是了解疾病之间的相关性,客户担心自己的隐私(姓名、病史等)泄露可能会影响就业。在分布式数据挖掘中,参于的各方拥有各自的数据,通过合作进行挖掘的过程中,一方数据相对于其他方是隐私。

1基本概念

1.1数据挖掘

数据挖掘是从大型数据库中提取人们感兴趣的知识,这些知识是隐含的、事先未知的、潜在的、有用信息,提取的知识表示为概念、规则、规律、模式等形式。数据挖掘要处理的问题,就是在庞大的数据库中寻找有价值的隐藏事件,加以分析,并将这些有意义的信息归纳成结构模式,提供给有关部门决策时参。常用的方法有关联规则、决策树、聚类、神经网络等方法。

2隐私保护数据挖掘的分类

对隐私保护数据挖掘的研究,可分为初始的用户数据隐私保护(输入保护)和挖掘结果的隐私保护(输出保护)。目前对于初始的用户数据的采取主要是随机扰动技术(RandomPerturbation)和安全多方计算技术(SecureMulti-partyComputation)。

2.1随机扰动技术

邮局订阅号:82-946360元/年

隐私保护数据挖掘方法的研究

1.2关联规则

设I={i1,i2,…,in}是项的集合。设任务相关的数据D是数据事务的集合。其中每个事务T是项的集合,每一个事务有唯一标识TID。设A是一个项陈芸:讲师硕士研究生

PLC技术应用200例》

239-

Word文档免费下载Word文档免费下载:隐私保护数据挖掘方法的研究 (共3页,当前第1页)

你可能喜欢

  • 隐私保护技术
  • 个人隐私保护
  • 数据挖掘研究
  • 数据挖掘综述
  • 社会保护
  • 信息保护
  • 电脑开机密码
  • xp开机密码破解

隐私保护数据挖掘方法的研究相关文档

最新文档

返回顶部