社交网络隐私成本的量化研究
郑莉 蔡琼 石曼 刘志恒
摘 要 由于社交网络具有开放性、共享性和连通性等特点,用户的个人隐私更容易被窥探、收集和非法利用,用户因此遭受的损失和伤害也更大。查找文献得到15项敏感信息及其数据,每项敏感信息划分为三个等级。根据所得数据,把这三个等级加权计算得分,从而得到15項敏感信息的权重,建立了社交网络方面的个人隐私成本的量化模型。
关键词 社交网络 隐私 成本
中图分类号:TP393.08 文献标识码:A
大数据背景下的网络发展势不可挡,传统的隐私观念受到冲击,这些变化催生着互联网语境下隐私概念的重构。在各种移动互联网应用上,用户暴露个人信息如身份信息、工作信息、联系方式、照片以及各种行为信息,如在线活动和位置等。
1社交网络方面的隐私成本模型
在对社交网络方面的隐私成本分析中,本文借鉴了孙文晶问卷调查中的数据,该问卷调查表共有16项敏感信息,这里我们将信息类别(X)按序排序:X1~X17每类敏感信息的价值,每一项敏感信息分成三个等级:根据情况而定、不是隐私(可公开)、是隐私(不可公开)。根据所得数据,我们把这三个等级加权计算得分,从而得到16项敏感信息的权重p1~p16(图1)。设每类敏感信息的价值vi=pi100(这里的100只是一个货币单位,可根据实际问题自行改变)得到信息类别的价值分别为v1~v16。进而得出敏感信息的价值矩阵V=(Vij)。建立了社交网络方面的个人隐私成本的量化模型。
在是隐私的判断中家庭住址、身份证号、购买行为、联系人信息对于用户来说,是高度一致的。因此这几项敏感信息的权重较大,相对于其他敏感信息而言对社交媒体领域的隐私成本模型作出的贡献更大,其商业价值越高。为了定义个人隐私价格点,我们把上文得到的敏感信息划分为5种程度,0%表示完全不具有,25%表示较少,50%表示一般,75%表示较多,100%表示完全具有,制定出一张个人评估调查表(见附件一)。用矩阵B=[0%,25%,50%,75%,100%]来表示个人评估的5种程度(每个人可以根据自身情况填写调查表,0代表否,1代表是),根据调查后的数据得到了一个矩阵A=(aij)。我们用向量Ai表示矩阵A的第i行,那么第Xi项敏感信息价格点公式为:
Li=B*AiT*vi1 (1)
那么该模型在社交媒体领域的个人隐私的价格点就可以用公式(2)表示,如下:
L=B*AT*v (2)
2社交网络用户隐私量化研究的意义
在社交网络用户隐私量化分析方面,从用户的网络行为与用户属性等角度出发,建立隐私成本量化模型,促进用户对网络隐私的重视。这是本项目的理论创新。在社交媒体领域,家庭住址、身份证号、购买行为、联系人信息对于用户来说,比其他元素更值钱,这些基本要素对模型的贡献更大,用户需要加强对这些敏感信息的保护。
参考文献
[1] 孙文晶.社交媒体中个人隐私的传播隐患研究[D].哈尔滨:黑龙江大学,2016:17-18.