每日彩票客户端|搜狗百科
每日彩票下载2023-06-30

你的隐私,大数据怎知道******

  作者 :杨义先 、钮心忻(均为北京邮电大学教授)

  在网络上,每个人都会或多或少 ,或主动或被动地泄露某些碎片信息。这些信息被大数据挖掘,就存在隐私泄露的风险 ,引发信息安全问题。面对汹涌而来的5G时代 ,大众对自己的隐私保护感到越来越迷茫,甚至有点不知所措。那么 ,你的隐私 ,大数据是怎么知道 的呢?大家又该如何自我保护呢 ?

  1.“已知、未知”大数据都知道

  大数据时代 ,每个人都有可能成为安徒生童话中那个“穿新衣”的皇帝 。在大数据面前 ,你说过什么话,它知道;你做过什么事,它知道;你有什么爱好,它知道 ;你生过什么病 ,它知道;你家住哪里,它知道;你 的亲朋好友都有谁 ,它也知道……总之,你自己知道的,它几乎都知道 ,或者说它都能够知道 ,至少可以说 ,它迟早会知道!

  甚至 ,连你自己都不知道的事情 ,大数据也可能知道 。例如 ,它能够发现你 的许多潜意识习惯 :集体照相时你喜欢站哪里呀,跨门槛时喜欢先迈左脚还 是右脚呀,你喜欢与什么样的人打交道呀 ,你的性格特点都有什么呀 ,哪位朋友与你 的观点不相同呀……

  再进一步说 ,今后将要发生 的事情 ,大数据还是有可能知道。例如 ,根据你“饮食多 、运动少”等信息,它就能够推测出,你可能会“三高” 。当你与许多人都在独立地购买感冒药时,大数据就知道:流感即将暴发了 !其实,大数据已经成功地预测了包括世界杯比赛结果、股票的波动 、物价趋势 、用户行为、交通情况等。

  当然 ,这里 的“你”并非仅仅指“你个人” ,包括但不限于 ,你 的家庭,你 的单位 ,你 的民族,甚至你 的国家等 。至于这些你知道 的 、不知道 的或今后才知道的隐私信息,将会把你塑造成什么, 是英雄还 是狗熊?这却难以预知 。

  2.数据挖掘就像“垃圾处理”

  什么 是大数据?形象地说,所谓大数据,就是由许多千奇百怪 的数据,杂乱无章地堆积在一起 。例如,你在网上说 的话、发的微信、收发 的电子邮件等 ,都 是大数据的组成部分。在不知道 的情况下被采集 的众多信息 ,例如被马路摄像头获取的视频、手机定位系统留下 的路线图、驾车的导航信号等被动信息,也都 是大数据的组成部分 。还有 ,各种传感器设备自动采集的有关温度 、湿度 、速度等万物信息 ,仍然是大数据的组成部分 。总之,每个人 、每种通信和控制类设备 ,无论它 是软件还是硬件,其实都 是大数据之源 。

  大数据利用了一种名叫“大数据挖掘”的技术 ,采用诸如神经网络 、遗传算法 、决策树、粗糙集、覆盖正例排斥反例、统计分析、模糊集等方法挖掘信息。大数据挖掘的过程,可以分为数据收集、数据集成、数据规约、数据清理 、数据变换 、挖掘分析、模式评估、知识表示等八大步骤 。

  不过,这些听起来高大上 的大数据产业,几乎等同于垃圾处理和废品回收 。

  这并不是在开玩笑 。废品收购和垃圾收集,可算作“数据收集” ;将废品和垃圾送往集中处理场所,可算作“数据集成” ;将废品和垃圾初步分类 ,可算作“数据规约” ;将废品和垃圾适当清洁和整理,可算作“数据清理” ;将破沙发拆成木、铁 、布等原料 ,可算作“数据变换” ;认真分析如何将这些原料卖个好价钱 ,可算作“数据分析”;不断总结经验,选择并固定上下游卖家和买家 ,可算作“模式评估”;最后 ,把这些技巧整理成口诀 ,可算作“知识表示”。

  再看原料结构 。大数据具有异构特性,就像垃圾一样千奇百怪 。如果非要在垃圾和大数据之间找出本质差别 的话 ,那就在于垃圾 是有实体的,再利用 的次数有限 ;而大数据 是虚拟 的 ,可以反复处理 ,反复利用。例如,大数据专家能将数据(废品)中挖掘出 的旅客出行规律交给航空公司 ,将某群体的消费习惯卖给百货商店等。总之,大数据专家完全可以“一菜多吃” ,反复利用 ,而且时间越久 ,价值越大。换句话说 ,大数据 是很值钱 的“垃圾”。

  3.大数据挖掘永远没有尽头

  大数据挖掘,虽然能从正面创造价值,但是也有其负面影响 ,即存在泄露隐私的风险。隐私是如何被泄露的呢 ?这其实很简单,我们先来分解一下“人肉搜索” 是如何侵犯隐私的吧 !

  一大群网友 ,出于某种目 的,利用自己的一切资源渠道 ,尽可能多地收集当事人或物的所有信息;然后,将这些信息按照自己 的目的提炼成新信息,反馈到网上与别人分享 。这就完成了第一次“人肉迭代” 。

  接着 ,大家又在第一次人肉迭代的基础上 ,互相取经 ,再接再厉 ,交叉重复进行信息 的收集、加工、整理等工作 ,于是 ,便诞生了第二次“人肉迭代”。如此循环往复,经过多次不懈迭代后 ,当事人或物的画像就跃然纸上了。如果构成“满意画像”的素材确实已经证实 ,至少主体 是事实,“人肉搜索”就成功了。

  几乎可以断定 ,只要参与“人肉搜索”的网友足够多 ,时间足够长,大家 的毅力足够强,那么任何人都可能无处遁形。

  其实,所谓的大数据挖掘,在某种意义上说 ,就是由机器自动完成 的特殊“人肉搜索”而已。只不过,这种搜索的目 的,不再限于抹黑或颂扬某人,而 是有更加广泛的目的,例如,为商品销售者寻找最佳买家、为某类数据寻找规律 、为某些事物之间寻找关联等。总之 ,只要目 的明确,那么 ,大数据挖掘就会有用武之地。

  如果将“人肉搜索”与大数据挖掘相比,网友被电脑所替代 ;网友们收集的信息 ,被数据库中 的海量异构数据所替代 ;网友寻找各种人物关联 的技巧,被相应 的智能算法替代;网友们相互借鉴 、彼此启发 的做法,被各种同步运算所替代 。

  各次迭代过程仍然照例进行,只不过机器的迭代次数更多,速度更快,每次迭代其实就是机器 的一次“学习”过程 。网友们 的最终“满意画像”,被暂时 的挖掘结果所替代。之所以说是暂时,那是因为对大数据挖掘来说 ,永远没有尽头,结果会越来越精准 ,智慧程度会越来越高 ,用户只需根据自己 的标准 ,随时选择满意 的结果就行了。

  当然,除了相似性外,“人肉搜索”与“大数据挖掘”肯定也有许多重大 的区别 。例如,机器不会累 ,它们收集 的数据会更多 、更快,数据的渠道来源会更广泛。总之 ,网友的“人肉搜索” ,最终将输给机器 的“大数据挖掘”。

  4.隐私保护与数据挖掘“危”“机”并存

  必须承认 ,就当前的现实情况来说,大数据隐私挖掘 的“杀伤力”,已经远远超过了大数据隐私保护 的能力;换句话说,在大数据挖掘面前 ,当前人类有点不知所措。这确实 是一种意外。自互联网诞生以后 ,在过去几十年 ,人们都不遗余力地将碎片信息永远留在网上 。其中 的每个碎片虽然都完全无害 ,可谁也不曾意识到 ,至少没有刻意去关注,当众多无害碎片融合起来 ,竟然后患无穷!

  不过,大家也没必要过于担心。在人类历史上,类似的被动局面已经出现过不止一次了。从以往 的经验来看 ,隐私保护与数据挖掘之间总是像“走马灯”一样轮换的——人类通过对隐私的“挖掘”,获得空前好处,产生了更多需要保护的“隐私”,于是,不得不再回过头来,认真研究如何保护这些隐私。当隐私积累得越来越多时,“挖掘”它们就会变得越来越有利可图 ,于 是 ,新一轮的“挖掘”又开始了 。历史地来看,人类在自身隐私保护方面,整体处于优势地位 ,在网络大数据挖掘之前,“隐私泄露”并不是一个突出 的问题 。

  但是 ,现在人类需要面对一个棘手的问题——对过去遗留在网上 的海量碎片信息,如何进行隐私保护呢?单靠技术,显然不行,甚至还会越“保护”,就越“泄露隐私”。

  因此,必须多管齐下。例如从法律上,禁止以“人肉搜索”为目 的的大数据挖掘行为 ;从管理角度 ,发现恶意的大数据搜索行为 ,对其进行必要 的监督和管控。另外,在必要的时候 ,还需要重塑“隐私”概念 ,毕竟“隐私”本身就 是一个与时间 、地点、民族、文化等有关的约定俗成的概念 。

  对于个人的网络行为而言,在大数据时代 ,应该如何保护隐私呢 ?或者说,至少不要把过多包含个人隐私 的碎片信息遗留在网上呢 ?答案只有两个字:匿名 !只要做好匿名工作,就能在一定程度上,保护好隐私了 。也就 是说 ,在大数据技术出现之前,隐私就是把“私”藏起来 ,个人身份可公开 ,而大数据时代,隐私保护则 是把“私”公开(实际上 是没法不公开) ,而把个人身份隐藏起来 ,即匿名。

  《光明日报》( 2023年01月12日 16版)

每日彩票客户端

师恩难忘******

  刘末利

  1960年 ,对于当下,已是十分遥远。对于我 ,那时从学校毕业,加入中新社大家庭的情景 ,还 是如此清晰在目 。那时 的我,即使与同时进中新社的同学相比,也显得非常稚嫩 。我的第一个工作岗位 是在专稿部通讯组。资深同事们对我关爱有加 ,社领导 、部门领导对我的点滴表现 ,都给予鼓励、赞许。

  记得1961年的春天,我奉命出差 ,地点 是天津市区 。组内资深记者张益常陪我同行,她侧重采访天津郊区 。这样的安排体现了良苦用心。当时兼部主任的副社长王纪元说过:“要是刘末利一个人出门 ,还分不清东南西北呢 。”

  几十年来 ,这个“评语”一直牢记在心。1963年初,我奉调至上海记者站。第二年的春天,浙江省侨务工作会议在杭州召开。总社指定我前往采访是次会议 。第一次采访大型会议 ,我毫无把握。到了杭州 ,得知张帆社长也将应邀赴会 ,更使我忐忑不安,心想千万不能在社领导面前“出洋相” 。张帆社长抵达杭州后 ,抽空了解了我的采访计划 。他当即给我出题目,约请与会 的杭州、宁波、温州等市侨务部门负责人座谈,他也参加。社长手把手 的指导 ,真 是十分难得 的学习机会。一切安排妥当,座谈就在晚上 。趁那天下午休会,常驻杭州的摄影记者沈鸣陪张帆社长游虎跑 ,我也随行。我们在虎跑山上喝茶、聊天 。后又驱车前往梅家坞,品尝龙井新茶 。我倒是先把握了这个“机会”,享受龙井 的美妙,一杯接一杯 ,忘乎所以。返程途中,自我感觉不妙——晕车了 。回到宾馆,免去晚饭还不行 。待到座谈会即将开始 ,与会者陆续到达。我却因胃里“翻江倒海” ,忍不住奔进卫生间一阵呕吐。多少年来 ,无论我怎样努力 ,也想不起那次座谈的主题以及写稿过程 ,永远记得的是张帆社长曾经说过 :“你这种身体 ,怎么当记者呀!”

  这个“洋相”出得够可以 的了。晕车固然是因为“内耳前庭平衡感受器受运动刺激而影响神经中枢的症状” ,算不上疾病 ,但对一个记者确实很麻烦。“杭州事件”使我明白必须与那个平衡感受器“对着干”。后来 ,我因采访而海 、陆 、空都“晕”过了。印象最深的是上世纪80年代前期,上海决定恢复经过台湾海峡的上海至福州航班,我参加首航采访。事先我一心要在船上“现场采访” 。没料到船刚出吴淞口 ,我就晕得躺倒了 。眼看完成任务有难 ,幸好一位同行大力支持。他根据我 的要求在旅客中物色采访对象 ,再陪着我前去。我就在“采访—躺下—再采访—再躺下” 的节奏中完成“首航” 。

  岁月流逝 。时至上世纪70年代末,终于盼来中新社恢复建制 。我从上海某出版社回归中新社。1979年初 ,上海分社“开张” ,包括分社负责人 ,人员只有七八个,我包揽了上海全部 的经济报道工作 。那时国家进入“以经济建设为中心”的新时期。上海曾经是远东经济发达 的大城市,又 是全国工业基地;在执行国家经济体制改革 、对外开放的方针中 ,自有许多符合经济规律的创新之举 。何况还有引进30万吨乙烯工程的上海石油化工总厂 、以进口矿砂为原料 的宝山钢铁总厂正在加紧建设 。在这样 的背景下,上海分社 的经济报道应该做得有声有色,实际上却 是将近3年没有达到总社的要求。上海分社“经济报道没做好” ,使我承受巨大压力 。我感到迷惘 ,无所适从。某年 ,总编室主任徐曰琮来上海分社 。我不知道他此行 的“任务”。但 是他私下对我说,上海分社经济报道没有做好 ,责任不在于我 ,我已经尽职了。此话使我得到极大宽慰 。1982年春 ,当时 的副社长王士谷率总社新闻部 、专稿部及广东 、福建等分社的各路精英云集上海,召开经济报道工作会议。会议下达了总社对经济报道 的方针和思路 ,交流了经济采编 的经验 。会下有关部门领导对我更有针对性地点拨和指导,特别鼓励我要敢于采访重大题材 。于我,真是醍醐灌顶 !总社领导在多年没有做好经济报道的上海分社召开经济工作会议 ,目的明确,效果显见。我走出了“中新社 是新华社 的补充”、“上海分社以报道侨务 、文艺 、体育等‘三宝’为主”等中新社初创时期办社和报道思想 的局限,在报道思想和业务能力上都进入了一个新阶段 。

  也 是在1982年 ,总社召开专稿工作会议 ,明确了“面向中间,反映现实” 的专稿工作新方针 。这 是针对国内外形势的变化,针对海外读者迫切希望了解中国新时期政治、经济新动向而拟定 的。其时香港《明报》、《快报》等常见署名“宗涓” 的专电,评述中国时政。文笔挥洒自如,读得我如痴如醉 ,不胜钦羡。我本专稿部出身,于是学样“跟进” 。专稿部负责人时来电话 ,给我鼓励 。1984年底 ,我赴总社参加工作会议期间,还当面请教,受益匪浅 ,为我此后坚持专稿写作打下基础 。上述时期,除了总社和相关部门领导之外 ,我的多位老同事,也给我莫大支持和鼓励,他们 是我 的益友 ,更 是良师 。我永远感谢他们 。挂一漏万 ,在此不一一列举姓名了 。

  1984年底 ,各地方分社换班 。总社委任我为上海分社采编主任 。我毫无思想准备,心中茫然。刚卸任 的上海分社社长姚凡对我关心又支持。他“面授机宜”道:不要脱离采编第一线。一来采编业务是我 的“强项”;二来只有身在“第一线”才能指挥和组织分社 的采编活动。后来 ,我一直按照他提示 的原则去做 。虽然辛苦 ,于我个人、于分社都足见成果 ,毋庸多言 。

  在中新社40年一路跋涉之中,得到多位领导 、资深同事们的培养、帮助 ,十分难得;唯有满怀感激,永远念叨:“师恩难忘” !

  (历史资料)

中国网客户端

国家重点新闻网站,9语种权威发布

每日彩票地图