浙江企业新闻网  欢迎您! 设为首页

于我而言,“水井坊”不单单指那

成都观行丨水井坊(一)香格里拉

时装周是流行的风向标,引领着穿

下一季流行穿什么?看完这次纽约

《三国志9》和《三国志11》是

TGS:我们玩了《三国志14》

大北妞我作为时尚小姐妹没事儿走

北京穿衣鄙视链:三里屯竟然不是

大数据行业遭遇“生死劫”?

2019-09-20 14:03:00 来源: 阅读:1

大数据行业遭遇“生死劫”?

最近,大数据的生意危机四伏,负面消息既在报纸的社会版块,又频频出现在商业版块。

先来看看“社会版块”:

9月12日,网名叫“ooooviki”的女孩爆料,一名自称是网警的男子,利用职务之便找到了她,还搜集了很多她的个人隐私,比如身份证号码、家庭地址、电话号码等。这名男子展示了疑似她户籍信息的截图,被拒绝后,还对女孩进行“人身攻击”。

大数据行业遭遇“生死劫”?

9月12日,网名“ooooviki”爆料称一名“网警”人肉其信息并要求与之交往

两天后,这被证明是一起“乌龙事件”。

调查此事的郑州市公安局在9月14日发布通报称,女孩所遭遇的是一次恶作剧。事件起因于女孩的男友,他下单购买了测试恋爱忠诚度的服务,想要试探女友,并将她的个人信息提供给了服务方。而服务方假扮成网警接近女孩,最后演变至此。

据通报,这起乌龙事件中的3人,都因涉嫌寻衅滋事接受了处罚。

虽说是虚惊一场,但在这场误会中,“情感分析”的生意浮出了水面。有媒体发现,事件发生过后,基于大数据分析系统的情感分析服务仍然在某些平台上售卖。

大数据行业遭遇“生死劫”?

某平台上基于大数据分析系统的情感分析服务

它并不复杂,类似“婚前体检”,判断双方的身体状况是不是合适结婚。市面上也提供一种服务,可以搜索、汇集一个人的“网络大数据”,例如这个人在网上的所有发言记录,其公开账号和私密小号等等,据此判断这个人的人品、过往情感等等。

不过,这项工作有一定的技术门槛:得能写“爬虫”。

所谓的网络爬虫,是指平台按照一定规则,自动从互联网上提取网络信息的程序或脚本。有了它,短短数秒之内,就能够有针对性地、将一个人的上网痕迹储存下来。在这之后,针对储存的信息进行分类和分析,效率比起个人的搜索要高得多。

“爬虫”的能力不可小觑。一般情况下,“爬虫”在单个网站搜集到的信息,往往是不完整的,但它能够在多个网站中相互拼接、比对,最终得出完整的个人信息。

大数据行业遭遇“生死劫”?

网络爬虫原理示意图(图源网络)

用一个例子说明:比如在某个外卖软件中,它隐藏了客户电话号码的中间四位数。在另一个约车软件中,则隐藏了后四位数。它们都做到了保障客户隐私,然而,“爬虫”只要爬取了两边的网站,就能够得出完整的电话号码。这叫“拼接”。

再比如:在某个招聘网站,“爬虫”先进入应聘方的端口,爬取所有的公示信息。再进入招聘方的端口,重复操作一次。两相“比对”,完整的简历信息就被窃取走了。

在这个时代,网民的电话、住址、照片、工作经历等等,几乎都存储在各式各样的软件数据库中,只要其中的一两项信息泄露,那么整个信息都被窃取,在理论上是成立的。

更何况,网民常常将个人信息拱手让出而不自知,比如前不久上线的软件“zao”。又或者,身边亲友出于自己的目的,故意提供被爬取信息之人的隐私,比如上述的在郑州的乌龙事件。

提供技术服务的人,在获取了海量信息之后,建模分析形成“用户画像”,或者直接提供给客户,让其分析判断。这就是所谓的“大数据情感分析”。可怕的是,被扒光了隐私的人,对此却毫不知情。


推荐阅读:叶紫网