《大数据战争》经典读后感有感
《大数据战争》是一本由何渊著作,北京大学出版社出版的平装图书,本书定价:39,页数:230,特精心从网络上整理的一些读者的读后感,希望对大家能有帮助。
《大数据战争》精选点评:
●数据堂、社工库、脱库、洗库、撞库、脱敏、徐玉玉案、被遗忘权、技术中立、opt-out转为opt-in、淘宝的生意参谋、微博诉脉脉不正当竞争、协同过滤算法、大众点评诉百度不正当竞争、三重授权原则、腾讯诉抖音多闪、robots协议、hiQ诉领英、Cambridge Analytica资助Aleksandr Kogan通过Open API从Facebook获取数据用于川普竞选and用于帮助脱欧组织、cloud法案、Amicus Curiae Briefs、欧盟GDPR、reasonable privacy expectation原则、警察用热成像判断车库种大麻是违宪的(4th Amendament)。
●在挖财最后阶段的工作基本都是在支持用户数据与隐私权的相关需求,也是在当时了解到了这本书,赶上新工作通勤时间翻倍,第一周就读完了……整体来看书中不仅案例详实,且对比中外法律展开分析,说理逻辑清晰。另,互联网和技术部分没有明显的常识性错误。
●有几篇文章写的不错,能从本质去分析问题。难得既有干货又不枯燥
●乱炖
●赶上了数据保护执法风暴的热点,以案说法的方式很适合科普,尤其喜欢有几位作者把别国案例拿到中国法律环境下分析的部分。
●本书本书选取大数据引发不正当竞争案(新浪微博诉脉脉案)、遗忘权案(任甲玉诉百度案)、大众点评网诉百度案、“头腾案”、Facebook“数据门”事件,以及美国CLOUD法案、欧盟GDPR应用等典型案例与事件过对著名司法案件的分析、溯源立法本意,法律边界的演变,谈论数据隐私、数据竞争、数据合规和数据共享。 以案件的形式来描写,读起来很顺畅,体验很好,很值得一读。 不过感慨一下安全是小众,同类型书籍《批评官员的尺度》同样描述一个个案件是如何探索,定义和捍卫言论自由的边界,那些伟大法官的判文则经常看的让等热血沸腾。也顺便推荐一下。
●第二篇几章讲企业间数据竞争的还行
●我读完了~引用了很多国内的案例,尤其是一审和二审法院对同一个案件的不同认定,之间的区别以及思考还是很有价值的,目前国内这类书还是比较少,希望自己尽快研究明白。
●对于吃瓜群众(我)来说,是本高效扫盲书,有趣有深度。比如“被遗忘权”。
●主要是以介绍中外案例的形式介绍大数据合规中的问题,属于一些专业人士的文集。但是实际的解决思路和对问题的深入探究并不多。
《大数据战争》读后感(一):随书小记
1、一直期待的这本书应该是详细地讲述运行的机制、过程、原理等,而不是一直在口头上说他很重要他很重要像极了《大数据时代》。 2、希望读一些详细的,把大公司运用大数据进行商战的事情的来龙去脉,书中虽有涉猎,但是总感觉笔墨不够。 3、全力和义务是对等的,鱼和熊掌不可兼得,自己想要获得一些便利,就一定要让渡一些权利,问题就在于让渡多少,让渡那些,如何让渡。 4、此书对于非法律人士的作用估计比纯法律人士更大。 5、中国人更愿意出卖一些自己的隐私来获取更好的体验。 6、在某种程度上,作者似乎在为企业站台,与常规看法不同,把个人对企业的要求降低。 7、注意到在对大数据产品的判决中,中国的法院都考虑了国家现在的政策,但这样的话不就造成了一定程度上的不正当竞争了么?同一法律在不同行业的适用不同?(不过也有可能本书里面的行业都是大数据板块)
8、法院的判决书是个好东西,可以好好看看,外国的英文的更好,还可以学学法律文本的翻译。
9、结果导向性的推理个人觉得还是很不错的!
10、我爬你的数据还需要你同意?那你为啥不直接给我?难不成是在看我的技术能不能爬到?
11、仔细看才发现这是一本评论性质的文章拼凑起来的,不是一本传统意义上的书!
12、法律玩文字游戏也是一个不争的事实,律师挑起问题而工程师解决问题的这种说法也有一定程度的合理性!
13、作者也是要吃饭的,从后面的几篇来看,数据,特别是大数据并未展现出太多的作用,更多的是在讨论隐私的内容,起名《大数据战争》在某种程度上也是引导性命名把!
14、书的封面上说的“大数据杀熟”案例在哪里?
《大数据战争》读后感(二):《大数据战争》
“除了企业需要关注数据合规以外,作为每一个公民更要提高个人信息保护的意识。或许我们已经习惯了接受个性化广告,享受定制化服务的便利,但我是否意识到这些 “个性化” 和 “定制化” 的服务都基于对我们个人信息的挖掘和分析?如果 “个性化” 和 “定制化” 成为常态而且不被我们所知,我们不禁要怀疑,我们所见的世界是真实的世界,还是上架想让我们看到的世界。” ----- 摘自原文。
借用书封面的一句话 “本文作者何渊教授团队是业内屈指可数的既对法律法规有深刻理论造诣,又对产业发展有实战经验的理论与实践完美结合的团队” 。本书一共分为三篇十二章,除了两篇理论介绍外,其他章节都是围绕实际案例,结合实际从法学角度解释其中的规律。深入浅出,对于普通人起到了很好的科普作用,看完之后会有一种豁然开朗的感觉。
因为本人的工作会接触到一些数据分析相关的内容,也稍微接触到一些程序方面的知识,所以对大数据的重要性以及皮毛知识有一些大致的轮廓。对于法学方面,那就是十足的法盲。看完本书,总体感觉有四个方面的收获:
一、大数据时代带来的隐私泄露以及安全隐患
所谓大数据,即 “系互联网技术高速发展的产物,表现为通过网络技术无差异的地收集网络用户上网信息,根据需要对数据进行整理、挖掘和分析,形成一定的数据库,用以投放广告或者其他用 (摘自原文 北京海淀区人民法院在判决中的定义)” 。
我们可以联想一下,下载抖音之后,我们的联系人都会出现在推荐里面;在房产中介或者展会中留下联系方式,后面会接到源源不断的推销或者装修买房营销电话;又或者我们百度了下减肥方法,下次逛淘宝的时候肯定会出现减肥产品的推荐。这就是典型的我们的信息被整理、挖掘和分析了,我们的信息被存储在了别人的数据库里面,并且被比人针对性的投放广告。这又两说,如果商家投放的正式我们所需要的,那就是上文中提到的 “个性化” “定制化” 服务, 如果是我们不需要的那形成了骚扰。加上数据还可能被二次收集分析,所以我们可能因为一个信息的泄露被反复骚扰。结合我个人的实际感觉,被骚然的感觉占到了98% 以上。
正如白岩松说的那样,我们沉迷于网络是正常的,因为那么多公司花那么多时间和金钱用来研究你的喜好,专门推荐给你喜欢的东西(参考字节跳动旗下)。这些也许是在未被征得同意的前提下就收集我们的个人信息,推送符合兴趣的内容甚至的定向投放广告也无伤大雅,但是我们得联想下,当下网络诈骗的成功率居高不下的原因,正式句句都在心坎上。本文中还列举了例如联通这样的专门负责数据维护的公司内部员工渎职倒卖客服信息的案例,不得不引人深思。
二、法律法规的详细解释扫盲
本文采用了非常多的实际案例,从个人隐私案件到企业的关于数据控制权的争夺再到美国欧盟数据争端案例,从法律角度深入分析了每个案例的前因后果,并且部分案例着重突出了一审、二审判决结果不同的依据,都在不断刷新我对这部分的认知。
中国相较与美国而言,互联网发展要之后几十年,本文先从从个人角度出发,2013 “朱烨诉百度隐私案” 引发的中国cookie 第一案开始,引起大家的注意,时代发展到今天,普通中国大众已经非常关注互联网引发的种种数据安全了,然后展开到 “冈萨雷斯被遗忘权案” ,欧洲早已有先例。再到大数据时代下,企业的责任,案例有东航,趣拿案;再深入到企业因为大数据的控制权引发的不正当竞争案,有脉脉私自收集案、头腾案、大众点评以Linkedin 案、Facebook 案。最后过度到国际跨国数据纠纷,各国法律对相关的定义和判决,案例有微软诉美国司法部案 引申到 美国的CLOUD 法案、欧盟GDPR 相关规定 以及 美国法律中“合理隐私期待”,从先行者的实际案例和出发点来给我们一些参考。中国的路还很长。
三、大数据时代下新的商业模式和数据引发的不正当竞争
阿里巴巴自称是一家数据公司,并非是卖货的。当今的商业模式发展由此可见一斑,谁掌握了数据谁就有相当的决定权。公司肯定都会蜂拥而上,那么对于我们普通人而言,数据安全的风险又加大了。对于公司来说,一方面是利用好数据寻求更好的发展,一方面是在需要承担适度的法律责任,本文中都有详细案例解读。
天下熙熙皆为利来,天下攘攘皆为利往,既然有利可图,那么所有的公司都会按部就班的复制这一模式,更有甚者,直接私自收集二次加工别的公司花费大力气整理收集的信息为己用,例如本文中脉脉收集新浪微博客户信息。这就直接引发了不正当竞争这一话题,谁都不想辛辛苦苦的劳动最后为了他人做了嫁衣裳。本文中也列举了案例详细说明,理清楚了其中的逻辑关系,比较值得我们思考借鉴
四、美国法律的新认知
本文还有一个引发我兴趣的就是美国司法的公平公正。这可能不是书中想要表达的中心思想,不过在看本书最后部分的美国法律中“合理隐私期待”,作者列举了美国大法官对于美国宪法的解释,及时对象是罪罚,也并不会偏颇,在FBI 的压力下,力排众议,就事论事给出判决。由此可见在司法层面美国高喊的 “自由民主平等”并非口号而已,本人感觉近些年来的三权已经有些偏了,即使这样,也不能掩盖它司法本来的精神。也许是本人法学方面孤陋寡闻,只是浅谈一些见解。
《大数据战争》读后感(三):数据战争序幕才开精彩在后
这几年持续关注大数据背景下业务数据安全与合规的相关主题,对欧盟gdpr,美国加州cpa,以及中国《网络安全法》和立法规划中的《个人数据保护法》的研究,以及iso27701,gb/t35273等国际国内数据安全标准化的实践,关注到个人数据保护的任重道远。 《大数据战争》从司法判例的角度解读背后立法的理念,对相关方的权利,义务,以及权益保障,引起矛盾冲突事时引申的基本道德和公共秩序的源头,甚至不同观点的不同交锋,在不同文化背景,不同认知阶段的反复和争论,精彩纷呈。人类的进步源于社会共同认知的进步,源于思辨以及实践,很多判例对未来经济,社会关系,结构稳定性和人类的发展需要时间去判断,而总结,思考和反思是人类进步的源泉。 这本书虽然是不同作者文章的汇编,在开始还有些担心逻辑的一致性和知识体系的结构化,幸好,何渊教授巧妙的用利益冲突方的分类,以及权益之争把文章组合在一起,浑然一体,并未带来重复或者缺失的影响。
首先,从数据黑产谈起,数据作为数据时代的石油,搭上大数据云计算等新技术的发动机,带来的价值毋庸置疑,但像石化燃料带来污染一样,数据燃料对人的隐私权的侵犯,带来了同样需要治理的副作用,而数据源的合法性和数据交易的脱敏,就是基本的红线要求,数据堂从独角兽坠落神探坛,不得不说是缺少了基本底线的理念,当然黑白之间的灰色地带游走,风险同样不能忽视,因为时间原因未纳入本书的征信领域的明星企业同盾的坠落同样值得反思。
cookie作为浏览器访问应用非账号的识别利器,初衷是通过记录相关访问行为识别用户提供更好服务,不过这是最早的ubea的基础,可以通过记录行为的分析,实现对用户兴趣爱好的跟踪,为用户画像,精准营销提供服务,对于是否侵犯用户隐私,经历了一个判例反复的过程,朱桦诉百度案一审保护了个人利益,二审保护了百度的商业利益。2013年的案件在2018年重审的话,想必会是另一个结果,gdpr出台后的共识说明cookie已经无可争议的列入个人隐私范畴,相关的搜集必须得到用户的认可和授权。
被遗忘权是个容易被忽略的权利,隐私权和个人数据的权利,一般被认做人格权,而互联网的行为记录如果难以被修正确实存在永久性污点的问题,但也不能单纯的以用户所有记录都可以被遗忘,如果这种遗忘对第三方知情权的侵犯导致更大的利益损坏,确实会变成另一个冲突,任佳玉诉百度案很好的诠释了这个困境。
同时,在有些场景下,作为服务提供方因为技术的原因也难于在散播到自己控制范围外的记录配合用户要求的遗忘,考虑到场景,技术,现实,利益平衡,权利的落地仍需要探索。企业的责任边界,以及付出的代价和成本的效益分析,从产业保护角度也需要予以思辨和平衡,庞理鹏诉东航趣拿可以作为一个分析的样本。
第一部分是个人与企业之争,重点关注的是用户的数据和隐私的边界以及权利,在获取服务和业务过程中,权利的分类和保障,除了上述描述之外,其实还有知情,授权,访问,修改,获取,转移,获益,等相关权利的落实与冲突,对企业的责任仍有谨慎,最小化,安全,尽责,等责任需要遵守,希望第二版更加丰富翔实。
第二部分主要是企业之争,互联网经济在高速发展中,你中有我我中有你,业务服务的错综复杂,随着用户的选择而眼花缭乱,头晕目眩,从用户的角度出发,服务的连通性,便利性,一体化,是方便快捷,提高效率,降低成本的最佳实践。而流量大佬们手握大量流量,本能的出现吃相难看的模式模仿和抄袭,在3q大战中有所呈现,腾讯转而连纵合作的模式,通过生态体系合作实现流量变现,逐渐形成了寡头垄断的多家阵营,是目前的互联网圈的真实写照。
对于用户行为数据,或交易数据,或衍生数据所有权和财产权,目前上尚无定论,中国多根据《反不正当竞争法》的角度对互联网企业的对技术投入和运营努力形成的数据采取保护的模式,在大众点评诉百度地图中有所提现,从技术角度出发,因数据控制方安全策略,保护机制的缺陷导致的爬虫爬取,或公共信息未按照最小够用原则获取展示,对数据控制方业务造成影响的,也倾向于保护数据原创方,在微博案中体现,在今日头条诉腾讯案中,引出提供身份服务和数据属性引发的业务潜在竞争风险关系中,采取了一定程度上对努力创造业务逻辑关系带来的数据关系属性的保护。
相对于中国队对《不正当竞争法》的引用,美国在hiq诉linkin案中,更多的是考虑对《反垄断法》的引用,考虑业务创新,保护中小企业,甚至强制要求linkin开放相关数据。
这确实是值得注意的一个价值观的问题,保护努力劳动所得,还是保护消费者利益,从反垄断公平与创新的角度保护后发者,是一个值得思考的主题。另外一个因素,考虑用户的数据携带权,转移权,财产权,由用户产生的数据归属和权利主张如果在企业冲突中场景中如何定位与落实,同样需要思考。
第三部分,从国家安全和数据主权的角度讨论国家间的利益冲突,在司法实践中如何呼应政府调查的数据需求,首先是跨过企业面对的困境,在互联网业务全球化,和成本角度考虑突破资源区域局限性的过程中需要考虑合规法律和数据的相关要求,无论从属地管理,还是控制方管理都存在企业法律风险。微软诉美国司法部案对北爱尔兰数据的管辖权问题随着美国cloud法案出台落地,引发巨大的争议。对于美国长臂管辖权引发的立法竞赛和逻辑割裂,对全球技术创新应用和资源配置带来了巨大的变量,在中美贸易之争背景下,在中国未签署《布达佩斯网络犯罪公约》不属于司法援助适格国家范畴之下,美国企业在中国的业务运营面对巨大风险,而亚马逊,微软云服务的实践来看,割裂服务,销售模式,独立布局的中国授权运营商的规避,带来业务的逻辑隔离,为企业的服务和用户使用带来人为的障碍。
仅考虑司法协助带来的挑战就已经造成割裂,考虑到监听,行为、经济、人群种族特征,以及相关大数据应用带来的国家安全风险,则大数据的全球化模式蒙上一层阴霾。
大数据目前还仅从互联网模式带来的问题,在物联网,产业互联网,企业数字化背景下,科技对人类的影响日益加剧,物理的虚拟化数字化再造逐渐模糊物理网络的边界,带来的伦理,认知和变革尚未开始,数据战争刚缓缓拉开序幕,精彩还在后头。
非法律专业人士,看惯了技术角度的分析,从法律,案例角度来看,精彩纷呈,启发甚多,极力推荐。
《大数据战争》读后感(四):被大数据“杀熟”
大数据是这个时代必然要了解的话题,被它的黑金书封吸引,看到了一些皮毛之后开始恐慌,再多了解一些,就变得有意思了。
想要分享里面非常重要的一些想法。不得不说何渊老师写的非常有条例,从个人,企业,国家三者交互的角度,以及耐人寻味的数据黑产角度出发,阐述现代最新最重要的数据战役。
是否接受Cookie
现在打开很多国外的网站都会跳出来一个请求接受Cookie条例的提示。
“cookie技术主要是用于服务器与浏览器之间的信息交互,使用cookie技术可以支持服务器端在浏览器返回HTTP对象的同时会发一天状态信息保存到浏览器,这个状态信息被称为cookie信息,主要说明哪些范围的URL是有效的。”
简单的理解,指的是我们的网络信息痕迹会被记录。朱烨以侵犯隐私为由发起了中国cookie隐私第一案。不过实际情况下,cookie信息是不会对具体的个人进行识别的,而是存储成为一个模糊画像,cookie它不会知道这是张三还是李四的信息,而是认定是这个浏览器使用者的信息。但是匿名程度成为了一个可探讨的地方。因为如果信息收集的足够精密,是可以具体到个人的。
法院判决的时候认为,个人隐私和个人信息是有所不同的,从法律属性上看,个人信息是综合的权利,兼具了人格权利和财产权益,即可用来获利;隐私权主要包括维护私生活的安宁,个人信息权主要是对个人信息的支配和自主决定等等。cookie收集的是个人信息,所以在那个时候朱烨败诉,不过后来国家推出了《网络安全法》,从法律层面提供了个人信息保护的有力依据。
使用“被遗忘权”吗?
书中介绍的这个概念非常有意思,就是有人会在网上看到自己很早以前的黑历史,想要抹去,但是做的到吗?在2014年5月欧洲法院作出了裁决,作为“数据控制者”(搜索引擎供应商)负有删除“不充分的、无关的或不再相关的个人数据”的法定义务,否则将侵犯作为”数据主体“的公民的被遗忘权。但是在欧洲和美国,类似的案例有不同的法律判决,美国法院认为这还是属于美国宪法中所保护的商业言论自由。书中精辟的总结为,”欧盟更注重的是“人的尊严”,而美国更强调的是“人的自由”。
划好大数据产品的权益边界了吗
根据《网络安全法》,个人信息需要经过匿名化处理,而不仅仅只是去标识化(如采用假名等)。针对阿里巴巴的“特别授权”条款,阿里认为淘宝不仅不存在出售或变相售出个人信息的行为,反而利用平台收集到的信息为国家大数据的构建提供了便利,促进了零售行业的发展。
它的主要反击点就是未利用数据关联个人。
脉脉通过新浪的open API 收集数据怎么不正当竞争了
前情交代:脉脉通过openAPI 超权限收集到了新浪没有允许的用户信息(用户私密信息);涉案的用户信息是新浪微博用户主动提交的,微梦公司(新浪)合法收集的;脉脉和新浪的部分社交功能是重叠的,彼此存在竞争关系。
由于双方的技术日志无法完整提交,即无法判断到底是否是微梦的open API自身存在漏洞,还是脉脉确实是不正当的从这个API中获取了信息。过程很复杂,最后问题简化为了:淘友(脉脉)公司的行为是否违背了公认的商业道德?
然而什么是商业道德呢,一种思路是从”道德”出发,寻找特定行业现有的商业道德,或者根据行业现状总结出来;另一种是从“利益”出发,分析行为对经营者、消费者乃至全社会的影响。如果在整体上是促进或平衡各方利益的,则判定不违反商业道德。
最后不判定淘友公司违法。实际上,在判断某行为是否违背互联网领域工人的商业道德时,法院先假定行为不违反公认的商业道德的。
不过如果把问题更具体或者说负责一步,何渊老师写道,用户有没有权利不经平台同意而要求平台向第三方提供数据呢?法院提出了open API开发合作模式中的一般原则——第三方通过open API获取用户信息时应坚持“用户授权+平台授权+用户授权”的三重授权原则。
大众点评和百度干架了
用过百度地图的人都应该知道,我们可以在上面看到吃喝玩乐的信息,而且都是从大众点评上直接“搬运”过来的,这样通过网络爬虫获取数据是否违法了呢?二审法院认为,百度行为一方面丰富了消费者的选择,有积极的效果;但是汉涛公司(大众点评)对点评用户的信息获取付出了巨大的劳动,具有可获得法律保护的权利。在考量了信息获取者的财产收入,信息使用者自由竞争的权利以及公众自由获取信息的利益之后,确定了应遵循“最少,必要”的原则。
在此次判决中,汉涛获得了赔偿(被爬虫抓取方),但是类似的案例在美国又出现了不同的审判结果。可以说,中国法院较为注重对个体竞争者在平台数据积累中付出的辛勤劳动,而美国更为重视信息自由流通对不同市场中繁荣竞争的重要性(爬虫抓取方-hiQ)。
“有待我们思考的是,如何在数据保护和数据利用中、流通之间更好地寻求平衡,在充分发挥数据价值的同时,维护、保障数据安全。”(P158)
“人们所关心的不只是数据安全,更是安全感”
从事前角度观察,Facebook缺乏数据共享的风险管理。Facebook至少应开展“个人信息安全影响评估”
我想起来早些时候在一家互联网大厂面试,讲到了平台自身可能无法控制的问题,比如假货问题。作为一个平台,为商户提供了服务,为消费者提供了便利,但是在根本上是没有办法管理商户。书中对于平台的性质以及管理有一段非常好的描述,可以从书上详细看,简单的一小段如下:
“平台设立之初,规则层发挥着决定性作用,而平台一旦步入正轨,就展现出鲜明的自组织性,规则层必须和应用/服务层、数据层之间相互反馈,同步调适。在Facebook的数据层和应用/服务层开放之后,规则层就本鞥再由Facebook单方垄断,否则引发平台功能失调,而这正式Facebook数据失控的根源。”
之后针对用户定向的广告,作者给出了一个回答,“普通免费和个别付费”。如扎克伯里再回应库克时所言,如果你想简历要给服务来帮助连结世界上的每个人,那么由很多人会无力付费,这就是为什么基于广告的商业模式是唯一“理性”的原因。但是并非所有人都无力支付服务费用。
确实,有闲钱的人,或者有需求的人可以去买这样的服务,钱解决一切。但是这带来的问题,好像又会让人有一些不舒服。
你合理期待的隐私是什么
这是最后一个部分,也是我看得最津津有味的一个部分,但也是最矛盾的部分,通过窃听的手段去捕获证据将犯人绳之以法,它的道德性和正义性在哪里呢?这或许有了一个相似的认知,即不应该。但是如果用红外线在嫌疑人的屋子外围去照,然后发现了种大麻的证据呢?
哈伦大法官给出的答案是,不可以。
“《宪法》第四修正案保护的是人,而不是某个领域。我对先前判断所产生的规则的理解是,有两个层面的要求:第一,一个人表现出对隐私的实际(主观)期待;第二,这种期待是社会已经承认为“合理的”。
这个想法提的好出乎意料。我从来没有想过还会有这样的可能性存在。这不就意味着在具体的隐私范围和想象中的隐私范围进行一个对比,并想象中的隐私成为了真正的”隐私”。观念重塑了语言和规则。
......
这本书很有意思,是在图书馆的新书展上看见的。而且作为一本更加侧重于从法律角度上解读大数据对人们的生活的具体影响,有很大的启发。很多直接引述了原文的内容,总之,安利!
甚至想念法了。