元数据(metadata)在我们的周围无时不在,无处不在。当代社会中随处可见的电子设备,不是依靠元数据来运行,就是用于产生元数据,或者两者皆有。但当元数据真正发挥作用的时候,它却隐于幕后、默默无闻,就像根本不存在一样。一定程度上来说,这也让元数据在2013 年夏天突然成了一个广受关注且具有争议性的话题。
2013 年5 月,美国国家安全局前外聘员工爱德华斯诺登(Edward Snowden)飞往中国香港与英国《卫报》记者会面,向其披露了大量有关美国国家安全局在本土进行监听活动的机密文件。这些监听项目之一棱镜(PRISM),涉及直接向电信公司搜集电话呼叫的数据。不用说,《卫报》对此事的报道成为轰动一时的大新闻。
美国媒体对斯诺登泄密事件反应不一,随着事态的发展,这些反应的变化耐人寻味。对于美国国家安全局暗中搜集美国公民数据的行为,公众当时最直接的反应就是群情激愤。然而随着事件日趋明朗,让人们如释重负的是,美国国家安全局搜集的仅仅是与电话呼叫有关的元数据,而不是电话呼叫本身的内容。换句话说,美国国家安全局没有进行窃听活动。这很快缓和了公众的怒火。事态随后急转直下,媒体通过调查才发现,凭借区区元数据居然能推断出如此多的个人信息。在此之后,对这一事件的权威解读才终于公之于众。
MetaPhone项目是斯坦福大学法学院互联网与社会研究中心(Stanford Law School Center for Internet and Society)的研究人员于2013 年年底进行的一项研究,旨在重现美国国家安全局搜集电话呼叫元数据采取的方法。他们发现,用区区元数据居然能推断出如此令人难以置信的信息量。MetaPhone的研究人员在报告中提到了这样一个案例:一位研究对象分别打电话联系了家庭装修用品店、锁匠、水培植物经销商还有烟草大麻用具店。也许,打这些电话是出于非常单纯、合理的原因,也许它们之间完全没有关系但是这可能并不是我们大多数人会得出的结论。
许多元数据都与电话呼叫有关,尤其是手机呼叫。而在与电话呼叫有关的元数据片段中,最显而易见的就是拨打与接听双方的电话号码,其次就是电话呼叫的时间与通话时长。如果使用具备GPS(全球定位系统)功能的智能手机拨打电话,还可搜集到拨打与接听双方的地理位置信息,至少可以精确到通话双方手机所在地区手机信号塔的信号范围。与手机呼叫关联的元数据还有很多,但是如此少量的信息也足以让倡导保护隐私的人士再三思忖。因为即使你没有在打电话,你的手机也会与本地手机信号塔之间交换数据。这样一来,移动运营商就能随时搜集你的位置信息以及一段时间内的活动轨迹根据斯诺登披露的机密文件显示,移动运营商实际也在这样做。当然,前提是你一直带着自己的手机。
元数据这个词就这样成了一个公众话题。鉴于元数据如此广泛地存在,人们理应更好地去了解它,而公众也早应该进行这样的讨论。在当代世界中,计算活动无处不在,因此元数据像电网和高速公路网一样成了一种基础设施。这些当代基础设施的构成部分一方面发挥着不可或缺的作用,另一方面它们展现在我们面前的又只是冰山一角。比如,当你触动照明开关时,你就变成了大量技术与策略的最终用户。
分开来看,这些技术或策略也许微不足道、无关紧要,但是聚合在一起,就能带来深远的文化与经济影响。元数据亦是如此。就像电网和高速公路网一样,元数据不知不觉地融入日常生活的背景之中,理所当然地成为当代社会得以稳步前进的动力之一。
作为生活在现代世界的公民,我们熟悉电网、高速公路网以及其他现代的基础设施,也对其有着合理(尽管可能并不完整)的了解。但是除非你是一位信息技术科学家,或者是为美国国家安全局工作的情报分析师,否则可能无法对元数据形成这样的认识。
这就是我写作本书的目的向你介绍元数据,以及元数据涉及的诸多主题与问题。我将探讨什么是元数据及其存在的原因、适用于不同用户与用例的各类元数据以及使现代元数据
成为可能的一些技术,还会预测元数据的未来路在何方。读完本书,你无论身在何处都会看到元数据。
这是一个元数据的世界,而你就身处其中。
元数据(metadata)在我们的周围无时不在,无处不在。当代社会中随处可见的电子设备,不是依靠元数据来运行,就是用于产生元数据,或者两者皆有。但当元数据真正发挥作用的时候,它却隐于幕后、默默无闻,就像根本不存在一样。一定程度上来说,这也让元数据在2013 年夏天突然成了一个广受关注且具有争议性的话题。
2013 年5 月,美国国家安全局前外聘员工爱德华斯诺登(Edward Snowden)飞往中国香港与英国《卫报》记者会面,向其披露了大量有关美国国家安全局在本土进行监听活动的机密文件。这些监听项目之一棱镜(PRISM),涉及直接向电信公司搜集电话呼叫的数据。不用说,《卫报》对此事的报道成为轰动一时的大新闻。
美国媒体对斯诺登泄密事件反应不一,随着事态的发展,这些反应的变化耐人寻味。对于美国国家安全局暗中搜集美国公民数据的行为,公众当时最直接的反应就是群情激愤。然而随着事件日趋明朗,让人们如释重负的是,美国国家安全局搜集的仅仅是与电话呼叫有关的元数据,而不是电话呼叫本身的内容。换句话说,美国国家安全局没有进行窃听活动。这很快缓和了公众的怒火。事态随后急转直下,媒体通过调查才发现,凭借区区元数据居然能推断出如此多的个人信息。在此之后,对这一事件的权威解读才终于公之于众。
MetaPhone项目是斯坦福大学法学院互联网与社会研究中心(Stanford Law School Center for Internet and Society)的研究人员于2013 年年底进行的一项研究,旨在重现美国国家安全局搜集电话呼叫元数据采取的方法。他们发现,用区区元数据居然能推断出如此令人难以置信的信息量。MetaPhone的研究人员在报告中提到了这样一个案例:一位研究对象分别打电话联系了家庭装修用品店、锁匠、水培植物经销商还有烟草大麻用具店。也许,打这些电话是出于非常单纯、合理的原因,也许它们之间完全没有关系但是这可能并不是我们大多数人会得出的结论。
许多元数据都与电话呼叫有关,尤其是手机呼叫。而在与电话呼叫有关的元数据片段中,最显而易见的就是拨打与接听双方的电话号码,其次就是电话呼叫的时间与通话时长。如果使用具备GPS(全球定位系统)功能的智能手机拨打电话,还可搜集到拨打与接听双方的地理位置信息,至少可以精确到通话双方手机所在地区手机信号塔的信号范围。与手机呼叫关联的元数据还有很多,但是如此少量的信息也足以让倡导保护隐私的人士再三思忖。因为即使你没有在打电话,你的手机也会与本地手机信号塔之间交换数据。这样一来,移动运营商就能随时搜集你的位置信息以及一段时间内的活动轨迹根据斯诺登披露的机密文件显示,移动运营商实际也在这样做。当然,前提是你一直带着自己的手机。
元数据这个词就这样成了一个公众话题。鉴于元数据如此广泛地存在,人们理应更好地去了解它,而公众也早应该进行这样的讨论。在当代世界中,计算活动无处不在,因此元数据像电网和高速公路网一样成了一种基础设施。这些当代基础设施的构成部分一方面发挥着不可或缺的作用,另一方面它们展现在我们面前的又只是冰山一角。比如,当你触动照明开关时,你就变成了大量技术与策略的最终用户。
分开来看,这些技术或策略也许微不足道、无关紧要,但是聚合在一起,就能带来深远的文化与经济影响。元数据亦是如此。就像电网和高速公路网一样,元数据不知不觉地融入日常生活的背景之中,理所当然地成为当代社会得以稳步前进的动力之一。
作为生活在现代世界的公民,我们熟悉电网、高速公路网以及其他现代的基础设施,也对其有着合理(尽管可能并不完整)的了解。但是除非你是一位信息技术科学家,或者是为美国国家安全局工作的情报分析师,否则可能无法对元数据形成这样的认识。
这就是我写作本书的目的向你介绍元数据,以及元数据涉及的诸多主题与问题。我将探讨什么是元数据及其存在的原因、适用于不同用户与用例的各类元数据以及使现代元数据
成为可能的一些技术,还会预测元数据的未来路在何方。读完本书,你无论身在何处都会看到元数据。
这是一个元数据的世界,而你就身处其中。