CoinGeek社论大数据已死?大数据仍将长存

本文是来自Unbounded Capital的戴夫·马伦-穆尔(Dave Mullen-Muhr)的嘉宾投稿。如果您想要投稿,请联系比尔·比蒂(Bill Beatty)了解详细的提交信息。谢谢。

最近,Unbounded Capital的杰克·拉斯基(Jack Laskey)写了一篇题为《BSV:一场关于数据保护的变革》的文章。文中阐述了当前大数据商业模式存在的问题,探讨了通过比特币让用户真正拥有数据和实现小额支付将如何成为一种强大的解决方案。本文将沿着这一思路进一步剖析,看看我们如何从当前的大数据模式转向受经济激励的“用户掌控数据”系统。

这个系统会是什么样子?它能带来什么?

也许与人们的直觉恰恰相反,这个改进后的系统很可能涉及到比现在更大(和更好)的数据!

大数据的名不副实

谷歌是一家网络服务公司或数据及信息经纪公司是不是更符合实际?谷歌旗下的产品组合,包括搜索算法、电子邮件服务、云存储、视频平台YouTube,以及每天数十亿人使用的其他产品,通常都不是谷歌的直接收入来源。大多数用户不需要为使用这些产品付费。但是,用户在与这些产品交互的过程中会产生数据,而谷歌会将这些数据卖给出价最高的人。

谷歌的创收产品并不是网络服务,而是数据和信息。为了鼓励用户提供数据,谷歌开发了一系列诱人的产品,在收集到数据后,他们会将这些数据转化成具有实际价值的信息,然后通过像AdSense这样的B2B服务出售,这也是谷歌的主要收入来源。

重要的是,正是这种与数据买家的关系和各买家对信息的需求,促使谷歌将海量的原始用户数据提炼成一些有用的内容,通常是有针对性的广告。所以说,谷歌实际上是一个以海量数据/信息为依托的经纪公司,他们的旗舰服务则是众多大受欢迎的亏本商品。

大数据的鞭打伤害

这种架构上的转变会产生许多下游影响,对于大数据,取其精华、去其糟粕是引领互联网潜在未来的关键。

大数据的问题不在于数据的规模庞大。这是一个不可避免的现实,并且,将海量的原始数据转化成有用的信息本身是一件非常好的事情。

大数据真正的问题源于各个数据处理公司采取的商业模式。越来越多的直觉告诉人们,普通用户从谷歌服务那里获得的价值远远比不上他们为谷歌提供的数据所产生的价值。

这种差异让人们觉得,用户受到了不公平的待遇。此外,谷歌的激励机制往往与用户的期望有所偏差,导致用户体验不佳,使得这种直觉上的补偿不足更加令人难以接受。在其他任何交易平台,如果参与者有这种不满的感觉,他们会将自己的业务(在这种情况下,即他们宝贵的数据)转移到别处。

不幸的是,对谷歌用户来说,几乎所有市场竞争者使用的都是同样的数据处理模式,这让他们没有实质性的替代方案可以选择。如果你想要使用互联网上最受欢迎的工具,你就必须交出自己宝贵的数据,拒绝从来都不是一个现实的选择。

切忌良莠不分

正如拉斯基在文中所说,比特币(如今的BSV)的发明使得用户可以现实地选择退出这个系统。但是,仅仅因为我们可以选择不通过这些现有的大数据经纪公司交易,并不意味着大数据本身将会或者应该消亡。加密货币领域内的一些人认为,未来,像广泛收集数据这样的事情将完全不复存在,取而代之的将是一个注重极端隐私保护的系统。

可以说,这是对当前数据处理模式弊端的一种过度反应,而没有从实际出发去认识它的优点,其结果只能是付出高昂的代价。其实,在基于比特币的“个人掌控数据”互联网模式下,我们完全可以用一种能够更好补偿用户的方式来交换和使用数据。与极端隐私保护的孤立愿景相比,这种对用户在数据创建和交换上的成本/收益的再平衡将进一步扩大数据规模,除了如今令人细思极恐的精准广告以外,这些数据还可以应用于大量其他用途。

如今,只要你展现真实的自己,广告商马上就能预测出你的确切需求,这种怪异的事情已经变得稀松平常,人们也都见怪不怪了。但是,为了避免对数据保护反应过度,我们必须认识到,相比展示用户完全不想看到的广告,展示用户可能希望看到的广告有助于提升用户体验,这一点毋庸置疑。

不管怎样,我们想要知道的是,如今的大数据是如何使这种不可思议的预测能力成为可能的?

- 第1步:谷歌的热门服务充当数据收集者的角色,先收集大量的数据点,然后再私下对它们进行集中整合。虽然没有确切的数据,但可以肯定的是,对于每个用户,谷歌都掌握了数百万个数据点。

- 第2步:谷歌充当数据分析者的角色,在专有算法和机器学习的帮助下,梳理并细化这些原始数据,使之成为具有实际价值的信息。

- 第3步:谷歌通过其AdSense服务,以中间人的身份将这些有用的信息卖给那些愿意付费的公司,为自己创下每年11到12位数美元的年收入。

从原始数据到专有算法,谷歌对这整个产业的垄断使得其在定价上处于有利的谈判地位。不妨假设一下,如果互联网用户借助比特币退出以数据交换服务的交易模式,那么原始数据就不再仅仅属于谷歌所有。一旦丧失了垄断优势,他们便无法维持当前的定价,而只能在数据分析上展开竞争。

分析市场的竞争相当激烈,所以谷歌在这方面的利润率可能也会下降。在基于比特币的“个人掌控数据”互联网模式下,这种数据到信息的转化过程会开始摆脱谷歌的垄断控制,更接近于一个自由市场,让终端用户在如何使用自己数据方面拥有更大的优势和选择。

大数据市场

在这种用户优势中,一个特别值得注意的方面是利润。你的个人数据值多少钱?在此之前,由于个人数据的收集、处理和出售都是在谷歌的垄断下实现的,我们很难知道它们的价值。但是现在,随着人们能够拒绝以数据向谷歌交换服务的不透明协议,转而选择基于比特币的直接出售数据交易模式,我们很快便可以知晓数据的价值。对用户掌控的原始数据的市场定价很有可能会降低广告商购买这些信息的花费,同时激励用户产生和出售更多优质数据。

此外,借助链上加密技术,广告商可以通过使用这些数据的衍生品,在不损害个人隐私的情况下,可靠地触达目标市场。如果你目前对谷歌的数据实践存在担忧,可以放弃谷歌搜索,转而使用诸如DuckDuckGo这类更加注重隐私的搜索引擎。

但是,如果谷歌搜索给你带来的不仅仅是偶尔符合自己兴趣的定向广告,而是每月的收入流,那又当如何?转向DuckDuckGo对你还会具有同样的吸引力吗?在这种激励机制的刺激下,用户往往会倾向于更多地创建数据,而不会吝于分享。

那么,除了购物习惯以外,用户可能更希望保密的那些更加私人的数据呢?提到这里,我首先想到的是医疗数据。现在,合法且实际拥有这些数据的用户可以在链上对数据进行加密,自行决定如何处理它们。这样一来,谁可以访问这些数据、访问多长时间、将其用于什么目的、需支付什么样的价格等等,所有这些都在用户的掌控之中。

例如,某个用户可能不希望强生公司公然向其展示治疗某种令人尴尬的疾病的定向广告,但可能希望私下向某个公司出售同样的个人医疗信息,例如出售给试图对大量样本进行数据分析,希望借此找到治疗方案的公司。我们都知道,这些数据经过整合后是非常有价值的商品,在当今,它们甚至比石油更有价值。现在,随着比特币开启了数据自由市场的大门,我们将能够明确自己个人数据的价值,进而就我们想要如何处理这些数据做出更明智的决定。

这种用户优势的另一个积极方面是数据分析结果的改善。仍然以医学研究为例,受激励创建和分享(出售)的数据将会更多,质量也将更高。而且,这些数据存储在比特币的单一公共数据库中,这使得任何愿意为其付费的服务可以很容易地实现数据整合和互操作。在当今的模式下,或许谷歌根据药物搜索历史掌握了一些宝贵的用户健康数据。

但是,除此之外,还有一些宝贵的用户健康数据存储在其他公司拥有的其他数据库中,比如根据用户使用Apple Pay购买食品的行为收集的数据存储在苹果公司拥有的另一个数据库中,来自诸如Fitbit这类生物识别技术公司的一些宝贵用户健康数据存储在第三个数据库中。如果某家医学研究公司想要分析这一系列数据,他们就需要从多家不同的公司那里购买数据,这些数据存储在不同的服务器上,而且存储格式可能各不相同。虽然这种做法在技术上可行,但数据去中心化带来的额外阻力会使得其分析业务不太可能获得丰厚利润,也不太可能持续下去。

为了巩固自己的垄断地位,同时消除去中心化带来的低效率,像谷歌这样的巨头经常会购买这些宝贵的数据。就在上个月,谷歌收购了生物识别数据收集公司Fitbit。尽管谷歌声称他们不会为了卖广告而出售用户数据,但Fitbit平台上那些没有仔细阅读就点击同意复杂服务协议条款的用户,现在已经把他们的数据拱手交给了另一家公司。虽然这对我们假设的医学研究人员来说可能是一件好事,因为他们现在少了一家需要谈判的公司,但对关注隐私的用户来说,结果却没有那么让人欢喜。归入谷歌旗下后,Fitbit如何处理用户健康数据实际上已经不在自己的掌控之中。

现在,我们来看看基于比特币的“用户掌控数据”互联网模式。从搜索历史到购买历史,再到生物识别数据,所有这些数据仍然由用户产生,但不同的是,现在这些数据是保密的,如果价格合适,用户可以选择将其解密出售。

这些数据以相同的格式集中存储在一个地方,天生具有可互操作性,使分析变得轻而易举。另外,这些数据在公开市场定价,用户可以确信,自己在提供数据后会获得合理的补偿。如果他们对补偿不满意,可以拒绝任何公司访问他们的数据。那些致力于提供最佳原始数据分析服务的公司(或许谷歌也会加入竞争)也将有机会直接向用户购买数据。

这些公司就是数据与广告之间的中间商,即,将原始数据提炼成具有实际价值的情报,然后出售给信息买家。他们会在价格和分析上展开竞争,这样一来,医学研究人员将能够以更低廉的价格获得更优质的信息,使更多疾病有望得到治愈。

那么,还有哪些用途可以从更大规模的数据整合和更好的分析方法创新中获益?在依托大量原始数据的技术之中,人们经常谈论的一个是无人驾驶汽车。设想一下,如果车辆位置、目的地、车速、优先级、汽油/充电等等,所有这些必要、宝贵的数据都变成数据提供者(车主)的可获利收入来源会怎么样?一旦有了经济激励,用户往往会倾向于提供这些数据,运营无人驾驶软件的汽车公司则能够实时将这些数据转化为他们软件所需的信息。不过,在考虑当今模式下激励数据产生的迂回方法时,人们回避了一个问题,那就是,如果没有比特币带来的大数据所有权模式转变,像可持续无人驾驶汽车生态系统这样的东西有可能实现吗?

大数据的未来

人们对当今大数据模式的担忧是有道理的。很容易看出,目前的模式对大多数参与者来说都不是最优的。但是,解决的办法并非放弃大数据,退回到极端孤立的状态。相反,我们应该向更大的数据看齐,只要它的所有权掌握在用户手中。现在,既然比特币已经使得这成为一种可能,我们便可以激励用户产生更多的数据和信息,这将使参与其中的几乎每个人都受益。

值得指出的是,对大数据模式的当前主要受益者来说,这并不是判他们的死刑。像谷歌这样的公司将在数据整合和分析领域的竞争中处于有利地位,但如果他们想要维持这种地位,就必须不断创新,同时为他们的用户(现在是业务伙伴)提供适当的补偿。随着时间的推移,用户体验应该不断改进,而不是倒退。在公司采取更加端正、规范的方式处理数据和信息后,用户将更乐意提供数据,也会更少猜疑这些数据在幕后的使用方式。

未来,基于比特币的互联网将给当今的商业惯例带来深远的变化。但是大数据不会消亡。在比特币的推动下,大数据将变得更大,更好地服务于每个人。

戴夫·马伦-穆尔是一位投资者、企业家、撰稿人和永远充满好奇心的学习者。作为Unbounded Capital的一名负责人,戴夫致力于利用比特币将过去的智慧与现在的技术相结合,以创新未来。

您是比特币新手吗?请查看CoinGeek的比特币新手入门栏目,这是了解更多关于(中本聪最初设想的)比特币与区块链的终极资源指南。

更多社论新闻

社论十二月 09, 2022
代码真的就是法律吗?

代码真的就是法律吗?

“代码即法律”这个观点仅仅源于一小部分开发者或企业试图通过一种从未存在过的去中心化的错误谬言来施加控制。代码不会自己编写出来。更重要的是,代码可以被更改。

社论十二月 02, 2022
研究者的作用

研究者的作用

在研究者于博士阶段的学习过程中发展自身时,找到能够帮助提供反馈和支持的学术同行支持小组是至关重要的。

社论十二月 01, 2022
宪法的设计方案

宪法的设计方案

尽管美国宪法的基础及其《权利法案》为人民的自由与保护提供了坚实的基础,但这样的法案也不可能是为了预测未来而创造的。