数据科学家与 Web 3.0

一篇有意思的文章,原文链接

听说过蒂姆·伯纳斯·李吗?当然,你有。毕竟,他发明了互联网。

关于蒂姆,你可能还会知道,他发明了互联网 3.0……又名 Web 3.0……又名语义(semantic)网……又名空间网。 这里是 蒂姆爵士对互联网未来的评价:

“我有一个梦想,让网络 [其中的计算机] 能够分析网络上的所有数据——内容、链接以及人与计算机之间的交易。应该使这成为可能的“语义(semantic)网”尚未出现,但是当它出现时,贸易、官僚主义和我们日常生活的日常机制将由机器与机器对话来处理。人们吹捧多年的‘智能特工’终于要实现了。”

Web 3.0 到底是什么?

术语的多样性仅适用于 Web 3.0 的今天。事实上,许多思想领袖仍在清晰地理解 Web 3.0 的全部含义。 有人 将其定义为

“……一个用来描述万维网未来的术语”

其他人提供了更具体的标准,例如语义、人工智能、3D 和无处不在。

其他人 提供的仍然是更窄的定义,更专注于当前商业模式可以使用空间技术利用这种未来状态的方式(我将在下面更详细地探讨其中的一些定义)。

不管你想叫它什么,不管你想定义它,有一些重大的努力正在进行中,开始意识到 Tim 预言了万维网的未来,它对数据科学家有一些重要的影响。

我凝视着深渊,开始了解 Web 3.0 及其对我热爱的职业的潜在影响。回过头来,我看到了一丝机会。一封来自未来的情书,渴望被实现,祈求我们铺平道路。

我目前的理解

抛开所有的戏剧性,我对 Web 3.0 的理解仍在随着我的学习和我看到新产品进入带有 Web 3.0 营销标签的空间而不断发展。

在阅读了 Tim Denning 关于使用 Web 3.0 创建内容的几篇文章后,我第一次开始注意到这个概念,就像这里的这篇文章(嘿,看,另一个聪明的 Tim 😊)。

Tim 还撰写了当今 Web 3.0 最突出的用例之一,即加密货币。加密货币是 Web 3.0 潜力的很好例子,因为它们是一种去中心化且完全透明的价值交换手段。

加密货币消除了对控制货币流动的中央银行或政府的需要。这让我们重新理解 Web 3.0 究竟意味着什么。

两种定义,至少

在我看来,有两种不同的定义开始形成。一种定义是对互联网技术未来状态的理想主义愿景(Web3技术栈)。正是这种理想与伯纳斯-李的愿景最为吻合。

第二个是对现有技术的更直接应用,这些技术尚未成为企业如何向消费者交付价值的规范。

让我们先解决后者,因为我认为这不是数据科学家最有价值的地方。

德勤等几家著名的咨询集团正在推动 Web 3.0 与空间网络同义的说法。从本质上讲,空间网络是一种未来状态,企业可以将客户数据连接到物联网设备,并将客户所居住的地理位置连接到三维空间中。认为 Pokémon Go 越来越成为常态。

为什么向现有企业销售服务的咨询公司更喜欢这个定义是有道理的。它可以通过当今的技术实现,并且也适用于现有的商业模式,即企业继续囤积用户数据以实现货币化。

在这种情况下,区块链仍然很有用,企业与物联网提供商合作构建连接这些设备的区块链服务,但企业仍然利用他们的集中数据来混合和提供由内部衍生的洞察力介导的用户体验。

正是这种超级用户驱动和身临其境的体验,导致一些人将亚马逊和 Salesforce 等现有公司标记为 Web 3.0 公司,但事实并非如此。

这也不是伯纳斯-李设想的理想情况。 Web 3.0 的理想状态要微妙得多,需要对现有 Web 基础设施、在其上运行的应用程序以及传统业务模型进行重大更改。

由于数据现在以分布式方式存储在整个互联网上,因此可以部署 AI 以通过开发语言模型来更全面地了解用户需求,因为查询与用户交互相关联。

换句话说,用户可以允许 AI 解决方案访问他们的数据,以丰富和进一步个性化他们的体验。在这种情况下,人工智能将可以访问用户认为相关的数据,而不是公司持有的中央存储库中可用的数据。

这就是数据科学家在这种理想化的未来状态中可能拥有巨大机会的地方。

将数据科学家与 Web 3.0 配对

你会看到,Web 3.0 完全以用户为中心,其中用户数据分布在支持区块链的存储技术中。应用程序分布在这些相同的区块链平台上,因此用户可以选择允许这些应用程序(或称为 dApps)访问他们的数据,从而创造更丰富、更相关的体验。用户不再需要向企业请求数据,因为它已经由他们控制并存储在区块链上。

正如这种新的用户级数据所有权有利于 Tim Denning 等内容创建者一样,它也可能有利于数据科学家。例如,未来的数据科学家联盟可以与用户合作,购买对过去归公司所有的数据的访问权限,以使用这些数据构建模型,从而实现新的体验。数据可以跨 dApp 和设备混合,因为数据都存储在区块链上并连接到用户,而不是单独的公司,因此可以专门为用户量身定制解决方案。

反过来,这些 AI 解决方案可以作为 dApp 出售给可能从使用它们中受益的用户。通过这种方式,数据生成者(用户)和数据“理解者”(数据科学家)都从这种关系中获益。

但是,这个未来是否太遥远而无法让所有软弱的人都陷入困境?

我关注的一家公司正在为数据科学家向 Web 3.0 迈出重大步伐,它是 Ocean Protocol。需要明确的是,我与这家公司没有任何关联。我只是发现他们的平台对数据科学家很感兴趣。

海洋协议为企业和数据科学家等数据聚合商提供市场,让他们在分散的框架中共同买卖数据资产。

此外,Ocean Protocol 使私营企业能够在市场上出售其数据资产,而无需在其防火墙之外共享数据。海洋协议采用“计算到数据”的编排,允许人工智能模型对私有数据进行训练。

想象一下,能够使用来自多个主要医院网络的数据来训练疾病模型,而无需访问数据本身,只需访问元数据。

关于海洋协议等平台的最后一个想法

这一切归结为个人数据科学家作为内容/模型/数据创建者在全球经济中发挥更大作用的潜力,他们可以通过在海洋协议等市场上的个人努力获得补偿。

这也意味着人工智能开发本身可能会变得去中心化。

因此,在这个新的分布式和用户拥有的数据框架中人工智能的下一个重大进步可能更类似于元人工智能。也就是说,可以像大脑一样使用和组织其他 AI 模型的 AI 是围绕不同功能区域的互连网络组织的。

为了将这个比喻推得太远,数据科学家成为互联网架构的新神经元,它将努力将这些神经元组织成功能区域(功能等效的 AI 模型组),将它们与其他功能区域连接起来以协调它们,并帮助我们解决越来越复杂的问题。

我的理解……明天

正如我所说,我仍在学习。我确信我错过了一些东西,甚至可能误解了这个新空间的一些东西。对我来说,写作是一种理解,所以我与你分享我现在的理解,并理解明天可能不是我的理解。

Web 3.0 仍然很新,很多变化肯定会到来。我将继续关注并参与这个新框架。试验 Web 3.0 可能有助于实现的数据科学的潜在价值。