今天,人类在一周内创造的数据量比人类有史以来创造的全部数据量还要多,机器更是如此。再过一周,数据量又将是人类知识总量的两倍。再加上用光缆以光速传输数据的能力,可用于决策的数据的范围和速度已经超越了人类的能力,进入了纳米空间。
在积累这些数据的同时,我们也担心数据的安全性。尽管我们忧心忡忡(甚至还有即将到来的纳米化),但大数据的优势远远大于随之而来的危险。即使是最精明的人类统计学家也会觉得如海啸般涌入的数据,在饥渴的人工智能看来不过是一滴水珠。当一个智能系统在这些数据海洋中畅饮时,它就会有奇妙的发现,从而造福于我们所有人。
系统中的数据有三个来源:人工输入、传感器读数和其他人工智能操作的结果。
数据存储在数据湖中,即本地服务器、远程服务器(包括云)、设备或闪存驱动器和光盘等可移动媒体上的数据集合。
每个数据点都要经过质量和实用性检验。任何数据点都可能是错误的或不相关的。
算法是为实现既定目标而计算结果的过程。虽然每种算法都有许多步骤,但不一定需要所有这些步骤才能解决问题。由于算法是由人类编写的,因此任何步骤都可能包含意想不到的偏差。未雨绸缪型领导者努力确保其组织使用的所有算法都能产生公平的结果。
每个结果都会依次存储在链中下一个实体(包括其他计算设备、机器人和动能机器)可以访问的位置。
有了结果,后继实体就会采取所需的行动,无论是物理运动还是进一步计算。
在每一门学科中,人工智能每天都在实现理解上的巨大飞跃,因为它们可以筛选出眼前的复杂现象,并找出重复出现的模式。一旦某种模式与某种结果建立了常规联系,人工智能就能在每次出现已知模式时预测出这种结果。这种所谓的预测分析超出了人类的能力(因为它发生在超人类的机器领域),也往往超出了人类的理解能力。虽然这些通信的内容是由人类创建的,但所有这些通信中所包含的数据都是由机器独自收集和共享的。