信息时代的“无价之宝”——数据
张唯诚
①在古代,炼金术士声称他们能将铅之类的金属变成贵重的黄金,当然这是不可能的。现在,数据科学家正在将大量数据变成信息,这些信息虽然不是黄金,但价值胜似黄金。数据科学家可以说是现代的“炼金术士”。
②英国数据科学家维克托・迈尔・舍恩伯格在他的著作《大数据》中指出,今天全世界存储的信息中,书和磁带只占不到两成,多数信息都以数据形式存储在电脑硬盘、通信设备和其他数字设备中。全世界产生的数据正在以惊人的速度增长,最近两年的数据产生量就占到总数据量的90%。一家互联网研究公司预测,人类产生的数据还将以每三年翻一番的速度增长。
③互联网并不是产生大量信息的唯一地方,另有大量信息是由科学家们“制造”出来的,这些信息来自于他们对大量事实的研究,而对这些事实的记录就是数据。例如,生物学家测量了成千上万个细胞,从而收集到大量数据;天文学家观测了恒星、星系和太空中的各种能量活动,从而收集到大量数据;地球科学家收集到世界各地的有关水、风和气流的资料,从而也形成了大量数据。
④数据经过分析和归纳会形成有用的信息,于是人们发明了各种各样用于处理数据的计算机软件,人们利用数据做各种各样的事。在美国,人们通过分析数据了解到,每当飓风来袭前,超市中的草莓糖霜果塔饼干便特别抢手,这时的销售量会比平时增加7倍, 而在暴风雨天气来临前,啤酒的销售也特别好,于是超市便知道在这种时候及时补充货源,从而令销量大增。数据还给警察们的工作带来了方便。在那些犯罪率高的城市,以前积累下来的犯罪数据可以派上用场,警察们使用这些数据预测犯罪的高发时间和地区,从而合理地调配警力,提高工作效率和防范效果。
⑤数据之所以能发挥上述作用,很重要的一个原因是它帮助我们预测了未来有可能发生的事,然而在有些领域,知道为什么会有某种事情发生显得更加重要。例如在医学领域,来自人体或者人体细胞的数据就有可能告诉医生们,某种疾病为什么会发生,从而帮助医生治疗这些疾病。
⑥科学家们还期待有一天数据能使各行各业变得更加高效和更具“个性化”。例如,当一个病人向医生提供了详细的数据,医生便可以将这些数据和其他病人的数据进行比较,从而依据这个病人的生活方式制定特定的治疗方案。同样在一个班级里,学生们利用平板电脑或者阅读器进行阅读练习。数据传到老师那里,如阅读用了多长时间,某个词语被学生标注了多少次等。分析这些数据,老师便可以发现读物的难点和学生们的兴趣点,从而有针对性地进行讲解,还可以对个别学生提供有针对性的辅导。数据同样可以运用到其他行业。
⑦因此,在我们这样一个信息时代,假若你成了一个数据科学家,你便拥有了神奇的魔力,就好像中世纪的炼金术士们所声称的那样。
(选自《百科知识》,2016年02期,略有删改)