晶片的进步带动了科技的发展,随着物联网的普及,我们如今面临的数据其本质已和过往不同,值得思考的是在现在的数据世代,我们使用数据的方式
近年来,随着数据的急遽增长,我们已迈入人工智能的崛起时代,「数据经济」再次被高度重视,庞大的商业利益使得我们对于数据的价值更加重视。即便现今已进入以数据驱动的世代,在设备技术优化、时空背景的转变下,数据的型态与本质已发生巨大转变,但我们使用数据的方式是否也跟着改变了呢?
本篇主要希望可以先带领大家一起谈谈过去的世代与数据转变的历程,通过这些资讯,我们能够更加清楚了解过去与现今的世代差异,进而思考世代转变所衍生出的数据问题。
以「计算」为中心的Compute centric世代 到 以「数据」为中心的Data centric世代
追朔到1970年代,积体电路技术的崛起使得电脑开发成本降低,普及化的潮流席卷各个家庭,迎接了电脑世代的来临。然而,当时电脑记忆体容量有限,中央处理器(CPU)价格高昂且运算速度较为缓慢。
为了解决电脑计算资源有限的问题,在过去数十年里,计算中心化是处理数据的主要方式,使数据集中在一个适合运算的位置处理分析,提高整体运算的效率,也就是以「计算」为中心的Compute centric世代。
每次要运算时,使用者必须把资料从硬碟内搬移至记忆体运算,再搬回硬碟,因此花费很多时间与成本在「搬移」这个过程之中。
随着数据本质的转变、晶片的优化加上物联网拓展应用下,庞大的数据量已不再适合使用这样的方式,改透过设备本身足够的计算能力,即时处理数据问题,使我们从传统的中央化的数据处理方式慢慢转变成为以「数据」为中心的Data centric世代。
数据的转变-物联网时代与大数据
数据本质改变的契机源自于摩尔定律。
定律提出后的50年,半导体的发展有如当年预测的那样,晶片越来越强大,价格也不断降低,带动数位科技的演进,让我们快速进入到一个数据量巨大且计算能力强大的世代。
通讯设备与网际网路的普及促进了物联网(IoT)的诞生,彻底改变数据的本质。晶片被广泛运用在随身的电子产品上,智慧型穿戴装置的诞生开启我们被无处不在的数据所环绕的生活。
物联网的扩展使得我们被包围在一个处处都是感测器的世界,进而产生源源不绝的数据,从个人软体的使用或智慧城市的应用,数据量已经成长到基本上可以还原我们每一个人一整天的历史轨迹。根据IDC所发布的《数据时代2025》报告显示,2025年全球每天将产生491EB的数据量,以目前美国的平均网速为25Mb/秒而言,一个人要下载完一年所产生的数据量,至少需要18亿年。
这么大量的数据从哪里来的呢?
可以想像一下,现代人越发依赖手机、平板、智能手表等装置,这些随身携带的装置中有着各种应用程式,随时记录着不同时间、地理位置产生的各种数据型态,包含:照片、文字、影片、数值等,透过广泛覆盖的网际网路,让这些数据更加「即时」(接近即时)地被搜集,进而改变过往数据的本质,成为了「巨量、多样、快速」的存在。 Live and Ubiquitous ,现在的数据是鲜活且无处不在的,就宛如有生命的活动着,也就是所谓的「活数据」。
数据的转变对我们而言,是一种新的转机。这些鲜活的数据能够帮助我们更全面思考并推理合适的商业决策,但与此同时,如此复杂的即时数据,更需要具有专业背景与相应能力的专家来协助转化成清晰的图表,在这过程中我们也将面临到新的挑战。
Awareness 打开数据新思维
值得我们思考的是,在这个不论是数据的本质或是计算方式都已不同的世代里,大多的使用者仍旧遵循着: 数据搜集、清洗整理、储存管理(ETL)再到串接API的标准来处理数据。
然而我们察觉到的是,随着数据本质的转变,其价值性越来越高,人们就更加不愿意提供自身的数据,即便愿意提供数据,却无法保证数据不会被做二次贩售或恶意滥用,当没有足够保障的情况下,数据就可能被拷贝盗用。但是当数据之间无法有任何交集时,就形成一座座孤独的岛屿,纵使岛上矿物资源丰富,却也难以发展出更加进步的文明与价值,这也恰恰是数据商业价值被低估的原因。
因此在最初的数据搜集过程中,我们面临到最大的挑战就是「如何让大家都愿意在有保障的情况下愿意拿出数据?」再来,我们将思考的是,整个数据处理的方式较为复杂,当我们迈入到大数据的时代时,这样的方式是否会使我们付出更多的成本?
这些对新世代数据的疑问,成为我们的起心动念。
从打开封闭环境开始,我们希望建立开放的数据生态系,让数据在被保护的状态下能够碰撞出新的商业机会,并且在不用整合的情况下,就能够完成数据的交叉分析,降低数据使用的技术门槛,打造更加平民化的数据使用环境。正如同历史中纸张的出现,让知识、文化得以保存并传播得更远,在不知不觉中改变了人类行为与思考的模式。现今,品牌名称Aralia取自当时造纸最为高级的蓪草纸的原料名称,期许能够打破现有的数据思维,开创崭新的使用模式,建立更加广阔的数据生态系。
🪐漫步星球🪐
除了上述的问题之外,你认为目前的数据使用上还面临了哪些问题?
0条评论