谷歌的行动
谷歌的体量和规模,使它拥有比其他大多数企业更多的应用大数据的途径。谷歌的优势之一在于,它拥有一支软件工程师部队,这使得谷歌能够从无到有地建立大数据技术。
谷歌的另一个优势在于它所拥有的基础设施。谷歌搜索引擎本身的设计,就旨在让它能够无缝链接成千上万的服务器。如果出现更多的处理或存储需要,抑或某台服务器崩溃,谷歌的工程师们只要再添加更多的服务器就能轻松搞定。
谷歌软件技术的设计也秉持着同样的基础设施理念。MapReduce(谷歌开发的编程工具,用于大规模数据集的并行运算。——译者注)和谷歌文件系统(Google File System)就是两个典型的例子。《连线》杂志在 2012年初夏曾报道称,这两个软件系统“重塑了谷歌建立搜索索引的方式”。
为数众多的企业如今开始使用Hadoop, 它是MapReduce和谷歌文件系统的一种开源衍生产品。Hadoop允许横跨多台电脑,对庞大的数据集合进行分布式处理。在其他企业刚刚开始使用Hadoop的时候,谷歌早已多年深耕大数据技术,这让它在行业中获得了巨大的领先优势。
如今谷歌正在进一步开放数据处理领域,将其和更多第三方共享。谷歌最近刚刚推出web服务BigQuery。该项服务允许使用者对超大量数据集进行交互式分析。按照谷歌目前的状况,“超大量”,意味着数十亿行数据。BigQuery 就是按指令在云端运行的数据分析。
除此以外,谷歌还坐拥人们在谷歌网站进行搜索及经过其网络时所产生的大量机器数据。用户所输入的每一个搜索请求,都会让谷歌知道他在寻找什么,所有人类行为都会在互联网上留下痕迹路径,而谷歌占领了一个绝佳的点位来捕捉和分析该路径。
不仅如此,谷歌在搜索之外还有更多获取数据的途径。企业安装“谷歌分析(Google Analytics)”之类的产品来追踪访问者在其站点的足迹,而谷歌也可获得这些数据。网站还使用“谷歌广告联盟(Google Adsense)”,将来自谷歌广告客户网的广告展示在其站点,因此,谷歌不仅可以洞察自己网站上广告的展示效果,同样还可以对其他广告发布站点的展示效果一览无余。
将所有这些数据集合在一起所带来的结果是:企业不仅从最好的技术中获益,同样还可以从最好的信息中获益。在信息技术方面,许多企业可谓耗资巨大,然而在信息技术的组成部分之一——信息领域,谷歌所进行的庞大投入和所获得的巨大成功,却罕有企业能望其项背。
已有0人发表了评论
哈佛网友评论