标题 | 大数据向云端过渡 |
范文 | ![]() ![]() ![]() 大多数企业都会努力捕获和分析自己的数据。但这项工作以何种方式,在哪里进行呢? 解决方案曾经仅限于完全部署在本地的数据库。但今天,企业必须面对一个充满众多技术和部署类型的环境。从单个数据库和Hadoop产品到云端、本地和混合部署,数据格局呈现出多样化和快速演变的特征。 《云端数据简报》是一项持续性项目,目标是对这种格局的演变进行定量。它探索Tableau Online客户在全球范围内使用的数据源的连接。通过分析这些连接,我们可以窥见企业当前,以何种方式在何处分析自己的数据。 我们的方法: 《云端数据简报》对4000 多个客户向Tableau Online发布,数量超过一百万个匿名数据源连接进行采样分析。由于这是一种云端托管工具,其使用模式可能在总体上带有云端偏向性。 尽管如此,Tableau Online客户既有小公司,也有大型股份制企业,并且几乎覆盖了所有行业。此报告中的数据囊括了这些客户,我们相信它可以准确地指示市场大趋势。 重要发现: 数据存储正在延伸到传统数据库概念之外。 Tableau Online客户在自己的分析中使用众多类型的数据源。从专有数据库到开源Hadoop工具,客户使用的数据源类型超过40种。就其中三分之二的数据源类型而言,云端部署比本地部署更常见。 数据重心正在向云端偏移 ●在过去15个月内,云端托管数据的连接数量增加了28%。2015年1月,在Tableau Online的数据源连接中,云端和本地部署的数据源基本呈均势分布。到2016 年第一季度,二者的比例已经变为70:30。 ●Amazon Redshift和Google BigQuery之类云端原生数据源正在获得更多的市场份额。2014年年初,此类连接仅占Tableau Online连接总数的12%。到2016年第一季度,其份额已增长到所有连接的28%。 混合数据技术对企业经营仍至关重要。 ●既能部署在本地又能部署在云端的混合数据源 仍然是Tableau Online客户使用最多的连接类型,远超其他类型。在过去两年内,混合数据源在所有连接中的份额从未低于60%。 ●混合数据的重心同样正在朝云端偏移。15个月前,Tableau Online客户在云端环境和本地环境中部署的混合数据源一样多。到2016年第一季度,云端部署的混合数据源在连接中的份额已增加到了60%。 数据呈多样化格局 Tableau Online用户使用40多种数据源。 排除基于文件的源(例如Excel)和业务特定Web应用程序(例如Salesforce和Google Analytics),用户使用32个不同的数据库类型和Hadoop生态系统。这种多样性表明当今可用的数据管理工具,具有广泛且多样的格局。 未来,该格局只会变得更加稠密。高德纳 (Gartner) 报告指出,运营数据库管理系统正在经历“强势复苏,新来者在这一过程中对传统领先者构成了挑战。”高德纳还发现,在专为数据分析设计的仓储工具中,颠覆过程将加速创新。 在用户更喜欢云端部署还是本地部署的问题上,各种数据源类型之间有很大差异。 就三分之二的上述数据源而言,云端部署比本地部署更常见。但虽然Amazon Redshift和Google BigQuery之类的某些数据仓库仅支持云端部署,SQL Server和MySQL等其他数据仓库同时支持云端和本地环境部署。 部署偏好有怎样的总体趋势? 云端部署的连接正在增长。 在2015年1月,云端部署的数据源在向Tableau Online发布的所有连接中占55%。到2016年第一季度,其份额为所有连接的70%。这相当于在短短15个月内,就实现了28%的合计百分比增长。 是什么在推动云端数据源连接的增长? 云端部署,无疑可以帮助组织在设置和维护基础结构方面,降低成本和节省时间。但另外三个趋势,在进一步推动云端数据源的使用: ●新公司常常“在云端诞生”。这些公司从第一天起就将自己的数据基础结构部署在云端,它们在市场中的占比不大,但却一直在增加。 ●新数据源让高度可扩展的环境不可或缺。最好的例子是物联网(IoT),在其中,机器生成的数据不断地从设备和传感器流出。组织常常使用可扩展的云基础结构,来捕获和存储这些数据。企业管理协会(一家研究公司)估计IoT记录当前占云端环境中数据总量的33%。另外,在使用IoT数据来为业务系统提供信息和改进业务系统的企业中,这些情况正在变得越来越普遍。 ●人们越来越多地使用手机和平板电脑之类的设备来完成业务任务。Dresner Advisory Service的“Wisdom of Crowds 2015”市场调查发现,接近 70%的调查对象认为,移动设备的支持对于商业智能计划而言“重要、非常重要或至关重要”。云解决方案可以在任何时间和地点实现数据访问,由此为业务数据的移动访问提供了基础。 虽然一些数据库仅支持云端部署,另一些解决方案既可以在本地,也可以在云端环境部署。企业怎样选择? 在过去两年中,云端原生数据源的连接增加了125%。 2014年初,支持云端使用的数据源仅占Tableau Online连接总数的12%。到2016年3月,其占比为27%。Tableau Online客户对Amazon Redshift 和Google BigQuery等云端数据仓库的使用,推动了这一增长。 云端部署呈增长态势,但混合部署仍占统治地位,最常见的连接类型仍然是“混合”数据源。 在2014 年初,既可以部署在本地又可以部署在云端的混合数据源占连接总量的73%。2016年3月,其占比为62%。虽然略有下降,混合类型仍然在Tableau Online用户发布的所有数据源连接中占据绝大多数。 混合数据源为何如此盛行?许多组织以多种数据源为基础进行分析构建,其中的一些数据源无法部署在云端。例如,为了符合某些类型的财务和医疗数据在安全性方面的要求,常常需要采用本地存储方式。在另一些情况下,将业务迁移至云端是一个渐进的过程,需耗费数月或数年时间才能完成。高德纳预测,2016 年的竞争将以这些混合产品的实现为焦点。到2018年,这些产品将成为主流。 业务用户具体选择部署混合类型中的哪种数据库技术,在哪里部署? 混合数据源的重心已移至云端。 2015年1月,Tableau Online客户的云端环境混合数据源连接与本地环境混合数据源连接一样多。到2016年第一季度,云端部署的混合数据源在连接中的份额略有增加,达到60%。 《云端数据简报》使用Tableau Online 中混合数据源连接的匿名IP 地址,判断它们是部署在本地还是在云端。这种方法虽有少量误差,但可以正确确定多数部署的类型。 高德纳预测,同时包含云端和本地软件部署的企业资源规划 (ERP) 环境,最晚将在2018年成为常见环境。与混合数据的总体统治地位一样,云端部署和本地部署几乎平分混合数据源的现象也表明,虽然市场明显趋向于云端部署,过渡还远未完成。 Tableau Online客户使用最多的四种混合数据源为Microsoft SQL Server、MySQL、PostgreSQL和Oracle。 在这四种类型中,SQL Server和Oracle部署在本地的可能性更大。 平均而言,本地部署的SQL Server比云端部署的SQL Server多出一倍。本地Oracle数据源的连接概率是云端Oracle数据源的四倍。 SQL Server和Oracle都是云时代到来之前的常见技术。它们长期以来一直部署在本地,对本地部署的偏向性不足为奇。然而,随着Microsoft Azure云平台的增长,Rightscale的《State of the Cloud》发现Azure的使用量,在2014至2015年增加了一倍。我们可能很快就会看到,该公司的SQL Server更加普遍地采用云端部署。 相比之下,与云端部署的MySQL和PostgreSQL的连接远比本地部署连接常见。 平均而言,云端MySQL 的概率几乎是本地MySQL的六倍。云端部署的PostgreSQL比本地部署的PostgreSQL多四倍。 作为开源技术,MySQL和PostgreSQL在云端的流行很可能都是因为它们兼容所有主要的云端平台(包括Amazon Web Services、Microsoft Azure和Google Cloud Platform)。Tableau Online客户对于云端MySQL和PostgreSQL的偏爱,还突出了在云端使用开源数据库技术的更大行业趋势。 未来的数据格局 从部署方案到具体的数据库产品,想要捕获自己的数据并从其中提取见解的企业有众多选择。本地、云端,还是混合?Redshift还是SQL Server?选择最佳的解决方案并不容易。 但尽管选择众多,企业管理协会 (EMA) 的一项近期调查发现,企业对具体技术的属性并不是特别关注。他们关注的是,特定解决方案的价值实现时间。确实,同一项调查发现,40%的组织相信他们的数据管理系统有助于建立竞争优势。云端托管的软件,日益被视为创造这种竞争优势的最佳方法。 为了构建成功的数据战略,组织需要理解并考虑大数据世界正在发生的变化。高德纳等行业分析机构提出,很快大部分IT费用将会用于“对已经长期使用的业务应用程序进行现代化改进或扩展,或用基于云的应用程序对其进行取代。”云端部署的数据源在Tableau Online用户中越来越流行,这表明云技术的势头在大数据世界同样日趋强劲。 三个具体趋势将影响分析和可视化未来将使用什么样的数据: 1. 数据重心将向云端偏移。 数据重力表示数据在服务和应用程序方面的影响。如果您的数据存储在云端,您将很可能希望您的数据工具(从处理到分析)也能在云端运行。 现在,数据重心集中在云端,集中程度在未来会进一步增强。构建数据生态系统的企业应将工作重心放在云端工作流程上,以确保系统做好应对数据改变的准备。 2. 在向云端迁移的过程中,混合数据技术对企业经营至关重要。 如果只有部分数据可以迁移至云端,或者你想循序渐进地迁移数据,混合数据选项让你可以灵活地应对云端托管和本地环境之间的矛盾。 高德纳最近预计,到2018年前,这些混合产品与服务将成为标准。针对正在向云端转移的企业,混合已经成为了标准。 3. 数据存储正在迅速地延伸到传统数据库和数据仓库概念之外。 现在,数据来自四面八方,来自万事万物。因此,为满足多种多样的新数据流所带来的需求,存储的格局正在扩展。 通过Snowflake等“即服务”产品以及Amazon关系数据库服务等可信服务,云端托管数据工具对这种扩展起到了尤为突出的推动作用。 未来,该格局一定会变得更加稠密。为了从突飞猛进的创新中获益,许多企业正在致力于构建以灵活性和选择性为最高标准的数据流程。 无论数据有多大或是来源于多少系统,Tableau软件都能帮助人们查看并理解数据。通过从PC到iPad的无缝体验,快速连接、混合、可视化并分享数据仪表板。用户不需要编程技能,就能创建和发布带有自动数据更新功能的仪表板,并分享给同事、合作伙伴或客户。 |
随便看 |
|
科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。