专注广西服务器储存、备份容灾、数据库、虚拟化等产品服务商,服务范围:南宁、百色、河池、崇左、柳州、桂林、玉林、贵港、北海、防城、钦州。


SERVICE PHONE
0771-3492568
服务中心
SERVICE CENTER
SERVICE PHONE
0771-3492568
banner

咨询热线

0771-3492568
15078896959
0771-6779766
地址:广西南宁市青秀区民族大道88-1号铭湖经典A座1707号
联系人:罗先生、梁小姐
邮箱:838792164@qq.com
© 2017 Baidu - GS(2016)2089号 - Data © 长地万方

行业资讯

当前位置:广西南宁机房 > 行业资讯 > 数据虚拟化对大数据优化的重要性

数据虚拟化对大数据优化的重要性

发布时间:2018-01-22 17:20:22 点击量:128

  大数据就像是从当代数据环境中不断涌现出的丰富的、极度膨胀的资源。如今,不断扩张的物联网、随处可见的移动设备、社交媒体、点击流量、网页以及开放的数据都是导致我们今日数据不断增长的的主要因素。虽然数据资源富足,但这些数据都是最原始的、未经提炼的,其中存在大量不能用的数据。与其他”自然”资源一样,“原始的”数据必须经过提炼后,才能被用于生产目的,例如设备维护、产品创新、竞争情报、市场营销以及数据货币化等等。

  数据细化、提炼的过程可以纳入数据探查,准备,关联和背景化,标注和注释,统一和整合以及安全和治理政策的应用。元数据也是一个重要的组成部分,它在数据整体细化过程中输入、输出阶段起着十分重要的作用。

数据虚拟化对大数据优化的重要性

  其中,数据探查主要是对数据进行技术性分析,对数据的内容、一致性和结构进行描述。数据探查担负着两种不同的目标:战略性的和战术性的。

  1、战略性:一旦确定了某个候选数据源,就应当进行一次轻量级的探查评估来确定该数据源是否适合于包含到数据仓库中,针对早期的采纳/不采纳问题提供决策。理想情况下,应当在业务需求分析过程中确定出一个候选数据源之后立即进行战略性评估。较早地找出那些不合格的数据源是一个责任重大的步骤,即使带来的是坏消息,也是必要的一步。如果很晚才发现数据源无法支持要做的工作,对DW/BI团队的积极性将产生重大的打击,特别是当项目已经展开数月之后才发现数据源存在问题时更是如此。

  2、战术性:一旦将某个数据源引入项目的基本战略决策已经定下来,就需要进行一系列战术性的数据探查工作来尽可能多地确定出各种问题。通常这一工作从数据建模过程就开始了,一直到ETL系统设计过程。有时ETL团队也可能需要使用一个其内容没有经过彻底评估的数据源。系统也可能支持产品过程的需求,但是却存在ETL方面的难题,因为对产品处理并不重要的字段用来进行分析也是不可靠和不完整的。

  该子系统中揭示出来的问题最终会产生两种详细说明:

  1、将数据送回原来的数据源中,请求改善数据质量;

  2、构成了数据质量子系统的需求。

  备注:元数据(Metadata),又称中介数据、中继数据,为描述数据的数据,主要是描述数据属性的信息,用来支持如指示存储位置、历史数据、资源查找、文件记录等功能。元数据算是一种电子式目录,为了达到编制目录的目的,必须在描述并收藏数据的内容或特色,进而达成协助数据检索的目的。

  如果还没有为分析提供数据,那么这些数据可能会受到碎片化、最小化标记和丢失信息的影响。这些特征在电子健康记录(EHRs)中很明显,这说明了优化数据面对的挑战。收集和分析EHR数据的其中的一个障碍就是缺乏适当的标签和一致的语义的缺乏。

  EHRs的设计主要是为了满足病人的医疗、行政和经济的需要。埃尔斯的多用途目标——不考虑每一种数据的数据分析——可能造成数据碎片化,这需要在为临床研究等分析提供数据之前进行纠正。

  从共享患者健康记录中构建数据集的另一个挑战是在卫生保健组织中如何实现EHRs的标准化,甚至在相同的卫生保健系统中也缺乏标准化。例如,不同的部门(例如:同一家医院的放射学、整形和内医学)可能采用不同的方法来满足他们独特的数据输入需求、文档和排序需求,以及偏好,因此,会产生数据仓。

  备注:电子健康记录(EHR,electronic health record)是个人官方的健康记录,这些记录可以在多个设备和机构中共享。一个电子健康记录通常包括:联系方式、访问医护专业人员信息、过敏史、医疗保险信息、家族遗传病史、免疫状况、身体状况或疾病信息、服用药物清单、住院记录、做手术信息等。

  事实上,数据安全和隐私也可能成为分析受监管数据的障碍,比如在EHRs中。克服这一障碍的最佳方法是在细化过程中应用适当的安全性和治理。谷歌等公司正在试验联邦学习,以推进分析,同时确保隐私。

  数据的优化对于从数据分析中获得可靠结果是至关重要的,数据分析包括有意义的结论、准确的预测和明智的决策。

  事实上,与任何虚拟化一样,数据虚拟化是一种允许用户访问、管理和优化异构基础架构的方法,就好像它们是一种单一、且在逻辑上是统一的资源一样。这使得用户能够从一些服务、功能或其他资源的内部部署中对外部界面进行抽象化。

  与支持逻辑上统一的访问、查询、报告、预测分析,以及针对关系型、Hadoop、NoSQL等不同后端数据库应用的任何“SQL-虚拟化”解决方法相同,数据虚拟化的核心是抽象层。

  当然,数据虚拟化可能会转而依靠其他的基础设施虚拟化层,例如存储与服务器平台。在某些情况下,数据虚拟化可能会在地理上和多云环境中进行扩张。在众多层中,虚拟化无疑是这些枯燥数据话题的一个缩影。


相关标签 :

在线留言

  • 留言标题 *

  • 留言内容 *

  • 姓名 *

  • 手机号码 *




上一篇:中兴通讯:虚拟化网络转型是5G必经之路

下一篇:欧盟发布《通用数据保护条例》 应该如何应对

相关文章:
cache
Processed in 0.009476 Second.