数据库

注册

 

发新话题 回复该主题

数据质量管理,是数据价值的生命线 [复制链接]

1#
山东治疗白癜风的医院 http://finance.sina.com.cn/chanjing/b/20090930/09073071708.shtml

随着组织不断发展壮大,组织内部数据量剧增,数据系统存在大量无效冗余旧数据,错误数据,残缺数据的情况,影响后续数据处理分析,使管理层决策失误。问题数据频繁出现的背后,是组织数据质量管理不善导致的。

免费获取更多信息,点击了解更多

数据质量是数据的生命线,没有高质量的数据,一切数据分析、数据挖掘、数据应用基于错误数据,数据价值会大打折扣,甚至出现完全错误的结论,浪费组织大量时间和精力,得不偿失。

本篇文章,小亿就带大家系统了解组织数据质量管理的概念、4种常见低数据质量情况、3大影响因素、6大评价维度以及实施落地6大步骤。

—01—

什么是数据质量管理

1.数据质量的概念

既然要进行数据质量管理,我们首先要理解,什么是数据质量。

数据质量,指的是在组织业务,管理要求下,符合数据使用者满足业务,管理需求的评价方式。

注意,数据质量是一种评价方式,就像我们评价一个电脑是否优质,要看外观,材质,工作性能等。

对于组织来说,只要对业务管理有价值的数据,都是高质量的数据。比如一个超市的销售数据,管理者知道某种产品大卖,开始增加库存,产生更多业绩。

这个销售数据辅助管理者决策,让超市盈利更多,对组织业务和管理有价值,于是属于质量高的数据。

同理,如果一些数据不能满足某些组织的业务和管理需求,这就是质量低的数据。

比如一家公司邀请用户填写调查问卷,但问卷答案是用户乱填的,这些错误数据无法反映用户,市场真实意图,对企业了解市场没什么益处,还会导致管理者做出错误决策,这就属于质量低的数据。

2.数据质量管理的概念

我们明白数据质量的概念,知道高质量数据是发挥数据价值的基础,企业需要对数据质量管理有足够重视。

什么是数据质量管理呢?根据国际数据治理协会DAMA官方定义,数据质量管理是对数据从计划、获取、共享、维护、应用、消亡生命周期的每个阶段里可能引发的各类数据质量问题,进行识别、度量、监控、预警等一系列管理活动,并通过改善和提高组织的管理水平使得数据质量获得进一步提高。

数据质量管理是循环管理过程,其终极目标是通过可靠的数据提升数据在使用中的价值,并最终为企业赢得经济效益。

简单理解,我们就是要对数据进行清洗,整理,分类,监控等一系列管理,提高数据的质量,减少数据库里面的无效数据,旧数据,残缺数据,错误数据等情况。

3.4种常见低质量数据情况

在组织数据库中,主要有4种常见低质量数据情况,分别是重要数据缺失,数据异常,数据不一致,数据重复或错误,它们是拉低数据库数据质量的元凶。

(1)重要数据缺失

第一种情况是数据缺失,它指的是一些表格,业务中,缺少的一些重要数据未被填充。

比如在CRM系统中,很多客户的手机号信息没有被获取,企业无法用短信电话触发用户,实现营销效果,导致整个CRM数据质量不高。

缺失数据产生原因主要有3个:

①有些信息暂时无法获取,或者获取信息的代价太大。比如用户的手机号信息,身份证,银行卡信息,暂时无法获取

②信息在采集输入中遗漏。比如系统故障,导致大量数据无法输入

③属性值不存在。比如CRM系统中,需要填写用户的

分享 转发
TOP
发新话题 回复该主题