快捷搜索:  

晓说企业数据治理二:识别数据题目

"晓说企业数据治理二:识别数据题目,这篇新闻报道详尽,内容丰富,非常值得一读。 这篇报道的内容很有深度,让人看了之后有很多的感悟。 作者对于这个话题做了深入的调查和研究,呈现了很多有价值的信息。 " 账号设置我的关注我的收藏申请的报道退出登录登录搜索36氪Auto数字时氪将来消费智能涌现将来城市启动Power on36氪出海36氪研究院潮生TIDE36氪企服点评36氪财经(Finance)职场bonus36碳后浪研究所暗涌Waves硬氪媒体品牌企业号企服点评36Kr研究院36Kr创新咨询企业服务核心服务城市之窗行政部门服务创投发布LP源计划VClubVClub投资机构库投资机构职位推介投资人认证投资人服务寻求报道36氪Pro创投氪堂企业入驻创业者服务创投平台 首页快讯资讯推荐财经(Finance)科技(Technology)企服城市最新创投汽车(Car)AI创新直播视频专题活动搜索寻求报道我要入驻城市合作晓谈企业数据管理二:识别数据问题王建峰·2024-04-01 16:57关注要踏上有效数据管理之旅,识别数据问题并对其进行(Carry Out)分类非常重要。

介绍

在上一篇文章中我们(We)讨论(Discuss)了不同类型的企业数据。这里我主要讲一下数据的识别、分类和量化问题。我们(We)将看到数据问题的不同分类、衡量数据质量的参数和分析数据源的参数。

数据问题分类

组织的数据可能存在不同的问题,这些问题会影响充分利用(Use)数据促进组织发展的能力。然而,识别和分类数据问题变得困难。要踏上有效数据管理之旅,识别数据问题并对其进行(Carry Out)分类非常重要。一般来说,数据问题可以分为四类:

数据孤岛:当部门/职能/应用程序的数据可能信息收集被隔离并且无法在整个组织中访问时,就会发生这种情况。

发生这种情况的原因有多种,例如组织结构、将每个部门视为独立的文化(Culture)、缺乏通用技术等。

数据治理:简单地说,数据治理的目标是为组织中的不同人员和团队提供最少且足够的数据访问权限,以开展业务。它是为了确保整个企业内数据的有保障和安危的可用性。

由于缺乏数据领导力和对其重要性的理解,组织中可能会发生数据治理问题,例如数据无法提供给正确的人员、未经授权的访问、数据泄露等。

数据不一致:当业务流程的相同属性可能实体存在不同值时,就会发生数据不一致。发生这种情况的原因可能是缺乏数据协调、数据集成可能流程重叠技术实施。

低效的数据处理流程:一般来说,随着业务的增长,较大的组织会出现这种情况,流程会变得更加复杂。尽管使用了最好的技术和工具,但这仍会导致数据处理效率低下。

在大多数情况下,数据管理问题是这些数据问题的各种组合。这些数据问题并不像上面定义的那样明显。例如,由于缺乏数据治理,可能会出现数据不一致的问题;未经培训和授权更新值的人也能做到这一点。可能者,由于数据处理效率低下,可能会产生数据孤岛;当作为业务扩展的一部分引入新流程并且数据集成处理不当时,就会产生数据孤岛。无数的场景可能会在数据管理中产生各种问题。通过正确的理解和分析,可以找出这些问题的根本原因。

衡量数据质量

人们总是需要衡量所拥有的数据的质量。它对于了解数据管理流程的当前状态和改进范围发挥着重要作用。

数据质量可以根据以下客观标准来衡量:1. 准确性2. 一致性3. 完整性4. 一致性5. 及时性

准确性:它是指为对象存储的数据值的正确程度。为了获得 100% 的准确性,数据值必须是正确的值且形式明确。

一致性:意味着所有系统的数据反映相同的信息,并且在整个企业内相互同步。

完整性:是指期望从数据中获得所需信息的全面程度。完整性是强制性属性的衡量标准,并且独立于可选数据。

遵从性:指数据遵守数据类型、大小和格式等标准化数据定义的程度。例如,在整个组织中,日期的格式为“mm/dd/yyyy”

及时性:指信息在预期和需要时是否可用。数据的及时性非常重要。例如,延迟获取低于阈值水平的库存信息可能会扰乱您的供应链运营。

数据质量的衡量和改进需要时间和资源。因此,分析以下三个标准的数据对于获得高投资回报率也非常重要。1. 相关性2. 理解性3. 客观性

相关性:正在分析的数据应与预期的业务目的相关。它还应该与您的分析目标直接相关。

理解性:数据的格式应该能够被业务理解以供进一步利用(Use)。如果销售数据正确、完整、一致,但不能提供企业高管所需要的信息,那就没有任何用处。

客观性:与数据来源的可靠性和数据收集方法有关。它衡量通过数据收集方法获得相同结果(Result)的能力,无论确定数据的介质如何。一个现实世界的例子是一个标准化模板,用于接收客户体验评级,而不是让一个人向客户提出主观问题。

数据来源分析

一旦我们(We)能够识别数据问题并对不同参数的数据进行(Carry Out)分类和量化,我们(We)就需要定义和设计一种数据管理解决方案。为此,每个数据源都会根据以下参数进行(Carry Out)分析:

数据量:指每个数据源产生的数据量。

生成率:指生成数据的速率。有些数据可能每天都会生成,而在某些情况下,数据可能会以 24x7 连续流的形式传入。

准确性:指数据的质量。它有助于估计清理数据以便能够使用数据所需的工作量。

多样性:指数据的格式。必须考虑数据的格式,是结构化、半结构化还是非结构化,因为它直接影响处理数据所需的能力。

所有这些因素都有助于正确设计数据基础设施以满足数据处理的需求。通过对数据源的上述参数的正确理解,可以获得有关数据库大小、数据湖需求、大数据基础设施、NoSQL 数据库、实时数据消耗等不同问题的答案。

通过逐步客观的方法,我们(We)可以识别、分类和量化我们(We)的数据问题。根据我们(We)的分析,我们(We)可以利用(Use)现有的技术能力来解决这些问题,为任何规模的企业构建强大、可扩展且灵活的数据管理解决方案。市场上有多种解决方案可以执行相同可能相似的活动,但是,每种解决方案都有自己的优点和缺点,这些优点和缺点在实施的初始阶段可能并不明显。随着时间的推移,当数据量增加时,次优解决方案开始显示出工作量增加和效率降低的迹象。设计和定义能够解决组织和行业当前数据流程、需求、痛点和将来目标的数据策略非常重要。

本文来自微信公众号“数据驱动智能”(ID:Data_0101),作者:晓晓,36氪经授权发布。

该文观点仅代表作者本人,36氪平台仅提供信息存储空间服务。

+11

好文章,需要你的鼓励

王建峰特邀作者0收  藏+10评  论打开微信“扫一扫”,打开网页后点击屏幕右上角分享按钮微  博沉浸阅读返回顶部参与评论评论千万条,友善第一条登录后参与讨论(Discuss)提交评论0/1000你可能也喜欢这些文章数字化浪潮下的采购与支出管理正在发生新一轮革命确保数字化转型成功(Success)的三种方法祖国供应链数字化行业研究报告国外客商数据清洗示例原腾讯云VP创办「矩阵起源」,打造超融合异构数据库|早期项目我国数据局局长刘烈宏:围绕优化数据要素市场化配置重点推进五方面工作还不知道如何做数字化转型吗?认真读完这100个经典问答就够了(一)衍因科技(Technology)完成数千万元天使轮融资,打造祖国领先的生物医药数字化科研协作平台AI数字人“搅局”直播电商最新文章推荐视频号,要站出来养家了卷出天际的新茶饮,茶百道IPO再闯关AIGC时代,新闻(News)不存在了?上山采东北稀有特产,能赚多少钱?新相机加价不加量,理光靠“颜值正义”还能走多久?产业带计划|祖国新能源,迈向更有想象力的智能化将来「当代打工人(Worker)」投资理财生存指南漩涡中的小林制药:去年纯利润近10亿元,曾是祖国消费者必买品从万元私董会到滥用AI,抖音(Tik Tok)封杀“割韭菜”内容纸箱设备大王,投出一个高科技(Technology)军团王建峰特邀作者

作者有点忙,还没写简介

发表文章166篇最近内容晓谈企业数据管理二:识别数据问题1小时前国外客商数据清洗示例2024-03-27数据所有权和数据管理的关系2024-03-25阅读更多内容,狠戳这里下一篇京东、永辉超市「分手」在即,新零售回归慢生意

新零售变革必须回归零售的基本规律

1小时前

热门标签暖脚宝陈丽云bn赵燕菁铁蛋白阿春信息安危技术最低工资规定李正茂小说家滋源胡兴国法兰琳卡基金排行榜黄辉李鹏杰蓝兔猴票祖国第一套邮票黄永玉考研奶奶辟谣联盟鬼怪ost王瑞淇孙博抗血清土楼妈祖社区卫生服务伶鼬关于36氪城市合作寻求报道我要入驻投资者关系商务合作关于我们(We)联系我们(We)加入我们(We)网站谣言信息举报入口热门推荐热门资讯热门产品文章标签快讯标签合作伙伴阿里云火山引擎高德个推星球日报(Daily)鲸准氪空间富途牛牛企服点评人人都是产品经理领氪36氪APP下载iOS Android36氪本站由 阿里云 提供计算与安危服务 违法和不良信息、未成年人保护举报电话:010-89650707 举报邮箱:jubao@36kr.com 网上有害信息举报© 2011~2024 首都多氪信息科技(Technology)有限公司 | 京ICP备12031756号-6 | 京ICP证150143号 | 京公网安备11010502036099号意见反馈36氪APP让一部分人先看到将来36氪鲸准氪空间

推送和解读前沿、有料的科技(Technology)创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业

晓谈企业数据管理二:识别数据问题

您可能还会对下面的文章感兴趣:

赞(701) 踩(41) 阅读数(1019) 最新评论 查看所有评论
加载中......
发表评论