这篇文章是关于数据运营的深入探讨,特别强调了在数据使用过程中“找到数据”的重要性。作者详细介绍了数据地图、数据目录和数据资产平台等工具,这些工具的目标是展示数据平台已经加工好的数据,以便有数据需求的人能够轻松地找到并使用这些数据。

找数据对于数据使用这来说,是开启数据使用的第一步,如果连数据都找不到谈何使用。数据地图、数据目录、甚至于数据资产平台等等。其实目标就是一件事情,展示数据平台已经加工好的数据,能够让有数据需求的人,完成使用数据第一步–找数据。

这里的数据地图和数据管理篇中档我们讨论元数据的时候,我们在讨论什么 中介绍的元数据本质是一样的。但是展示形式上可以更加灵活些。或者说一个是面向研发的,一个是面向业务应用的。

在元数据篇中,界面一般按照所属的数据源展示为树状结构。

在数据地图中,一般有一个首页,首页一个搜索框,在搜索列表中,详情页有各个不同的tab。

首页

首页的主要就是一个搜索能力,用户输入想搜索的内容,模糊匹配后显示模糊匹配的列表内容。这里的列表均是表的内容。

如果是增强版本的话,通过这个搜索能够将数据资产的的数据服务API、报表、大屏、甚至文章等等均进行搜索查询。这块可以在资产搜索 中再说明。

详情页面

搜索完之后,点击某一个具体的字段,可以显示搜索的详情。

详情页面其实就是针对表的各个维度的描述,有哪些维度也是随着使用不断深入的。通常我们可以添加的维度有:基本信息、字段  、  数据预览、分区信息、数据稽核、数据血缘、更新信息、加工任务、评价等等。

基本信息

基本信息包括表的英文名称、中文名称、表的描述、创建时间、负责人、等等基本的信息。

以及这个元数据属于什么数据仓库分层,属于什么业务领域的。这些信息是在数据管理篇中2、表层面的规划 中进行的设置。

字段

以列表的形式展示表里面的字段、字段的类型、以及字段的描述信息。其中字段描述信息是否丰富、全面也是数据是否全面的一个重要维度。

数据预览

不需要查询数据,提供一下数据预览能力,把表里面的数据是什么样子,能够更加直观的给数据消费者以用户体验。

这里有一个问题是如果是直接查询数据的话,需要选择查询数据的时候使用的资源。如果是提前保存数据的话,保存的多少,使用什么存储,是否进行更新就需要有一个方案了。

分区信息

如果是大数据存储如HIVE等。如果是分区表,需要列出来分区信息,都有哪些分区字段,最新分区是什么。每个分区是什么时候更新写入数据的。

数据稽核

这个信息其实更多的是一个数据探查的过程,相当于提前把一些字段的特征给总结出来不需要用户手动写SQL进行总结。如果字段的最大值、最小值、平均值。如果是枚举字段的话,有多少个枚举值,每个值数多少。如果数数值类型的话,数值类型的字段分布是什么样的等等,这些信息。

这些信息是一个表的一个计算的结果,就会涉及到一个范围的问题。以及什么时候来进行计算。使用什么资源来进行计算。这些想清楚了,这个功能才能更好的实现。

数据血缘

数据血缘可以理解为是在任务治理篇中的端到端的任务血缘链路 的精简版本,这里仅仅展示表与表之前的上下游关系。用户作为影响分析, 数据溯源。展示形式上仍旧以图的形式进行展示。

更新信息

每个表都需要进行更新,进行字段增加,进行字段类型变更,字段删除等等。这里就可以记录表的整个的变更信息。

加工任务

将对应的加工任务在界面上显示出来,直观的体现是由哪个任务加工生成的此表。

评价

评价的功能就比较灵活了。可以是官方的评价,如数据热度、数据可信度—这个可信度就可以是面向OLAP的数据指标使用 中提到的,如果是统一的指标了,就保证是一致的,添加一个官方标签表明已经是。

也可以是用户为主的,提这张表的意见,新增什么字段、数据准确性怎么样等等信息。从而建立一个信息收集、反馈的渠道。

生成的数据服务

如果是基于表生成的数据服务API,直接显示对应的API,如果是基于SQL的也可以体现下,此表在哪个数据服务API逻辑中。

本文由运营派作者【null】,微信公众号:【数据小吏】,原创/授权 发布于运营派,未经许可,禁止转载。

题图来自 Unsplash,基于 CC0 协议。

登录后参与评论
给作者一些鼓励吧!
等我一分钟 我去找个夸你的句子
这世上美好的东西不多,牛起来要人命的你就是其一!
不要厉害的这么随意,不然我会觉得我又行了
这就很离谱了,老天爷追着喂饭的主儿~
我要是有这才华,我走路都得横着走!
对你的作品崇拜!
反手就是一个推荐,能量满满!
感谢分享
  1. 这篇文章让我收获了很多知识,感谢作者的分享,期待更多优质内容。

  2. 必须评论支持一下!!!

  3. 好希望有一天也能成为博主这样优秀的人。

  4. 努力就好,做真实的自己,不留遗憾。

  5. 搞不清做运营分那么多职位干啥,用户运营、内容运营、渠道运营、新媒体运营、活动运营、用户增长等等。。。都被这各大招聘平台给引导坏了。。。我觉得把,本身做运营就是这些模块都要做的。分工太细反而做的更差,毕竟这是一个系统性的活。 :idea:

    1. 小公司确实都需要做,但是大的组织他们就会细分,是为了更好的进行精细化运营,然后进行组织间得协调配合,最后整合资源做一件事,这样效率反而会更高,不然随着产品体量增加,一个人是搞不定得。

收藏
评论
返回
营销日历12月22日 更多
1981年中华全国台湾同胞联谊会成立
1823年法国昆虫学家法布尔诞辰
1936年苏联著名作家奥斯特洛夫斯基逝世
1992年华夏银行开业
加入圈子
全栈运营交流群
加入
抖音运营交流群
加入
小红书运营交流群
加入
视频号运营交流群
加入