嗨，无聊么

我的世界

Docker (5)
Git (5)
IDE (6)
- intellij idea (5)
- vscode (1)
JAVA (10)
Linux (5)
- Shell (1)
Mac (6)
OpenCV (4)
PHP (15)
Python (52)
- anaconda (6)
- numpy (12)
- pandas (3)
- pip (2)
- 爬虫 (4)
Redis (2)
Scala (17)
云计算 (2)
前端 (3)
- css (2)
- js (1)
- React (1)
- Vue (1)
大数据 (53)
- flink (5)
- flume (1)
- hadoop (5)
- hive (12)
- kafka (3)
- oozie (1)
- Presto (2)
- spark (24)
大模型 (2)
广告营销 (3)
数据仓库 (8)
数据库 (3)
数据治理 (5)
- 数据血缘 (3)
数据结构 (17)
机器学习 (10)
- NLP (2)
概率统计 (5)
比特币 (1)
编译工具 (4)
- gradle (3)
- maven (4)
计算机基础 (3)
- 算法 (1)
量化投资 (11)
- 指标 (6)
- 概念 (7)

数据仓库

2023年2月17日

数据仓库主题和主题域划分

数据仓库-主题和主题域-划分

进一步了解

2023年2月15日

指标体系管理系统闲扯下

指标体系在数仓物理实现层面主要是结合数仓模型分层架构进行指导建设，数仓建模的过程很大一部分其实就是在构建指标体系，可以说指标体系的好坏决定了模型了健壮性。构建指标体系需要从“管理、计算、使用”三个角度阐述一下什么样的指标管理方法是“合格的”

进一步了解

数据仓库 / 数据治理
0

2023年2月13日

数据血缘 Data Lineage 基础概念

数据血缘 (Data Lineage) ,又称数据血统、数据起源、数据谱系,是指数据的全生命周期中,数据从产生、处理、加工、融合、流转到最终消亡,数据之间自然形成一种关系。其记录了数据产生的链路关系,这些关系与人类的血缘关系比较相似,所以被成为数据血缘关系。它是数据治理的重要组成部分。

进一步了解

数据血缘 / 数据仓库
0