嗨，无聊么

我的世界

Docker (5)
Git (5)
IDE (6)
- intellij idea (5)
- vscode (1)
JAVA (10)
Linux (5)
- Shell (1)
Mac (6)
OpenCV (4)
PHP (15)
Python (52)
- anaconda (6)
- numpy (12)
- pandas (3)
- pip (2)
- 爬虫 (4)
Redis (2)
Scala (17)
云计算 (2)
前端 (3)
- css (2)
- js (1)
- React (1)
- Vue (1)
大数据 (53)
- flink (5)
- flume (1)
- hadoop (5)
- hive (12)
- kafka (3)
- oozie (1)
- Presto (2)
- spark (24)
大模型 (2)
广告营销 (3)
数据仓库 (8)
数据库 (3)
数据治理 (5)
- 数据血缘 (3)
数据结构 (17)
机器学习 (10)
- NLP (2)
概率统计 (5)
比特币 (1)
编译工具 (4)
- gradle (3)
- maven (4)
计算机基础 (3)
- 算法 (1)
量化投资 (11)
- 指标 (6)
- 概念 (7)

大数据

2023年2月20日

Hadoop HA 基本认知

Hadoop HA（High A...

进一步了解

hadoop / 大数据
0

2023年2月13日

数据血缘 Data Lineage 基础概念

数据血缘 (Data Lineage) ,又称数据血统、数据起源、数据谱系,是指数据的全生命周期中,数据从产生、处理、加工、融合、流转到最终消亡,数据之间自然形成一种关系。其记录了数据产生的链路关系,这些关系与人类的血缘关系比较相似,所以被成为数据血缘关系。它是数据治理的重要组成部分。

进一步了解

数据血缘 / 数据仓库
0

2023年2月13日

数据治理 Data Governance 基础概念

数据架构、数据标准、数据质量、主数据管理、元数据管理、数据安全、数据生命周期、数据基础平台、数据应用、数据需求与规划、外部数据采购、数据运维等；数据治理的6个基本原则：职责、策略、采购、绩效、符合和人员行为；数据管理组织的构成分为三个层次，自上而下划分为决策层、管理协调层以及执行层。

进一步了解

数据治理 / 大数据 / 数据仓库
0