嗨，无聊么

我的世界

Docker (5)
Git (5)
IDE (6)
- intellij idea (5)
- vscode (1)
JAVA (10)
Linux (5)
- Shell (1)
Mac (6)
OpenCV (4)
PHP (15)
Python (52)
- anaconda (6)
- numpy (12)
- pandas (3)
- pip (2)
- 爬虫 (4)
Redis (2)
Scala (17)
云计算 (2)
前端 (3)
- css (2)
- js (1)
- React (1)
- Vue (1)
大数据 (53)
- flink (5)
- flume (1)
- hadoop (5)
- hive (12)
- kafka (3)
- oozie (1)
- Presto (2)
- spark (24)
大模型 (2)
广告营销 (3)
数据仓库 (8)
数据库 (3)
数据治理 (5)
- 数据血缘 (3)
数据结构 (17)
机器学习 (10)
- NLP (2)
概率统计 (5)
比特币 (1)
编译工具 (4)
- gradle (3)
- maven (4)
计算机基础 (3)
- 算法 (1)
量化投资 (11)
- 指标 (6)
- 概念 (7)

大数据

2022年10月25日

spark Accumulator AccumulatorV2 累加器学习随笔

spark Accumulator AccumulatorV2 累加器是Spark的核心数据结构之一 — Spark的三大核心数据结构：RDD、累加器（只写不读）、广播变量（只读不写），累加器在不同的spark版本中有不一样的具体实现逻辑

进一步了解

spark / Scala
0

2022年9月17日

flink wordcount 一步一步学习大数据

flink wordcount 初次看到这两个词的同学可能会有些不明所以，但是一般在大数据研发有过一定深耕或者了解的童鞋会瞬间get到在表达什么意思。大数据的代码研发不论是用什么语言什么工具，在最开始的时候都会有一个经典的代码示例，词数统计。

进一步了解

intellij idea / flink / Mac / Scala
0

2022年8月23日

flink 一步一步学习

flink是一个用于对无界和有界数据流进行有状态计算的框架和分布式处理引擎，被设计在所有常见的集群环境中运行，以内存执行速度和任意规模来执行计算，即它是一个持高吞吐、低延迟、高性能的分布式处理框架。是Apache软件基金会的顶级项目

进一步了解

大数据 / flink
0