嗨，无聊么

我的世界

Docker (5)
Git (5)
IDE (6)
- intellij idea (5)
- vscode (1)
JAVA (10)
Linux (5)
- Shell (1)
Mac (6)
OpenCV (4)
PHP (15)
Python (52)
- anaconda (6)
- numpy (12)
- pandas (3)
- pip (2)
- 爬虫 (4)
Redis (2)
Scala (17)
云计算 (2)
前端 (3)
- css (2)
- js (1)
- React (1)
- Vue (1)
大数据 (53)
- flink (5)
- flume (1)
- hadoop (5)
- hive (12)
- kafka (3)
- oozie (1)
- Presto (2)
- spark (24)
大模型 (2)
广告营销 (3)
数据仓库 (8)
数据库 (3)
数据治理 (5)
- 数据血缘 (3)
数据结构 (17)
机器学习 (10)
- NLP (2)
概率统计 (5)
比特币 (1)
编译工具 (4)
- gradle (3)
- maven (4)
计算机基础 (3)
- 算法 (1)
量化投资 (11)
- 指标 (6)
- 概念 (7)

10 月 2021

2021年10月25日

hive tf idf 基于hive sql的方式实现词频-逆文档频率(tf idf)的计算

TF-IDF(Term Freq...

进一步了解

hive
0

2021年10月22日

spark scala 分词利用 ansj jsoup 对带有页面标签的文章分词

场景描述：我们有很多文章需要进行...

进一步了解

spark
0

2021年10月18日

spark mllib 余弦相似度文本相似推荐 scala代码实现

文本相似推荐是推荐系统中最常见的...

进一步了解

spark
0