# 大数据技术文档总结 **Repository Path**: jesslee/bigdata ## Basic Information - **Project Name**: 大数据技术文档总结 - **Description**: hadoop spark flink zookeeper hbase - **Primary Language**: Unknown - **License**: MIT - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 1 - **Forks**: 1 - **Created**: 2024-09-15 - **Last Updated**: 2024-11-19 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 大数据技术文档总结 ## 介绍 hadoop spark flink zookeeper hbase ### Spark 1. 《[Spark ML、原理、床头书、调优、Graphx、pyspark、sparkSQL、yarn集群、源码解析等系列专栏目录](https://zhuanlan.zhihu.com/p/679523201)》 ### hadoop 1. [【Hadoop开窍系列1】 Hadoop官网中英文目录清单](https://zhuanlan.zhihu.com/p/710528300) 2. [【Hadoop开窍系列2】Hadoop配置文件core-site.xml参数说明用途](https://zhuanlan.zhihu.com/p/664406632?utm_psn=1751002171163004929) 3. [【Hadoop开窍系列3】Hadoop Capacity Scheduler 调度用法官网权威示例详](https://zhuanlan.zhihu.com/p/660648497?utm_psn=1751001139892703232) 4. [【Hadoop开窍系列4】 Fair Scheduler 公平调度器官方介绍](https://zhuanlan.zhihu.com/p/660667684?utm_psn=1751001548636020736) 5. [【Hadoop开窍系列5】web代理反向代理异同及在大数据hadoop中应用](https://zhuanlan.zhihu.com/p/664406340?utm_psn=1751002534863568898) 6. [【hadoop开窍系列6】HDFS 高可用性(HA)功能以及如何配置和管理](https://zhuanlan.zhihu.com/p/713421133) 7. [【Hadoop开窍系列7】Proxy user 代理用户 - Superusers 超级用户代表其他用户操作](https://zhuanlan.zhihu.com/p/713550355) 8. [【Hadoop开窍系列9】 Hadoop hdfs分布式文件系统架构](https://zhuanlan.zhihu.com/p/713550407) ### flink 1. [SparkML:Flink History Server用法介绍](https://zhuanlan.zhihu.com/p/661007313) 2. [SparkML:Flink System (Built-in) Functions内置函数词典](https://zhuanlan.zhihu.com/p/661361949) 3. [SparkML:FLINK Table/SQL Data Types 数据类型词典](https://zhuanlan.zhihu.com/p/661355068) 4. [SparkML:Flink JAR 包的命名中uber、bundle、shade、 SNAPSHOT含义用法示例](https://zhuanlan.zhihu.com/p/661217019) 5. [SparkML:flink log日志管理权威详解](https://zhuanlan.zhihu.com/p/661010926) 6. [SparkML:FLink配置说明权威词典](https://zhuanlan.zhihu.com/p/661008340) ### Hive && iceberg &&数仓 1. [【数仓系列】ods cdm(dwd dws dim) ads分层定义原理特点作用区别详解](https://zhuanlan.zhihu.com/p/697796564) 2. [【数仓系列】数仓分层、表的概念分类更新频率、建模方法、实时数仓问题总结](https://zhuanlan.zhihu.com/p/717233574) 3. [Hive配置文件hive-site.xml中参数说明和用法](https://zhuanlan.zhihu.com/p/664407010) 4. [Hive中窗口函数的定义分类适用场景示例难点权威详解](https://zhuanlan.zhihu.com/p/666042911) 5. [Hive 函数大全(吐血整理)_hive函数-CSDN博客](https://link.zhihu.com/?target=https%3A//blog.csdn.net/GodSuzzZ/article/details/106793445) 6. [一键启动、停止、查看Hive的metastore和hiveserver2两个服务的脚本](https://zhuanlan.zhihu.com/p/660789537) 7. [【Hive sql床头书系列】Hive DML用法示例权威说明](https://zhuanlan.zhihu.com/p/709859049) 8. [Apache Iceberg教程简介](https://zhuanlan.zhihu.com/p/660791691) 9. [Apache Iceberg Tables教程1-分支和标签](https://zhuanlan.zhihu.com/p/660799153) 10. [Apache Iceberg Tables教程2-表配置](https://zhuanlan.zhihu.com/p/660800742) 11. [Apache Iceberg Tables教程3-Evolution](https://zhuanlan.zhihu.com/p/660803750) 12. [Apache Iceberg Tables中文教程4-维护Maintenance](https://zhuanlan.zhihu.com/p/660811207) ### zookeeper 1. [一键启动、停止、查看状态zookeeper集群脚本](https://zhuanlan.zhihu.com/p/660790006) ### Hbase 1. [【Hbase开窍系列1】Hbase官网中英文目录](https://zhuanlan.zhihu.com/p/710534231) 2. [【Hbase开窍系列2】初次使用HBase的步骤--hbase shell增删查demo](https://zhuanlan.zhihu.com/p/710533222) 3. [【Hbase开窍系列3】mysql hbase索引异同总结](https://zhuanlan.zhihu.com/p/717190204) ### kafka 1. [【kafka系列】Kafka经典论文: a Distributed Messaging System for Log Processing](https://zhuanlan.zhihu.com/p/730976695)