测试方法:MAC下操作指令:1、创建主题:./kafka-topics.sh --create --topic kafka-study --zookeeper 127.0.0.1:218 ... 查看全文>>
数据倾斜是在大数据计算中常见的问题,用最通俗易懂的话来说,数据倾斜无非就是大量的相同key被partition分配到一个分区里,造成 ... 查看全文>>
【郑州校区】连接池的概述1.1.1 什么是连接池 连接池是装有连接的容器,使用连接的话,可以从连接池中进行获取,使用完成之后将 ... 查看全文>>
这两天学了些数组方面的内容,赶紧整理一下分享出来:数组 概述:一种引用类型 是一种可以用来存储同一种类型数据且长度固定的 ... 查看全文>>
引言Spark 从1.6.x 开始对 JVM 的内存使用作出了一种全新的改变,Spark 1.6.x 以前是基于静态固定的JVM内存使用架构和运行机制, ... 查看全文>>
5. 导入Java依赖[hr]要使用SparkSQL的API,首先要导入Scala,Spark,SparkSQL的依赖:6. Java代码操作DataFrame[hr] 1.Data ... 查看全文>>