首页最新资讯

全部 新闻动态 技术文章 常见问题 技术问答

    • Spark SQL用法建议【大数据文章】

      参数默认false。当设为true,parquet会聚合所有parquet文件的schema,否则是直接读取parquet summary文件,或者在没有parquet summary文件时候随机选择一个文件的schema作为最终的schema。查看全文>>

      技术文章2021-01-14 |黑马程序员 |Spark SQL性能调优,操作Spark SQLt调优
    • Kafka数据是存在磁盘上还是内存上?

      Kafka是一个高吞吐量的分布式发布订阅消息系统,它在实时计算系统中有着非常强大的功能。把topic中一个parition大文件分成多个小文件段,通过多个小文件段,就容易定期清除或删除已经消费完文件,减少磁盘占用。查看全文>>

      技术文章2021-01-12 |黑马程序员 |Kafka,Kafka数据存储
    • Hadoop实现join的几种方法【大数据开发面试】

      Hadoop实现join有三种方法,第一种是reduce side join,它是一种最简单的join方式,其主要思想如下:查看全文>>

      技术文章2021-01-12 |黑马程序员 |实现join,Hadoop,大数据面试题
    • Spark RDD的两种依赖关系?

      在Spark中,不同的RDD之间具有依赖的关系。RDD与它所依赖的RDD的依赖关系有两种类型,分别是窄依赖(narrow dependency)和宽依赖(wide dependency)。查看全文>>

      技术文章2021-01-05 |黑马程序员 |spark RDD,RDD的两种依赖关系
    • 大数据离散流是什么?它的内部结构是怎样的?

      Spark Streaming提供了一个高级抽象的流,即DStream(离散流)。DStream表示连续的数据流,可以通过Kafka、Flume和Kinesis等数据源创建,也可以通过现有DStream的高级操作来创建。查看全文>>

      技术文章2021-01-05 |黑马程序员 |DStream,离散流,DStream是什么
    • CSS3颜色不透明度的设置方法【web前端】

      在CSS3之前,我们设置颜色的方式包含十六进制颜色(如#F00)、rgb模式颜色、或指定颜色的英文名称(如red),但这些方法无法改变颜色的不透明度。在CSS3中新增了两种设置颜色不透明度的方法,一种是使用rgba模式设置,另一种是使用opacity属性设置。下面将详细讲解两种设置方法。查看全文>>

      技术文章2020-12-30 |黑马程序员 |CSS3颜色不透明度设置
和我们在线交谈!