Scrapy和Scrapy-Redis是两个Python框架,用于构建网络爬虫。它们之间的主要区别在于数据的调度和存储方式。查看全文>>
E-R图也称为实体-联系图(Entity Relationship Diagram),是一种用图形表示的实体联系模型,由PeterChen于1976年提出。E-R图提供了表示实体型、属性和联系的方法,用来描述现实世界的概念模型。其通用的表示方式如下。查看全文>>
Hive中的回收站是通过HDFS的Trash功能实现,Trash功能可以将HDFS中删除的文件放入回收站目录(默认回收站目录/user/root/.Trash/Current,其中回收站目录中的root会根据当前操作HDFS的用户名而变化),防止用户意外删除文件,出现无法找回的情况。Hive内部表的数据存放在...查看全文>>
CREATE(DATABASE|SCHEMA)表示创建数据库的语句,其中 DATABASE和SCHEMA含义相同,可以切换使用。创建数据库,Hive中创建数据库的语法格式如下。查看全文>>
数据分析师是当今市场上非常热门的职业之一,据预测,在未来几年内,数据分析师的需求量将继续增长。这是由于大量数据的产生以及企业对数据驱动决策的需求不断增加。因此,从长远来看,数据分析师的职业前景非常好。查看全文>>
掌握Python基础语法,掌握代码编写的规范和技巧,Bug调试能力,用Python第三方库做出可视化图表。查看全文>>