关键词

Hive 和 Hue 的区别

Hive和Hue是两个密切相关的工具,都是Hadoop生态系统当中的一部分。但是他们的功能和用途却不一样。接下来我们来分别详细讲解。

Hive

介绍

Hive是一个运行于Hadoop上的数据仓库框架,它可以协助我们以SQL的方式查询、处理和管理大规模的数据集。Hive把Hadoop认为是可扩展、高可用、高性能的数据存储,以及复杂数据处理的平台。 Hive的优势在于处理结构化数据,可以方便的使用SQL语言进行数据的查询和统计。

示例

以下是Hive的一些常用操作示例:

查询数据

查询表所有数据

SELECT * FROM table_name;

按条件查询数据

SELECT * FROM table_name WHERE column_name = 'column_value';

创建表结构

创建表

CREATE TABLE table_name (column_1 data_type, column_2 data_type,…);

创建外部表结构

CREATE EXTERNAL TABLE table_name (column_1 data_type, column_2 data_type,…);

Hue

介绍

Hue是一个开源的Hadoop WEB界面,他的主要作用是让用户能够更加方便直观的使用Hadoop。Hue支持Hadoop所有主要的功能,如Hive、Pig、Hbase、Map-Reduce等等。此外Hue也支持YARN、HDFS、Spark、Solr和Impala以及其他的Hadoop生态系统专业应用。

示例

以下是Hue的一些常用操作示例:

Hive

在Hue上执行HiveQL查询

SELECT * FROM database_name.table_name;

编辑HiveQL查询

-- 导航到hive的查询编辑器
Query Editors -> Hive Editor -> Load Table -> Run Query

HDFS

在Hue上上传和下载文件

1. Login Hue webserver;
2. Navigate to Files;
3. Click on the '+' button to upload or download files.

编辑HDFS上的文件

-- Login Hue webserver
1. Navigate to Files;
2. Select the file you want to edit;
3. Click on the Edit button.

综上所述,Hive主要是用于数据的统计和管理,而Hue更是用于一个集群的管理和监控。Hue提供了强大的架构来管理大规模的Hadoop集群,而Hive则主要是处理数据的查询和统计。

本文链接:http://task.lmcjl.com/news/16380.html

展开阅读全文