GNU/Linux >> Tutoriales Linux >  >> Ubuntu

Cómo instalar Apache Hive con Hadoop en CentOS, Ubuntu y LinuxMint

¿Qué es Apache Hive? El software de almacenamiento de datos Apache Hive facilita la consulta y la gestión de grandes conjuntos de datos que residen en el almacenamiento distribuido. Hive proporciona un mecanismo para proyectar la estructura en estos datos y consultar los datos mediante un lenguaje similar a SQL llamado HiveQL. Leer más en el sitio oficial

Esta guía práctica lo ayudará a instalar Apache Hive en CentOS/RHEL con Hadoop con pasos sencillos.

Paso 1:Instalar JAVA y Hadoop

Apache Hive requería java 6 o una versión posterior. También necesitamos instalar Hadoop primero antes de instalar Apache Hive en nuestro sistema. Use los enlaces a continuación para instalarlos

Pasos para instalar JAVA en CentOS y RHEL 7/6/5
Pasos para instalar Hadoop en Linux

Paso 2:Descarga el archivo de Hive

Después de configurar hadoop con éxito en su sistema Linux. comencemos la configuración de la colmena. Primero descargue el último código fuente de Hive y extraiga el archivo con los siguientes comandos.

# cd /home/hadoop
# wget http://archive.apache.org/dist/hive/hive-0.12.0/hive-0.12.0-bin.tar.gz
# tar xzf hive-0.12.0-bin.tar.gz
# mv hive-0.12.0-bin hive
# chown -R hadoop hive

Paso 3:Configuración de variables de entorno

Después de extraer el archivo de almacenamiento de Hive, cambie al usuario de Hadoop y configure las siguientes variables de entorno.

# su - hadoop
$ export HADOOP_HOME=/home/hadoop/hadoop
$ export HADOOP_PREFIX=/home/hadoop/hadoop
$ export HIVE_HOME=/home/hadoop/hive
$ export PATH=$HIVE_HOME/bin:$PATH

Paso 4:Inicie Hive

Antes de ejecutar Hive, debemos crear /tmp y /usuario/colmena/almacén y configúrelos chmod g+w en HDFS antes de crear una tabla en Hive. Utilice los siguientes comandos.

$ cd /home/hadoop/hive
$ $HADOOP_HOME/bin/hadoop fs -mkdir /tmp
$ $HADOOP_HOME/bin/hadoop fs -mkdir /user/hive/warehouse
$ $HADOOP_HOME/bin/hadoop fs -chmod g+w /tmp
$ $HADOOP_HOME/bin/hadoop fs -chmod g+w /user/hive/warehouse

Comencemos a usar Hive usando el siguiente comando.

$ bin/hive

Logging initialized using configuration in jar:file:/home/hadoop/hive/lib/hive-common-0.12.0.jar!/hive-log4j.properties
hive>

Paso 5:Crear tabla de demostración y prueba

En esta etapa, ha instalado colmena con éxito. Vamos a crear una tabla de muestra usando el siguiente comando

hive>  CREATE TABLE demo1 (id int, name string);
OK
Time taken: 6.565 seconds

Muestre las tablas creadas con el siguiente comando.

hive> SHOW TABLES;
OK
demo1
Time taken: 0.231 seconds, Fetched: 1 row(s)

Suelta la tabla usando el siguiente comando.

hive> DROP TABLE demo1;
OK
Time taken: 2.393 seconds

Obtenga más información sobre las operaciones de SQL en Hive en el sitio oficial de Apache Hive.


Ubuntu
  1. Cómo instalar el software Ghost Blog con Apache y SSL en Ubuntu 16.04

  2. Cómo instalar Apache Hadoop en CentOS 7, Ubuntu 18.04 y Debian 9

  3. Cómo instalar Apache Maven en Ubuntu 18.04 y 16.04

  4. Cómo instalar Apache Hadoop en Ubuntu 14.04

  5. Cómo instalar Apache Hadoop en Ubuntu 18.04 LTS

Cómo instalar y configurar el módulo mod_pagespeed con Apache en Ubuntu 20.04 LTS

Cómo instalar el software Ghost Blog con Apache y SSL en Ubuntu 15.10

Cómo instalar PrestaShop en Ubuntu 20.04 con Apache

Cómo instalar y configurar Hadoop en Ubuntu 20.04

Cómo instalar Drupal con Apache en Debian y Ubuntu

Cómo instalar Django 3.2 en Ubuntu 20.04 con Apache y WSGI