¿Qué es Apache Hive? El software de almacenamiento de datos Apache Hive facilita la consulta y la gestión de grandes conjuntos de datos que residen en el almacenamiento distribuido. Hive proporciona un mecanismo para proyectar la estructura en estos datos y consultar los datos mediante un lenguaje similar a SQL llamado HiveQL. Leer más en el sitio oficial
Esta guía práctica lo ayudará a instalar Apache Hive en CentOS/RHEL con Hadoop con pasos sencillos.
Paso 1:Instalar JAVA y Hadoop
Apache Hive requería java 6 o una versión posterior. También necesitamos instalar Hadoop primero antes de instalar Apache Hive en nuestro sistema. Use los enlaces a continuación para instalarlos
Pasos para instalar JAVA en CentOS y RHEL 7/6/5
Pasos para instalar Hadoop en Linux
Paso 2:Descarga el archivo de Hive
Después de configurar hadoop con éxito en su sistema Linux. comencemos la configuración de la colmena. Primero descargue el último código fuente de Hive y extraiga el archivo con los siguientes comandos.
# cd /home/hadoop # wget http://archive.apache.org/dist/hive/hive-0.12.0/hive-0.12.0-bin.tar.gz # tar xzf hive-0.12.0-bin.tar.gz # mv hive-0.12.0-bin hive # chown -R hadoop hive
Paso 3:Configuración de variables de entorno
Después de extraer el archivo de almacenamiento de Hive, cambie al usuario de Hadoop y configure las siguientes variables de entorno.
# su - hadoop $ export HADOOP_HOME=/home/hadoop/hadoop $ export HADOOP_PREFIX=/home/hadoop/hadoop $ export HIVE_HOME=/home/hadoop/hive $ export PATH=$HIVE_HOME/bin:$PATH
Paso 4:Inicie Hive
Antes de ejecutar Hive, debemos crear /tmp y /usuario/colmena/almacén y configúrelos chmod g+w en HDFS antes de crear una tabla en Hive. Utilice los siguientes comandos.
$ cd /home/hadoop/hive $ $HADOOP_HOME/bin/hadoop fs -mkdir /tmp $ $HADOOP_HOME/bin/hadoop fs -mkdir /user/hive/warehouse $ $HADOOP_HOME/bin/hadoop fs -chmod g+w /tmp $ $HADOOP_HOME/bin/hadoop fs -chmod g+w /user/hive/warehouse
Comencemos a usar Hive usando el siguiente comando.
$ bin/hive Logging initialized using configuration in jar:file:/home/hadoop/hive/lib/hive-common-0.12.0.jar!/hive-log4j.properties hive>
Paso 5:Crear tabla de demostración y prueba
En esta etapa, ha instalado colmena con éxito. Vamos a crear una tabla de muestra usando el siguiente comando
hive> CREATE TABLE demo1 (id int, name string); OK Time taken: 6.565 seconds
Muestre las tablas creadas con el siguiente comando.
hive> SHOW TABLES; OK demo1 Time taken: 0.231 seconds, Fetched: 1 row(s)
Suelta la tabla usando el siguiente comando.
hive> DROP TABLE demo1; OK Time taken: 2.393 seconds
Obtenga más información sobre las operaciones de SQL en Hive en el sitio oficial de Apache Hive.