GNU/Linux >> Tutoriales Linux > >> Ubuntu

Cómo instalar Apache Kafka en Ubuntu 20.04

Ubuntu 20.04 es un sistema operativo robusto que es la base para implementar muchas infraestructuras complejas, como la transmisión fluida y el procesamiento rápido y eficiente de flujos de datos. Hoy aprenderá cómo implementar uno porque en esta publicación aprenderá cómo instalar Apache Kafka en Ubuntu 20.04.

El software Apache Kafka es una aplicación multiplataforma de código abierto desarrollada por Apache Software Foundation y especializada en el procesamiento de transmisiones. Le permite publicar, almacenar, procesar y suscribirse a flujos de registro en tiempo real. Está diseñado para manejar flujos de datos de varias fuentes y distribuirlos a varios usuarios.

Apache Kafka es la alternativa a un sistema de mensajería empresarial tradicional. Empezó como un sistema interno que LinkedIn desarrolló para gestionar 1400 millones de mensajes al día.

Esta plataforma ha comenzado a ganar popularidad gracias a que grandes empresas como Netflix y Microsoft la utilizan en sus arquitecturas. Kafka está escrito en Java y Scala, por lo que debe estar presente en el sistema para ejecutarse.

Instalar Apache Kafka en Ubuntu 20.04

Apache Kafka está construido con Java, por lo que debemos instalarlo antes de continuar con cualquier paso.

Entonces, abra una terminal o conéctese a su servidor a través de SSH y actualice Ubuntu

sudo apt update

sudo apt upgrade

Ahora instale Java en Ubuntu.

sudo apt install default-jdk default-jre

El siguiente paso es agregar un nuevo usuario al sistema para que Kafka pueda ser administrado por él.

sudo adduser kafka

El usuario que creaste debe agregarse a sudo grupo para que tenga permisos suficientes para ejecutar el programa.

sudo adduser kafka sudo

Ahora que el kafka el usuario está creado y listo, puede iniciar sesión usando el su comando

su -l kafka

Descargando e instalando Apache Kafka

Cree una nueva carpeta para descargar el programa. Lo llamaré kafka pero puedes elegir otro nombre.

mkdir kafka

Ahora acceda a él y desde allí con la ayuda de wget comando, puede descargar la última versión estable del programa.

cd kafka
wget https://downloads.apache.org/kafka/2.7.0/kafka_2.13-2.7.0.tgz

Salida de muestra:

--2021-04-15 23:13:07--  https://downloads.apache.org/kafka/2.7.0/kafka_2.13-2.7.0.tgz
Resolving downloads.apache.org (downloads.apache.org)... 2a01:4f8:10a:201a::2, 88.99.95.219
Connecting to downloads.apache.org (downloads.apache.org)|2a01:4f8:10a:201a::2|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: 68583422 (65M) [application/x-gzip]
Saving to: ‘kafka_2.13-2.7.0.tgz’

kafka_2.13-2.7.0.tgz                       100%[=====================================================================================>]  65.41M  3.08MB/s    in 20s     

2021-04-15 23:13:27 (3.21 MB/s) - ‘kafka_2.13-2.7.0.tgz’ saved [68583422/68583422]

Después de eso, descomprímalo usando el comando tar .

tar -xvzf kafka_2.13-2.7.0.tgz --strip 1

Ahora tenemos el binario correctamente en el sistema. Así que tendremos que hacer alguna configuración antes de poder usarlo.

Configurar Apache Kafka antes de usarlo

De forma predeterminada, Apache Kafka no le permitirá eliminar un tema. En este caos, un tema puede ser una categoría, un grupo o un nombre de fuente que se puede publicar en un mensaje. Así que es una buena idea cambiar esto.

Para hacer esto, abra el server.properties archivo dentro de config carpeta

nano config/server.properties

Y busque el delete.topic.enable directiva y configúrelo en true .

delete.topic.enable = true

En este mismo archivo, puede cambiar la carpeta donde Apache Kafka guarda los registros que se generan.

log.dirs=/home/kafka/logs

En este caso, la carpeta de registros debe estar en el mismo directorio que el directorio de inicio.

Otra configuración que tenemos que hacer es crear un servicio para administrar Kafka como si fuera un servicio del sistema. Esto hará que sea más fácil iniciarlo, detenerlo y verificar su estado.

Sin embargo, tenemos que empezar con Zookeeper que es un servicio con el que Kafka administra las configuraciones y el estado del clúster.

Para hacer esto, cree un nuevo archivo para Zookeeper en el directorio donde están alojados los servicios.

sudo nano /etc/systemd/system/zookeeper.service

Y agrega lo siguiente

[Unit]
Requires=network.target remote-fs.target
After=network.target remote-fs.target

[Service]
Type=simple
User=kafka
ExecStart=/home/kafka/kafka/bin/zookeeper-server-start.sh /home/kafka/kafka/config/zookeeper.properties
ExecStop=/home/kafka/kafka/bin/zookeeper-server-stop.sh
Restart=on-abnormal

[Install]
WantedBy=multi-user.target

Guarde los cambios y cierre el editor.

Ahora haz lo mismo con kafka.

sudo nano /etc/systemd/system/kafka.service

Y agrega lo siguiente:

[Unit]
Requires=zookeeper.service
After=zookeeper.service

[Service]
Type=simple
User=kafka
ExecStart=/bin/sh -c '/home/kafka/kafka/bin/kafka-server-start.sh /home/kafka/kafka/config/server.properties > /home/kafka/kafka/kafka.log 2>&1'
ExecStop=/home/kafka/kafka/bin/kafka-server-stop.sh
Restart=on-abnormal

[Install]
WantedBy=multi-user.target

De nuevo, guarde los cambios y cierre el editor.

Para aplicar los cambios, simplemente actualice la lista de demonios del sistema.

sudo systemctl daemon-reload

E inicie los servicios Kafka y Zookeeper.

sudo systemctl start kafka
sudo systemctl enable kafka
sudo systemctl enable zookeeper
sudo systemctl start zookeeper

Esto completará la instalación.

Conclusión

Apache Kafka es una solución profesional de código abierto para grandes empresas que necesitan una transmisión de datos efectiva. Ser de código abierto nos da una referencia de lo poderoso y manejable que es.

Entonces, comparte esta publicación y déjanos un comentario.

Sitio web de Kafka

Cómo instalar Flatpak en Ubuntu 20.04/18.04

¿Cómo instalar Apache Tomcat en Ubuntu 20.04?

Ubuntu

Cómo instalar Apache Tomcat 10 en Ubuntu 20.04

Cómo instalar Apache Kafka en Ubuntu 18.04 y 16.04

Cómo instalar Apache Solr 8.9 en Ubuntu 20.04

Cómo instalar Apache Kafka en Ubuntu 16.04 LTS

Cómo instalar Apache Kafka en Ubuntu 20.04 LTS

Cómo instalar Apache en Ubuntu 20.04