Apache Cassandra es una base de datos distribuida NoSQL de código abierto que ofrece escalabilidad y alta disponibilidad sin comprometer el rendimiento y en la que confían miles de empresas. La escalabilidad lineal y la tolerancia a fallas comprobada en hardware básico e infraestructura en la nube la convierten en una plataforma ideal para datos de misión crítica. Este tutorial describe cómo instalar Apache Cassandra en un servidor Ubuntu 20.04.
Requisitos previos#
- Un servidor Ubuntu 20.04
- Cree un usuario no root con acceso sudo.
- Para usar cqlsh, la última versión de Python 2.7 o Python 3.6+. Para verificar que tiene instalada la versión correcta de Python, escriba
python --version
Instalar Apache Cassandra#
-
Instalar Java 8
Instale la última versión de Java 8, ya sea Oracle Java Standard Edition 8 u OpenJDK 8.
$ sudo apt install openjdk-8-jdk -y
Para verificar que tiene instalada la versión correcta de Java, escriba
java -version
.$ java -version
La salida puede ser:
openjdk version "1.8.0_222" OpenJDK Runtime Environment (build 1.8.0_222-8u222-b10-1ubuntu1~16.04.1-b10) OpenJDK 64-Bit Server VM (build 25.222-b10, mixed mode)
-
Instale las dependencias requeridas.
$ sudo apt install apt-transport-https gnupg2 -y
-
Descargue y agregue la clave Apache Cassandra GPG.
$ sudo wget -q -O - https://www.apache.org/dist/cassandra/KEYS | sudo apt-key add -
Puede ver el resultado:
% Total % Received % Xferd Average Speed Time Time Time Current Dload Upload Total Spent Left Speed 100 266k 100 266k 0 0 320k 0 --:--:-- --:--:-- --:--:-- 320k OK
-
Agregue el repositorio de Apache Cassandra a su sistema.
$ echo "deb http://www.apache.org/dist/cassandra/debian 40x main" | sudo tee -a /etc/apt/sources.list.d/cassandra.sources.list
-
Actualice el índice del paquete.
$ sudo apt-get update
-
Instale Apache Cassandra.
$ sudo apt-get install cassandra -y
-
Verifique que Apache Cassandra esté instalado.
$ dpkg -l | grep cassandra
-
Verifique que Apache Cassandra se esté ejecutando.
$ sudo systemctl status cassandra
-
Verifique las estadísticas de su nodo.
$ sudo nodetool status
La columna de estado en la salida debe informar UN, que significa "Up/Normal".
Alternativamente, conéctese a la base de datos con:
$ cqlsh
La salida debería verse así:
Connected to Test Cluster at localhost:9042. [cqlsh 5.0.1 | Cassandra 3.8 | CQL spec 3.4.2 | Native protocol v4] Use HELP for help.
Configuración de Apache Cassandra#
La Casandra la ubicación de los archivos de configuración varía según el tipo de instalación:
- tarball:
conf
directorio dentro de la ubicación de instalación de tarball - paquete:
/etc/cassandra
directorio
Dado que estamos instalando usando un paquete, usaremos el /etc/cassandra
directorio.
-
Edite el
cassandra.yaml
archivo.$ sudo nano /etc/cassandra/cassandra.yaml
El archivo es un archivo YAML que contiene la configuración de Apache Cassandra.
El archivo está dividido en secciones. Las secciones están separadas por una línea que comienza con un
#
personaje.Vamos a actualizar el
cluster_name
sección.# cluster_name: The name of the cluster. cluster_name: My First Cluster
El
cluster_name
se utiliza para identificar el clúster. -
Borrar la memoria caché del sistema
$ nodetool flush system
El
flush system
El comando borra la memoria caché del sistema.La memoria caché del sistema se utiliza para almacenar información sobre el clúster. Esta información se utiliza para acelerar el inicio del clúster. El caché del sistema se borra ejecutando
flush system
dominio. Este comando es útil cuando desea iniciar el clúster con una configuración diferente. Por ejemplo, es posible que desee iniciar el clúster con una cantidad diferente de nodos. -
Reinicie el servicio Cassandra.
$ sudo systemctl restart cassandra
El
systemctl
El comando se utiliza para iniciar, detener, reiniciar y habilitar/deshabilitar el servicio. -
Verificar el cambio
$ cqlsh