Apache Cassandra es una de las bases de datos NoSQL más populares. Aunque hay otras versiones de NoSQL disponibles. Pero, ¿por qué Apache Cassandra es popular? echemos un vistazo. Aquí veremos las características y la instalación de Apache Cassandra.
Introducción
Las organizaciones que manejan una gran cantidad de datos no estructurados, lo prefieren. Es una base de datos NoSQL basada en Java. Sin un esquema fijo, Cassandra puede manejar y administrar un volumen de datos realmente enorme. Funciona con el modelo basado en pares, donde cada nodo está conectado a todos los demás nodos. Los nodos tienen permiso de lectura y escritura, por lo que no es necesario un nodo maestro. Puede agregar un sinfín de nodos en el clúster.
Características
1. Arquitectura punto a punto
No hay dependencia del servidor maestro, todos los nodos se tratan por igual aquí. No tiene sentido fallar debido al modelo de servidor y de igual a igual.
2. Alta escalabilidad
Debido al diseño de rendimiento de lectura/escritura. Se agrega un nuevo nodo o máquina, sin interrumpir ninguna aplicación en ejecución ni operaciones en vivo.
3. Tolerancia a fallas
Cada nodo tiene la misma copia de datos. Suponga que hay 5 nodos en el clúster y uno de ellos deja de funcionar, ese nodo defectuoso se puede eliminar rápidamente.
4. Almacenamiento de datos flexible
Puede admitir todo tipo de datos estructurados como formatos de datos semiestructurados, estructurados y no estructurados.
5. Acceso y almacenamiento de datos rápidos
Puede ejecutarse incluso en estructuras de hardware baratas, puede almacenar una gran cantidad de datos sin sacrificar la velocidad del centro de datos.
Instalación
Requisitos previos:
- En esta demostración de instalación, usaremos Rocky Linux.
- Se requieren JAVA y YUM actualizados para realizar la configuración.
Primero actualice el sistema:
# yum update
Instalar JAVA y python
# yum install java-1.8.0-openjdk
Después de ejecutar el comando, verifique qué versión de JAVA instaló.
# java -version
openjdk version "1.8.0_302"
OpenJDK Runtime Environment (build 1.8.0_302-b08)
OpenJDK 64-Bit Server VM (build 25.302-b08, mixed mode)
Ahora, instalemos el repositorio de Cassandra en el servidor.
Cree un nuevo archivo de repositorio para Cassandra, modifíquelo de la siguiente manera.
$ sudo vim /etc/yum.repos.d/cassandra.repo
[cassandra]
name=Apache Cassandra
baseurl=https://downloads.apache.org/cassandra/redhat/40x/
gpgcheck=1
repo_gpgcheck=1
gpgkey=https://downloads.apache.org/cassandra/KEYS
Paquete de instalación.
$ sudo yum install cassandra -y
Cambie la configuración requerida para el clúster.
El clúster predeterminado denominado "Clúster de prueba" de forma predeterminada. Necesitas cambiarle el nombre. Todas las configuraciones se almacenan en /etc/cassandra . Todos los datos del clúster se almacenan en /var/lib/cassandra
Cambie el nombre del clúster, cambie a la línea de comandos.
# cqlsh
cqlsh> UPDATE system.local SET cluster_name = 'unixcop Cluster' WHERE KEY = 'local';
# service cassandra restart
Abra cassandra.yaml, cambie el nombre del clúster. Guarde el archivo y salga.
# cd /etc/cassandra/default.conf
Abra el archivo y realice los cambios necesarios.
# vim cassandra.yaml
Reinicie el servicio y aquí vamos.
Conclusión
Hoy, hemos mostrado cómo configurar y cambiar el nombre de la base de datos de Cassandra. Aunque es una de las bases de datos NoSQL más populares, no se adapta a todos los requisitos de bases de datos complicados. Inicialmente, era un proyecto de código abierto, ahora parte del proyecto Apache.