GNU/Linux >> Tutoriales Linux >  >> Cent OS

¿Qué es una base de datos?

Introducción

Las bases de datos son la columna vertebral de todos los sistemas de información modernos. Dado que las computadoras almacenan bases de datos contemporáneas, los datos pueden ser de cualquier tamaño y complejidad. Hay muchas formas de recopilar y organizar datos según el uso y el tipo de datos.

Este artículo ofrece una descripción completa de las bases de datos y los sistemas de bases de datos.

Definición de base de datos

Una base de datos es un conjunto organizado de datos lógicamente conectados. La información se transforma en conocimiento útil, estructurado y mantenido para adaptarse a las necesidades del usuario. Además de almacenar los datos en sí, una base de datos también mantiene las relaciones entre los puntos de datos.

En un sentido más amplio, una base de datos es un conjunto integrado de información sobre un sistema y los procedimientos de mantenimiento y uso. A diferencia de las hojas de cálculo, varios usuarios y aplicaciones acceden al almacenamiento a la vez.

¿Para qué se utilizan las bases de datos?

Las bases de datos tienen un amplio espectro de aplicaciones. Los ejemplos típicos incluyen:

  • Sistemas bancarios mantener bases de datos de clientes, cuentas bancarias, créditos, transacciones, etc.
  • Tráfico aéreo mantiene la información sobre vuelos, reservas de billetes y similares. Las compañías aéreas son el primer sector en utilizar bases de datos distribuidas geográficamente.
  • Universidades use bases de datos para registrar información sobre estudiantes, solicitudes, calificaciones, cursos, etc.
  • Transacciones con tarjeta de crédito contienen pestañas sobre los pagos y generan informes mensuales.
  • Empresas de telecomunicaciones almacenar información sobre llamadas, generar facturas mensuales, rastrear la línea de comunicación, etc.
  • El sector financiero rastrea las ventas y compras de instrumentos financieros como bonos y acciones.
  • Comercio y comercio electrónico empresas almacenar datos sobre consumidores, productos y varios catálogos de precios.
  • Negocios de fabricación gestionar cadenas de suministro, líneas de producción, almacenes, generar facturas, etc.
  • Recursos humanos almacena información sobre empleados, cheques de pago, impuestos, beneficios, etc.

La lista anterior muestra cuán cruciales son las bases de datos para cualquier tipo de negocio. Con las interfaces de usuario modernas, el backend está oculto cuando se accede a una base de datos, por lo que muchos usuarios no saben que usan una todos los días.

Una breve historia de las bases de datos

La primera base de datos automatizada se conecta con Herman Hollerith, quien patentó el sistema para el procesamiento automático de datos en 1884. El censo de EE. UU. de 1890 usó el sistema de contador de tarjetas perforadas, y la colección de tarjetas representa el primer sistema de base de datos automatizado.

Cada tarjeta tenía 80 columnas y caracterizaba la información sobre una persona. Por lo general, la información del censo tardaría dos años en procesarse. Sin embargo, el sistema de tarjetas perforadas y el mecanismo automatizado de lectura de tarjetas tardaron solo unas seis semanas en procesar los datos. El sistema de tarjetas perforadas se utilizó a lo largo del siglo XX, especialmente para votar y fichar para trabajar.

Después de la Segunda Guerra Mundial, las empresas y las instituciones gubernamentales comenzaron a usar computadoras para bases de datos contables lineales simples. Las primeras bases de datos informatizadas se usaban para tareas específicas y carecían de flexibilidad.

Bases de datos en la década de 1960

En la década de 1960, las bases de datos de documentos tenían un papel dominante. Los primeros sistemas de gestión de bases de datos aparecieron en esta década y se utilizaron para proyectos grandes y complejos, como el alunizaje del Apolo.

Bases de datos en la década de 1970

Las bases de datos se convierten en una realidad comercial en la década de 1970. Los sistemas jerárquicos y de red para la gestión de datos se introducen principalmente para gestionar estructuras de datos complejas, como cuentas de fábrica, al comprar materias primas.

Esta década incluye los DBMS comerciales de primera generación, y algunos todavía están en uso en la actualidad. Varios inconvenientes son:

  • Los datos fueron difíciles de recuperar. Las empresas usaban programas complejos en la década de 1970 para acceder a datos simples.
  • La limitada independencia de los datos hizo que la información fuera difícil de cambiar y actualizar.
  • Sin base teórica para ningún modelo de base de datos.

Bases de datos en la década de 1980

La década de 1980 aborda los inconvenientes de la década anterior. El modelo de datos relacionales aparece durante la década de 1970, y el DBMS de segunda generación encuentra uso comercial comercial en la década de 1980. Cuando se usa el modelo relacional, todos los datos están en un formato tabular familiar. Un lenguaje de programación relativamente simple (SQL) recupera los datos de la base de datos.

El nuevo modelo de base de datos permitió un acceso más fácil a los datos para personas que no eran programadores, abordando el problema más importante con los modelos anteriores. El modelo relacional era conveniente para la comunicación cliente/servidor, las transferencias de datos en paralelo y una GUI simplificaba el uso.

Bases de datos en la década de 1990

La década de 1990 dio lugar a aplicaciones de Internet y sistemas de almacenamiento de datos. Los datos multimedia (gráficos, sonido, imágenes y videos) se hicieron más comunes. Grandes cantidades de datos estructurados y no estructurados eran estándar. Debido al aumento de la complejidad de los datos, los sistemas de bases de datos relacionales recurrieron al enfoque orientado a objetos.

Bases de datos en la década de 2000

Aparecen tres nuevos tipos de bases de datos:bases de datos XML, NoSQL y NewSQL.

Las bases de datos XML son un tipo basado en documentos altamente estructurado. Se permite realizar consultas a través de atributos XML con distintos grados de flexibilidad.

Las bases de datos NoSQL responden a la fuerte demanda de sistemas de bases de datos distribuidas altamente flexibles, que usan coherencia eventual y no requieren un esquema fijo. El tipo NoSQL es altamente escalable y almacena datos no normalizados.

NewSQL tiene como objetivo combinar los mejores atributos de las bases de datos NoSQL, como la escalabilidad, mientras usa SQL y mantiene el cumplimiento de ACID.

Diferentes tipos de bases de datos

Hay muchos tipos diferentes de bases de datos actualmente disponibles, cada uno con ventajas e inconvenientes. Cada tipo de base de datos crea un entorno específico para el almacenamiento de datos y la relación entre la información.

  • Las bases de datos relacionales almacenan datos en estructuras similares a tablas como filas y columnas con un enfoque en la consistencia de los datos. Este tipo de base de datos se centra en las relaciones entre los datos y es el tipo de base de datos más utilizado.
  • Las bases de datos orientadas a objetos combinan los principios de la programación orientada a objetos (POO) con los estándares de las bases de datos relacionales.
  • Bases de datos distribuidas distribuidas en múltiples sitios y escalables horizontalmente.
  • Los almacenes de datos integran datos de diversas fuentes de forma coherente en un único sistema de apoyo a la toma de decisiones. Los almacenes atienden grandes volúmenes de datos y normalmente residen en servidores de big data.
  • Las bases de datos NoSQL son tipos de bases de datos estructuralmente diversos que se centran en la alta disponibilidad. Los sistemas NoSQL son los más adecuados para grandes volúmenes de datos no estructurados.
  • Las bases de datos de gráficos son un tipo de base de datos NoSQL que se centran en las relaciones entre los puntos de datos. Con una estructura de red topográfica, las bases de datos de gráficos son el mejor sistema para explorar y descubrir relaciones.
  • Las bases de datos OLTP se enfocan en transacciones breves del día a día y admiten una gran base de usuarios con alta integridad de datos y efectividad en consultas simultáneas.
  • Las bases de datos de código abierto están abiertas a modificaciones y son de uso gratuito. Las preferencias personalizables del usuario y el bajo costo hacen que este tipo de base de datos sea ampliamente adoptado.
  • Las bases de datos en la nube tienen todas las funciones de bases de datos tradicionales con la flexibilidad de la computación en la nube.
  • Las bases de datos multimodelo proporcionan un único motor para trabajar con varios tipos de modelos de bases de datos.
  • La base de datos Document/JSON es un sistema de almacenamiento NoSQL que almacena datos en documentos JSON.
  • Las bases de datos en la nube autónomas (bases de datos autónomas) utilizan el aprendizaje automático para automatizar varias tareas en el DBMS.

Componentes de una base de datos

Cinco componentes principales conforman un sistema de base de datos.

Hardware

El hardware abarca los dispositivos físicos que conectan las computadoras con el mundo real. Cuando se trata de bases de datos, servidores, discos de almacenamiento y varios dispositivos de recopilación de datos, incluya el hardware necesario para ejecutar y llenar una base de datos.

Software

El software incluye una amplia gama de programas utilizados para acceder, manipular y controlar las bases de datos. En los niveles inferiores, el software incluye los sistemas operativos en los que residen las bases de datos, la red para la comunicación con las bases de datos y el software para acceder a los datos.

Datos

Los datos son el hecho esencial sobre un elemento o evento que la base de datos puede guardar. Los datos requieren procesamiento para ganar significado y convertirse en información. Además, el procesamiento extrae detalles interesantes de los datos y ayuda en los procedimientos de toma de decisiones.

Procedimientos

Los procedimientos de la base de datos incluyen todas las funciones que operan dentro de un almacenamiento. Ya se trate de copias de seguridad periódicas, generación de informes y otras operaciones diarias, los procedimientos son un conjunto de instrucciones que se ejecutan en el sistema de administración de la base de datos.

Idioma de acceso a la base de datos

El lenguaje de acceso a la base de datos es el lenguaje de programación utilizado para insertar, actualizar, eliminar y modificar datos almacenados en una base de datos. Las bases de datos ejecutan consultas en el lenguaje de acceso a la base de datos directamente.

¿Qué es un Sistema de gestión de base de datos (DBMS)?

Un sistema de administración de bases de datos (DBMS) sirve como interfaz entre el usuario (o las aplicaciones) y la base de datos. El programa permite la comunicación directa con la base de datos, lo que permite la recuperación de datos, actualizaciones, optimización y la gestión general de la información almacenada en la base de datos.

¿Qué es un servidor de base de datos?

Un servidor de base de datos es un servidor dedicado que proporciona servicios a un cliente a través de aplicaciones de base de datos. Una parte del servidor almacena el DBMS, mientras que otra almacena la propia base de datos. Por lo general, los servidores de bases de datos tienen una gran capacidad de almacenamiento y muchas tarjetas de memoria.

¿Por qué son importantes las bases de datos?

Un sistema de base de datos almacena datos esenciales sobre un negocio:los datos, cuando se analizan, se convierten en información valiosa sobre una empresa y ayudan en el proceso de toma de decisiones.

Del mismo modo, una base de datos ayuda a crear un archivo sobre el negocio, lo que hace que una empresa sea más sólida y consciente de hacia dónde se dirige al tomar decisiones. El almacenamiento de datos sobre una interacción ayuda a proporcionar información sobre la información para ayudar a la empresa a desarrollarse aún más y aumentar las ganancias.

Hay muchas ventajas cuando se utiliza un sistema con una base de datos:

  • Independencia entre programas y datos . Separar los metadatos de las aplicaciones que usan datos es un atributo clave. La característica principal de la base de datos es la capacidad de cambiar y transferir los datos de una organización a un sistema informático diferente sin cambiar los programas que procesan la información.
  • Redundancia de datos mínima . Las bases de datos abordan el desafío de la repetición de datos. La información se integra en una estructura lógica y cada dato se repite mínimamente. Sin embargo, las bases de datos no eliminan las redundancias por completo. El sistema permite que un diseñador de bases de datos planifique el alcance de las redundancias según el caso de uso.
  • Intercambio de datos mejorado. Las bases de datos son un recurso de la empresa que utilizan muchos empleados y sectores. Usuarios internos y externos específicos operan la base de datos, y cada persona o grupo tiene vistas especializadas de los datos.
  • Mayor seguridad de datos. Un DBMS tiene funciones administrativas que ayudan a controlar la seguridad de la información confidencial a través de privilegios y roles de usuario.
  • Mayor productividad en el desarrollo de aplicaciones. El desarrollo de nuevas aplicaciones es más rápido gracias a los sistemas de bases de datos. Un programador puede concentrarse en las funciones necesarias para una nueva aplicación sin tener que definir datos. Un DBMS ayuda a automatizar actividades como el diseño y la implementación de una base de datos.

Desafíos comunes de la base de datos

Las bases de datos contienen desafíos, riesgos y gastos al construir el sistema.

El futuro de las bases de datos

La tecnología con mayor impacto potencial para el futuro de las bases de datos son las bases de datos autónomas. El aprendizaje automático ayuda a automatizar por completo el aprovisionamiento, la gestión, el ajuste y las actualizaciones de una base de datos. Además, la automatización ayuda a poner un enfoque más significativo en la seguridad de la base de datos, que es el mayor desafío al que se enfrentarán los sistemas en el futuro.


Cent OS
  1. ¿Qué es la base de datos NoSQL? – Explicación de NoSQL

  2. Tipos de bases de datos NoSQL

  3. ¿Qué es un marco de datos Spark?

  4. ¿Qué es una base de datos relacional?

  5. Base de datos NoSQL distribuida de Elasticsearch:¿qué es y debería usarla?

¿Qué es una base de datos de documentos?

¿Qué es una base de datos OLTP?

¿Qué es la desnormalización de la base de datos?

¿Qué es la normalización de bases de datos?

¿Qué es NewSQL?

¿Qué es una base de datos distribuida y para qué sirven los sistemas de datos distribuidos?

    Capacitación del personal Una empresa que opta por un sistema de base de datos debe reclutar o capacitar a las personas para diseñar, implementar y mantener una base de datos. Debido a la naturaleza en constante cambio, la capacitación continua es necesaria para maximizar la eficiencia de las tecnologías de bases de datos.
    Gastos y complejidades de instalación y gestión Los sistemas de bases de datos multiusuario son arquitecturas de software extensas y complejas, a menudo con costos anuales de soporte técnico y expansiones. Las extensiones de software con mejoras continuas en seguridad son imprescindibles cuando se trabaja con datos.
    Copias de seguridad, recuperación y seguridad Las copias de seguridad regulares aseguran la consistencia de los datos y la alta disponibilidad. Los procedimientos de seguridad claros y la recuperación de la base de datos son necesarios para un sistema de base de datos moderno.
    Conflictos de organización Las bases de datos compartidas requieren consentimiento sobre la definición y la propiedad de los datos. Además, se requiere una persona dedicada para mantener los datos. Por lo tanto, se necesita un administrador de base de datos capaz y roles de acceso significativos.