1.1 y 1.2 : Historia y Contexto de las Bases de Datos Distribuidas (BDD)

Perro Informático y Fachero.

Unidad I. Fundamentos de BDD.

1.1 Historia de las Bases de Datos Distribuidas.

En 1970, Edgar Frank Codd escribió un artículo con nombre “Un modelo relacional para grandes bancos de datos compartidos”. Con este artículo, definió el modelo de BD relacionales y reglas para poder evaluar un administrador de bases de datos relacionales.

Impulsaron la creación de almacenamiento distribuido, los cuales hoy en día proveen características indispensables en el manejo de información; es decir, la combinación de las redes de comunicación y las bases de datos.

Hay varios factores que han hecho que las bases de datos evolucionen a bases de datos distribuidas: los usuarios como parte de organizaciones mas complejas han demandado una serie de capacidades y por otro lado, la tecnología ha hecho posible que muchas facilidades sean realidad.


La presión de los usuarios:

Fase 1: La idea original era que todos lo s accesos a datos podrían ser integrados en un solo lugar usando herramientas de BD tales como lenguajes de programación, manipulación, etc. Bajo este esquema centralizado “los propietarios” perdieron el control de su información ya que no se almacenaba en lugares de trabajo.

Fase 2: Se promovió la descentralización de los sistemas de BD corporativos; se empezaron a adquirir sistemas de software y hardware departamentales.  Este enfoque presentaba buenos resultados hasta que se presentaron problemas de consistencia de la información entre los sistemas locales y centrales, así como transferir la información entre departamentos.

Fase 3 (la cual no sea concluido): se ha tratado de formalizar la descentralización de las bases de datos y de sus funciones manteniendo la integridad de la información y quizá algún tipo de control centralizado o distribuido.

La presión de la tecnología:

Es mucho mejor distribuir los accesos a la información sobre diferentes canales que concentrarlos en uno solo. Las computadoras empezaron a trabajar a velocidades razonables.



1.2 Contexto de las Bases de Datos Distribuidas.

Una BDD es un objeto virtual; es un conjunto de múltiples bases de datos las cuales  se encuentran distribuidas en diferentes sitios interconectados por una red de comunicaciones.

Un SBDD es un sistema en el cual múltiples sitios de bases de datos están ligados por un sistema de comunicaciones, de tal forma que un usuario en cualquier sitio puede acceder a los datos en cualquier parte de la red exactamente como si  los datos estuvieran almacenados en un su sitio propio.


Características.
  • Se usa para crear, recuperar, actualizar y eliminar bases de datos distribuidas.
  • Sincroniza la base de datos periódicamente y proporciona mecanismos de acceso en virtud de los cuales la distribución se vuelve transparente para los usuarios.
  • Asegura que los datos modificados en cualquier sitio se actualicen universalmente.
  • Se utiliza en áreas de aplicación donde numerosos usuarios procesan y acceden grandes volúmenes de datos simultáneamente.
  • Está diseñado para plataformas de bases de datos heterogéneas.
  • Mantiene la confidencialidad y la integridad de los datos de las bases de datos.

Ventajas de las BDD
1.- Compartir información y control  sobre los datos.
2.- Disponibilidad de la información.
3.- Permite romper barreras geográficas.
4.- Modularidad, se pueden modificar, agregar o quitar sistemas de bases de datos distribuidas sin afectar  a los demás sistemas (módulos).
5.- Un fallo en una parte del sistema solo afectara  a u n fragmento, en lugar de a toda la base de datos.

Desventajas de las BDD
1.- Disponibilidad y dependencia total de la red de comunicaciones.
2.- Seguridad de la información.
3.- Costo del desarrollo del software.
4.- Complejidad, se debe asegurar  que la base de datos sea transparente.
5.- Falta de experiencia, las BDD son un campo relativamente nuevo y poco común por lo cual  no existe mucho personal con experiencia o conocimientos adecuados.



         Popularidad.
  • Fiabilidad: crear una infraestructura es similar a invertir: diversifíquese para reducir sus posibilidades de pérdida. Específicamente, si ocurre una falla en un área de la distribución, toda la base de datos no experimenta un retroceso.
  • Seguridad: puede otorgar permisos a secciones individuales de la base de datos general, para una mejor protección interna y externa.
  • Rentable: los precios del ancho de banda disminuyen porque los usuarios acceden a datos remotos con menos frecuencia.
  • Acceso local: al igual que en el punto  1 anterior, si hay una falla en la red general, aún puede obtener acceso a su parte de la base de datos.
  • Crecimiento: si agrega una nueva ubicación a su negocio, es simple crear un nodo adicional dentro de la base de datos, lo que hace que la distribución sea altamente escalable.
  • Velocidad y eficiencia de los recursos: la mayoría de las solicitudes y otras formas de interactividad con la base de datos se realizan a nivel local, lo que también reduce el tráfico remoto.
  • Responsabilidad y contención: debido a que fallas técnicas o fallas ocurren localmente, el problema está contenido y puede ser manejado por el personal de TI designado para manejar esa parte de la empresa.

Tipos de datos distribuidos.

Datos duplicados: la replicación de datos se usa para crear instancias adicionales de datos en diferentes partes de la base de datos. Usando esta táctica, una base de datos distribuida puede evitar el tráfico excesivo porque se puede acceder a los datos idénticos localmente. En este tipo de sistema de datos distribuidos, las actualizaciones pueden configurarse según la importancia de que la base de datos tenga los detalles correctos momento a momento (o durante cualquier período de tiempo). Tenga en cuenta que la replicación es especialmente valiosa cuando no necesita revisiones para que aparezcan en todo el sistema de datos distribuidos en tiempo real.

Datos fragmentados horizontalmente: esta categoría de distribución de datos implica el uso de claves primarias (cada una de las cuales se refiere a un registro en la base de datos). La fragmentación horizontal se usa comúnmente para situaciones en las que ubicaciones específicas de una empresa generalmente solo necesitan acceso a la base de datos correspondiente a su rama específica.

Datos verticalmente fragmentados: con la fragmentación vertical, las claves primarias se utilizan nuevamente. Sin embargo, en este caso, las copias de la clave primaria están disponibles dentro de cada sección de la base de datos (accesible para cada rama). Este tipo de formato funciona bien para situaciones en las que una sucursal de una empresa y la ubicación central interactúan con las mismas cuentas, pero quizás de diferentes maneras (como cambios en la información de contacto del cliente frente a cambios en las cifras financieras).
 
Datos reorganizados: la reorganización significa que los datos se han ajustado de una manera u otra, como es típico en las bases de datos de soporte de decisión. En algunos casos, hay dos sistemas distintos que manejan las transacciones y el soporte de decisiones. Si bien los sistemas de soporte de decisiones pueden ser más difíciles de mantener técnicamente, el procesamiento de transacciones en línea (OLTP) a menudo requiere una reconfiguración para permitir grandes cantidades de solicitudes.

Datos de esquema separado: esta categoría de datos divide la base de datos y el software utilizado para acceder a diferentes departamentos y situaciones, por ejemplo, datos de usuario frente a datos de productos. Por lo general, existe una superposición entre las diversas bases de datos dentro de este tipo de distribución.

Componentes.
  1. Hardware involucrado: El hardware utilizado no difiere mucho del hardware utilizado en un servidor normal. Al principio se creía que si los componentes de una base de datos eran especializados serían más eficientes y rápidos, pero se comprobó que el decentralizar todo y adoptar un enfoque "nada compartido" (shared-nothing) resultaba más barato y eficaz. Por lo que el hardware que compone una base de datos distribuida se reduce a servidores y la red.
  2. Software Sistema Manejador de Base de Datos Distribuida (DDBMS):Este sistema está formado por las transacciones y los administradores de la base de datos distribuidos. Un DDBMS implica un conjunto de programas que operan en diversas computadoras, estos programas pueden ser subsistemas de un único DDBMS de un fabricante o podría consistir de una colección de programas de diferentes fuentes.
  3. Administrador de transacciones distribuidas (DTM): Este es un programa que recibe las solicitudes de procesamiento de los programas de consulta o transacciones y las traduce en acciones para los administradores de la base de datos. Los DTM se encargan de coordinar y controlar estas acciones. Este DTM puede ser propietario o desarrollado en casa.
  4. Sistema Manejador de base de datos (DBMS): Es un programa que procesa cierta porción de la base de datos distribuida. Se encarga de recuperar y actualizar datos del usuario y generales de acuerdo con los comandos recibidos de los DTM.
  5. Nodo: Un Nodo es una computadora que ejecuta un DTM o un DBM o ambos. Un nodo de transacción ejecuta un DTM y un nodo de base de datos ejecuta un DBM.
A continuación se anexa un video:

Conclusión:

Con lo visto en clase podemos deducir que no todos están capacitados para trabajar con este tipo de Base de datos, si bien es una gran herramienta actualmente para facilitar los datos en los trabajos,  es muy difícil darle solución a un problema de estos si no se tiene el conocimiento; no solo es una empresa la que va a depender de que el trabajo salga bien, pueden ser miles de empresas las que sufran de perdidas.
Actualmente, la información de las empresas es algo muy importante, un activo que cuidan demasiado.
Hay que pensar en todos los posibles fallos para darle la mejor solución.

Gracias por su atención :D

Fuentes de información.
Toda la información mostrada en esta pagina (a excepción de la conclusión) pertenece a los siguientes enlaces. Agradezco que compartan su información UwU💓

Comentarios