En 1970, Edgar Frank Codd escribió un artículo con nombre “Un modelo relacional para grandes bancos de datos compartidos”. Con este artículo, definió el modelo de BD relacionales y reglas para poder evaluar un administrador de bases de datos relacionales.
Impulsaron la creación de almacenamiento distribuido, los cuales hoy en día proveen características indispensables en el manejo de información; es decir, la combinación de las redes de comunicación y las bases de datos.
Hay varios factores que han hecho que las bases de datos evolucionen a bases de datos distribuidas: los usuarios como parte de organizaciones mas complejas han demandado una serie de capacidades y por otro lado, la tecnología ha hecho posible que muchas facilidades sean realidad.
La presión de los usuarios:
Fase 1: La idea original era que todos lo s accesos a datos podrían ser integrados en un solo lugar usando herramientas de BD tales como lenguajes de programación, manipulación, etc. Bajo este esquema centralizado “los propietarios” perdieron el control de su información ya que no se almacenaba en lugares de trabajo.
Fase 2: Se promovió la descentralización de los sistemas de BD corporativos; se empezaron a adquirir sistemas de software y hardware departamentales. Este enfoque presentaba buenos resultados hasta que se presentaron problemas de consistencia de la información entre los sistemas locales y centrales, así como transferir la información entre departamentos.
Fase 3 (la cual no sea concluido): se ha tratado de formalizar la descentralización de las bases de datos y de sus funciones manteniendo la integridad de la información y quizá algún tipo de control centralizado o distribuido.
La presión de la tecnología:
Es mucho mejor distribuir los accesos a la información sobre diferentes canales que concentrarlos en uno solo. Las computadoras empezaron a trabajar a velocidades razonables.
1.2 Contexto de las Bases de Datos Distribuidas.
- Se usa para crear, recuperar, actualizar y eliminar bases de datos distribuidas.
- Sincroniza la base de datos periódicamente y proporciona mecanismos de acceso en virtud de los cuales la distribución se vuelve transparente para los usuarios.
- Asegura que los datos modificados en cualquier sitio se actualicen universalmente.
- Se utiliza en áreas de aplicación donde numerosos usuarios procesan y acceden grandes volúmenes de datos simultáneamente.
- Está diseñado para plataformas de bases de datos heterogéneas.
- Mantiene la confidencialidad y la integridad de los datos de las bases de datos.
- Fiabilidad: crear una infraestructura es similar a invertir: diversifíquese para reducir sus posibilidades de pérdida. Específicamente, si ocurre una falla en un área de la distribución, toda la base de datos no experimenta un retroceso.
- Seguridad: puede otorgar permisos a secciones individuales de la base de datos general, para una mejor protección interna y externa.
- Rentable: los precios del ancho de banda disminuyen porque los usuarios acceden a datos remotos con menos frecuencia.
- Acceso local: al igual que en el punto 1 anterior, si hay una falla en la red general, aún puede obtener acceso a su parte de la base de datos.
- Crecimiento: si agrega una nueva ubicación a su negocio, es simple crear un nodo adicional dentro de la base de datos, lo que hace que la distribución sea altamente escalable.
- Velocidad y eficiencia de los recursos: la mayoría de las solicitudes y otras formas de interactividad con la base de datos se realizan a nivel local, lo que también reduce el tráfico remoto.
- Responsabilidad y contención: debido a que fallas técnicas o fallas ocurren localmente, el problema está contenido y puede ser manejado por el personal de TI designado para manejar esa parte de la empresa.
- Hardware involucrado: El hardware utilizado no difiere mucho del hardware utilizado en un servidor normal. Al principio se creía que si los componentes de una base de datos eran especializados serían más eficientes y rápidos, pero se comprobó que el decentralizar todo y adoptar un enfoque "nada compartido" (shared-nothing) resultaba más barato y eficaz. Por lo que el hardware que compone una base de datos distribuida se reduce a servidores y la red.
- Software Sistema Manejador de Base de Datos Distribuida (DDBMS):Este sistema está formado por las transacciones y los administradores de la base de datos distribuidos. Un DDBMS implica un conjunto de programas que operan en diversas computadoras, estos programas pueden ser subsistemas de un único DDBMS de un fabricante o podría consistir de una colección de programas de diferentes fuentes.
- Administrador de transacciones distribuidas (DTM): Este es un programa que recibe las solicitudes de procesamiento de los programas de consulta o transacciones y las traduce en acciones para los administradores de la base de datos. Los DTM se encargan de coordinar y controlar estas acciones. Este DTM puede ser propietario o desarrollado en casa.
- Sistema Manejador de base de datos (DBMS): Es un programa que procesa cierta porción de la base de datos distribuida. Se encarga de recuperar y actualizar datos del usuario y generales de acuerdo con los comandos recibidos de los DTM.
- Nodo: Un Nodo es una computadora que ejecuta un DTM o un DBM o ambos. Un nodo de transacción ejecuta un DTM y un nodo de base de datos ejecuta un DBM.
Comentarios
Publicar un comentario