BASES DE DATOS
ARQUITECTURA DE BASES DE DATOS
COMPONENTES DE UN SISTEMA DE GESTION DE BASE DE DATOS
EL DBA
DBMS
COMPONENTES DE UN SISTEMA DE GESTIÓN DE BASES DE DATOS
SEGURIDAD E INTEGRIDAD EN LAS BASES DE DATOS
COMPONENTES PRINCIPALES DE UNA BASE DE DATOS

PERIFERICOS
MODELOS DE DATOS
REGLAS DE INTEGRIDAD
ARQUITECTURAS CLIENTE/SERVIDOR
MODELOS LOGICOS
BASES DE DATOS DISTRIBUIDAS
TIPOS DE FRAGMENTACION
SGBD COMERCIALES
BASES DE DATOS DISTRIBUIDAS


Una Base de Datos Distribuida (BDD) es un conjunto de múltiples bases de datos lógicamente relacionadas las cuales se encuentran distribuidas entre diferentes sitios interconectados por una red de comunicaciones, los cuales tienen la capacidad de procesamiento autónomo lo cual indica que puede realizar operaciones locales o distribuidas. Un sistema de Bases de Datos Distribuida (SBDD) es un sistema en el cual múltiples sitios de bases de datos están ligados por un sistema de comunicaciones de tal forma que, un usuario en cualquier sitio puede acceder los datos en cualquier parte de la red.

En un sistema distribuido de bases de datos se almacenan en varias computadoras. Los principales factores que distinguen un SBDD de un sistema centralizado son los siguientes:

• Hay múltiples computadores, llamados sitios o nodos.

• Estos sitios deben de estar comunicados por medio de algún tipo de red de comunicaciones para transmitir datos y órdenes entre los sitios.


Imagen
LAS DOCE REGLAS DE LAS BASES DE DATOS DISTRIBUIDAS

El principio fundamental es que para el usuario un sistema distribuido debe ser igual que uno centralizado.

• Autonomía Local: Los sitios distribuidos deben ser autónomos, es decir que todas las operaciones en un sitio dado se controlan en ese sitio.

• No dependencia de un sitio central: No debe de haber dependencia de un sitio central para obtener un servicio.

• Operación Continua: Nunca debería apagarse para que se pueda realizar alguna función, como añadir un nuevo sitio.

• Independencia con respecto a la localización: No debe de ser necesario que los usuarios sepan dónde están almacenados físicamente los datos, sino que más el usuario lo debe de ver como si solo existiera un sitio local.

• Independencia con respecto a la fragmentación: La fragmentación es deseable por razones de desempeño, los datos, pueden almacenarse en la localidad donde se utilizan con mayor frecuencia de manera que la mayor parte de las operaciones sean sólo locales y se reduzca el tráfico en la red.

• Independencia de réplica: Si una relación dada (es decir, un fragmento dado de una relación ) se puede presentar en el nivel físico mediante varias copias almacenadas o réplicas, en muchos sitios distintos.

• Procesamiento Distribuido de Consultas: El objetivo es convertir transacciones de usuario en instrucciones para manipulación de datos, y así reducir el trafico en la red implica que el proceso mismo de optimización de consultas debe ser distribuido.

• Manejo Distribuido de Transacciones: Tiene dos aspectos principales, el control de recuperación y el control de concurrencia, cada uno de los cuales requiere un tratamiento más amplio en el ambiente distribuido.

• Independencia con respecto al equipo: El SGBDD debe ser ejecutable en diferentes plataformas hardware.

• Independencia con respecto al Sistema Operativo: El sistema debe ser ejecutable varios diferentes SO.

• Independencia con respecto a la red: El sistema debe poder ejecutarse en diferentes redes.

• Todos los usuarios accesan a la BDD a través de un esquema global en forma transparente al usuario. Debe ser posible ejecutar diferentes SGBDD locales que utilicen distintos modelos de datos.


VENTAJAS DE LAS BASES DE DATOS DISTRIBUIDAS

Imagen

• La principal ventaja de los sistemas distribuidos es la capacidad de compartir y acceder a la información de una forma fiable y eficaz.

• Utilización compartida de los datos y distribución del control: la ventaja principal de compartir los datos por medio de la distribución es que cada localidad pueda controlar hasta cierto punto los datos almacenados localmente. En un sistema centralizado, el administrador de base de datos de la localidad central controla la base de datos. En un sistema distribuido existe un administrador global de la base de datos que se encarga de todo el sistema. Parte de esta responsabilidad se delega al administrador de base de datos de cada localidad. Dependiendo del diseño del sistema distribuido, cada administrador local podrá tener un grado de autonomía diferente, que se conoce como autonomía local. La posibilidad de contar con autonomía local es en muchos casos una ventaja importante de las bases de datos distribuidas.

• Fiabilidad y disponibilidad: si se produce un fallo en una localidad de un sistema distribuido, es posible que las demás localidades puedan seguir trabajando. En particular, si los datos se repiten en varias localidades, una transacción que requiere un dato específico puede encontrarlo en más de una localidad. Así, el fallo de una localidad no implica necesariamente la desactivación del sistema. El sistema debe detectar cuando falla una localidad y tomar las medidas necesarias para recuperarse del fallo. El sistema no debe seguir utilizando la localidad que falló. Por último, cuando se recupere o repare esta localidad, debe contarse con mecanismos para reintegrarla al sistema con el mínimo de complicaciones. La disponibilidad es fundamental para los sistemas de bases de datos que se utilizan en aplicaciones de tiempo real. Por ejemplo, si una línea aérea no puede tener acceso a la información, es posible que pierda clientes a favor de la competencia.

• Agilización del procesamiento de consulta: si una consulta comprende datos de varias localidades, puede ser posible dividir la consulta en varias subconsultas que se ejecuten en paralelo en distintas localidades. Sin embargo, en un sistema distribuido no se comparte la memoria principal, así que no todas las estrategias de intersección se pueden aplicar en estos sistemas. En los casos en que hay repetición de los datos, el sistema puede pasar la consulta a las localidades más ligeras de carga.



DESVENTAJAS DE DISTRIBUCION DE LOS DATOS

La desventaja principal de los sistemas distribuidos es la mayor complejidad que se requiere para garantizar una coordinación adecuada entre localidades.
imagen

El aumento de la complejidad se refleja en:

* Coste del desarrollo de software: es más difícil estructura un sistema de bases de datos distribuidos y por tanto su coste es menor.

* Mayor posibilidad de errores: puesto que las localidades del sistema distribuido operan en paralelo, es más difícil garantizar que los algoritmos sean correctos.

* Mayor tiempo extra de procesamiento: el intercambio de mensajes y los cálculos adicionales son unaforma de tiempo extra que no existe en los sistemas centralizados.


FRAGMENTACION DE DATOS
+ INFO