Base de Datos Distribuidas
Inicialmente podemos decir que las SGBD surgen como respuesta a la distribución que las empresas ya tiene, al menos de manera lógica (divisiones, Departamentos, etc.) y que en ocasiones también de manera física (plantas, fabricas). Toso esto nos lleva a que posiblemente los datos también estén distribuidos, ya que cada unidad organizacional mantendrá los datos con los que normalmente opere.
A cada una de estas subdivisiones se les llama “islas de información”, y lo que hace un sistema distribuido es establecer los “puentes” necesarios para conectar a esas islas entre sí.
En definitiva lo que pretende es que la estructura de la base de datos refleje la estructura de realidad una BD virtual compuesta de varias BD’s “reales” distintas que se encuentran en varios sitios distintos.
Definición:
Podemos ver las BDD como un colección de múltiples bases de datos interrelacionadas lógicamente y distribuidas por un red de computadores, formando un única gran base de datos.
Tipo de Base de Datos Distribuidas:
Una de las decisiones mas importantes que el diseñador de base de datos distribuidas debe tomar es el posicionamiento de la data en el sistema y el esquema bajo el cual lo desea realizar. Para esto existen cuatro alternativas principales: centralizada, replicada, fragmentada e hibrida.
Centralizada:
Es muy similar al modelo Cliente/Servidor en el sentido que la BDD esta centraliza en un lugar y los usuarios están distribuidos. Este modelo solo brinda la ventaja de tener el procesamiento distribuido ya que en sentido de disponibilidad y fiabilidad de los datos no se gana nada.
Replicadas:
El esquema de la BDD de replicación consiste en que cada nodo debe tener su copia completa de la base de datos. Es fácil ver que este esquema tiene un alto costo en el almacenamiento de la información. Debido a que la actualización delos datos debe ser realizada en todas las copias, también tiene un alto costo de escritura, pero todo esto vale la pena si tenemos un sistema en el que se va a escribir pocas veces y leer muchas, y donde la disponibilidad y fiabilidad de los datos sea de máxima importancia.
Particionadas:
Este modelo consiste en que solo hay una copia de cada elemento, pero la información está distribuida a través delos nodos. En cada nodo se aloja uno o más fragmentos disjuntos de la base de datos, como los fragmentos no se replican esto disminuye el costo de almacenamiento, pero sacrifica la disponibilidad y fiabilidad de los datos. Algo que se debe tomar en cuenta cuando se desea implementar este modelo es la granularidad de la fragmentación. La fragmentación se realiza también de tres formas:
-Horizontal
-Vertical
-Mixto
-Hibrida:
Este esquema simplemente representa la combinación del esquema de partición y replicas. Se particiona la relación y a la vez los fragmentes están selectivamente replicados a través del sistema de BDD.
Los Objetivos de una SBDD
1. Autonomía local:Los sitios en un sistema distribuido deben ser autónomos.
-Autonomía local, significa que todas las operaciones en un sitio dado están controladas por este sitio
-Seguridad, integridad y representación de almacenamiento de los datos locales permanecen bajo el control y jurisdicción del sitio local.
2. Independencia de un sitio CentralLa autonomía central implica que todos los sitios deben ser tratados como iguales. Por lo tanto, no debe haber particularmente ninguna dependencia de un sitio”maestro” central para algún servicio central. Tal que todo el sistema dependa de ese sitio central. Asimismo existen algunas razones por las cuales no debería haber un sitio central como por ejemplo:
-el sitio central puede ser un cuello de botella
-el sistema seria vulnerable; es decir, si el sitio central falla, también fallara todo el sistema
3. el sistema debe estar en continua operación:
Una ventaja de los sistemas distribuidos es que deben proporcionar mayor confiabilidad y mayor disponibilidad.
Confiabilidad, la probalidad de que el sistema esté listo y funcionando en cualquier momento dado. Los SD no son una propuesta de todo o nada; pueden continuar operando cuando hay alguna falla en algún componente independiente.
Disponibilidad, probabilidad de que el sistema esté listo y funcionando continuamente a lo largo de un periodo especificado, podemos decir q nunca debería ser necesario apagar el sistema.
4. Procesamiento de consultas Distribuidas
El sistema debe ser capaz de procesar consultas que afecten a datos de más de un sitio y hacerlo de forma optimizada. Este hecho puede ser considerado como otra razón por la que los sistemas distribuidos siempre son relacionales.
No hay comentarios:
Publicar un comentario