Bases de datos distribuidas pdf




















Problemas de mantenimiento. Esto permite distinguir una base de datos distribuida de una base de datos centralizada. Las definiciones anteriores no son suficientes para distinguir siempre si una base de datos es distribuida o no lo es.

Por ejemplo, una transferencia de fondos. Suponga el mismo el mismo banco y las mismas aplicaciones. Suponga el mismo banco. Los programas deben poderse construir como si la base de datos no fuera distribuida.

El modelo de datos relacional organiza y representa los datos en forma de tablas o relaciones. Ejemplos de relaciones se encuentran en el desarrollo de bases de datos para las organizaciones. Un atributo, informalmente hablando, corresponde a lo que es una columna o un campo, tal como lo usa el programador de aplicaciones.

De la misma manera, una tupla es un registro o una fila. El dominio es el tipo de datos o fondo de valores posibles para determinado atributo. Estas operaciones pueden ser unarias o binarias. Si hay tuplas repetidas, estas se eliminan. R1 CP R2 R1. C que especifica el predicado del join.

R1 JN R1. C R3 R1. Las tuplas resultantes son las que satisfacen la igualdad en dichos atributos. Debe tener en cuenta un predicado, igual que con el join. R1 SJR1. Una red puede soportar un proceso corriendo en un sitio de tal manera que pueda enviar un mensaje a otro proceso corriendo en cualquier otro sitio de la misma red.

Retardo del mensaje en llegar al destino. Confiabilidad de la red: Probabilidad de que el mensaje llegue correctamente. Las redes en bus o satelitales son broadcast. Un protocolo es un conjunto de normas entre dos equipos al mismo nivel.

Sus componentes son tangibles, tales como los cables, los conectores y las tarjetas. Entre los dispositivos de este nivel se encuentran los bridges, los switches y las tarjetas de red.

El nivel de Red Maneja los algoritmos de enrutamiento, es decir, decide la interfaz que debe utilizar un paquete que llega y que debe ser retransmitido. Involucra bloques de control que permiten hacer chequeo de errores. No hay donde colocar los paquetes. El dispositivo fundamental utilizado es el router. Tiene sentido entre puntos de la red que desean comunicarse, sin necesidad de que sean adyacentes.

El control de errores permite un transporte de datos fiable y eficiente. Resuelve inconsistencias entre sistemas operacionales. Manejador de la base de datos DB. Acceso remoto por medio de primitivas del DBMS. Para poner a funcionar una base de datos distribuida es necesario a Un sistema operativo de red b Un sistema operativo distribuido c Un sistema operativo que pueda operar sobre una red d Un sistema operativo monousuario 3.

Ella requiere acceder la base de datos que se encuentra funcionando en la red. El Esquema Global define todos los datos contenidos en la base de datos distribuida como si ella no fuera distribuida.

El tipo de mapeo definido en este esquema determina si la base de datos distribuida es redundante en cuyo caso es 1:N o no redundante en cuyo caso es A esta se le denota como Rj. La copia de un fragmento se denota por Rij, lo que quiere decir, la copia del fragmento i en el sitio j.

Este nivel es dependiente del tipo de DBMSs local. Independencia de los DBMSs locales o transparencia de mapeo local. Esto permite estudiar problemas de manejo de bases de datos distribuidas sin tener en cuenta los modelos de datos locales. Completitud: Todos los datos deb en estar mapeados en los fragmentos. Estos cualificadores satisfacen las condiciones 1, 2 y 3 para los fragmentos que definen. PD1 determina aquellas tuplas de partes despachadas a los clientes de Armenia y PD2 queda formada por las partes despachadas a los clientes de Pereira.

Las aplicaciones pueden ser escritas en los diferentes niveles por el DDBMS, dependiendo la transparencia que se tenga. Las solicitudes se pueden ejecutar en secuencia o en paralelo para explotar el paralelismo de un sistema distribuido. El DDBMS interpreta las primitivas, accesando las bases de datos, usando nombres de objetos independientes a los sistemas locales, pero especificando los sitios y los fragmentos donde residen.

Estos lenguajes corresponden a los DBMSs de cada sitio. En este ejercicio, el objetivo es consultar el nombre de la dependencia donde trabaja un vendedor dado. El comportamiento es igual que con cualquier otra consulta. Se diferencia del anterior en que la consulta global contiene un join.

El programador define la estrategia de acceso, no el sistema, como en el caso del nivel global. WHERE vend1. Las consultas sobre los datos distribuidos siempre se pueden hacer a partir de una copia de los datos. Por ahora, nos dedicaremos a las actualizaciones sin garantizar la atomicidad de las transacciones.

El resultado es el siguiente:. En este nivel, las actualizaciones se ejecutan como si la base de datos no fuera distribuida. El programa no requiere conocer los sitios a los que han sido asignados los fragmentos:. Hay consultas que retornan un valor. En este caso se requiere el uso de una variable. Por cada cliente obtener las partes despachadas. Los valores permitidos en la base de datos 2.

Las fases involucradas son las siguientes:. Es el esquema conceptual de la BDD. Se utiliza en sistemas desarrollados a partir de cero. El enfoque bottom-up permite integrar bases de datos existentes, intercalando los datos comunes y resolviendo conflictos entre diferentes representaciones. En esencia requiere:. Estos cuatro predicados constituyen cuatro fragmentos de R. AD1, funciona en el departamento D1 y referencia los empleados de D1 con mayor probabilidad que los de D2.

Un join distribuido es representado por un grafo de join. Todo grafo simple es un grafo particionado y, a su vez, todo grafo particionado es un grafo reducido.

Download Free PDF. Ricardo Chinchilla. A short summary of this paper. Download Download PDF. Translate PDF. De esta manera, cuando 1. Dicho dato no se mueve por todo el sistema, sino que reside en una localidad. Cada tuple, por su parte, es una lista ordenada de valores El principal objetivo usuario, como si se tratara de una de un SABDD base local.

Los puede acceder a los datos de otra. Autor: Abraham Silberschatz, Henry F. Korth, S. Sudarshan ; tr. Fernando Saenz Perez ; colab. Antonio Ibarra Santiago. El usuario no tiene privilegios de administrador a nivel de servidor de base de datos y, por consiguiente, no puede realizar tareas administrativas a nivel de servidor de base de datos.

Algoritmo Optimista Desventajas:. Puede que. La rplica como la fragmentacin, debe ser "transparente para el usuario". En otras palabras , un sistema que maneja la rplica de los datos deber ofrecer tambin una independencia de rplica conocida tambin como transparencia de rplica ; es decir, los usuarios debern poder comportarse como si slo existiera una copia de los datos. La independencia de rplica es buena porque simplifica los programas de los usuarios y sus actividades en la terminal.

En particular, permite la creacin y eliminacin dinmicas de las rplicas en cualquier momento en respuesta a cambios en los requerimientos, sin anular la validez de esos programas o actividades de los usuarios. Procesamiento distribuido de consultas. En este aspecto debemos mencionar dos puntos amplios. Primero consideremos la consulta "obtener los proveedores de partes rojas en Londres". Supongamos que el usuario est en la instalacin de Nueva York y los datos estn en el sitio de Londres.

Si sistema es relacional, consulta implicar en esencia dos mensajes : uno transmitir la solicitud Nueva York a Londres, y otro para devolver el conjunto resultante de n registros de Londres a Nueva York. Si, por otro lado, el sistema no es relacional, sino de un registro a la vez, la consulta implicar en esencia 2n mensajes : n de Nueva York a Londres solicitando el siguiente registro, y n de Londres a Nueva York para devolver ese siguiente registro.

As, el ejemplo ilustra el punto de que un sistema relacional tendr con toda probabilidad un mejor desempeo que uno no relacional para cualquier consulta que solicite varios registros , quiz en varios rdenes de magnitud. En segundo lugar, la optimizacin es todava ms importante en un sistema distribuido que en uno centralizado. Lo esencial es que, en una consulta como la anterior, donde estn implicados varios sitios, habr muchas maneras de trasladar los datos en al red para satisfacer la solicitud, y es crucial encontrar una estrategia suficiente.

Por ejemplo, una solicitud de unin de una relacin Rx almacenada en el sitio X y una relacin Ry almacenada en el sitio Y podra llevarse a cabo trasladando Rx a Y o trasladando Ry a X, o trasladando las dos a un tercer sitio Z. Manejo distribuido de transacciones. El manejo de transacciones tiene dos aspectos principales, el control de recuperacin y el control de concurrencia, cada uno de los cuales requiere un tratamiento ms amplio en el ambiente distribuido.

Para explicar ese tratamiento ms amplio es preciso introducir primero un trmino nuevo, "agente". En un sistema distribuido, una sola transaccin puede implicar la ejecucin de cdigo en varios sitios en particular puede implicar a actualizaciones en varios sitios. Por tanto, se dice que cada transaccin est compuesta de varios agentes, donde un agente es el proceso ejecutado en nombre de una transaccin dada en determinado sitio.

Y el sistema necesita saber cundo dos agentes son parte de la misma transaccin; por ejemplo,. La cuestin especifica del control de recuperacin; : para asegurar, pues que una transaccin dada sea atmica todo o nada en el ambiente distribuido, el sistema debe asegurarse de que todos los agentes correspondientes a esa transaccin se comprometan al unsono o bien que retrocedan al unsono.

Este efecto puede lograrse mediante el protocolo de compromiso en dos fases. En cuanto al control de concurrencia, esta funcin en un ambiente distribuido estar basada con toda seguridad en el bloqueo, como sucede en los sistemas no distribuidos. Independencia con respecto al equipo. En realidad, no hay mucho que decir acerca de este tema, el ttulo lo dice todo. Por tanto conviene ejecutar el mismo DBMS en diferentes equipos, y adems lograr que esos diferentes equipos participen como socios iguales en un sistema distribuido.

Independencia con respecto al sistema operativo. Este objetivo es un corolario del anterior. Independencia con respecto a la red.

Si el sistema ha de poder manejar mltiples sitios diferentes, con equipo distinto y diferentes sistemas operativos, resulta obvia la conveniencia de poder manejar tambin varias redes de comunicacin distintas. Independencia con respecto al DBMS Bajo este ttulo consideramos las implicaciones de relajar la suposicin de homogeneidad estricta.

Puede alegarse que esa suposicin es quiz demasiado rgida. En realidad, no se requiere sino que los DBMS en los diferentes sitios manejen todos la misma interfaz ; no necesitan ser por fuerza copias del mismo sistema. Consideraciones para el respaldo Es importante realizar copias de respaldo de las Bases de Datos, para ello se deben tener en cuenta las siguientes consideraciones: Plan de Respaldo: El plan de respaldo debe ser dado a conocer a cada uno de los interesados en esta informacin directivos, administradores de las bases de datos.

Definir los datos a incluir en el respaldo:.



0コメント

  • 1000 / 1000