viernes, 20 de marzo de 2009

DISEÑO DE BASE DE DATOS RELACIONALES

DISEÑO DE BASE DE DATOS RELACIONAL.



Una Base de Datos Relacional es una tarea larga y costosa. Existe la necesidad de contar con procedimientos ordenados que faciliten el desarrollo de un producto software. Esto tiene una incidencia en cuanto a costos y plazos de entrega. Según Sommerville (1988) " un buen diseño es la clave de una eficiente ingeniería del software Un software bien diseñado es fácil de aplicar y mantener, además de ser comprensible y fiable sistemas mal diseñados, aunque puedan funcionar, serán costosos de mantener.

Muchas veces, el diseño de una base de datos limita aplicar la teoría de normalización, en realidad debe abarcar muchas otras etapas la concepción hasta la instrumentación. Una metodología es un conjunto de modelos y herramientas que nos permiten pasar de una etapa a la siguiente en el proceso de diseño de la base de datos.
Rolland y Benci (1988).

la determinación de las fases de la metodología debemos definir una jerarquía de niveles de abstracción que resulte apropiada lo suficientemente amplia para que a cada nivel le correspondan decisiones de diseño bien definidas.

No existe una metodología consagrada, sin embargo, ciertas etapas son distinguibles:

1.Diseño Conceptual, obtener una buena representación de los recursos de información de la empresa en particular y fuera de consideraciones de eficiencia del computador
2. Diseño Lógico, objetivo es transformar el esquema conceptual obtenido en la etapa anterior
3. Diseño Físico, es conseguir una instrumentación lo mas eficiente posible esquema lógico


Causas de malos diseños

1. Falta de conocimiento del dominio de la aplicación que no posee el informático (aunque no sepa estructurarlo ni expresarlo de forma precisa).
2. Falta de experiencia en el modelado


PELIGROS EN EL DISEÑO DE BASES DE DATOS RELACIONALES.


Uno de los retos en el diseño de la base de datos es el de obtener una estructura estable y lógica tal que:




  1. sistema de base de datos que no sufra de anomalías de almacenamiento

  2. El modelo lógico pueda modificarse fácilmente para admitir nuevos requerimientos.

Una base de datos implantada sobre un modelo bien diseñado tiene mayor esperanza de vida aun en un ambiente dinámico, una base de datos experimenta una reorganización general cada seis años, lo dinámico de los requerimientos de los usuarios. Una base de datos bien diseñada tendrá un buen desempeño aunque aumente su tamaño.Existen diversos riesgos en el diseño de las bases de datos relacionales que afecten la funcionalidad de la misma, los riesgos generalmente son la redundancia de información y la inconsistencia de datos.


  • Estructura de datos de forma que se puedan representar las relacione pertinentes entre los datos.
  • la recuperación sencilla de los datos en respuesta de consultas y reportes
  • Simplificar el mantenimiento de los datos actualizándolos
  • Reducir la necesidad de reestructurar o reorganizar los datos que surjan nuevas aplicaciones.

En términos más sencillos la normalización trata de simplificar el diseño de una base de datos, esto a través de la búsqueda de la mejor estructuración que pueda utilizarse con las entidades involucradas en ella.
Pasos de la normalización:

  • descomponer todos los grupos de datos en registros bidimencionales
  • eliminar los todas las relaciones que hay en los datos no dependen de la llave primaria de registro
  • elimina todas las relaciones en donde contengan dependencias trancitivas

de normalización tiene como fundamento el concepto de formas normal esse dice que una relación está en una determinada forma normal si satisface un conjunto

PRIMERA Y SEGUNDA FORMAS NORMALES.

Formas normales.
las técnicas para prevenir las anomalías en als tablas .dependiendo de su estrura .una tabla puede estar en forma normal .segunda forma normal o en cualqier otra forma


Primera forma normal.

Definición formal: la reacion R se encuentra en 1FN si solo por cada renglon de la columna contiene valores atomicos.

es abrebiado con 1FN en donde se condedera una relacion en donde se encuentra en donde la primera normal se cumple lo sigiente :

Las celdas de las tablas poseen valores simples y no se permiten grupos ni arreglos repetidos como valores, es decir, contienen un solo valor por cada celda.
Todos los ingresos en cualquier columna(atributo) deben ser del mismo tipo.
Cada columna debe tener un nombre único, el orden de las columnas en la tabla no es importante.
Dos filas o renglones de una misma tabla no deben ser idénticas, aunque el orden de las filas no es importante.


en esta relación maneja valores atómicos, es decir un solo valor por cada uno de los campos que conforman a los atributos de las entidades, ya se encuentra en primera forma normal, gráficamente así representamos a las relaciones en 1FN.

Segunda forma normal.


para definir la forma de la segunda en la cual referimos a un dependencia funcional Consiste en edificar que atributos dependen de otro(s) atributo(s).
y todos sus atributos que no son claves (llaves) dependen por completo de la clave. De acuerdo con está definición,
Nótese que las llaves primarias están representadas con doble cuadro, las flechas nos indican que de estos atributos se puede referenciar a los otros atributos que dependen funcionalmente de la llave primaria.

TERCERA FORMA NORMAL Y LA FORMA NORMAL DE BOYCE CODD.

definir formalmente la 3FN necesitamos definir dependencia transitiva: una afinidad (tabla bidimensional) por lo menos 3 atributos (A,B,C) en donde A determina a B, B determina a C pero no determina a A.

Tercera forma normal.

Definición formal: relación R está en 3FN si y solo si esta en 2FN y todos sus atributos no primos dependen no transitivamente Consiste en eliminar la dependencia transitiva que queda en una segunda forma normal,una relación esta en tercera forma normal si está en segunda forma normal y no existen dependencias transitivas entre los atributos, existe más de una forma de llegar a referencias a un atributo de una relación.Por ejemplo, consideremos el siguiente caso

relación alumno-cursa-materia manejada anteriormente, pero ahora consideramos al elemento maestro, gráficamente lo podemos representar de la siguiente manera:
cuenta que se encuentra graficado en segunda forma normal, es decir que todos los atributos llave están indicados en doble cuadro indicando los atributos que dependen de dichas llavesNecono tiene como dependientes a 3 atributos en el cual el nombre puede ser referenciado por dos atributos: Necono y RFC (Existe dependencia transitiva), podemos solucionar esto aplicando la tercera forma normal que consiste en eliminar estas dependencias separando los atributos, entonces tenemos:

Forma normal de Boyce Codd.

Determinante: que, de manera funcional, determinan otro atributo o atributos. En la dependencia funcional (A,B)-->C, (A,B)

Definición formal: relación R esta en FNBC si y solo si cada determinante es una llave candidato.


con el ejemplo anterior, si consideramos que en la entidad alumno sus atributos control y nombre nos puede hacer referencia al atributos esp., entonces decimos que dichos atributos pueden ser llaves candidato


CUARTA Y QUINTA FORMAS NORMALES

Cuarta forma normal.

relaciones R está en 4FN con respecto a un conjunto D de dependencias funcionales y de valores múltiples sí, para todas las dependencias de valores múltiples en D de la forma X->->Y, donde X<=R y Y<=R,

* X->->Y es una dependencia de valores múltiples trivial.

* X es una superllave del esquema R.

En esta tabla o relación no existe dependencia funcional porque los estudiantes pueden tener distintas especialidades, un valor único de clave puede poseer muchos valores de especialidades al igual que de valores de cursos. Por lo tanto existe dependencia de valores múltiples. Este tipo de dependencias produce redundancia de datos, como se puede apreciar en la tabla anterior, en donde la clave S01 tiene tres registros para mantener la serie de datos en forma independiente lo cual ocasiona que al realizarse una actualización se requiera de demasiadas operaciones para tal fin.

QUINTA FORMA NORMAL.

Definición formal:
para todas las dependencias de productos en D se cumple por lo menos una de estas condiciones:

* (R1, R2, R3, ... Rn) es una dependencia de producto trivial.* Toda Ri es una superllave de R.


No hay comentarios:

Publicar un comentario