Base de Datos Estrategicas

1. Modelo dimensional y multidimensional

1.1 Modelo dimensional

Básicamente el Modelo Dimensional es el nombre que se le da a una técnica utilizada especialmente en Data Warehouses. Este modelo difiere bastante del modelo Entidad-Relación que normalmente conocemos.

El Modelo Dimensional busca presentar la información de una manera estándar, sencilla y sobre todo intuitiva para los usuarios, además de que permite accesos a la información mucho más rápida por parte de los manejadores de bases de datos.

Cada Modelo Dimensional está compuesto por una tabla llamada "de hechos" y por un conjunto de pequeñas tablas llamadas "dimensiones". Cada dimensión contiene una llave primaria que se "conecta" a la tabla de hechos manteniendo una relación de 1 a muchos (1 a N).

https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEj2_XmywFQ3f6oAAIlz4lHkAVG2Yw33dIvhzABsm0ZSlunVguzaAA4lGZj-Y3vmYLKxVMNnTxQ1g9nFn0NGJVwmAunaNczd_M1hskwRnY8S0wRIEucL6HeZTRQOWfWEVe2aZyafWem0hfY/s1600/Modelo_Dimensional.png

Viendo la figura anterior comprendemos porque en los inicios este modelo también se le conoció como Modelo de Estrella.

La tabla de hechos contiene incluso varias llaves foráneas, cada una de ellas hacia una dimensión, es por eso que contiene una llave primaria compuesta, es decir, que se compone de varias columnas. Además las tablas de hecho típicamente incluyen otras columnas numéricas llamadas "métricas" o "hechos", por ejemplo en la figura anterior las métricas son "Ventas en Pesos" y "Ventas en Cantidad".

La información contenida en una tabla de hechos por si sola no nos dice nada, la mayoría de las veces contiene únicamente números.

Por otro lado las dimensiones comúnmente contienen información descriptiva. Los atributos de las dimensiones muchas veces serán los encabezados de las columnas en los reportes.

Lo bonito del modelo dimensional es que fácilmente los usuarios pueden intuir el contenido de la información y sobre todo permite a las aplicaciones de inteligencia de negocios extraer la información increíblemente rápido.

1.2 Modelo Multidimensional

Un modelo de datos Multidimensional contiene un conjunto de medidas numéricas objeto de análisis. Dichas medidas dependen de una serie de dimensiones.
Cada medida particular es un punto en un espacio Multidimensional en el que los valores de cada dimensión se suelen jerarquizar.

Los datos en un DW se modelan en data cubes (cubos de datos), estructuras multidimensionales (hipercubos).

Cuyas operaciones más comunes son:

* Roll up (incremento en el nivel de agregación de los datos).
* Drill Down (incremento en el nivel de detalle, opuesto a roll up).
* Slice (reducción de la dimensionalidad de los datos mediante selección).
* Dice (reducción de la dimensionalidad de los datos mediante proyección).
* Pivotaje o rotación (reorientación de la visión Multidimensional de los datos).

CUBO OLAP

2. Proceso de negocio

Un proceso de negocio es un conjunto de tareas relacionadas lógicamente llevadas a cabo para lograr un resultado de negocio definido. Cada proceso de negocio tiene sus entradas, funciones y salidas. Las entradas son requisitos que deben tenerse antes de que una función pueda ser aplicada. Cuando una función es aplicada a las entradas de un método, tendremos ciertas salidas resultantes.

Es una colección de actividades estructurales relacionadas que producen un valor para la organización, sus inversores o sus clientes. Es, por ejemplo, el proceso a través del que una organización ofrece sus servicios a sus clientes.

Un proceso de negocio puede ser parte de un proceso mayor que lo abarque o bien puede incluir otros procesos de negocio que deban ser incluidos en su función. En este contexto un proceso de negocio puede ser visto a varios niveles de granularidad. El enlace entre procesos de negocio y generación de valor lleva a algunos practicantes a ver los procesos de negocio como los flujos de trabajo que efectúan las tareas de una organización.

Los procesos poseen las siguientes características:

1. Grandes y complejos
2. Muy dinámicos
3. Ampliamente distribuidosy particularizados
4. Largaduración una ejecución puede durar meses o años
5. Automatizados al menos en parte
6. Dependientesde la inteligencia y juicio humanos
7. Difícilesde hacer visibles
8. Pueden ser medidos y están orientados al rendimiento
9. Tienen resultados específico
10. Entregan resultados a clientes o “stakeholders”
11. Responden a alguna acción o evento específico
12. Las actividades deben agregar valor a las entradas del proceso.

Los procesos de negocio pueden ser vistos como un recetario para hacer funcionar un negocio y alcanzar las metas definidas en la estrategia de negocio de la empresa. Las dos formas principales de visualizar una organización, son la vista funcional y la vista de procesos.

Tipos de procesos de negocio:

Procesos estratégicos - Estos procesos dan orientación al negocio. Por ejemplo, “Planificar estrategia”, “Establecer objetivos y metas”.

Procesos centrales – Estos procesos dan el valor al cliente, son la parte principal del negocio. Por ejemplo, “Repartir mercancías”.

Procesos de soporte – Estos procesos dan soporte a los procesos centrales. Por ejemplo, “contabilidad”, “Servicio técnico”.

Por ejemplo, el proceso a través del que una organización ofrece sus servicios a sus clientes:

3. Medida del negocio

Las medidas más útiles para incluir en una tabla de hechos se pueden ir sumando como por ejemplo:

La cantidad de producto vendido, dinero obtenido por las ventas; son medidas numéricas que pueden calcularse con la suma de varias cantidades de la tabla. En consecuencia, por lo general los hechos a almacenar en una tabla de hechos son siempre numéricos.

Características de las medidas:

–Deben ser numéricas.

–Cruzan todas las dimensiones en todos los niveles.

Las medidas pueden clasificarse en:

Naturales

Estas formas de agregación pueden ser:

Suma: es la operación que suma los valores de las columnas

Cuenta: realiza un conteo de los valores

Mínima: devuelve un valor mínimo

Máxima: proporciona el mayor de los valores

Cuenta de Distintos: cuenta los valores diferentes

Calculadas

Cálculos Matemáticos

Expresiones condicionales

Alertas

4. Tabla dimensional o dimensión

Las tablas de dimensiones deﬁnen como están los datos organizados lógicamente y proveen el medio para analizar el contexto del negocio. Representan los ejes del cubo, y los aspectos de interés, mediante los cuales el usuario podrá ﬁltrar y manipular la información almacenada en la tabla de hechos.

•Definen la organización lógica de los datos.
•Tiene una PK (única) y columnas de referencia:

o Clave principal (PK) o identificador único
o Clave foráneas.
o Datos de referencia primarios (identifican la dimensión)
o Datos de referencia secundarios (complementan la descripción).

5. Tabla de Hechos

En las bases de datos, y más concretamente en un data warehouse, una tabla de hechos (o tabla fact) es la tabla central de un esquema dimensional (en estrella o en copo de nieve) y contiene los valores de las medidas de negocio. Cada medida se toma mediante la intersección de las dimensiones que la definen, dichas dimensiones estarán reflejadas en sus correspondientes tablas de dimensiones que rodearán la tabla de hechos y estarán relacionadas con ella.

Ejemplo de Tabla de Hechos:

Cardinalidad de la tabla de hechos:

Las tablas de hechos pueden contener un gran número de filas, a veces cientos de millones de registros cuando contienen uno o más años de la historia de una gran organización, esta cardinalidad estará acotada superiormente por la cardinalidad de las tablas dimensionales.

Granularidad

Una característica importante que define a una tabla de hechos es el nivel de granularidad de los datos que en ella se almacenan, entendiéndose por 'granularidad' el nivel de detalle de dichos datos, es decir, la granularidad de la tabla de hechos representa el nivel más atómico por el cual se definen los datos. Por ejemplo, no es lo mismo contar el tiempo por horas (grano fino) que por semanas (grano grueso); o en el caso de los productos, se puede considerar cada variante de un mismo artículo como un producto (por ejemplo, en una empresa textil, cada talla y color de pantalón podría ser un producto) o agrupar todos los artículos de una misma familia considerándolos como un único producto (por ejemplo, el producto pantalón genérico).

Como se puede observar, la granularidad afecta a la cardinalidad, tanto de las dimensiones como de la tabla de hechos, a mayor granularidad (grano más fino) mayor será el número de registros final de la tabla de hechos.

Cuando la granularidad es mayor, es frecuente que se desee disponer de subtotales parciales, es decir, si tenemos una tabla de hechos con las ventas por días, podría interesar disponer de los totales semanales o mensuales, estos datos se pueden calcular haciendo sumas parciales, pero es frecuente añadir a la tabla de hechos registros donde se almacenan dichos cálculos para no tener que repetirlos cada vez que se requieran y mejorar así el rendimiento de la aplicación. En este caso se dispondrá en la misma tabla de hechos de datos de grano fino y de grano más grueso aumentando aún más la cardinalidad de la tabla.

Agregación

La agregación es un proceso de cálculo por el cual se resumen los datos de los registros de detalle. Esta operación consiste normalmente en el cálculo de totales dando lugar a medidas de grano grueso. Cuando se resumen los datos, el detalle ya no está directamente disponible para el analista, ya que este se elimina de la tabla de hechos.

Esta operación se realiza típicamente con los datos más antiguos de la empresa con la finalidad de seguir disponiendo de dicha información (aunque sea resumida) para poder eliminar registros obsoletos de la tabla de hechos para liberar espacio.

6. Data Mart

Un Data mart es una versión especial de almacén de datos (data warehouse).

Son subconjuntos de datos con el propósito de ayudar a que un área específica dentro del negocio pueda tomar mejores decisiones. Los datos existentes en este contexto pueden ser agrupados, explorados y propagados de múltiples formas para que diversos grupos de usuarios realicen la explotación de los mismos de la forma más conveniente según sus necesidades.

Es un pequeño DataWarehouse, para un determinado numero de usuarios, para un área funcional, especifica de la compañía. También podemos definir que un Data Martes es un subconjunto de una bodega de datos para un propósito especifico.

Características:

Son pobladas por usuarios finales.

Se optimizan en función a procesos transaccionales.

Se actualizan constantemente.

Contienen mucha información de detalle.

Dependencia de un data mart

Según la tendencia marcada por Inmon sobre los data warehouse, un data mart dependiente es un subconjunto lógico (vista) o un subconjunto físico (extracto) de un almacén de datos más grande, que se ha aislado por alguna de las siguientes razones:

Se necesita para un esquema o modelo de datos espacial (por ejemplo, para reestructurar los datos para alguna herramienta OLAP).

Prestaciones: Para descargar el data mart a un ordenador independiente para mejorar la eficiencia o para obviar las necesidades de gestionar todo el volumen del data warehouse centralizado.

Seguridad: Para separar un subconjunto de datos de forma selectiva a los que queremos permitir o restringir el acceso.

Conveniencia: la de poder pasar por alto las autorizaciones y requerimientos necesarios para poder incorporar una nueva aplicación en el Data Warehouse principal de la Empresa.

Demostración sobre el terreno: para demostrar la viabilidad y el potencial de una aplicación antes de migrarla al Data Warehouse de la Empresa.

Política: Cuando se decide una estrategia para las TI (Tecnologías de la información) en situaciones en las que un grupo de usuarios tiene más influencia, para determinar si se financia dicha estrategia o descubrir si ésta no sería buena para el almacén de datos centralizado.

Política: Estrategia para los consumidores de los datos en situaciones en las que un equipo de almacén de datos no está en condiciones de crear un almacén de datos utilizable.

jueves, 25 de abril de 2013