1.1
Modelo dimensional
Básicamente
el Modelo Dimensional es el nombre que se le da a una técnica utilizada
especialmente en Data Warehouses. Este modelo difiere bastante del modelo Entidad-Relación
que normalmente conocemos.
El Modelo Dimensional busca presentar la información de una manera estándar, sencilla y sobre todo intuitiva para los usuarios, además de que permite accesos a la información mucho más rápida por parte de los manejadores de bases de datos.
Cada Modelo Dimensional está compuesto por una tabla llamada "de hechos" y por un conjunto de pequeñas tablas llamadas "dimensiones". Cada dimensión contiene una llave primaria que se "conecta" a la tabla de hechos manteniendo una relación de 1 a muchos (1 a N).
El Modelo Dimensional busca presentar la información de una manera estándar, sencilla y sobre todo intuitiva para los usuarios, además de que permite accesos a la información mucho más rápida por parte de los manejadores de bases de datos.
Cada Modelo Dimensional está compuesto por una tabla llamada "de hechos" y por un conjunto de pequeñas tablas llamadas "dimensiones". Cada dimensión contiene una llave primaria que se "conecta" a la tabla de hechos manteniendo una relación de 1 a muchos (1 a N).
Viendo la figura anterior comprendemos porque en los inicios este modelo también se le conoció como Modelo de Estrella.
La tabla de hechos contiene incluso varias llaves foráneas, cada una de ellas hacia una dimensión, es por eso que contiene una llave primaria compuesta, es decir, que se compone de varias columnas. Además las tablas de hecho típicamente incluyen otras columnas numéricas llamadas "métricas" o "hechos", por ejemplo en la figura anterior las métricas son "Ventas en Pesos" y "Ventas en Cantidad".
La información contenida en una tabla de hechos por si sola no nos dice nada, la mayoría de las veces contiene únicamente números.
Por otro lado las dimensiones comúnmente contienen información descriptiva. Los atributos de las dimensiones muchas veces serán los encabezados de las columnas en los reportes.
Lo bonito del modelo dimensional es que fácilmente los usuarios pueden intuir el contenido de la información y sobre todo permite a las aplicaciones de inteligencia de negocios extraer la información increíblemente rápido.
1.2 Modelo Multidimensional
Un modelo
de datos Multidimensional contiene un conjunto de medidas numéricas objeto de
análisis. Dichas medidas dependen de una serie de dimensiones.
Cada medida particular es un punto en un espacio Multidimensional en el que los valores de cada dimensión se suelen jerarquizar.
Cada medida particular es un punto en un espacio Multidimensional en el que los valores de cada dimensión se suelen jerarquizar.
Los datos
en un DW se modelan en data cubes (cubos de datos), estructuras
multidimensionales (hipercubos).
Cuyas operaciones más comunes son:
* Roll up (incremento en el nivel de agregación de los datos).
* Drill Down (incremento en el nivel de detalle, opuesto a roll up).
* Slice (reducción de la dimensionalidad de los datos mediante selección).
* Dice (reducción de la dimensionalidad de los datos mediante proyección).
* Pivotaje o rotación (reorientación de la visión Multidimensional de los datos).
Cuyas operaciones más comunes son:
* Roll up (incremento en el nivel de agregación de los datos).
* Drill Down (incremento en el nivel de detalle, opuesto a roll up).
* Slice (reducción de la dimensionalidad de los datos mediante selección).
* Dice (reducción de la dimensionalidad de los datos mediante proyección).
* Pivotaje o rotación (reorientación de la visión Multidimensional de los datos).

CUBO OLAP

2.
Proceso de negocio
Un proceso de negocio es un conjunto de tareas relacionadas
lógicamente llevadas a cabo para lograr un resultado de negocio definido. Cada
proceso de negocio tiene sus entradas, funciones y salidas. Las entradas son
requisitos que deben tenerse antes de que una función pueda ser aplicada.
Cuando una función es aplicada a las entradas de un método, tendremos ciertas
salidas resultantes.
Es una colección de actividades estructurales relacionadas que producen
un valor para la organización, sus inversores o sus clientes. Es, por ejemplo,
el proceso a través del que una organización ofrece sus servicios a sus
clientes.
Un proceso de negocio puede ser parte de un proceso mayor que lo abarque
o bien puede incluir otros procesos de negocio que deban ser incluidos en su
función. En este contexto un proceso de negocio puede ser visto a varios
niveles de granularidad. El enlace entre procesos de negocio y generación de
valor lleva a algunos practicantes a ver los procesos de negocio como los
flujos de trabajo que efectúan las tareas de una organización.
Los procesos poseen las siguientes características:
Los procesos poseen las siguientes características:
1. Grandes y complejos
2. Muy dinámicos
3. Ampliamente distribuidosy particularizados
4. Largaduración una ejecución puede durar meses o años
5. Automatizados al menos en parte
6. Dependientesde la inteligencia y juicio humanos
7. Difícilesde hacer visibles
8. Pueden ser medidos y están orientados al rendimiento
9. Tienen resultados específico
10. Entregan resultados a clientes o “stakeholders”
11. Responden a alguna acción o evento específico
12. Las actividades deben agregar valor a las entradas del proceso.
2. Muy dinámicos
3. Ampliamente distribuidosy particularizados
4. Largaduración una ejecución puede durar meses o años
5. Automatizados al menos en parte
6. Dependientesde la inteligencia y juicio humanos
7. Difícilesde hacer visibles
8. Pueden ser medidos y están orientados al rendimiento
9. Tienen resultados específico
10. Entregan resultados a clientes o “stakeholders”
11. Responden a alguna acción o evento específico
12. Las actividades deben agregar valor a las entradas del proceso.
Los
procesos de negocio pueden ser vistos como un recetario para hacer funcionar un
negocio y alcanzar las metas definidas en la estrategia de negocio de la
empresa. Las dos formas principales de visualizar una organización, son la
vista funcional y la vista de procesos.
Tipos de procesos de negocio:
- Procesos estratégicos - Estos procesos dan orientación al negocio. Por ejemplo, “Planificar estrategia”, “Establecer objetivos y metas”.
- Procesos centrales – Estos procesos dan el valor al cliente, son la parte principal del negocio. Por ejemplo, “Repartir mercancías”.
- Procesos de soporte – Estos procesos dan soporte a los procesos centrales. Por ejemplo, “contabilidad”, “Servicio técnico”.
Por ejemplo, el proceso a través del que una organización ofrece sus servicios a sus clientes:
3. Medida del negocio
Las medidas más útiles para incluir en una tabla de hechos se pueden ir
sumando como por ejemplo:
La cantidad de producto vendido, dinero obtenido por las ventas; son
medidas numéricas que pueden calcularse con la suma de varias cantidades de la
tabla. En consecuencia, por lo general los hechos a almacenar en una tabla
de hechos son siempre numéricos.
Características de las medidas:
–Deben ser numéricas.
–Cruzan todas las dimensiones en todos los niveles.
Las medidas pueden clasificarse en:
Naturales
- Estas formas de agregación pueden ser:
- Suma: es la operación que suma los valores de las columnas
- Cuenta: realiza un conteo de los valores
- Mínima: devuelve un valor mínimo
- Máxima: proporciona el mayor de los valores
- Cuenta de Distintos: cuenta los valores diferentes
Calculadas
- Cálculos Matemáticos
- Expresiones condicionales
- Alertas
4. Tabla
dimensional o dimensión
Las tablas de dimensiones definen como están los datos organizados lógicamente y proveen el medio para analizar el contexto del negocio. Representan los ejes del cubo, y los aspectos de interés, mediante los cuales el usuario podrá filtrar y manipular la información almacenada en la tabla de hechos.
Las tablas de dimensiones definen como están los datos organizados lógicamente y proveen el medio para analizar el contexto del negocio. Representan los ejes del cubo, y los aspectos de interés, mediante los cuales el usuario podrá filtrar y manipular la información almacenada en la tabla de hechos.
•Definen
la organización lógica de los datos.
•Tiene una PK (única) y columnas de referencia:
•Tiene una PK (única) y columnas de referencia:
o
Clave principal (PK) o identificador único
o Clave foráneas.
o Datos de referencia primarios (identifican la dimensión)
o Datos de referencia secundarios (complementan la descripción).
o Clave foráneas.
o Datos de referencia primarios (identifican la dimensión)
o Datos de referencia secundarios (complementan la descripción).

5. Tabla de Hechos
En las bases de datos, y más
concretamente en un data warehouse, una tabla de hechos (o tabla fact)
es la tabla central de un esquema dimensional (en estrella o en copo de nieve)
y contiene los valores de las medidas de negocio. Cada medida se toma mediante
la intersección de las dimensiones que la definen, dichas dimensiones estarán
reflejadas en sus correspondientes tablas de dimensiones que rodearán la tabla
de hechos y estarán relacionadas con ella.
Ejemplo de Tabla de Hechos:

Cardinalidad de la tabla de hechos:
Las
tablas de hechos pueden contener un gran número de filas, a veces cientos de
millones de registros cuando contienen uno o más años de la historia de una
gran organización, esta cardinalidad estará acotada superiormente por la
cardinalidad de las tablas dimensionales.
- Granularidad
Una característica
importante que define a una tabla de hechos es el nivel de granularidad de los datos que en
ella se almacenan, entendiéndose por 'granularidad' el nivel de detalle de
dichos datos, es decir, la granularidad de la tabla de hechos representa el
nivel más atómico por el cual se definen los datos. Por ejemplo, no es lo mismo
contar el tiempo por horas (grano fino) que por semanas (grano grueso); o en el
caso de los productos, se puede considerar cada variante de un mismo artículo
como un producto (por ejemplo, en una empresa textil, cada talla y color de
pantalón podría ser un producto) o agrupar todos los artículos de una misma
familia considerándolos como un único producto (por ejemplo, el producto
pantalón genérico).
Como se puede
observar, la granularidad afecta a la cardinalidad, tanto de las dimensiones
como de la tabla de hechos, a mayor granularidad (grano más fino) mayor será el
número de registros final de la tabla de hechos.
Cuando la
granularidad es mayor, es frecuente que se desee disponer de subtotales
parciales, es decir, si tenemos una tabla de hechos con las ventas por días,
podría interesar disponer de los totales semanales o mensuales, estos datos se
pueden calcular haciendo sumas parciales, pero es frecuente añadir a la tabla
de hechos registros donde se almacenan dichos cálculos para no tener que
repetirlos cada vez que se requieran y mejorar así el rendimiento de la
aplicación. En este caso se dispondrá en la misma tabla de hechos de datos de
grano fino y de grano más grueso aumentando aún más la cardinalidad de la
tabla.
- Agregación
La agregación es un
proceso de cálculo por el cual se resumen los datos de los registros de
detalle. Esta operación consiste normalmente en el cálculo de totales dando
lugar a medidas de grano grueso. Cuando se resumen los datos, el detalle ya no
está directamente disponible para el analista, ya que este se elimina de la
tabla de hechos.
Esta operación se
realiza típicamente con los datos más antiguos de la empresa con la finalidad
de seguir disponiendo de dicha información (aunque sea resumida) para poder
eliminar registros obsoletos de la tabla de hechos para liberar espacio.
6. Data Mart
6. Data Mart
Un Data mart
es una versión especial de almacén de datos (data warehouse).
Son subconjuntos de
datos con el propósito de ayudar a que un área específica dentro del negocio
pueda tomar mejores decisiones. Los datos existentes en este contexto pueden
ser agrupados, explorados y propagados de múltiples formas para que diversos
grupos de usuarios realicen la explotación de los mismos de la forma más
conveniente según sus necesidades.
Es un pequeño
DataWarehouse, para un determinado numero de usuarios, para un área funcional,
especifica de la compañía. También podemos definir que un Data Martes es un
subconjunto de una bodega de datos para un propósito especifico.

Características:
- Son pobladas por usuarios finales.
- Se optimizan en función a procesos transaccionales.
- Se actualizan constantemente.
- Contienen mucha información de detalle.
Dependencia de un data mart
Según la tendencia
marcada por Inmon sobre los data warehouse, un data mart dependiente es un
subconjunto lógico (vista) o un subconjunto físico (extracto) de un almacén de
datos más grande, que se ha aislado por alguna de las siguientes razones:
- Se necesita para un esquema o modelo de datos espacial (por ejemplo, para reestructurar los datos para alguna herramienta OLAP).
- Prestaciones: Para descargar el data mart a un ordenador independiente para mejorar la eficiencia o para obviar las necesidades de gestionar todo el volumen del data warehouse centralizado.
- Seguridad: Para separar un subconjunto de datos de forma selectiva a los que queremos permitir o restringir el acceso.
- Conveniencia: la de poder pasar por alto las autorizaciones y requerimientos necesarios para poder incorporar una nueva aplicación en el Data Warehouse principal de la Empresa.
- Demostración sobre el terreno: para demostrar la viabilidad y el potencial de una aplicación antes de migrarla al Data Warehouse de la Empresa.
- Política: Cuando se decide una estrategia para las TI (Tecnologías de la información) en situaciones en las que un grupo de usuarios tiene más influencia, para determinar si se financia dicha estrategia o descubrir si ésta no sería buena para el almacén de datos centralizado.
- Política: Estrategia para los consumidores de los datos en situaciones en las que un equipo de almacén de datos no está en condiciones de crear un almacén de datos utilizable.