Para recordar lo que son los sistemas informacionales dejo aquí la entrada a mi anterior blog donde explico el contenido de esto.
Acto seguido podemos empezar a hablar de lo que hemos aprendido el lunes pasado día 26 de abril de 2021.
Componentes de los sistemas informacionales:
Fuentes de información externa:
Bases de datos documentales, prensa del sector, asociaciones empresariales, etc.
Fuentes de información interna:
Bases de datos del sistema operacional
Almacén de datos:
Data warehouse
Herramientas de análisis de datos:
EIS, DSS, OLAP, consulta e informes, minería de datos
Sistemas informacionales
Nuestro universo se desenvuelve alrededor de los datos: Ciencia, ciencias sociales, empresa y comercio, entretenimiento y ocio, medicina, industria, energía, internet de las cosas (IoT)
La necesidad de almacenar información cada día es mayor. Somos ricos en datos pero pobres en conocimiento. Existen ingentes cantidades de datos almacenados infrautilizados.
El problema no son los datos, es la capacidad de gestionar, analizar, sintetizar, visualizar y descubrir el conocimiento implícito de ello
Acceso
Middleware o lógica de intercambio de información entre aplicaciones, o Agente Intermedio, es un software que asiste a una aplicación para interactuar o comunicarse con otras aplicaciones, o paquetes de programas, redes, hardware o sistemas operativos.
Operaciones con los datos
Operaciones básicas (rutinas del día a día)
Operaciones descriptivas (explicar lo datos existentes)
Operaciones predictivas (hacer previsiones que faciliten la toma de decisiones)
Operaciones básicas
Supone introducir, almacenar y controlar los datos.
Utiliza Bases de datos convencionales (crear, borrar, modificar registros de información, consultar)
Ejemplos: Transacciones, tales como comprar un billete o entrada, pagar con tarjeta de crédito, etc
Operaciones descriptivas
Agrupar (clustering), detectar datos que tienen valores o características similares y segmentarlos en grupos o clases representativas.
Identificar reglas de asociación, supone encontrar relaciones interesantes entre variables.
Descubrir secuencia de patrones (ADN, sistemas de recomendación).
Sintetizar. Resumir conjuntos o bases de datos masivos para facilitar la toma de decisiones.
Operaciones predictivas (hacer previsiones que faciliten la toma de decisiones)
Clasificar o segmentar (tipos de clientes, preferencias de usuarios, etc).
Estimar relaciones entre parámetros (análisis de regresión).
Detectar desviaciones o anomalías (detección de acciones fraudulentas, detección de accidentes, etc).
Identificar series temporales (pronósticos sobre nuevos datos o tendencias).
Fase de Explotación
La fase o componente de explotación es la encargada de hacer tangible todo el proceso que conlleva un sistema de BI. Se encarga de generar conocimiento que pueda ser útil a la empresa.
En ésta capa o componente se agrupan todas las interfaces de usuario. Se encarga del manejo de las herramientas que obtienen resultados del DW y los DM.
Serán herramientas de generación de informes ejecutivos (EIS, Executive Information System), soporte de toma de decisiones (DSS, Decision Support Systems), generación de modelos de predicción, análisis estadístico e incluso Data Mining, Inteligencia Artificial, Redes Neuronales y herramientas OLAP.
Es donde se utilizan los Metadatos, para recuperar los informes y consultas predefinidos de manera eficaz.
Es en esta capa donde se debe tener una mayor visibilidad creativa para llegar a ciertas conclusiones no siendo trivial el hecho de explotación de los datos en todos los casos y habrá que usar diversas técnicas para la toma de decisiones.
Sistemas OLAP – On Line Analytical Processing
La razón de usar sistemas OLAP reside en la rapidez de respuesta que se obtiene sobre datos resumidos, agrupados y detallados en contraposición con los sistemas OLTP.
Los sistemas OLAP son bases de datos orientadas al procesamiento analítico. Este análisis suele implicar, generalmente, la lectura de grandes cantidades de datos para llegar a extraer algún tipo de información útil y multidimensional.
Diseño multidimensional
El sistema decisional no debe ayudar a vender, comprar, producir o transportar, sino a evaluar, comparar, presupuestar, planificar, proyectar, etc.
Excel es una de las herramientas de reporting y análisis de datos más utilizadas en BI
Herramientas OLAP
La solución la proporcionan las herramientas OLAP.
Son Herramientas con la capacidad de procesar consultas en línea con el objetivo de analizar datos que cumplan con las siguientes propiedades.
FAST: respuesta = 5 seg. (20 seg. excepcionalmente)
ANALYSIS: Herramientas de análisis estadístico para responder preguntas del tipo: why y what if
SHARED Mecanismos de seguridad, concurrencia y compartición de datos
INFORMATION: Almacenar y gestionar gran cantidad de datos y de información (metadatos)
Objetivos OLAP
Que los usuarios no dependan del departamento de informática
Que se puedan formular nuevas preguntas de forma dinámica
Presentar los datos de la manera que los analistas están acostumbrados a verlos
Elementos a utilizar
Hechos: datos métricos a analizar - Qué se quiere analizar ?
Dimensiones: datos descriptivos - Quién, a quién, dónde cuándo, cómo, etc.
La posición de una celda de información define su significado.
Operaciones sobre los cubos
Una vez que se tiene el cubo, ¿Cuáles son las operaciones que se pueden realizar para visualizar los datos?
Slice (o sesgo)
Dice (o dado)
Roll–up (o generalización)
Drill down (o especialización)
Drill across (o navegación entre cubos)
Estas operaciones pueden encadenarse para satisfacer la necesidades analíticas de los usuarios.
Arquitecturas OLAP
Alternativas para una BD Multidimensional:
Usar un modelo relacional: Relational OLAP - Algunos no lo consideran adecuado: - Utilizar tablas para almacenar hipercubos
Usar modelos alternativos: MOLAP, HOLAP - Ofrecen modelos alternativos de representación más cercanos a la estructura de cubos
Minería de datos-Business Analytics
La constante e iterativa exploración y estudio del rendimiento pasado del negocio, con el objetivo de ganar conocimiento útil para la consecución de los objetivos estratégicos de la organización
Extracción de patrones (conocimiento) en grandes bases de datos
Aplicación de los campos:
Market basket analysis (compras)
Perfiles de usuarios en la web
Segmentación de clientes
Detección de fraudes/intrusos
...
Ejemplos:
Determinar la probabilidad de que un cliente solicite la baja de su servicio en los próximos 3 meses.
Determinar qué clientes son más propensos a responder afirmativamente a una determinada acción de marketing con una oferta determinada.
Antes de lograr un préstamo, determinar la probabilidad de que esa persona no pueda hacer frente al pago del mismo en tiempo y forma, cayendo en mora
Segmentar nuestra cartera de clientes para encontrar grupos de clientes con características de comportamiento similares.
Analizar el comportamiento de compras de nuestros clientes para la confección de ofertas de productos.
Origenes:
Data Mining y Estadística:
Los métodos estadísticos son la base de muchas de las técnicas de minería de datos
Originalmente muchas de estas técnicas fueron diseñadas con propósitos confirmatorios
La estadística exploratoria aparece en los años 70, por J. Tuckey§Los algoritmos estadísticos fueron adaptados para el procesamiento de grandes volúmenes de datos
Data Mining y la Inteligencia Artificial:
La inteligencia artificial se integra al DM a partir de las redes neuronales artificiales
Se usan para construir modelos predictivos no lineales que aprenden a través de entrenamiento y que se asimilan a los modelos de redes neuronales biológicas.
Modelos de Minería de Datos
Modelos descriptivos
Describen el comportamiento de los datos de forma que sea interpretable por un usuario experto.
Ejemplos:
Los compradores de pañales también suelen comprar cerveza (Reglas de asociación)
Segmentación de los clientes de un hipermercado: clientes ocasionales que gastan mucho, clientes habituales con presupuesto limitado, clientes ocasionales con presupuesto limitado (Algoritmos de clustering)
Modelos predictivos○Además de describir los dato, se utilizan para predecir el valor de algún atributo desconocido.
Ejemplos:
Datagramas que corresponden a intentos de intrusión (Algoritmos de clasificación )
Perfil de un cliente de alto riesgo para préstamos bancarios. (Algoritmos de clasificación)
Perfil del minero
Es el vínculo entre las áreas de tecnología informática y las áreas de negocios
Traduce los requerimientos de información en preguntas apropiadas para su análisis con las herramientas de minería.
Realimenta el Data Warehouse de la organización con los resultados de sus modelos. Por ejemplo, segmento de cliente, canal de comunicación más efectivos, etc.
Habilidades:
Fuerte enfoque analítico con visión de negocio. No debe perder de vista el objetivo!
Conocimientos de estadística avanzada
Conocimiento de técnica de minería y análisis exploratorio
Conocimiento de técnicas de manipulación de datos (SQL u otros)
Pero sobre todo, curiosidad y creatividad
Paciencia
DSS – Decision Support System
Son los sistemas para el apoyo a la toma de decisiones.
Un DSS es un sistema informático que utiliza información y modelos matemáticos para ayudar a los trabajadores de la información a tomar decisiones empresariales adecuadas según las condiciones del mercado y la situación interna de la compañía.
Los actuales DSS utilizan metodologías OLAP, y ofrecen un soporte pasivo a la toma de decisiones. Es decir, los sistemas DSS actuales ayudan a la toma de decisiones proporcionando información confiable y actualizada, pero raramente aportan valor añadido a la información y decisión resultante.
Han de dar soporte a los diferentes tipos de decisiones empresariales. Las podemos clasificar:
Según su trascendencia:
Decisiones estratégicas
Decisiones tácticas
Decisiones operativas
Según su naturaleza:
Decisiones estructuradas. Variables conocidas
Decisiones desestructuradas. Variables no conocidas
Decisiones semiestructuradas.
Combinando estas clasificaciones, nos aparecen 9 clases de decisiones. En función de lo ambicioso de nuestro DSS, deberíamos tratar de cubrir el máximo número de estos casos
EIS – Executive Information System
Sistema de Información Ejecutiva en castellano, es una herramienta software, basada en un DSS, que provee a los gerentes de un acceso sencillo a información interna y externa de su compañía, y que es relevante para sus factores clave de éxito.
Se puede definir un EIS como una aplicación con soporte de querying y reporting sobre las diferentes áreas de negocio, de forma consolidada, para facilitar la monitorización de la organización o área específico.
El EIS se caracteriza por ofrecer al ejecutivo un acceso rápido y efectivo a la al DW o DM, utilizando interfaces gráficas visuales e intuitivas, con un interfaz gráfico que permite que los usuarios no sean técnicos.
Suele incluir alertas e informes basados en excepción, así como históricos y análisis de tendencias. También es frecuente que permita el envío por diferentes canales (correo, sistemas de ficheros, etc.) de los informes más relevantes.
CMI - Cuadro de mandos integral
También conocido como Balanced Sorecard (BSC) o dashboard, es una herramienta que permite el control de la organización a partir de sus diferentes áreas.
Se diferencia de los DSS o EIS en que está más orientado al seguimiento de indicadores que al análisis minucioso de información.
Situación actual en el Mercado BI
Líderes: Microsoft, Tableau, Qlik, ThoughtSpot
SAP se mantienen Oracle evoluciona
Big Data
Big Data son los activos de información de gran volumen, velocidad y variedad, que demandan formas innovadoras de procesamiento de la información, de manera rentable para conseguir un mayor conocimiento y con ello mejor toma de decisiones. (Gartner, Glosario TI, 2012) Beneficios: Ventajas competitivas, Optimización de procesos, Incrementos en ventas, Satisfacción clientes, ...
Implementar un Big Data
El negocio primero.
Los proyectos de Big Data deben responder a una necesidad del negocio y no a una decisión tecnológica.
El problema.
Determina el problema a resolver. Identifica qué temas preocupan más a tu organización y busca qué información le puede ayudar a solucionarlo.
Valora el impacto.
Entiende cuál es el impacto de estos problemas y desarrolla casos de uso para poner ejemplos.
Define métricas de éxito.
Cómo vas a medir el éxito de tu proyecto? Cuáles son las principales métricas que vas a tener que monitorizar durante el proyecto? KPIs
Asegura el encaje.
Si el problema se resuelve, ¿Qué va a mejorar en tu org?
Data Scientist
Personas dedicadas al big data: Data Scientist
Conocimientos principales:
Base matemática importante y estadística
Programar y base de datos
Conocimiento de negocios: curiosidad por los datos
Representación efectiva de los datos
Tecnologías
Las principales herramientas Big Data son de código abierto e impulsadas por grandes empresas: Espíritu Open Source.
Casos Prácticos
Marketing:
Segmentación de cliente
Estimación del gasto de cada cliente en las diferentes categorías de producto
Optimización de la cartera de productos
Recomendadores y cross-selling
Políticas de fidelización y descuentos
Comercio:
Gestión de precios por periodo, artículo y tienda
Localización óptima de las nuevas tiendas
Disposición de los productos en las tiendas
Gestión de inventario
Gestión de la cesta de la compra
Análisis de la política de ofertas
Recursos Humanos:
Identificación de talento
Recomendación de itinerarios de formación
Métricas de monitorización del talento
Predicción de la tasa de abandono de los empleados
Nuevas tendencias
Nuevos sistemas de localización indoor
Marcadores fijos (códigos QR, por ejemplo)
Sistemas inalámbricos (wifi, bluetooth)
Sistemas inerciales
Sistemas basados en el campo magnético
Google ha empezado a representar espacios Indoor
Posibilidades
Monitorización despertando el interés de los usuarios dentro de zonas comerciales
Emergencias: vías de evacuación o detección de refugios
Routing: para evitar masificaciones
Social
Comments