Logo Base de Conhecimento

Optimización de la estructura de datos

Una estructura analítica  o de datos optimizada es aquella que satisface las necesidades comerciales del usuario final con rapidez en la entrega de números, practicidad en el ensamblaje de vistas y agilidad en las actualizaciones de datos. Aquí verá cómo BIMachine realiza la clasificación del índice de optimización según los 8 criterios que se muestran en la imagen de arriba.

Criterios del índice de optimización

Todos los criterios siguen un patrón de clasificación de tres rangos: Malo, Regular y Bueno.Cada criterio tiene características que definen el índice dentro de cada rango, y se detallan a continuación.

Criterios de línea

Este criterio tiene como objetivo controlar el tamaño total de la estructura, ordena en función del número total de registros de datos que se cargan. Una estructura con muchas líneas indica que sus datos no se manejan correctamente y probablemente ralentizará las cargas de actualización y la entrega de indicadores y conocimientos a los usuarios finales.

El índice de optimización considera los siguientes parámetros para la clasificación:

  • Más de 1 millón de líneas: MALO
  • Entre 500 mil y 1 millón de líneas: REGULAR
  • Menos de 500 mil líneas: BUENO
Si su estructura tiene este índice BAD, existen algunos métodos para optimizarlo, como:
  • Criterios de filtrado y selección de datos: valida que estás cargando los datos que realmente se necesitan. En muchos casos siempre tenemos un rango de período de datos que queremos analizar, así que valide con el área de negocio que consume la información qué período realmente debería estar disponible.
  • Agrupación de registros: compruebe si existe la posibilidad de resumir sus datos, agrupándolos según el nivel de detalle requerido para el análisis
  • Desglose de estructuras: en algunos casos vale la pena segmentar su estructura, creando nuevas estructuras que contengan información más detallada para análisis específicos, y dejando la estructura principal con un menor nivel de detalle, agrupando registros para reducir el número de líneas, y así obtener vistas más rápidas
  • Nivel de detalle: el nivel o granularidad de su estructura es muy importante, define el nivel de detalle de la información que se pondrá a disposición del usuario. Normalmente, en BI, la información se analiza en niveles superiores y gerenciales, lo que permite la identificación de pistas y conocimientos para el usuario empresarial que son suficientes para la toma de decisiones. En general, lo mejor para la granularidad en una estructura es no descender el detalle al último nivel posible, como el número de una factura, pedido o documento financiero.

Criterios de dimensiones

El número de dimensiones dentro de una estructura indica la optimización de su modelo de negocio. Una estructura analítica bien modelada suele tener un número reducido de dimensiones, lo que debería permitir al usuario empresarial detallar la información necesaria para la toma de decisiones.
El índice de optimización considera los siguientes parámetros para la clasificación:
  • Más de 20 dimensiones: MALO
  • Entre 12 y 20 dimensiones: REGULAR
  • Menos de 12 dimensiones: BUENO
Si su estructura tiene un índice de dimensiones MALO, tenemos algunos consejos para optimizarlo:
  • Concatenación de campos: es común que la información se tome en diferentes formatos, pero que tienen la misma finalidad en una estructura, por ejemplo, la separación de Clientes en Código y Nombre de la Empresa. En estos casos, se recomienda que solo se cree una dimensión que concatene estos dos datos, reduciendo así el número total de dimensiones.
  • Dimensiones duplicadas: otra ocurrencia común es la duplicación de dimensiones en una estructura, asegúrese de tener dimensiones que sean únicas y que realmente permitan al usuario profundizar en los datos.
  • Dimensiones inutilizables: valida que todas las dimensiones que se encuentran en tu estructura realmente tengan una función para el escenario empresarial, es común agregar campos sin saber si serán usados y se olvidan. Esto solo se interpone en el camino de los usuarios comerciales, ralentiza la carga de datos, abre indicadores y vistas de BI
  • Estructuras cruzadas: cuando tiene una estructura que cruza datos de dos o más estructuras, como Facturación X Metas, asegúrese de que las dimensiones consideradas en el cruce existan en todas las estructuras involucradas, ya que no tiene sentido traer una información que solo existe. en facturación por ejemplo

Criterios de medición física

El número de mediciones físicas en una estructura es relevante para el modelo de negocio realizado. Muchas medidas indican que la estructura puede no haber sido bien pensada, y puede terminar entorpeciendo al usuario a la hora de generar sus opiniones e insights de negocio, contaminando con demasiadas opciones y generando confusión sobre qué números presentar son correctos.
El índice de optimización considera los siguientes parámetros para la clasificación:
  • Más de 15 medidas: MALO
  • Entre 10 y 15 medidas: REGULAR
  • Menos de 10 medidas: BUENO
Si su estructura tiene un índice MALO de medidas físicas, tenemos algunos consejos para optimizarlo:
  • Cálculos realizados: compruebe si puede hacer los cálculos necesarios para que sus indicadores ya estén en la extracción de datos, las operaciones de suma y resta se pueden realizar normalmente en la extracción, en lugar de llevar cada una de las variables a BIMachine y luego crear medidas calculadas
  • Medidas no utilizadas: asegúrese de que todas las medidas que está tomando para la estructura se utilizarán realmente, muchas medidas impiden que el usuario empresarial cree sus puntos de vista
  • Estructuras cruzadas: cuando tiene una estructura que cruza datos de dos o más estructuras, como Facturación X Metas, asegúrese de que las medidas consideradas en el cruce tengan sentido en la comparación, por ejemplo, no vale la pena traer valores de facturación de impuestos si no hay un objetivo de comparación para ello

Criterios de medidas calculadas

Las medidas calculadas en una estructura son fundamentales para que podamos obtener indicadores precisos e identificar puntos de mejora en el escenario empresarial.
El índice de optimización considera los siguientes parámetros para la clasificación:
  • Más de 15 medidas: MALO
  • Entre 10 y 15 medidas: REGULAR
  • Menos de 10 medidas: BUENO
Si su estructura tiene un índice MALO de medidas calculadas, tenemos algunos consejos para optimizarlo:
  • Cálculos realizados: compruebe si puede hacer los cálculos necesarios para que sus indicadores ya estén en la extracción de datos, las operaciones de suma y resta se pueden realizar normalmente en la extracción, en lugar de llevar cada una de las variables a BIMachine y luego crear medidas calculadas
  • Medidas no utilizadas: asegúrese de que todas las medidas que está tomando para la estructura se utilizarán realmente, muchas medidas impiden que el usuario empresarial cree sus puntos de vista
  • Estructuras cruzadas: cuando tiene una estructura que cruza datos de dos o más estructuras, como Facturación X Metas, asegúrese de que las medidas consideradas en el cruce tengan sentido en la comparación, por ejemplo, no vale la pena traer valores de facturación de impuestos si no hay un objetivo de comparación para ello

Criterios de frecuencia de carga total

La carga completa está destinada a actualizar todos los datos en su estructura de BI y solo debe usarse cuando sea realmente necesario, para evitar tráfico redundante y procesamiento de información. La frecuencia de las cargas totales en una estructura es un factor muy importante en su diseño de BI; muchas cargas totales realizadas afectarán el rendimiento de las vistas comerciales en su conjunto, y especialmente el rendimiento de su fuente de datos. Por ejemplo, si está buscando datos de su ERP, puede haber ralentizaciones para los usuarios operativos en su vida diaria. Idealmente, en un escenario de actualización de datos, debería tener una carga completa máxima por día.
El índice de optimización considera los siguientes parámetros para la clasificación:
  • Más de 1 carga completa por día: MALO
  • 1 carga completa por día: REGULAR
  • Menos de 1 carga completa por día: BUENO
Si su estructura tiene un índice MALO de frecuencia de cargas totales, tenemos algunos consejos para optimizarlo:
  • Períodos de actualización: asegúrese de que realmente necesita actualizar sus datos, la mayoría de la información necesita actualizaciones que busquen datos de los últimos días, por ejemplo, la facturación de su empresa, es información que difícilmente necesitará actualizar más que las facturas emitidas dentro 30 días, ya que ya no sufren ajustes ni cancelaciones
  • Cargas incrementales: una carga incremental borrará un cierto período de datos de su base en BI, y lo actualizará con datos nuevos o modificados, por lo que siguiendo el concepto tratado en el ítem anterior, transforme sus cargas totales en incrementales, buscando el período de datos que realmente sufrieron cambios que deben ser considerados en BI
  • Frecuencia de cargas totales: si realmente es necesario realizar cargas totales, trate de reducir su frecuencia, hágalo como máximo una vez al día, sin embargo, cuando sea posible programe sus cargas cada 2 días, semanalmente o incluso mensualmente.

Criterios de frecuencia de carga incremental

Una carga incremental está destinada a actualizar un período de datos en su estructura. Borrará un cierto período de datos ya cargados en BI y cargará datos nuevos y actualizados según su configuración de extracción. La frecuencia de las actualizaciones incrementales es un factor de rendimiento importante tanto para sus vistas analíticas como para su fuente de datos, donde las cargas muy frecuentes pueden ralentizar su sistema ERP, por ejemplo, cuando no están bien articuladas.
El índice de optimización considera los siguientes parámetros para la clasificación:
  • Más de 15 cargos incrementales por día: MALO
  • Entre 10 y 15 cargos incrementales por día: REGULAR
  • Menos de 10 cargos incrementales por día: BUENO
Si su estructura tiene un índice de frecuencia de carga incremental MALO, tenemos algunos consejos para optimizarlo:
  • Frecuencia de actualización: muchos usuarios comerciales informan que necesitan actualizar datos casi en tiempo real, necesitan que los datos siempre reflejen el momento más reciente. Sin embargo esto no siempre es real, verifique si será posible que el usuario vea las diferencias en los indicadores con cada actualización, en muchos casos una sincronización de las actualizaciones con los tiempos en que el usuario podrá verificarlas resuelve este problema, por lo que no sigue ejecutando actualizaciones de datos por nada, lo que solo carga su BI y, por lo tanto, su sistema de origen de datos.

Criterios para el número de líneas en cargas incrementales

La cantidad de registros devueltos en su carga incremental es un indicador importante de la eficiencia de sus actualizaciones. Muchas filas que se devuelven con cada actualización indican que el período de tiempo dado puede ser demasiado largo y es posible acortarlo, lo que resulta en una actualización más rápida y eficiente.
El índice de optimización considera los siguientes parámetros para la clasificación:
  • Más del 30% del total de líneas de estructura: MALO
  • Entre el 10% y el 30% del total de líneas de la estructura: REGULAR
  • Menos del 10% del total de líneas de estructura: BUENO
Si su estructura tiene un índice MALO de número de filas en cargas incrementales, tenemos algunos consejos para optimizarlo:
  • Periodo de actualización: validar si el periodo de actualización de la carga incremental está de acuerdo con la necesidad real, es común querer asegurarse de que si se ha cambiado un dato un poco más antiguo, se corrige en la base de BI, sin embargo esto se puede hacer por separado. cargas, por lo que es mejor tener más programas de carga incrementales que busquen períodos de tiempo diferentes que solo uno que intente actualizar todos los datos cada vez. Por ejemplo, puede programar una carga incremental cada 1 hora que siempre actualice los registros del día anterior y actual, y por la noche hacer una carga incremental que actualice los registros de 30 días, disminuyendo así el número total de registros traficados en el día. 

Criterios del modelo distribuido

El modelo distribuido es una pequeña configuración al momento de crear su estructura que marca una gran diferencia en el desempeño de sus visiones. Se recomienda encarecidamente que habilite el modelo distribuido, ya que garantizará una mayor velocidad en la apertura de sus vistas e indicadores. Lo que hace esta configuración es una mejor estructura de sus datos en la base de BI, esto no es visible para el usuario, pero es muy importante para el procesador analítico multidimensional.
El índice de optimización considera los siguientes parámetros para la clasificación:
  • Modelo distribuido inhabilitado: MALO
  • Modelo distribuido habilitado: BUENO

Ultimos artículos

Scroll al inicio
ada-icon Ada.ai