API – es un conjunto de rutinas y padrones de programación para acceso a un aplicativo de software o plataforma basado en la Web. La sigla API se refiere al término en ingles "Application Programming Interface" que significa "Interfaz de Programación de Aplicativos".
Atributo de GranularidadAtributo de Granularidade – A granularidade refere-se ao nível de detalhes ou precisão dos dados. Novamente, um exemplo comum é o jeito mais rápido de entender. Considere os valores de data: Para vendas diárias, você precisa dos valores de data específicos do dia em questão; para cotas, pode ser suficiente especificar o trimestre, mas se seus dados analíticos são os resultados de corridas de um evento esportivo, a granulação poderá ser milissegundos. O nível de precisão dos valores dos dados é a granulação.
Atributos clave – Es un valor único (tal como el número de su documento) en su estructura de datos que generalmente es generado por la herramienta, de igual forma, puede ser definido por el usuario también.
Balanced Scorecard – Es una metodología de medición y gestión de desempeño desarrollada por los profesores de Harvard Business Scholl (HBS) Robert Kaplan y David Norton, en 1992, que tiene como principal objetivo medir el desempeño empresarial a través de indicadores cuantificables y verificables.
Banco de datos y base de datos – Es un conjunto de datos con relacionamientos predefinidos entre si. Los datos que se encuentran en un banco de datos son organizadas en forma de tablas, columnas y líneas. Las tablas almacenan un conjunto de columnas y líneas.
Big Data – es el termino que describe el inmenso volumen de datos, estructurados y no estructurados, que impactan los negocios en el día a día. Big Data puede ser utilizado para el análisis y obtención de insights que llevan las mejores decisiones y direcciones estratégicas de negocio.
Business Analytics o Análisis de Negocios – Es un abordaje centrado en datos que combina la ciencia del análisis predictivo, utilizando algoritmos analíticos avanzados para procesar registros de datos y crear modelos que puedan realizar previsiones sobre los resultados futuros y agregar valor a las empresas.
Business Intelligence, Inteligencia de Negocios o BI – es definido como un proceso de reunión, organización y análisis de datos, que dan soporte a la toma de decisiones en el ambiente de negocios, a través de soluciones gráficas (informes, indicadores de gestión y dashboards) dinámicas e intuitivas. Las herramientas de BI tienen como objetivo transformar enormes volúmenes de datos en informaciones relevantes para la toma de decisiones.
Celda – se refiere al espacio en la intersección de un miembro del miembro de la dimensión de medidas y un miembro de cada jerarquía en un cubo.
Charts o Gráficos – son componentes de visualización que presentan los datos de forma amigable gráficamente. Ninguna solución de BI está completa sin el uso de este tipo de componentes.
Dentro de los principales tipos de gráficos se destacan el gráfico de pizza, línea, columna, barra, área y de radar.
Cloud Analytics – Es un modelo de servicio en el cual los datos analíticos son ofrecidos a través de una nube pública o privada. Los aplicativos y servicios analíticos en nube son normalmente ofrecidos sobre un modelo de precio basado en suscripción o de utilización.
Cloud computing – refiérese a la utilización de la memoria y de la capacidad de almacenamiento y calculo de computadores y servidores compartidos e interconectado por medio de internet, siguiendo el principio de computación en grande. Vale para hardware, memoria, banco de datos, carpetas de almacenamiento de archivos, infraestructura de red, etc.
Crosstab o Pivot Table -Método de categorización y combinación de datos relacionados. Es compuesto por tres partes: líneas, columnas y datos. Usado en el cruce de informaciones.
Cube o cubo – Un cubo OLAP, también conocimiento como cubo multidimensional o hipercubo, es una estructura de datos creada, usando bancos de datos OLAP, para permitir el análisis casi instantánea de los datos.
Cubo – Una estructura de datos que agrega las medidas por los niveles y jerárquicas de cada una de las dimensiones. Los cubos combinan varias dimensiones (como tiempo, geografía y productos) con datos resumidos (como los números de ventas o de clientes). Un cubo es compuesto por medida, dimensión y atributos de dimensión.
Dashboard – es la presentación visual de las informaciones más importantes y necesarias para alcanzar uno o más objetivos de negocio, consolidadas y ajustadas en una pantalla para fácil acompañamiento de su negocio.
Data integration – Es el proceso de combinar datos de diversas fuentes permitiendo la consolidación e integración de los datos en un ambiente único.
Data Mining o Mineración de datos – La mineración de datos es el proceso de descubiertas de informaciones accionables en grandes conjuntos de datos, a través de análisis matemáticos para derivar patrones y tendencias que existen en los datos. Normalmente, esos padrones no pueden ser descubiertos con la exploración de datos tradicionales por el hecho de que las relaciones sean muy complejas o por tener muchos datos.
Data Scientist o Ciencia de datos – Es aquella que consigue obtener en los millones de datos existentes en una o más fuentes de datos y darles algún sentido, a través de técnicas y métodos
Dimensión – Es un conjunto de informaciones analizando que puede ser usado como un filtro. Ej: Nombre del cliente, Supervisor, Empresa, Estado, etc. Es la tabla que almacena registros descriptivos (rótulos, descripciones) referentes a los hechos.
Dimensión de medidas – es la dimensión que contiene todas las medidas en un cubo.
Dimensiones de Banco de Datos y de Cubo – En un modelo, usted puede definir dimensiones independientes que serán incluidas en los cubos del mismo modelo. Cuando usted adiciona una dimensión a un cubo, el se llama una dimensión de cubo. Por si solo en un proyecto, como ítem independiente en el buscador de objetos, esta se llama como dimensión de banco de datos. ¿Por qué esta diferencia? Porque usted puede definir sus propiedades independientemente.
Documentación del producto, usted verá los dos términos usados, entonces vale la pena entender lo que significan.
DW– Data Warehouse es una base de datos utilizada para almacenar informaciones relacionadas a la organización. Su design permite el análisis de volúmenes de datos recogidos de los más diversos sistemas de informaciones de la empresa, resumiendo, es el banco de datos de BIMachine.
Es la utilización de recursos computacionales (como memoria, capacidad de almacenamiento y cálculos) de forma compartida entre varios computadores interconectados por medio del internet.
Área de consulta (Espacio del cubo) – El área de una consulta se refiere a los límites dentro de los cuales los datos son seleccionados. Este puede variar de un cubo entero (un cubo es el mayor objeto de consulta) hasta una celda. Así, el espacio de cubo es el producto de los miembros de las jerarquías de atributo de un cubo con las medidas del cubo.
Estructura de Datos – es donde almacenamos las informaciones extraidas del banco de datos. En esta estructuración, son recogidas las informaciones que más conviene y almacenadas de forma inteligente para que puedan ser montadas las visiones de BIMachine.
Hechos – son tablas que relacionan las medidas con las dimensiones.
Front-end y Back-end – Son términos generalizados que se refieren a las etapas iniciales y final de un proceso. El front-end es responsable por recoger la entrada del usuario en varias formas y procesarla para adecuarla a una especificación en el back-end pueda utilizar. Front-end es aquello que usted ve y con lo que usted interactúa, o sea, es la interconexión gráfica. Back-end es la contra regla por detrás de esa interfaz, que trabaja del lado del servidor. Front-End es la denominación dado a lo que es visto en la página, como: estilo de botones, layout de login, etc. El back-end es la denominación dada a lo que es visto en la página, como: estilo de botones, layout de login, etc. El back-end es el código bruto ejecutado en el lado del servidor donde el aplicativo esta rodando.
Gartner – Gartner desenvuelve tecnologías relacionadas con la introspección necesaria para sus clientes tomaran sus decisiones todos los días. Gartner trabajara con más de 10.000 (diez mil) empresas, incluyendo CIOs y otros ejecutivos de área de TI, en las corporaciones y órganos del gobierno. La compañía consiste en Búsqueda, Ejecución de Programas, Consultoría y Eventos.
Gauges – Un KPI de Guge tiene como principal característica un arco circular y exhibe un único valor que acompaña el proceso en relación con un objetivo. La meta, o el valor de destino, es representada por la línea (aguja) y el proceso en relación con ese objetivo es representado por el sombreamiento. También, el valor que representa el progreso es mostrado en negrilla dentro del arco siendo que todos ellos son distribuidos uniformemente a lo largo del arco, del mínimo (valor más a la izquierda) para el máximo (valor más a la derecha).
Grupos de medidas – son una colección de una o más medidas. La mayoría de ellas son definidos por el usuario, y usted puede usarlas para reunir medidas relacionadas. La excepción son las medidas de conteo distinto. Ellas siempre son colocadas en un grupo de medidas dedicado que contiene solamente a medida diferente.
Jerarquía – Son aquellas que acostumbran ser visualizadas en la forma del árbol, con uniones entre la base y sus respectivos subordinados. Por ejemplo: el año (base), tiene sus meses (subordinados) que por su vez tiene los días (posteriores a los subordinados).
Jerarquía Equilibrada – es la denominación dada cuando la jerarquía en formato de árbol, tiene la misma cantidad de datos, tanto del lado izquierdo cuanto derecho. Ilustrar.
Jerarquía Natural – son aquellas que surgen naturalmente como resultado de los datos que tenemos, por ejemplo, Año-Mes-Día
HTML (HyperText Markup Language) – significa Lenguaje de Marcación de Hipertexto y es un lenguaje de marcación utilizada en la construcción de páginas en la web. Los documentos HTML pueden ser interpretados por navegación y la tecnología es fruto de la unión entre los padrones HyTime y SGML.
KPI – Es una herramienta gráfica utilizada para medir el desempeño de los procesos de una empresa y, con esas informaciones, elaborar un plan de acción con los usuarios envueltos con el objetivo de alcanzar las metas establecidas.
Lenguaje R – Es un lenguaje de programación muy utilizada entre analistas de datos para desenvolver software para cálculos estadísticos y gráficos. Es un ambiente que permite el almacenamiento de datos, calculados en matrices e integración con herramientas intermediarias para los análisis.
Machine Learning – Quiere decir aprendizaje de máquina, quiere decir, son máquinas y sistemas inteligentes que al ser programados son capaces de adquirir conocimiento por cuenta propia, para que a partir de eso puedan ejecutar tareas substituyendo al ser humano. En Business Intelligence, decisiones con el mínimo de intervención humana.
MDX – MDX (Multidimensional Expressions) permite que usted consulte objetos multidimensionales, como cubos, y retorna conjuntos de células multidimensional que contiene datos del cubo. Este tópico y respectivos subtópicos ofrecen una visión general de las consultas MDX. En otras palabras, es el lenguaje utilizado por el BIMachine para extraer las informaciones del banco de datos y exhibirlas en las visiones creadas. Es similar al SQL y permitir la personalización de una medida calculada.
Medidas o métricas – son valores numéricos que representan el conjunto de datos y la situación de un indicador de negocio asociado a las dimensiones
Miembro calculado – es un miembro de dimensión definido y calculado en la hora de la consulta. Un miembro calculado puede ser definido como una consulta de usuario o como script de cálculo MDX y almacenado en el servidor.
Miembros – Son los datos en tiempo real dentro de la dimensión
Métricas – son medidas que sirven de base para la constitución de un indicador (KPI). Moneda es otro ejemplo: un aplicativo financiero puede acompañar valores monetarios hasta varios decimales, en cuanto el barrio de su escuela, puede necesitar solamente de los valores para la unidad. Es importante entender la granulación para evitar almacenar datos desnecesarios. Retirar los milisegundos de la marcación de la hora o centavos de valor de ventas puede economizar espacio de almacenamiento y tiempo de procesamiento cuando este nivel de detalle no fuera relevante para su análisis.
Niveles – Donde el dato se encuentra en la división jerárquica, por ejemplo, el Año está en el primer nivel, los meses en el segundo y los días en el tercero.
Observación: Si el atributo de granularidad y el atributo de llave fueran diferentes, todos los atributos no claves deberán ser vinculados, directa o indirectamente, al atributo de granularidad. Dentro de un cubo, el atributo de granularidad define la granularidad de una dimensión
OLAP – Online Analytical Processing o Procesamiento Analitio Online, es el servicio que recibe la solicitud de la aplicación y la enviada para nuestro servicio de extracción de datos para que este por su véz, los extraiga y presente en su pantalla. Es una tecnologia usada para organizar grandes bancos de datos comerciales y ofrecer soporte a la inteligencia empresarial. Los bancos de datos OLAP son divididos en uno o más o cubos, y cada cubo es organizado y proyectada por un administrador de cubo para ajustarse a la forma que usted recupera y analisa los datos de forma que sea más fácil crear y usar los informes de tablas dinamicas y los informes gráficos dinámicos que usted necesita.
Origenes de datos – es el cubo de origen. También llamado de estructura de datos.
Pie charts – son gráficos divididos en sectores, cada sector de la pizza exhibe el tamaño de una parte de la información relacionada. Gráficos de pizza normalmente son utilizados para exhibir los tamaños relativos de las partes de un todo.
Gráfico de radar – Exhibe una serie como un conjunto de puntos agrupados por categorías en un círculo de 360 grados. Los valores son representados por el tamaño del punto, conforme medido del centro del círculo. Cuanto más distante el punto esta del centro, mayor es su valor. Son exhibidos los rótulos de categoría en el perímetro del gráfico.
Predictive Analytics o Análisis Predictiva – Es un conjunto de herramientas y técnicas para extraer informaciones de conjuntos de datos, a fin de comprender padrones y resultados futuros. Es usada para analizar datos actuales y hechos históricos, a fin de comprender mejor los clientes, productos y aliados y para identificar riesgos y oportunidades potenciales para una empresa. Se utiliza una serie de técnicas, incluyendo la captura de datos, modelaje estadístico y Machine Learning para ayudar a los analistas a realizar previsiones de negocios futuros.
Relational Data base o Banco de datos relacional – es un banco de datos que modela los datos de una forma que ellos sean percibidas por el usuario como tablas, o más formalmente relaciones. Todos los datos son guardados en tablas. Estas tienen una estructura que se repite en cada línea, como usted puede observar en una planilla. Son los relacionamientos entre las tablas que las convierten "relacionales"
Scatter Charts o Gráficos de dispersión – son visualizaciones de datos usadas para mostrar el relacionamiento general en una grande cantidad de datos. Los datos son exhibidos como puntos, cada uno con el valor de una variable que determina la posición en el eje horizontal y el valor de otra variable que determina la posición en el eje vertical
Snowflake – La característica principal de este modelo es que las tablas dimensionales se relacionan con la tabla de hechos, solo algunas dimensiones se relacionan apenas entre ellas.
Social BI – es el análisis de fuentes de datos sociales como Twitter, Facebook y Linkedln y es utilizado con informes tradicionales y métodos de BI para ayudar las organizaciones a tomar mejores decisiones basadas en datos.
SQL (Structured Query Language) – es el lenguaje de búsqueda declarativa padrón para el banco de datos relacional (base de datos relacional). Muchas de las características originales del SQL fueron inspiradas en el álgebra relacional.
Stacked Bar Charts – son gráficos de barras que dividen sus barras en segmentos apilado y de colores diferentes. El eje color en la leyenda es definido como (Nombres de las columnas), lo que significa que cada columna seleccionada es representada por segmentos en un color especifico.
Star Schema – Metodología de modelo de datos utilizada del diseño de un Dara Warehouse. Los datos son modelados en tablas dimensionales unidas a una tabla de hechos. Las tablas dimensionales que contienen las características de un evento, La tabla de hechos almacena los hechos ocurridos y las claves para las características correspondiententes, en las tablas dimensionales
Subcubo es un subconjunto de un cubo que representa una exhibición filtrada del cubo. Subcubos pueden ser definidos con una instrucción Scope en el script de cálculo MDX o en cláusulas de subselección en una consulta MDX o como un cubo de sección.
Tabla de hecho – Es la tabla que almacena los valores detallados de medidas, valores, o hechos, en un Data Warehouse.
Tabla variables – Las variables de la tabla son objetos semejantes a las tablas temporales. La definición de una variable de la tabla inicia como una tabla vacía de estructura especifica. Su definición incluye columnas con sus tipos de datos, precisión, tamaño y advertencias. Esos elementos deben ser definidos durante la declaración, sin ser posible alterarlos o adicionarlos después de ejecutado.
Tables o Tablas – son objetos de banco de datos que contienen todos los datos en un banco de datos. En las tablas, los datos son organizados de manera lógica en un formato de línea y columna semejante al de una planilla. Cada línea representa un registro exclusivo y cada columna representa un campo de registro.