Glossário BIMachine

Análise Preditiva – É o uso de dados, algoritmos estatísticos e técnicas de machine learning para identificar a probabilidade de resultados futuros com base em dados históricos.

API – é um conjunto de rotinas e padrões de programação para acesso a um aplicativo de software ou plataforma baseado na Web. A sigla API refere-se ao termo em inglês “Application Programming Interface” que significa em tradução para o português “Interface de Programação de Aplicativos”.

Atributo de Granularidade – A granularidade refere-se ao nível de detalhes ou precisão dos dados. Novamente, um exemplo comum é o jeito mais rápido de entender. Considere os valores de data: Para vendas diárias, você precisa dos valores de data específicos do dia em questão; para cotas, pode ser suficiente especificar o trimestre, mas se seus dados analíticos são os resultados de corridas de um evento esportivo, a granulação poderá ser milissegundos. O nível de precisão dos valores dos dados é a granulação.

Atributos de chave – É um valor único (tal como o número do seu CPF) na sua estrutura de dados que geralmente é gerado pela ferramenta, contudo, pode ser definido pelo usuário também.

Balanced Scorecard – É uma metodologia de medição e gestão de desempenho desenvolvida pelos professores da Harvard Business School (HBS) Robert Kaplan e David Norton, em 1992, que tem como principal objetivo medir o desempenho empresarial através de indicadores quantificáveis e verificáveis.

Banco de dados ou base de dados – É um conjunto de dados com relacionamentos predefinidos entre si. Os dados contidos em um banco de dados são organizados na forma de tabelas, colunas e linhas. As tabelas armazenam um conjunto de colunas e linhas.

Big Data – é o termo que descreve o imenso volume de dados, estruturados e não estruturados, que impactam os negócios no dia a dia. Big Data pode ser utilizado para a análise e obtenção de insights que levam a melhores decisões e direções estratégicas de negócio.

Business Analytics ou Análise de Negócios – É uma abordagem centrada em dados que combina a ciência de análise preditiva, utilizando algoritmos analíticos avançados para processar registros de dados e criar modelos que possam realizar previsões sobre os resultados futuros e agregar valor às empresas.

Business Intelligence, Inteligência de Negócios ou BI – é definido como um processo de coleta, organização e análise de dados, que dão suporte às tomadas de decisão no ambiente de negócios, através de soluções gráficas (relatórios, indicadores de gestão e dashboards) dinâmicas e intuitivas. As ferramentas de BI objetivam transformar enormes volumes de dados em informações relevantes para a tomada de decisões.

Célula – refere-se ao espaço na interseção de um membro do membro de dimensão de medidas e um membro de cada hierarquia de atributo em um cubo.

Charts ou Gráficos – São componentes de visualização que apresentam os dados de forma amigável graficamente. Nenhuma solução de BI está completa sem o uso deste tipo de componente. Dentre os principais tipos de gráficos destacam-se o gráfico de pizza, linha, coluna, barra, área e polar.

Cloud Analytics – É um modelo de serviço no qual os dados analíticos são fornecidos através de uma nuvem pública ou privada. Os aplicativos e serviços analíticos em nuvem são normalmente oferecidos sob um modelo de precificação baseado em assinatura ou de utilização.

Cloud computing – refere-se à utilização da memória e da capacidade de armazenamento e cálculo de computadores e servidores compartilhados e interligados por meio da Internet, seguindo o princípio da computação em grade. Vale para hardware, memória, banco de dados, pastas de armazenamento de arquivos, infraestrutura de rede, etc.

Crosstab ou Pivot Table – Método de categorização e combinação de dados relacionados. É composto por três partes: linhas, colunas e dados. Usado no cruzamento de informações.

Cube ou cubo – Um cubo OLAP, também conhecido como cubo multidimensional ou hipercubo, é uma estrutura de dados criada, usando bancos de dados OLAP, para permitir a análise quase instantânea dos dados.

Cubo – Uma estrutura de dados que agrega as medidas pelos níveis e hierarquias de cada uma das dimensões. Os cubos combinam várias dimensões (como tempo, geografia e produtos) com dados resumidos (como os números de vendas ou de clientes). Um cubo é composto por medida, dimensões e atributos de dimensão.

Dashboard – é a apresentação visual das informações mais importantes e necessárias para alcançar um ou mais objetivos de negócio, consolidadas e ajustadas em uma tela para fácil acompanhamento do seu negócio.

Data integration – É o processo de combinar dados de diversas fontes permitindo a consolidação e integração dos dados em um ambiente único.

Data Mining ou Mineração de dados – A mineração de dados é o processo de descoberta de informações acionáveis em grandes conjuntos de dados. através de análises matemáticas para derivar padrões e tendências que existem nos dados. Normalmente, esses padrões não podem ser descobertos com a exploração de dados tradicional pelo fato de as relações serem muito complexas ou por haver muitos dados.

Data Scientist ou Cientista de Dados – É aquele que consegue obter nos milhões de dados existentes em uma ou mais fontes de dados e dar-lhes algum sentido, através de técnicas e métodos.

Dimensão – É um conjunto de informações analisado que pode ser usado como um filtro; Ex: Nome de Cliente, Supervisor, Empresa, Estado, etc. É a tabela que armazena registros descritivos (rótulos, descrições) referentes aos fatos.

Dimensão de medidas – é a dimensão que contém todas as medidas em um cubo.

Dimensões de Banco de Dados e de Cubo – Em um modelo, você pode definir dimensões independentes que serão incluídas nos cubos do mesmo modelo. Quando você adiciona uma dimensão a um cubo, ele se chama uma dimensão de cubo. Por si só em um projeto, como item independente no Pesquisador de objetos, ela é chamada uma dimensão de banco de dados. Por que esta diferença? Porque você pode definir suas propriedades independentemente. Documentação do produto, você verá os dois termos usados, então vale a pena entender o que significam.

DW – Data Warehouse é uma base de dados utilizada para armazenar informações relacionadas à organização. Seu design permite a análise de volumes de dados coletados dos mais diversos sistemas de informações da empresa, resumino, é o banco de dados do BIMachine.
É a utilização de recursos computacionais (como memória, capacidade de armazenamento e cálculos) de forma compartilhada entre vários computadores interligados por meio da Internet.

Escopo da consulta (Espaço de cubo) – O escopo de uma consulta refere-se aos limites dentro dos quais os dados são selecionados. Ele pode variar de um cubo inteiro (um cubo é o maior objeto de consulta) até uma célula. Assim, o espaço de cubo é o produto dos membros das hierarquias de atributo de um cubo com as medidas do cubo.

Estrutura de Dados – é onde armazenamos as informações extraídas do banco de dados. Nesta estruturação, são coletadas as informações que mais convém e armazenadas de forma inteligente para que possam ser montadas as visões do BIMachine.

Fatos – são tabelas que relacionam as medidas com as dimensões.

Front-end e Back-end – São termos generalizados que se referem às etapas inicial e final de um processo. O front-end é responsável por coletar a entrada do usuário em várias formas e processá-la para adequá-la a uma especificação em que o back-end possa utilizar. Front-end é aquilo que você vê e com o que você interage, ou seja, é a interface gráfica. Back-end é o contrarregra por trás dessa interface, que trabalha do lado do servidor. Front-End é a denominação dada ao que é visto na página, como: estilos de botões, layout de login, etc. Já o back-end é o código bruto executado no lado do servidor onde o aplicativo está rodando.

Gartner – A Gartner desenvolve tecnologias relacionadas a introspecção necessária para seus clientes tomarem suas decisões todos os dias. A Gartner trabalha com mais de 10.000 (dez mil) empresas, incluindo CIOs e outros executivos da área de TI, nas corporações e órgãos do governo. A companhia consiste em Pesquisa, Execução de Programas, Consultoria e Eventos.

Gauges – Um KPI de Gauge tem como principal característica um arco circular e exibe um único valor que acompanha o progresso em relação a um objetivo. A meta, ou o valor de destino, é representada pela linha (agulha) e o progresso em relação a esse objetivo é representado pelo sombreamento. Também, o valor que representa o progresso é mostrado em negrito dentro do arco sendo que todos eles são distribuídos uniformemente ao longo do arco, do mínimo (valor mais à esquerda) para o máximo (valor mais à direita).

Grupos de medidas – são uma coleção de uma ou mais medidas. A maioria deles são definidos pelo usuário, e você pode usá-los para reunir medidas relacionadas. A exceção são as medidas de contagens distintas. Elas sempre são colocadas em um grupo de medidas dedicado que contém somente a medida diferente.

Hierarquia – São aquelas que costumam ser visualizadas na forma de árvore, com ligações entre nós pai e seus respectivos nós filhos. Por exemplo: o ano (pai), possui seus meses (filhos) que por sua vez possuem os dias (filhos dos filhos).

Hierarquia Equilibrada – é a denominação dada quando a hierarquia em formato de árvore, possui a mesma quantidade de dados, tanto do lado esquerdo quanto direito. Ilustrar.

Hierarquia natural – são aquelas que surgem naturalmente como resultado dos dados que temos, por exemplo, Ano-Mês-Dia.

HTML (HyperText Markup Language) – significa Linguagem de Marcação de Hipertexto e é uma linguagem de marcação utilizada na construção de páginas na Web. Os documentos HTML podem ser interpretados por navegadores e a tecnologia é fruto da junção entre os padrões HyTime e SGML.

KPI – É uma ferramenta gráfica utilizada para medir o desempenho dos processos de uma empresa e, com essas informações, elaborar um plano de ação com os usuários envolvidos com o objetivo de alcançar as metas estabelecidas.

Linguagem R – É uma linguagem de programação muito utilizada entre analistas de dados para desenvolver softwares para cálculos estatísticos e gráficos. É um ambiente que possibilita o armazenamento de dados, cálculos em matrizes e integração com ferramentas intermediárias para as análises

Machine Learning – Quer dizer aprendizado de máquina, ou seja, são máquinas e sistemas inteligentes que ao serem programados são capazes de adquirir conhecimentos por conta própria, para que a partir disso possam executar tarefas substituindo o ser humano. No Business Intelligence, é uma forma de análise de dados que utiliza a identificação de padrões de dados para tomar decisões com o mínimo de intervenção humana.

MDX – O MDX (Multidimensional Expressions) permite que você consulte objetos multidimensionais, como cubos, e retorna conjuntos de células multidimensionais que contêm dados do cubo. Este tópico e respectivos subtópicos fornecem uma visão geral das consultas MDX. Em outras palavras, é a linguagem utilizada pelo BIMachine para extrair as informações do banco de dados e exibi-las nas visões criadas. É similar ao SQL e permite a customização de uma medida calculada.

Medidas ou métricas – são valores numéricos que representam o conjunto de dados e a situação de um indicador de negócio associado às dimensões.

Membro calculado – é um membro de dimensão definido e calculado na hora da consulta. Um membro calculado pode ser definido como uma consulta de usuário ou como script de cálculo MDX e armazenado no servidor.

Membros – São os dados em tempo real dentro da dimensão.

Métricas – são medidas que servem de base para a constituição de um indicador (KPI).
Moeda é outro exemplo: um aplicativo financeiro pode acompanhar valores monetários até vários decimais, enquanto o bairro da sua escola local pode precisar apenas de valores para a unidade. É importante entender a granulação para evitar armazenar dados desnecessários. Retirar os milissegundos da marcação de hora ou centavos do valor de vendas pode economizar espaço de armazenamento e tempo de processamento quando este nível de detalhe não for relevante para sua análise.

Níveis – Onde o dado se encontra na divisão hierárquica, por exemplo, o Ano está no primeiro nível, os Meses no segundo e os dias no terceiro.
Observação: Se o atributo de granularidade e o atributo de chave forem diferentes, todos os atributos não chave deverão ser vinculados, direta ou indiretamente, ao atributo de granularidade. Dentro de um cubo, o atributo de granularidade define a granularidade de uma dimensão.

OLAP – Online Analytical Processing) ou Processamento Analítico Online, é o serviço que recebe a requisição da aplicação e a envia para o nosso serviço de extração de dados para que este por sua vez, os extraia e apresente na sua tela. É uma tecnologia usada para organizar grande bancos de dados comerciais e oferecer suporte à inteligência empresarial. Os bancos de dados OLAP são divididos em um ou mais cubos, e cada cubo é organizado e projetado por um administrador de cubo para se ajustar à forma que você recupera e analisa os dados de forma que seja mais fácil criar e usar os relatórios de tabela dinâmica e os relatórios de gráfico dinâmico que você precisa.

Origens de dados – é o cubo de origem. Também chamado de estrutura de dados.

Pie charts – São gráficos divididos em setores, cada setor da pizza exibe o tamanho de uma parte da informação relacionada. Gráficos de pizza normalmente são utilizados para exibir os tamanhos relativos das partes de um todo.

Polar charts – Exibe uma série como um conjunto de pontos agrupados por categoria em um círculo de 360 graus. Os valores são representados pelo comprimento do ponto, conforme medido do centro do círculo. Quanto mais distante o ponto está do centro, maior é o seu valor. São exibidos rótulos de categoria no perímetro do gráfico.

Predictive Analytics ou Análise Preditiva – É um conjunto de ferramentas e técnicas para extrair informações de conjuntos de dados, a fim de determinar padrões e resultados futuros. É usada para analisar dados atuais e fatos históricos, a fim de compreender melhor os clientes, produtos e parceiros e para identificar riscos e oportunidades potenciais para uma empresa. Utiliza-se uma série de técnicas, incluindo a mineração de dados, modelagem estatística e Machine Learning para ajudar os analistas a realizarem previsões de negócios futuros.

Relational Databases ou Banco de Dados Relacional – É um banco de dados que modela os dados de uma forma que eles sejam percebidos pelo usuário como tabelas, ou mais formalmente relações. Todos os dados são guardados em tabelas. Estas têm uma estrutura que se repete a cada linha, como você pode observar em uma planilha. São os relacionamentos entre as tabelas que as tornam “relacionais”.

Scatter Charts ou Gráficos de Dispersão – São visualizações de dados usadas para mostrar o relacionamento geral em uma grande quantidade de dados. Os dados são exibidos como pontos, cada um com o valor de uma variável que determina a posição no eixo horizontal e o valor da outra variável que determina a posição no eixo vertical.

Snowflake – A característica principal deste modelo é que as tabelas dimensionais se relacionam com a tabela de fatos, porém algumas dimensões relacionam-se apenas entre elas.
Social BI – É a análise de fontes de dados sociais como Twitter, Facebook e LinkedIn e é utilizado com relatórios tradicionais e métodos de BI para ajudar as organizações a tomar melhores decisões baseadas em dados.

SQL (Structured Query Language) – É a linguagem de pesquisa declarativa padrão para banco de dados relacional (base de dados relacional). Muitas das características originais do SQL foram inspiradas na álgebra relacional.

Stacked Bar Charts – São gráficos de barras que dividem suas barras em segmentos empilhados e de cores diferentes. O eixo Cor na legenda é definido como (Nomes das Colunas), o que significa que cada coluna selecionada é representada por segmentos em uma cor específica.

Star Schema – Metodologia de modelagem de dados utilizada do desenho de um Data Warehouse. Os dados são modelados em tabelas dimensionais ligadas a uma tabela de fatos. As tabelas dimensionais contêm as características de um evento. A tabela de fatos armazena os fatos ocorridos e as chaves para as características correspondentes, nas tabelas dimensionais.

Subcubo é um subconjunto de um cubo que representa uma exibição filtrada do cubo. Subcubos podem ser definidos com uma instrução Scope no script de cálculo MDX ou em cláusula de subseleção em uma consulta MDX ou como um cubo de sessão.

Tabela Fato – É a tabela que armazena os valores detalhados de medidas, valores, ou fatos, em um Data Warehouse.

Table Variables – As variáveis de tabela são objetos semelhantes a tabelas temporárias. A declaração de uma variável de tabela inicia como uma tabela vazia de estrutura especificada. Sua definição inclui colunas com seus tipos de dados, precisão, tamanho e ressalvas opcionais. Esses elementos devem ser definidos durante a declaração, não sendo possível alterá-los ou adicioná-los depois de executado.

Tables ou Tabelas – são objetos de banco de dados que contêm todos os dados em um banco de dados. Nas tabelas, os dados são organizados de maneira lógica em um formato de linha-e-coluna semelhante ao de uma planilha. Cada linha representa um registro exclusivo e cada coluna representa um campo no registro.

Glossário BIMachine

Artigos recentes

2.99.7

2.99.5

2.99.3