Com o objetivo de facilitar a comunicação dos eventos e incidentes importantes que irão acontecer em nossa plataforma, disponibilizamos uma página de status que irá deixar registrado em ordem cronológica todas as manutenções em nossos servidores bem como incidentes e interrupções que possam vir a ocorrer em determinados recursos.
Esta página é alimentada diariamente e os dados contidos ali representam o status oficial de cada um dos serviços que compõem a nossa plataforma, os incidentes reportados na página poderão ser de “manutenção”, “Degradação de performance”, “Interrupção parcial” e “Interrupção total”.
O acesso a Status page poderá se dar mediante o link ou através da plataforma, acessando os Canais de apoio > Página de status.
Status
A página de status está predominantemente escrita em inglês em função da padronização da informação, e sempre que acessá-la e visualizar a mensagem “All Systems Operational”, significa que não há nenhum incidente reportado de momento e que a ferramenta está operando em normalidade.
Havendo alguma interrupção ela será registrada e representada de forma cronológica através de barras em destaque sobre cada serviço, por exemplo no dia 19 de Novembro onde houve uma instabilidade parcial na visualização de objetos, conforme o print:
Para saber mais sobre o incidente basta clicar sobre o título relatado, ou visualizar o históricos de incidentes na página:
Caso queira ficar por dentro de todos os incidentes e manutenções relatadas na página basta clicar sobre o botão “Subscribe to updates” e inserir o seu email. Toda vez que houver um novo evento um email também será enviado a você informando as alterações, esta notificação não tem nenhum custo e também pode ser revogada caso as informações contidas não venham a ser mais relevante.
Desempenho
Outro recurso muito interessante presente na página de status é o gráfico de tempo médio de resposta das requisições realizadas para nosso servidor de aplicação e também sobre o servidor MDS (responsável pela renderização dos objetos), este gráfico pode ser visto a nível de dia (day), semana (week) e mês (month).
Os tempos devem estar em média mais baixos que 2000ms, oque representa uma média de resposta de todas requisições inferior a 2 segundos.
Sendo assim em caso de lentidão na utilização da plataforma sem que haja um incidente relatado em nossa página de status a recomendação é que verifique o nível de otimização das estruturas que estão envolvidas (Saiba mais), se a internet está operando normalmente, e se não é uma lentidão relacionada a um determinado objeto construído (as vezes possui um volume grande de linhas e colunas, ou uma fórmula avançada).
Serviços
Os componentes que estão mapeados dentro da monitoria são:
Application Server (AS) : A aplicação é o módulo responsável pela interface com o usuário. Qualquer acesso do usuário à ferramenta se dá pelo Application Server. É através dela que o usuário se autentica, acessa as análises, altera as estruturas, agendamentos etc.
Multi-Dimensional Service (MDS): O Multi-dimension Service é o módulo responsável por realizar as consultas no DW. De forma resumida, ele recebe consultas em MDX, e retorna as informações para o solicitante através de objetos analíticos.
Task Service (TS): O Agendador, também chamado de Task Service (TS), é o módulo responsável por executar os serviços programados pelo usuário na aplicação, seja ele cargas de dados, agendamento de envio ou geração de books.
Exporter Service (ES): O Exportador, também chamado de Exporter Service (ES), é o módulo responsável por gerar PDF de dos objetos analíticos.
Presentation Service (PS): O Apresentador, ou Presentation Service (PS), é o módulo responsável por gerar e disponibilizar apresentações dinâmicas para os usuários.
Help Desk Service (HDS): Help Desk Service (HDS) é o serviço de atendimento aos usuários da BIMachine, nele serão registrados todos os chamados técnicos para resolver questões de problema de funcionamento, dúvidas sobre a plataforma, sugerir novas funcionalidades ou solicitar serviços especializados.
BIM News Service (News): BIM News é o nosso portal de notícias da BIMachine, através dele iremos divulgar as novas funcionalidades, webinares, treinamentos disponibilizados a clientes e parceiros, eventos e notícias em geral.
Integration Service (IS): É o serviço de integração da BIMachine com outras plataformas de maneira nativa para realizarmos a criação de estruturas de dados e inteligência sobre as informações recebidas via API.
BIM Store Service: BIMStore é nossa Loja de aplicações analíticas, os Templates Analíticos são soluções acessíveis e ágeis para implantação de projetos BI.
Temos também algumas integrações automatizadas com serviços de nossos parceiros, são eles:
Google Cloud Platform Google Cloud DNS: O Google Cloud DNS é um serviço de Sistema de Nome de Domínio (DNS), incidentes envolvendo este serviço poderão trazer instabilidade na comunicação entre BIMachiners e clientes.
AWS Servers: Os nossos servidores estão hospedados na AWS e um problema ou oscilação na prestação deste serviço poderá trazer impacto ao restante dos componentes.
AWS Lightsail Server: Uma pequena parcela de serviços (não fundamentais) está presente em máquinas lightsail na AWS, havendo qualquer incidente iremos também reportar em qual serviço haverá impactos.
AWS Simple Notification Service: É o sistema de notificação da AWS, utilizado para fazer por exemplo a chamada no disparo de envio de emails da ferramenta.
AWS Simple Email Service: Serviço responsável pelo disparo de emails.
GitHub API Requests: Possuímos integração direta entre BIMachine e Github, havendo algum incidente sobre a resposta de API, possivelmente haverá alguma instabilidade no processo de carga deste conector.
ACR
Em caso de incidentes graves que impossibilitam o uso da ferramenta por um determinado período de tempo ou que afetam de forma negativa uma grande parcela de usuários, construímos um documento chamado de Análise de Causa Raiz (ACR).
Este documento estará disponível na própria página de Status e tem como objetivo detalhar os incidentes registrados, bem como bolar estratégias de prevenção para evitar que o mesmo problema volte a ocorrer.
Exemplo de parte de um ACR: