Implementação de Data Lake para processamento e visualização eficientes de Big Data

Implementação de Data Lake para processamento e visualização eficientes de Big Data

Principais pormenores

Decisões aceleradas baseadas em dados e KPIs melhorados.

  • Desafio
    Encontrar uma abordagem eficiente para a recolha, análise, processamento e visualização de dados
  • Solução
    Solução de BI para permitir a monitorização em tempo real dos fluxos de trabalho numa organização
  • Tecnologias e ferramentas
    Apache NiFi, Cloudera CDH, Apache Oozie, Apache Spark, HDFS (raw, parquet), Apache Kudu, Apache Impala

Cliente

O Cliente é uma empresa de serviços de consultoria de gestão sediada no Reino Unido que ajuda diferentes representantes do sector a gerir os seus dados comerciais. A solução do Cliente é uma plataforma orientada para a IA que permite aos utilizadores finais utilizar o motor de análise para extrair valor dos dados empresariais brutos. Esta plataforma ajuda a construir relações comerciais criativas e a descobrir novas oportunidades de negócio.

Desafio: encontrar uma abordagem eficiente para a recolha, análise, processamento e visualização de dados

Ao operar em vários domínios, incluindo finanças, saúde, gestão, consultoria, etc., o Cliente enfrentou inevitavelmente o desafio de gerir grandes volumes de dados brutos não estruturados e recorreu à ESSID Solutions com a necessidade de construir lagos de dados e fornecer uma solução de BI para um processamento de dados mais eficiente. O Cliente precisava de uma solução para facilitar processos como a recolha, análise e visualização de dados.

Solução: Solução de Business Intelligence para permitir a monitorização em tempo real dos fluxos de trabalho numa organização

Um dos domínios do cliente é o sector bancário e financeiro. Os proprietários de empresas neste sector procuram continuamente uma abordagem fiável e coerente para gerir os dados. Esta abordagem está subjacente a todos os processos relacionados com gestão de documentos jurídicosdocumentos empresariais, contratos com clientes, etc., para eliminar erros e criar confiança nos consumidores.

As empresas cooperam com o Cliente para poderem tirar partido de uma solução baseada em IA para responder a questões comerciais fundamentais. Uma solução orientada para os dados requer o envolvimento de cientistas de dados para trazer a sua experiência e conhecimentos especializados em trabalhar com grandes volumes de dados.

Quando armazenados num lago de dados, os dados fornecidos pelos utilizadores finais ficam disponíveis para a IA e podem ser explorados para fornecer aos utilizadores finais informações valiosas sobre várias questões relacionadas com a gestão de riscos, o trabalho em equipa, o estado do projeto, o calendário de trabalho, os tempos de inatividade, a gestão de acidentes e muito mais.

Uma forma simplificada e optimizada de processar dados é o núcleo de uma Solução baseada em IA. A ESSID Solutions foi desafiada a fornecer serviços de ciência de dados para melhorar o desempenho e a eficiência da solução do Cliente.

A equipa da ESSID Solutions iniciou um processo de desenvolvimento passo a passo para resolver o desafio do cliente e apresentar uma solução robusta.

1. As organizações financeiras do Reino Unido adoptaram uma cadeia de fornecimento de documentos, que inclui as seguintes fases:

  • Recolha de documentos
  • Acumulação de documentos
  • Processamento de encomendas

Os documentos provêm de múltiplas fontes e em diferentes formatos. A natureza caótica dos documentos recolhidos e a falta de um repositório comum impedem a extração de valor dos grandes volumes de dados para outras utilizações importantes.

2. A equipa da ESSID Solutions trabalhou com dados não estruturados provenientes de diferentes fontes, tais como as listadas abaixo:

  • Dados do projeto
  • Reuniões
  • Identidade digital
  • Horário de trabalho
  • Dados de inspeção
  • Dados de perigo
  • etc.

Era necessário fornecer a solução para transformar grandes volumes de dados brutos em informações significativas.

3. A ESSID Solutions desenvolveu lagos de dados para agregar dados em bruto em diferentes formatos e armazenar dados em ficheiros. Utilizámos os seguintes serviços de código aberto para disponibilizar os dados para análise e visualização:

  • Apache NiFi para ingestão de dados
  • Cloudera CDH como uma plataforma de gestão de dados
  • Apache Oozie para fluxo de trabalho de processamento de dados
  • O Apache Spark como motor de processamento de dados
  • HDFS (raw e parquet) para armazenamento de dados
  • Apache Kudu para análise de dados
  • Apache Impala para análise de dados

A implementação do lago de dados ajudou a estruturar os dados comerciais, o que permitiu a utilização de componentes de código aberto para fornecer uma solução de BI que satisfizesse as necessidades do cliente.

4. Uma vez que os utilizadores finais requerem um acesso fácil aos dados em formas visualmente apelativas, a solução do Cliente fornece uma interface de fácil utilização. Os dados processados e classificados ficam disponíveis através de painéis de controlo fáceis de interagir. Estes painéis de controlo utilizam os dados dos lagos de dados para permitir uma visão abrangente. Como resultado, a solução facilita a monitorização em tempo real dos fluxos de trabalho empresariais numa organização e fornece uma visão visual para uma melhor tomada de decisões.

Resultado: KPIs melhorados e impulso para o desenvolvimento comercial baseado em dados

O Cliente forneceu à equipa da ESSID Solutions dados em bruto para serem utilizados no desenvolvimento de uma solução de BI. Com base nos dados, apresentados pelo Cliente, e utilizando componentes open-source, a ESSID Solutions adaptou e entregou um MVP para responder às principais necessidades dos utilizadores finais ao trabalhar com bases de dados e às necessidades dos consumidores dos serviços do Cliente numa solução de BI eficiente.

A solução de data lake permite aos funcionários e gestores que trabalham no sector tomar decisões aceleradas baseadas em dados, manter-se a par das tendências do mercado, obter melhores KPI, identificar novas fontes de receitas e oportunidades de negócio.

A nossa equipa forneceu serviços de dados prontos a utilizar para ajudar os utilizadores finais a resolver problemas críticos para a empresa e a promover a melhoria contínua dos processos empresariais.