Principais pormenores
Aumento da precisão da previsão do período até 15%.
-
DesafioMelhorar a precisão da previsão do período para os utilizadores de aplicações
-
SoluçãoModelos lineares e baseados em árvores para fazer melhores previsões do ciclo menstrual
-
Tecnologias e ferramentasAprendizagem automática: modelos de regressão e de gradiente aumentado Científico (pilha Python de análise preditiva): Python, NumPy, scikit-learn, LightGBM, XGBoost; Aplicação Web: hug (estrutura Web), Gunicorn (servidor Web)
Cliente
O cliente é uma empresa de media e entretenimento sediada no Japão. A empresa oferece várias aplicações para harmonizar as diferentes necessidades dos clientes em todo o mundo.
O cliente desenvolveu uma aplicação de análise preditiva. Trata-se de um rastreador de período que oferece informações valiosas sobre o ciclo menstrual. Tem como objetivo acompanhar e prever o período (dia da próxima menstruação, duração do período, dia da ovulação, probabilidade de conceção) e fornece ao utilizador um fio de conversa.
O cliente estava à procura de conhecimentos especializados em aprendizagem automática como um serviço e pediu à nossa equipa que melhorasse a precisão geral da previsão.
Desafio: melhorar a precisão da previsão do período para os utilizadores da aplicação
Mesmo com a abundância de aplicações de rastreio do período menstrual no mercado de aplicações móveis, as mulheres continuam a ter dificuldades em rastrear o seu período menstrual utilizando aplicações de previsão ou a ter problemas em engravidar. Pode haver várias razões para isso, mas uma coisa permanece a mesma - a precisão da previsão que as aplicações modernas têm para oferecer.
Recentemente, concluímos um projeto semelhante relacionado com a previsão do ciclo menstrual para uma famosa empresa em fase de arranque. Este projeto pode ser um bom exemplo de prospeção de dados preditivos.
Ter experiência em desenvolvimento de aplicações de análise preditivaA nossa empresa teve o prazer de partilhar os nossos conhecimentos com o cliente e de o ajudar com uma solução precisa e eficiente.
A nossa equipa foi desafiada a melhorar a solução atual para previsões de períodos sem afetar o desempenho da aplicação.
Solução: modelos lineares e baseados em árvores para fazer melhores previsões do ciclo menstrual
Sabendo que a aplicação de previsão tem muitos utilizadores, tivemos de optar por uma solução robusta que fosse suficientemente forte para processar milhares de pedidos de utilizadores por minuto. Para o conseguir, decidimos utilizar modelos de previsão baseados na aprendizagem automática.
A abordagem comum ao desenvolvimento de aplicações preditivas consiste em utilizar técnicas de extração de dados.
A nossa principal tarefa era prever o número de dias que faltam para o início do próximo ciclo menstrual em qualquer dia do ciclo atual. As seguintes informações são obtidas até ao dia atual do ciclo (registos de menstruações anteriores, informações do perfil da utilizadora, registos de peso, registos de temperatura, histórico de eventos anteriores, eventos ocorridos durante o ciclo atual). Todos estes dados foram completamente anonimizados, não tivemos acesso aos dados pessoais da utilizadora.
Com todas estas informações, podemos calcular a data de início da próxima menstruação utilizando a seguinte fórmula: data atual + dias restantes previstos.
Veja mais de perto a nossa abordagem:

A nossa equipa pegou em dados em bruto e extraiu algumas caraterísticas numéricas. Em seguida, utilizámos as caraterísticas e o objetivo calculado (o número de dias que faltam para o início do ciclo) para treinar um modelo capaz de prever o mesmo objetivo, mas para os novos utilizadores.
A nossa equipa escolheu modelos preditivos lineares porque são mais rápidos de treinar do que outras abordagens de aprendizagem automática, como as redes neurais. Além disso, os modelos lineares requerem menos RAM. E é muito mais fácil implementá-los tanto no lado do servidor como no lado da aplicação.
Propusemos uma fase de investigação dos dados. Os principais objectivos desta fase são estimar a exatidão que pode ser obtida através de uma abordagem de aprendizagem automáticapara determinar os tipos de dados úteis para as previsões e para selecionar as classes de modelos para posterior modelização.
Os resultados da fase proposta são:
- Protótipo de modelo para previsão da duração do ciclo
- Protótipo de modelo para previsões de duração de períodos
- Relatório de prova de conceito (incluindo a avaliação dos modelos treinados e a sua comparação com a solução existente)
- API de demonstração
Resultado: solução baseada em dados para uma previsão mais exacta do ciclo menstrual
A ESSID Solutions, com experiência no desenvolvimento de aplicações de extração de dados e análise preditiva, forneceu ao cliente uma solução de elevada capacidade para melhorar significativamente a precisão da aplicação de rastreio do período.
O cliente beneficiou da nossa cooperação nos seguintes aspectos:
- aumento da precisão da previsão do período até 15%
- fazer previsões para mulheres com períodos irregulares
- ajuda o cliente a lidar com a riqueza de dados do cliente de forma mais eficiente
- forneceu recomendações sobre a forma de implementar a previsão da ovulação na aplicação