L'apprentissage automatique pour améliorer la précision d'une application de prévision des règles

L'apprentissage automatique pour améliorer la précision d'une application de prévision des règles

Détails clés

Augmentation de la précision de la prédiction des périodes jusqu'à 15%.

  • Défi
    Améliorer la précision de la prédiction des périodes pour les utilisateurs de l'application
  • Solution
    Des modèles linéaires et arborescents pour mieux prédire le cycle menstruel
  • Technologies et outils
    Apprentissage automatique : modèles de régression et de gradient boosting Scientifique (pile Python pour l'analyse prédictive) : Python, NumPy, scikit-learn, LightGBM, XGBoost ; Applications web : hug (web-framework), Gunicorn (web-server)

Client

Le client est une société de médias et de divertissement basée au Japon. L'entreprise propose diverses applications pour harmoniser les différents besoins des clients dans le monde entier.

Le client a développé une application d'analyse prédictive. Il s'agit d'un outil de suivi des règles qui offre des informations précieuses sur le cycle menstruel. Elle vise à suivre et à prédire les règles (jour de la prochaine menstruation, durée des règles, jour de l'ovulation, probabilité de conception) et fournit à l'utilisateur un fil de conversation.

Le client recherchait une expertise dans les domaines suivants l'apprentissage automatique en tant que service et a demandé à notre équipe d'améliorer la précision globale de la prédiction.

Défi : améliorer la précision de la prédiction des règles pour les utilisateurs de l'application

Malgré l'abondance d'applications de suivi des règles sur le marché des applications mobiles, les femmes ont toujours du mal à suivre leurs règles à l'aide d'applications de prédiction ou ont des difficultés à tomber enceintes. Il peut y avoir plusieurs raisons à cela, mais une chose reste inchangée : la précision des prédictions qu'offrent les applications modernes.

Récemment, nous avons réalisé un projet similaire lié à la prédiction du cycle menstruel pour une célèbre startup. Ce projet peut être un bon exemple de data mining prédictif.

Avoir de l'expérience dans développement d'applications d'analyse prédictiveNous avons été heureux de partager notre expertise avec le client et de l'aider à trouver une solution précise et efficace.

Notre équipe a été mise au défi d'améliorer la solution actuelle pour les prédictions de période sans affecter les performances de l'application.

Solution : des modèles linéaires et arborescents pour mieux prédire le cycle menstruel

Sachant que l'application de prédiction compte de nombreux utilisateurs, nous devions opter pour une solution robuste, capable de traiter des milliers de demandes d'utilisateurs par minute. Pour ce faire, nous avons décidé d'utiliser des modèles prédictifs basés sur l'apprentissage automatique.

L'approche courante du développement d'applications prédictives consiste à utiliser des techniques d'exploration de données.

Notre tâche principale consistait à prédire le nombre de jours restants jusqu'au début du prochain cycle menstruel, quel que soit le jour du cycle en cours. Les informations suivantes sont obtenues jusqu'au jour actuel du cycle (journaux des menstruations précédentes, informations sur le profil de l'utilisatrice, enregistrements du poids, enregistrements de la température, historique des événements précédents, événements survenus pendant le cycle actuel). Toutes ces données ont été complètement anonymisées, nous n'avons pas eu accès aux données personnelles de l'utilisatrice.

En disposant de toutes ces informations, nous pouvons calculer la date de début des prochaines règles à l'aide de la formule suivante : date actuelle + nombre de jours restants prévus.

Découvrez notre approche :

Approche schématique d'un projet

Notre équipe a pris des données brutes et en a extrait des caractéristiques numériques. Nous avons ensuite utilisé ces caractéristiques et l'objectif calculé (le nombre de jours restants avant le début du cycle) pour former un modèle capable de prédire le même objectif, mais pour les nouveaux utilisateurs.

Notre équipe a choisi les modèles prédictifs linéaires parce qu'ils sont plus rapides à former que d'autres approches d'apprentissage automatique comme les réseaux neuronaux. En outre, les modèles linéaires nécessitent moins de mémoire vive. Et il est beaucoup plus facile de les mettre en œuvre à la fois du côté du serveur et de l'application.

Nous avons proposé une phase d'investigation des données. Les principaux objectifs de cette phase sont les suivants estimer la précision réalisable par une approche d'apprentissage automatiqueL'objectif est de déterminer les types de données utiles pour les prédictions et de sélectionner les classes de modèles pour la suite de la modélisation.

Les résultats de la phase proposée sont les suivants :

  • Prototype de modèle pour les prévisions de longueur de cycle
  • Prototype de modèle pour la prévision de la durée des périodes
  • Rapport sur la preuve du concept (y compris l'évaluation des modèles formés, leur comparaison avec la solution existante)
  • Démonstration de l'API

Résultat : une solution basée sur les données pour une prédiction plus précise du cycle menstruel

ESSID Solutions, expérimenté dans le développement d'applications de data mining et d'analyse prédictive, a fourni au client une solution à haute capacité pour améliorer de manière significative la précision de l'application de suivi des règles.

Le client a bénéficié de notre coopération dans les domaines suivants :

  • augmentation de la précision de la prédiction de la période jusqu'à 15%
  • faire des prévisions pour les femmes ayant des règles irrégulières
  • aide le client à gérer plus efficacement la richesse de ses données
  • a fourni des recommandations sur la manière de mettre en œuvre la prédiction de l'ovulation dans l'application

Travaillons sur votre Application de prédiction basée sur l'apprentissage automatique