Detalles clave
Mayor precisión en la predicción del periodo hasta 15%.
-
DesafíoMejorar la precisión de la predicción del periodo para los usuarios de aplicaciones
-
SoluciónModelos lineales y arbóreos para predecir mejor el ciclo menstrual
-
Tecnologías y herramientasAprendizaje automático: modelos de regresión y gradient boosting Científico (Predictive Analytics Python stack): Python, NumPy, scikit-learn, LightGBM, XGBoost; Aplicación web: hug (marco web), Gunicorn (servidor web)
Cliente
El cliente es una empresa de medios de comunicación y entretenimiento con sede en Japón. La empresa ofrece diversas aplicaciones para armonizar las diferentes necesidades de los clientes en todo el mundo.
El cliente ha desarrollado una aplicación de análisis predictivo. Se trata de un rastreador de periodos que ofrece información valiosa sobre el ciclo menstrual. Su objetivo es seguir y predecir el periodo (próximo día de menstruación, duración del periodo, día de ovulación, probabilidad de concepción) y ofrece al usuario un hilo de conversación.
El cliente buscaba expertos en aprendizaje automático como servicio y pidió a nuestro equipo que mejorara la precisión general de la predicción.
Reto: mejorar la precisión de la predicción del periodo para los usuarios de la aplicación
A pesar de la abundancia de aplicaciones de seguimiento de la menstruación en el mercado de aplicaciones móviles, las mujeres siguen teniendo problemas para realizar un seguimiento de sus periodos mediante aplicaciones de predicción o tienen problemas para quedarse embarazadas. Puede haber varias razones para ello, pero una cosa sigue siendo la misma: la precisión de predicción que ofrecen las aplicaciones modernas.
Recientemente, hemos completado un proyecto similar relacionado con la predicción del ciclo menstrual para una famosa startup. Este proyecto puede ser un buen ejemplo de minería de datos predictiva.
Tener experiencia en desarrollo de aplicaciones de análisis predictivoNos complace compartir nuestra experiencia con el cliente y ayudarle con una solución precisa y eficaz.
Nuestro equipo se enfrentó al reto de mejorar la solución actual para las predicciones de periodos sin afectar al rendimiento de la aplicación.
Solución: modelos lineales y arbóreos para predecir mejor el ciclo menstrual
Sabiendo que la aplicación de predicción tiene muchos usuarios, tuvimos que optar por una solución robusta que fuera lo suficientemente fuerte como para procesar miles de peticiones de usuarios por minuto. Para lograrlo, decidimos utilizar modelos predictivos basados en aprendizaje automático.
El enfoque habitual para el desarrollo de aplicaciones predictivas consiste en utilizar técnicas de minería de datos.
Nuestra tarea principal era predecir el número de días que faltan para que comience el siguiente ciclo menstrual en cualquier día del ciclo actual. Se obtuvo la siguiente información hasta el día actual del ciclo (registros de menstruaciones anteriores, información del perfil de la usuaria, registros de peso, registros de temperatura, historial de eventos anteriores, eventos ocurridos durante el ciclo actual). Todos estos datos son completamente anónimos, no tenemos acceso a los datos personales de las usuarias.
Con toda esta información, podríamos calcular la próxima fecha de inicio de la menstruación mediante la siguiente fórmula: fecha actual + días restantes previstos.
Eche un vistazo a nuestro enfoque:

Nuestro equipo tomó los datos brutos y extrajo algunas características numéricas. A continuación, utilizamos las características y el objetivo calculado (el número de días que faltan para que empiece el ciclo) para entrenar un modelo que fuera capaz de predecir el mismo objetivo pero para los nuevos usuarios.
Nuestro equipo ha elegido modelos predictivos lineales porque son más rápidos de entrenar que otros enfoques de aprendizaje automático, como las redes neuronales. Además, los modelos lineales requieren menos memoria RAM. Y es mucho más fácil implementarlos tanto en el servidor como en la aplicación.
Propusimos una fase de investigación de datos. Los principales objetivos de esta fase son estimación de la precisión alcanzable mediante un enfoque de aprendizaje automáticopara determinar los tipos de datos valiosos para las predicciones y seleccionar las clases de modelos para su posterior modelización.
Los resultados de la fase propuesta son:
- Prototipo de modelo para la predicción de la duración de los ciclos
- Prototipo de modelo para predecir la duración del periodo
- Informe de prueba de concepto (incluida la evaluación de los modelos entrenados y su comparación con la solución existente).
- API de demostración
Resultado: solución basada en datos para una predicción más precisa del ciclo menstrual
ESSID Solutions, con experiencia en el desarrollo de aplicaciones de minería de datos y análisis predictivo, ha proporcionado al cliente una solución de gran capacidad para mejorar significativamente la precisión de la aplicación de seguimiento del periodo.
El cliente se ha beneficiado de la cooperación con nosotros en los siguientes aspectos:
- mayor precisión en la predicción de periodos, hasta 15%
- hacer predicciones para las mujeres con periodos irregulares
- ayuda al cliente a gestionar más eficazmente la gran cantidad de datos que posee
- recomendaciones sobre cómo aplicar la predicción de la ovulación en la aplicación