Wichtige Details
Erhöhte Genauigkeit der Periodenvorhersage bis zu 15%.
-
HerausforderungVerbesserung der Genauigkeit der Periodenvorhersage für Anwendungsnutzer
-
LösungLineare und baumbasierte Modelle für eine bessere Vorhersage des Menstruationszyklus
-
Technologien und WerkzeugeMaschinelles Lernen: Regressions- und Gradient-Boosting-Modelle Wissenschaftlich (Predictive Analytics Python stack): Python, NumPy, scikit-learn, LightGBM, XGBoost; Web-Anwendung: hug (Web-Framework), Gunicorn (Web-Server)
Kunde
Der Kunde ist ein Medien- und Unterhaltungsunternehmen mit Sitz in Japan. Das Unternehmen bietet verschiedene Anwendungen an, um die unterschiedlichen Kundenbedürfnisse rund um den Globus zu harmonisieren.
Der Kunde hat eine App für prädiktive Analysen entwickelt. Es ist ein Perioden-Tracker, der wertvolle Einblicke in den Menstruationszyklus bietet. Sie zielt darauf ab, die Periode zu verfolgen und vorherzusagen (nächster Tag der Menstruation, Dauer der Periode, Tag des Eisprungs, Empfängniswahrscheinlichkeit) und bietet dem Nutzer einen Gesprächsfaden.
Der Kunde suchte Fachwissen in folgenden Bereichen maschinelles Lernen als Dienstleistung und bat unser Team, die Vorhersagegenauigkeit insgesamt zu verbessern.
Herausforderung: Verbesserung der Genauigkeit der Periodenvorhersage für App-Nutzer
Trotz der zahlreichen Apps zur Überwachung der Periode auf dem Markt für mobile Apps haben Frauen immer noch Schwierigkeiten, ihre Periode mit Hilfe von Vorhersage-Apps zu überwachen, oder sie haben Probleme, schwanger zu werden. Dafür mag es mehrere Gründe geben, aber eines bleibt gleich - die Vorhersagegenauigkeit, die moderne Apps zu bieten haben.
Vor kurzem haben wir ein ähnliches Projekt zur Vorhersage des Menstruationszyklus für ein bekanntes Startup-Unternehmen abgeschlossen. Dieses Projekt kann ein gutes Beispiel für prädiktives Data Mining sein.
Erfahrung in Entwicklung von Anwendungen für prädiktive AnalytikWir waren gerne bereit, unser Fachwissen mit dem Kunden zu teilen und ihm mit einer genauen und effizienten Lösung zu helfen.
Unser Team stand vor der Herausforderung, die derzeitige Lösung für Periodenvorhersagen zu verbessern, ohne die Leistung der App zu beeinträchtigen.
Lösung: Lineare und baumbasierte Modelle für eine bessere Vorhersage des Menstruationszyklus
Da wir wissen, dass die Prognose-App viele Nutzer hat, mussten wir eine robuste Lösung finden, die stark genug ist, um Tausende von Nutzeranfragen pro Minute zu verarbeiten. Um dies zu erreichen, beschlossen wir, Vorhersagemodelle auf der Grundlage von maschinellem Lernen zu verwenden.
Der übliche Ansatz für die prädiktive App-Entwicklung ist der Einsatz von Data-Mining-Techniken.
Unsere Hauptaufgabe bestand darin, die Anzahl der verbleibenden Tage bis zum Beginn des nächsten Menstruationszyklus an einem beliebigen Tag des aktuellen Zyklus vorherzusagen. Die folgenden Informationen wurden bis zum aktuellen Zyklustag eingeholt (frühere Menstruationsprotokolle, Benutzerprofilinformationen, Gewichtsaufzeichnungen, Temperaturaufzeichnungen, frühere Ereignisse, Ereignisse während des aktuellen Zyklus). Alle diese Daten wurden vollständig anonymisiert, wir hatten keinen Zugang zu den persönlichen Daten der Benutzerin.
Mit all diesen Informationen können wir das nächste Datum für den Beginn der Menstruation nach der folgenden Formel berechnen: aktuelles Datum + voraussichtliche verbleibende Tage.
Schauen Sie sich unseren Ansatz genauer an:

Unser Team nahm Rohdaten und extrahierte einige numerische Merkmale. Dann nutzten wir die Merkmale und das berechnete Ziel (die Anzahl der verbleibenden Tage bis zum Beginn des Zyklus), um ein Modell zu trainieren, das dasselbe Ziel vorhersagen kann, allerdings für die neuen Nutzer.
Unser Team hat sich für lineare Vorhersagemodelle entschieden, weil sie schneller zu trainieren sind als andere Ansätze des maschinellen Lernens wie neuronale Netze. Außerdem benötigen lineare Modelle weniger Arbeitsspeicher. Und es ist viel einfacher, sie sowohl auf Server- als auch auf Anwendungsseite zu implementieren.
Wir haben eine Phase der Datenerhebung vorgeschlagen. Die Hauptziele dieser Phase sind Schätzung der durch maschinelles Lernen erreichbaren Genauigkeitum Datentypen zu bestimmen, die für Vorhersagen nützlich sind, und um Modellklassen für die weitere Modellierung auszuwählen.
Die Ergebnisse der vorgeschlagenen Phase sind:
- Modellprototyp für die Vorhersage der Zykluslänge
- Modellprototyp für die Vorhersage der Periodenlänge
- Proof-of-Concept-Bericht (einschließlich der Bewertung der trainierten Modelle und ihres Vergleichs mit der bestehenden Lösung)
- Demo-API
Ergebnis: Datengesteuerte Lösung für eine genauere Vorhersage des Menstruationszyklus
ESSID Solutions, erfahren in der Entwicklung von Data-Mining-Anwendungen und prädiktiven Analysen, hat dem Kunden eine leistungsstarke Lösung zur Verfügung gestellt, um die Genauigkeit der Perioden-Tracker-App deutlich zu verbessern.
Der Kunde hat in den folgenden Bereichen von der Zusammenarbeit mit uns profitiert:
- erhöhte Genauigkeit der Periodenvorhersage bis zu 15%
- Vorhersage für Frauen mit unregelmäßiger Periode
- hilft dem Kunden, die Fülle der Kundendaten effizienter zu bewältigen
- Empfehlungen für die Implementierung der Eisprungvorhersage in die App gegeben