Wichtige Details
Freihändiges, sprachgesteuertes und interaktives Erstellen von Rezepten.
-
HerausforderungFreihändige, sprachgesteuerte Koch-App
-
LösungIntelligente AI-Sprachassistenten-App für freihändiges Kochen
-
Technologien und WerkzeugeCustom Speech2Text (wav2vec2-Feinabstimmung), Google Cloud speech API, Apple Speech Kit, Sprachdatenerweiterung, AI Voice Assistant, Sprachaktivierung, Voice Intent Classification, Recipes Text Parsing (Named Entity Recognition für Rezepte), Entities Dependency Parsing (Verstehen von Beziehungen zwischen Zutaten, ihren Werten und Einheiten unter Verwendung des Stanza-Pakets), Automatic Punctuation Restoring, AWS, AWS SageMaker
Kunde
Um das Projekt der Entwicklung eines intelligenten KI-Kochassistenten zu verwirklichen, benötigte der Kunde ein erfahrenes Team, das in der Lage ist, die gesamte Bandbreite der Entwicklung und AI-Beratung mit einem hohen Maß an Fachwissen im Bereich Data Science.
Der Kunde war auf der Suche nach einem Team mit Professionalität, umfassenden Kenntnissen im Bereich des maschinellen Lernens, einer positiven Erfolgsbilanz, hervorragender Kommunikation und der Begeisterung für ein Projekt wie das seine. Sie haben erwähnt dass sich ESSID Solutions bei der Befragung von mehr als zwei Dutzend Unternehmen weltweit von Anfang an durchgesetzt hat.
Der Kunde kam mit einem Anwendungsprototyp zu uns, der bereits über ein Back-End, ein Front-End, eine iOS-App und einige KI verfügte, die weiter entwickelt werden mussten. Die Hauptsorge des Kunden war, dass die Spracherkennungsfunktion nicht richtig funktionierte.
Herausforderung: Freihändige, sprachgesteuerte Koch-App
ESSID Solutions stand vor der Herausforderung, ein robustes KI-System zu entwickeln - sowohl die Front- und Backend-Aspekte (und die IOS-Anwendung) der App als auch die Integration von AI-Algorithmen.
Die Idee der App ist es, einen KI-Kochassistenten zu entwickeln, der es den Menschen ermöglicht, freihändig zu kochen (weil ihre Hände vielleicht mit der Zubereitung von Speisen beschäftigt sind). Beim Kochen können Sie der App Ihr Rezept diktieren, die es aufnimmt und speichert. Oder Sie können die App bitten, Ihnen einige der Rezepte zu diktieren, während Sie das Essen zubereiten. Mit Hilfe des Kochassistenten kann der Benutzer kochen, ohne zwischen dem Rezeptbuch oder dem Telefon und dem Küchenherd hin- und herlaufen zu müssen. Die App ermöglicht genussvolle kulinarische Erlebnisse.
Zu dem Team, das an dem Projekt arbeitete, gehörten ein Projektmanager, ein Datenwissenschaftler, ein Full-Stack-Entwickler, ein iOS-Entwickler und ein QA-Ingenieur.
Lösung: KI-Sprachassistent-App für freihändiges Kochen
Das Team von ESSID Solutions hat eine neue KI-Implementierung für alle Anwendungskomponenten vorgenommen. Seitdem kann die Anwendung per Sprache gesteuert werden. Die Sprachaktivierung der Anwendung und die Erkennung von Benutzerbefehlen funktioniert sehr gut, ebenso wie die Transkription des Rezepttextes.
Auf Wunsch des Kunden haben wir ein maßgeschneidertes AI-Algorithmus für die relevante Funktion der App - einen KI-Kochassistenten.
Zunächst haben unsere Ingenieure die übrigen Teile der Anwendung (Back-End, Front-End, iOS) überprüft und überarbeitet.
Die nächste Aufgabe bestand darin, eine große Anzahl zusätzlicher Funktionen zu entwickeln (z. B. automatische Extraktion von Zutaten, automatisches Zusammenrechnen von Zutaten, Teilen von Rezepten über soziale Medien, Push-Benachrichtigung, Datenerfassung usw.). Wir überprüften und rekonfigurierten das System des Kunden Cloud-Architektur auf AWS um die Kosten zu optimieren und die Verfügbarkeit und Nachhaltigkeit zu verbessern.
Hochrangige Anwendungsarchitektur:

Da der Kunde also die Full-Stack-Entwicklungsdienstleistungenwurde das Projekt in 2 Phasen geplant:
Phase I. Entwicklung der Back-End- und Front-End-Teile der App.
Phase II. Einen KI-Algorithmus zu entwickeln, der das Kochen digitalisiert und mühelos macht, ohne fettige Handys und ohne zwischen Zutatenlisten und Arbeitsschritten hin- und herzublättern.
Um dies zu ermöglichen, hat unser Team eine Technologie zur Sprach-zu-Text-Erkennung eingesetzt, mit deren Hilfe Sprache in ein schriftliches Kochbuch auf dem Telefon des Benutzers umgewandelt werden kann. Die Technologie ermöglicht eine reibungslose Sprachaufzeichnung und Diktierung.
Die Funktionen, die wir in den KI-Kochassistenten integriert haben:
- Sprachaktivierung, Sprachsteuerung über die App, Erstellen und Bearbeiten von Rezepten per Sprache, Abhören von Rezepten
- Sprachnotizen hinzufügen
- Rezeptsuche über den Rezepttitel und die Namen der Zutaten
- Bearbeitung und Neuanordnung von Rezeptschritten
- Automatische Extraktion der Inhaltsstoffe, ihrer Werte und Einheiten
- Die Zutaten werden automatisch summiert (basierend auf ihren Werten und Einheiten)
- Gemeinsame Nutzung von Rezepten (einschließlich sozialer Medien).
Mit der Rezepterfassung, dem Kochbuch und dem Essensplaner an einem Ort ist es für den Benutzer ein Leichtes, das Kochen zum Vergnügen und einfach zu machen.
Ergebnis: Mobile App zur einfachen Zubereitung von Rezepten
Verständnis für die Bedürfnisse des Kunden und Fachwissen in Datenwissenschaft und KI half ESSID Solutions dem Kunden bei der Umsetzung der Idee und der Einführung der funktionalen Anwendung. Das Ingenieurteam hat eine skalierbare KI-gestützte App entwickelt und alle gewünschten Funktionen implementiert.
Das Ergebnis dieser Arbeit ist ein ausgeklügeltes Mobile KI-Anwendung Myka - die sprachgesteuerte & interaktive Rezeptaufnahme-App für Kochbegeisterte. Der KI-fähige Küchenassistent macht das Kochen zum Vergnügen - er nimmt Rezepte mit der Stimme des Nutzers auf und liest sie vor, speichert alle Daten, damit der Nutzer nie wieder Zutaten vergisst.