KI erkennt Gemütszustand am Gang

Der Gang des Menschen sagt viel über seine Emotionen aus. Daher haben Forscher der University of North Carolina at Chapel Hill und der University of Maryland die erste KI der Welt entwickelt, die aus Videos eben mithilfe des Gangs die Gemütslage von Menschen einschätzt. [...]

Das System erzielte in Tests eine 80-prozentige Genauigkeit. (c) pixabay

In ersten Experimenten brachte es die KI dem Team zufolge auf gut 80 Prozent Genauigkeit – ein im Vergleich zu anderen Ansätzen starker Wert. Entsprechend vielseitig könnte die KI anwendbar sein.

Gefühlvoller Gang

„Emotionen spielen eine große Rolle in unserem Leben, sie definieren unsere Erfahrungen und prägen, wie wir die Welt sehen und mit anderen Menschen interagieren„, schreiben die Forscher in ihrem auf arXiv veröffentlichten Paper. Wenn Maschinen Emotionen gut einschätzen könnten, hätte das entsprechend großes Anwendungspotenzial, beispielsweise in Games und Unterhaltung, Sicherheitssystemen oder für das Shopping – einfach überall, wo Mensch und Maschine interagieren. Das Team setzt nun auf den oft expressiven Gang der Menschen als Schlüssel zur Emotionserkennung.

Die Forscher haben sich dabei auf die vier grundlegenden Gemütszustände „fröhlich“, „traurig“, „wütend“ und „neutral“ fokussiert. Denn diese sind, so die Annahme, im Gang lange klar zu erkennen. Dazu hat das KISystem mithilfe von Trainingsdaten im Prinzip gelernt, bestimmte Eigenheiten in der Haltung – beispielsweise Schulterposition und Kopfneigung – und dem Gehen – etwa der Schrittlänge – zu erkennen und daraus Schlüsse zu ziehen. Das System kann auch erkennen, ob jemand ruhig oder eher erregt ist. Denn für Letzteres sprechen etwa schnellere und ruckartige Bewegungen.

Vielversprechender Ansatz

In Tests hat die KI so mit 80,07-prozentiger Genauigkeit Emotionen einschätzen können. Das ist den Forschern zufolge eine Verbesserung um 13,85 Prozent gegenüber State-of-the-Art-Methoden. Der Ansatz eröffne zudem die Aussicht auf Echtzeit-Emotionserkennung aus Gangvideos. Allerdings räumt das Team ein, dass die Genauigkeit sehr von der Qualität der Abschätzung von Haltung und Gang abhängig ist. Da das System Gelenkspositionen am ganzen Körper benötigt, könnten alltägliche Videos, in denen ein Teil des Körpers nicht klar zu sehen ist, Probleme bereiten.


Mehr Artikel

Be the first to comment

Leave a Reply

Your email address will not be published.


*