DLR zählt Teil­neh­mer bei Veranstaltungen aus der Luft

Geschätzte Lesezeit: 5 Minuten

Experten für Photogrammetrie und Bildanalyse am Deutschen Zentrum für – und (DLR) haben einen ‚lernenden Algorithmus‘ zur automatischen Zählung von Personen auf Fotos und Videos entwickelt. Der Clou: Der Algorithmus erlaubt es, Bildmaterial der unterschiedlichsten Quellen und Qualitäten zu nutzen. Mit Methoden der künstlichen Intelligenz wurde das System auf das Erkennen von Kanten und Konturen trainiert, die typisch für Menschen auf Bildern sind. Und das in Echtzeit und datenschutzkonform, denn es können keine Personen erkannt, sondern nur gezählt beziehungsweise erfasst werden.

Ob Konzert, Kundgebung, Demonstration oder : Damit bei größeren Menschenansammlungen die Sicherheit – und in Zeiten einer Pandemie auch die Gesundheit der Gäste – gewährleistet werden kann, ist eine genaue Kenntnis der Besucherzahlen wichtig. Dieses Jahr kam ein neuer Aspekt hinzu: der Infektionsschutz. Um die Sicherheit auch unter diesem erweiterten Sinne zu gewährleisten, sind genaue Teilnehmerzahlen heute noch wichtiger geworden als zuvor.

Verlässliche automatische Schätzungen – auch bei sich ändernden Bedingungen

„Zuletzt werteten wir ein YouTube-Video aus, das jemand mit dem Smartphone bei einer Kundgebung aufgenommen hat. Die Aufnahmen waren zum Teil verwackelt. Der Algorithmus ist genügsam, was die Qualität des Quellenmaterials angeht. Die Bilder müssen nicht in besonders hoher Auflösung oder vom festen Stativ entstanden sein“, sagt Dr. Reza Bahmanyar vom DLR-Institut für Methodik der Fernerkundung. „Die Teilnehmerzahl, die das System schätzte, war bereits erstaunlich nah an den Angaben der . Wir haben natürlich noch eine signifikante Fehlerrate. Mit der Verfeinerung des Systems wird diese noch deutlich sinken.“

Egal, ob sich während einer Aufnahme die Beleuchtungssituation ändert, die Kameraposition, Aufnahmequalität oder der Kamerawinkel: Das System schafft es, sogar bei sich sehr dynamisch ändernden Bildparametern relativ genaue Schätzungen abzugeben. Von Mal zu Mal verbessert sich die Genauigkeit des KI-basierten Systems, Personen über graphische Indikatoren zu erfassen und ihre Anzahl zu schätzen – und das, ohne die Menschen dabei zu identifizieren. „Wir speichern nur statistische Werte, keine Bilder und personenbezogenen Daten. Die Privatsphäre bleibt bei unserer Methode unverletzt“, betont DLR-Experte Bahmanyar.

„Region of Interest“ – Bewegungsgeschwindigkeit der Menschenmasse

Im Fall des Handyvideos hat das Team die Bewegungsgeschwindigkeit der Menschenmasse, die sogenannte ‚Region of Interest‘ im Bild, also den für die Analyse genutzten Bildausschnitt im Quellmaterial, sowie die Abtastrate manuell bestimmt. Die Abtastrate wird so auf Basis der Flussgeschwindigkeit des Personenstroms gewählt, dass die vom System analysierten Einzelbilder jeweils andere Menschen zeigen. Damit stellen die Forschenden sicher, dass Teilnehmer nicht doppelt gezählt werden.

Das gesamte Verfahren kann weiter automatisiert werden, wenn die Kameraparameter im Vorfeld bekannt sind: Bildausschnitt und Abtastrate könnten bei Aufnahmen von fest installierten Übersichtskameras automatisch erfolgen. Dadurch – und weil sich mit größerem Winkel zwischen der Blickachse der Kamera und der Bewegungsrichtung der Masse die gegenseitige Verdeckung der Menschen reduziert – werden die Schätzungen genauer. Und je höher die Bildqualität, desto besser werden die Zählungen ebenfalls. Da das System funktioniert, wenn sich sowohl die Menschenmenge als auch die Kamera bewegen, ist es außerdem möglich, Aufnahmen von fliegenden Plattformen wie Kameradrohnen zu analysieren.

DLR-Institut für Methodik der Fernerkundung

Das Team des DLR-Instituts für Methodik der Fernerkundung hat den Algorithmus darauf trainiert, Personen zu erfassen. Das System, das auf einem tiefen neuronalen Netz basiert, könnte aber auch auf die verschiedensten anderen Bereiche angewendet werden. Es bedarf nur der Trainingszeit und -anzahl, um dem KI-Algorithmus das Erkennen anderer Merkmale beizubringen. So könnte er beispielsweise in der Qualitätssicherung Anwendung finden, indem er Fehlerstellen auf Oberflächen erkennt, oder im Umweltmonitoring, um die Anzahl von Partikeln wie Plankton auf Unterwasseraufnahmen zu schätzen.