Multimedia
vorangehende Seite
end
ICT Multimedia Suchmaschinen
Suchmaschinen: Bilder digital erkennen
Soziale Netzwerke Gefahren
ICT Multimedia Suchmaschinen
Links zu Suchmaschinen
Verwandte Themen
Thema: Informations- und Kommunikationstechnologie
letzte Seiteend
Suchdienste - Suchmaschinen
Eine Software, die Gesichter in digitalen Bildern erkennt
Wer auf dem Internet mit einer Suchmaschine wie Google das Porträt einer Person ausfindig machen will, erhält als Ergebnis nicht selten eine Liste mit Dutzenden von Bildern, die gar nicht zum Suchauftrag passen. Forschende des Nationalen Forschungsschwerpunkts «Interaktives Multimodales Informationsmanagement» (IM2) am IDIAP in Martigny haben dieses Problem nun gelöst: Sie haben eine Software entwickelt, die erkennen kann, ob in einem digitalen Bild Gesichter enthalten sind. Anwendungen sind in den Bereichen Biometrie, Videokonferenzen oder überwachungssysteme vorstellbar.

Wenn man nur mit dem Namen das Porträt einer Person im Internet sucht, liefert die Suchmaschine alle Bilder, bei denen im umgebenden Text die gewählten Schlüsselbegriffe vorkommen. Das gelieferte Bild enthält also nicht zwingend ein Gesicht. «Wir haben einen Filter mit dem Namen «Google Portrait» entwickelt, mit dem nur jene Dateien vorgeschlagen werden, die das Gesicht eines Menschen enthalten», sagt Sébastien Marcel, Forschungsbeauftragter am IDIAP in Martigny. Das allgemein zugängliche Programm erkennt allerdings die Identität der dargestellten Person noch nicht.

Wie funktioniert die Software?

«Sie startet zuerst eine herkömmliche Suche auf 'Google Bilder', der Bilder-Suchmaschine des Internetgiganten. Alle gefundenen Bilder werden dann von unserem Programm durchkämmt: Ein virtueller Bilderrahmen von 19 auf 19 Bildpunkten gleitet über das ganze Bild auf der Suche nach einem Gesicht dieser Grösse. Wenn die Suche erfolglos bleibt, wird der Rahmen vergrössert und erneut gesucht.» Schliesslich wird eine detaillierte Analyse der Datei durchgeführt.


Für jede Position des Rahmens muss das Programm entscheiden, ob der enthaltene Bereich einem Gesicht entspricht. Was ein Gesicht aus digitaler Perspektive ist, weiss das Programm aber nicht einfach so.

«Um das Programm dazu zu bringen, diese Entscheidung zielsicher zu treffen, stützen wir uns auf statistische Methoden des maschinellen Lernens», erklärt Sébastien Marcel.

Zuerst muss eine Datenbank angelegt werden, die einerseits einige Zehntausend Bilder mit Gesichtern enthält, andererseits aber auch mehrere Millionen Bilder ohne Gesichter (Natur, verschwommener Hintergrund usw.). «Nun lassen wir vom Programm jeweils zwei dieser Bilder anhand elementarer visueller Kriterien vergleichen, die zu Beginn der Analyse im verwendeten Algorithmus festgelegt wurden. Dabei handelt es sich zum Beispiel um charakteristische Unterschiede in der Intensität zwischen einem Bildpunkt und den benachbarten Punkten.» Die Software wiederholt diese Vergleiche immer wieder, bis sie irgendwann mit Unterstützung der Informatiker «gelernt» hat, Bilder mit Gesichtern zu erkennen.

In bestimmten Fällen kann sie sich noch täuschen. Eine höhere Genauigkeit des Algorithmus geht jedoch auf Kosten der Geschwindigkeit. Ausserdem werden von «Google Portrait» gegenwärtig ausschliesslich Dateien untersucht, die in der Trefferliste von Google weit oben aufgeführt sind. «Diese Einschränkung haben wir aber nur für die Demonstrationsversion getroffen», sagt Sébastien Marcel. «Derzeit arbeitet die Software mit einer Erfolgsrate von 90 bis 95 Prozent bei ungefähr einem Fehler pro 100 Millionen Tests.»

Die IDIAP-Software ist nicht konkurrenzlos geblieben. Das Unternehmen Google testet zurzeit diskret seine eigene Software im Internet. «Wir haben unsere Version aber bereits im Februar 2007 herausgegeben, während die Google-Version erst im Mai 2007 im Netz bemerkt wurde.» Dies zeigt, dass von öffentlichen Geldern geförderte Forschende qualitativ hervorragende Arbeit leisten und selbst einem Goliath der Informatikindustrie die Stirn bieten können. Sébastien Marcel weist auf die Qualitäten des Programms hin, das er in Zusammenarbeit mit seinem früheren Doktoranden Yann Rodriguez entwickelt hat: «Der Algorithmus ist dank der Programmarchitektur schnell und robust gegenüber einer häufig auftretenden Schwierigkeit: der schlechten Beleuchtung der abgebildeten Person. Ausserdem müssen die Gesichter nicht unbedingt von vorne abgebildet sein, damit sie von unserer Software als solche erkannt werden.»

Die Vision des Entwicklers geht noch weiter: «Jeder Benutzer kann Fehler von 'Google Portrait' korrigieren und dem dargestellten Gesicht den richtigen Namen zuweisen. Damit können wir eine riesige Datenbank mit Bildern und den zugeordneten richtigen Namen anlegen. Wenn die Software dann die Ergebnisse ihrer Suche mit den elektronischen Daten dieses Katalogs vergleicht, dürfte es gelingen, den gefundenen Gesichtern die richtige Identität zuzuordnen.»

Der Forscher kann sich eine ganze Reihe möglicher Anwendungen vorstellen. Natürlich beispielsweise im Bereich der Biometrie: «Bevor die Identität einer Person in einem elektronischen Bild geprüft werden kann, muss festgestellt werden, ob es sich überhaupt um ein Gesicht handelt.» Aber auch bei Videokonferenzen. «Bei diesen Fernbesprechungen könnten die eingesetzten Kameras automatisch auf festgestellte Gesichter zoomen und diesen folgen, während heute der Teilnehmer ruhig im Gesichtsfeld der Kamera bleiben muss.»

Die Software liesse sich auch zum Zählen von Personen in einer grossen Menschenmenge einsetzen. Im Marketing könnten mit Hilfe einer im Schaufenster platzierten Kamera die Passanten gezählt werden, die davor stehen bleiben. Schliesslich wäre auch die Einordnung digitaler Fotografien eine mögliche Anwendung.

«Unser Ziel ist es nun, Unternehmen für unsere Ideen zu gewinnen», schliesst Sébastien Marcel. Dazu will er «Google Portrait» für eine Evaluation frei zur Verfügung stellen. «Wenn eine Firma interessiert ist, kann sie eine Lizenz für die Verwendung des Produkts erwerben.» Oder es sogar weiterentwickeln: «Die Anwendung ist optimierbar».

Quelle: Text Text Schweizerische Nationafonds SNF, 2007

nach oben

Weitere Informationen
Die empfehlenswerte Alternative zu den traditionllen Suchmaschinen "Social-Bookmarking"
Soziale Netzwerke Gefahren

Links
Externe Links
Nationaler Forschungsschwerpunkt IM2 - Interaktives Multimodales Informationsmanagement
Schweizerischer Nationalfonds SNF
Eidgenössisches Institut für Geistiges Eigentum IPI
top
letzte Seite