|
ICT
Multimedia Suchmaschinen |
|
|
ICT
Multimedia Suchmaschinen |
|
Suchdienste
- Suchmaschinen |
Eine
Software, die Gesichter in digitalen Bildern erkennt
|
|
|
Wer
auf dem Internet mit einer Suchmaschine wie Google das Porträt einer
Person ausfindig machen will, erhält als Ergebnis nicht selten eine
Liste mit Dutzenden von Bildern, die gar nicht zum Suchauftrag passen.
Forschende des Nationalen Forschungsschwerpunkts «Interaktives Multimodales
Informationsmanagement» (IM2) am IDIAP in Martigny haben dieses Problem
nun gelöst: Sie haben eine Software entwickelt, die erkennen kann,
ob in einem digitalen Bild Gesichter enthalten sind. Anwendungen sind in
den Bereichen Biometrie, Videokonferenzen oder überwachungssysteme
vorstellbar.
Wenn
man nur mit dem Namen das Porträt einer Person im Internet sucht,
liefert die Suchmaschine alle Bilder, bei denen im umgebenden Text die
gewählten Schlüsselbegriffe vorkommen. Das gelieferte Bild enthält
also nicht zwingend ein Gesicht. «Wir haben einen Filter mit dem
Namen «Google Portrait» entwickelt, mit dem nur jene Dateien
vorgeschlagen werden, die das Gesicht eines Menschen enthalten»,
sagt Sébastien Marcel, Forschungsbeauftragter am IDIAP in Martigny.
Das allgemein zugängliche Programm erkennt allerdings die Identität
der dargestellten Person noch nicht.
Wie
funktioniert die Software?
«Sie
startet zuerst eine herkömmliche Suche auf 'Google Bilder', der Bilder-Suchmaschine
des Internetgiganten. Alle gefundenen Bilder werden dann von unserem Programm
durchkämmt: Ein virtueller Bilderrahmen von 19 auf 19 Bildpunkten
gleitet über das ganze Bild auf der Suche nach einem Gesicht dieser
Grösse. Wenn die Suche erfolglos bleibt, wird der Rahmen vergrössert
und erneut gesucht.» Schliesslich wird eine detaillierte Analyse
der Datei durchgeführt. |
|
|
|
Für
jede Position des Rahmens muss das Programm entscheiden, ob der enthaltene
Bereich einem Gesicht entspricht. Was ein Gesicht aus digitaler Perspektive
ist, weiss das Programm aber nicht einfach so. |
|
«Um
das Programm dazu zu bringen, diese Entscheidung zielsicher zu treffen,
stützen wir uns auf statistische Methoden des maschinellen Lernens»,
erklärt Sébastien Marcel.
Zuerst
muss eine Datenbank angelegt werden, die einerseits einige Zehntausend
Bilder mit Gesichtern enthält, andererseits aber auch mehrere Millionen
Bilder ohne Gesichter (Natur, verschwommener Hintergrund usw.). «Nun
lassen wir vom Programm jeweils zwei dieser Bilder anhand elementarer visueller
Kriterien vergleichen, die zu Beginn der Analyse im verwendeten Algorithmus
festgelegt wurden. Dabei handelt es sich zum Beispiel um charakteristische
Unterschiede in der Intensität zwischen einem Bildpunkt und den benachbarten
Punkten.» Die Software wiederholt diese Vergleiche immer wieder,
bis sie irgendwann mit Unterstützung der Informatiker «gelernt»
hat, Bilder mit Gesichtern zu erkennen.
In
bestimmten Fällen kann sie sich noch täuschen. Eine höhere
Genauigkeit des Algorithmus geht jedoch auf Kosten der Geschwindigkeit.
Ausserdem werden von «Google Portrait» gegenwärtig ausschliesslich
Dateien untersucht, die in der Trefferliste von Google weit oben aufgeführt
sind. «Diese Einschränkung haben wir aber nur für die Demonstrationsversion
getroffen», sagt Sébastien Marcel. «Derzeit arbeitet
die Software mit einer Erfolgsrate von 90 bis 95 Prozent bei ungefähr
einem Fehler pro 100 Millionen Tests.»
Die
IDIAP-Software ist nicht konkurrenzlos geblieben. Das Unternehmen Google
testet zurzeit diskret seine eigene Software im Internet. «Wir
haben unsere Version aber bereits im Februar 2007 herausgegeben, während
die Google-Version erst im Mai 2007 im Netz bemerkt wurde.» Dies
zeigt, dass von öffentlichen Geldern geförderte Forschende qualitativ
hervorragende Arbeit leisten und selbst einem Goliath der Informatikindustrie
die Stirn bieten können. Sébastien Marcel weist auf die Qualitäten
des Programms hin, das er in Zusammenarbeit mit seinem früheren Doktoranden
Yann Rodriguez entwickelt hat: «Der Algorithmus ist dank der Programmarchitektur
schnell und robust gegenüber einer häufig auftretenden Schwierigkeit:
der schlechten Beleuchtung der abgebildeten Person. Ausserdem müssen
die Gesichter nicht unbedingt von vorne abgebildet sein, damit sie von
unserer Software als solche erkannt werden.»
Die
Vision des Entwicklers geht noch weiter: «Jeder Benutzer kann
Fehler von 'Google Portrait' korrigieren und dem dargestellten Gesicht
den richtigen Namen zuweisen. Damit können wir eine riesige Datenbank
mit Bildern und den zugeordneten richtigen Namen anlegen. Wenn die Software
dann die Ergebnisse ihrer Suche mit den elektronischen Daten dieses Katalogs
vergleicht, dürfte es gelingen, den gefundenen Gesichtern die richtige
Identität zuzuordnen.»
Der
Forscher kann sich eine ganze Reihe möglicher Anwendungen vorstellen.
Natürlich beispielsweise im Bereich der Biometrie: «Bevor die
Identität einer Person in einem elektronischen Bild geprüft werden
kann, muss festgestellt werden, ob es sich überhaupt um ein Gesicht
handelt.» Aber auch bei Videokonferenzen. «Bei diesen Fernbesprechungen
könnten die eingesetzten Kameras automatisch auf festgestellte Gesichter
zoomen und diesen folgen, während heute der Teilnehmer ruhig im Gesichtsfeld
der Kamera bleiben muss.»
Die
Software liesse sich auch zum Zählen von Personen in einer grossen
Menschenmenge einsetzen. Im Marketing könnten mit Hilfe einer im Schaufenster
platzierten Kamera die Passanten gezählt werden, die davor stehen
bleiben. Schliesslich wäre auch die Einordnung digitaler Fotografien
eine mögliche Anwendung.
«Unser
Ziel ist es nun, Unternehmen für unsere Ideen zu gewinnen»,
schliesst Sébastien Marcel. Dazu will er «Google Portrait»
für eine Evaluation frei zur Verfügung stellen. «Wenn eine
Firma interessiert ist, kann sie eine Lizenz für die Verwendung des
Produkts erwerben.» Oder es sogar weiterentwickeln: «Die Anwendung
ist optimierbar».
Quelle: Text
Text Schweizerische Nationafonds SNF, 2007 |
|
nach
oben
Weitere Informationen |
|
Links |
|
|
|
Externe
Links |
|