https://frosthead.com

Jetzt wird der Turing-Test visuell

Facebooks Algorithmen können Ihr Gesicht aus der Masse herausheben (oder es zumindest versuchen), aber es kann immer noch nicht sagen, ob Sie in einem Familienporträt posieren oder mit Freunden trinken - es kann Ihnen nicht sagen, wie Sie mit anderen interagieren . In Zukunft könnten Computer jedoch in der Lage sein, genau das zu tun. Jetzt haben Forscher einen Weg vorgeschlagen, um herauszufinden, wie intelligent Computer bei der visuellen Identifizierung sind. Sie bezeichnen ihren Test als visuellen Turing-Test, nachdem der Informatiker Alan Turing getestet hat, ob ein Computer menschenähnliche Intelligenz anzeigen kann.

Die verbreitete Auffassung des Tests ist, dass er dazu dient, Menschen von Computern zu unterscheiden - und eine Version wird dazu verwendet, wenn Sie ein CAPTCHA durchführen, um sich für eine neue E-Mail zu registrieren. Forscher der künstlichen Intelligenz betrachten den Test jedoch als einen Weg, um zu messen, wie weit fortgeschritten die Computerintelligenz ist.

"In den letzten Jahren wurden einige beeindruckende Fortschritte in der Bildverarbeitung erzielt", so Stuart Geman, Mathematikprofessor an der Brown University und einer der Forscher, der die neue Bewertung vorschlägt, in einer Pressemitteilung. "Wir hielten es für an der Zeit, die Messlatte für die Bewertung und das Benchmarking dieser Systeme höher zu legen."

Anstatt einfach zu erkennen, dass ein Bild zwei Personen zeigt, wird beim Test geprüft, ob Computer herausfinden können, dass sich die beiden Personen unterhalten oder sogar streiten. Derzeit verwenden Forscher öffentlich verfügbare Datensätze, um ihre Programme zu testen. Das MIT verfügt über LableMe, das Crowdsourcing verwendet, um beispielsweise das "Auto", den "Baum" und das "Gebäude" in Bildern zu identifizieren. Um dies zu verbessern und eine größere Herausforderung zu bieten, entwickelten die Forscher von Brown einen Rahmen für einen standardisierten visuellen Turing-Test.

Lee Gomes für IEEE Spectrum berichtet:

Ihre vorgeschlagene Methode fordert menschliche Testdesigner auf, eine Liste bestimmter Attribute zu entwickeln, die ein Bild haben könnte, z. B. ob eine Straßenszene Personen enthält oder ob die Personen etwas tragen oder miteinander sprechen. Fotos würden zuerst von Menschen nach diesen Kriterien von Hand bewertet; Einem Computer-Vision-System würde dann das gleiche Bild ohne die "Antworten" gezeigt, um festzustellen, ob es in der Lage war, herauszufinden, was die Menschen entdeckt hatten.

Anfänglich wären die Fragen rudimentär und würden beispielsweise fragen, ob sich eine Person in einem bestimmten Bereich des Bildes befindet. Die Fragen würden jedoch mit zunehmender Komplexität der Programme immer komplexer werden. Eine kompliziertere Frage könnte die Art einer Interaktion zwischen verschiedenen Personen auf dem Bild betreffen.

Das Team beschrieb den Test in Proceedings der National Academy of Sciences . Deutsch sagt ab sofort, dass kein Computersystem auch nur die einfachen Versionen des neuen Tests bestehen könne. Aber sie werden es in Zukunft tun. Da es für jedes Foto viele mögliche Attribute gibt, müssten Forscher innovative Methoden entwickeln, mit denen ihre Computer lernen, Fotos zu bewerten.

"Als Forscher tendieren wir dazu, " auf die Probe zu stellen "", sagt Geman in der Erklärung. „Wenn es bestimmte Wettbewerbe gibt, an denen jeder teilnimmt, und das sind die Erfolgsmaßstäbe, dann konzentrieren wir uns darauf. Daher ist es möglicherweise ratsam, den Test zu ändern und ihn außerhalb der Reichweite der aktuellen Bildverarbeitungssysteme zu platzieren. “

Jetzt wird der Turing-Test visuell