Tech

Die Vermessung der Welt

7. Juli 2017

Nur wenige Unternehmen werden vom Hype um das selbstfahrende Auto so stark erfasst wie Mapping-Firmen. „Das Google Car fährt nicht..

Nur wenige Unternehmen werden vom Hype um das selbstfahrende Auto so stark erfasst wie Mapping-Firmen. „Das Google Car fährt nicht auf Straßen, sondern auf Karten“, hört man in Fachkreisen. Das Feld der digitalen Kartografie ist hart umkämpft. Doch wie gut sind solche Karten? Und wem gehören sie eigentlich?

Die gesamte Erdoberfläche abfotografieren und in 3-D nachbauen – Jan Erik Solem hat diese Vision schon seit 15 Jahren. Im Sommer 2013 machte der schwedische „Computer Vision Guy“ – wie er sich auf Twitter selbst nennt – dann aber ernst und gründete in Malmö das Start-Up Mapillary. Doch nicht nur Solem erhofft sich von der Branche eine vielversprechende Zukunft. Auch Google treibt mit seinem Kartendienst Google Maps sowie dem zugehörigen Street View die digitale Vermessung der Welt voran – und dominiert dabei das Feld. Anfangs versprach man sich Nutzwert für Navigation und Routenplanung, nun aber erschließt sich ein neues Anwendungsfeld: das autonome Fahren. Auch die großen deutschen Autohersteller Volkswagen, BMW und Daimler haben das begriffen und übernahmen Ende 2015 für 2,8 Milliarden € den Geodatendienst Here.

Und weil etablierte Mapping-Firmen wie Google oder TomTom ihre Rohdaten nun mal nicht preisgeben wollen, musste Jan Erik Solem einen anderen Weg einschlagen. Über Crowdsourcing, sprich über freiwillige Beiträge von Nutzern, erhält er täglich Fotos von Straßen, Rad und Wanderwegen aus aller Welt. Heute deckt Mapillary mit über 150 Millionen Fotos eine Strecke ab, die etwa 74-mal dem Erdumfang entspricht. Am Ziel ist das Start-Up deshalb aber noch lange nicht angekommen.

Im Unterschied zu Google Street View erhält Mapillary seine Aufnahmen über Crowdsourcing. Über 150 Millionen Straßenbilder haben Nutzer bereits hochgeladen. Wieso teilen die Nutzer Fotos auf Mapillary?

Jan Erik Solem: Die meisten Beiträge kommen von Privatpersonen. Viele der 150 Millionen Fotos werden aber auch von Kunden, Partnerfirmen oder Gemeinden hochgeladen. Die Motivation dahinter variiert. Als wir die Plattform auf die Beine gestellt haben, wollten wir, dass jeder Aufnahmen beitragen und die der anderen verwenden kann. Ganz egal, wozu sie benutzt werden. Wieso Leute Street-View-Aufnahmen hochladen? Weil wir ihnen helfen, ein Problem zu lösen. Oft sind es aber auch einfach nur Menschen, die ihre Heimatstadt oder Nachbarschaft im Street-View-Modus auf der Karte sehen wollen. Dann gibt es auch Nutzer, die Mapillary nutzen, um die Infrastruktur wie Radoder Wanderwege in ihrer Gemeinde zu verbessern. Das können einerseits Aktivisten sein, die unerschlossene Gegenden, einzelne Schlaglöcher oder andere Verbesserungsmöglichkeiten in der Stadt kartieren. Es kann aber auch die Stadtverwaltung selbst sein, die regelmä ßig Bestandsaufnahmen durchführen muss. Wichtig ist dabei: Alle tragen zum gleichen Pool an Street-View-Bildern bei.

Mapillary arbeitet mit anderen Mapping-Unternehmen, etwa Here und Mapbox, zusammen. Dabei begibt man sich in ein Spannungsfeld zwischen Konkurrenz und Kooperation. Wie ergänzen sich Mapillary und die anderen?

Das ist eine fundamental wichtige Sache beim digitalen Kartografieren. Normalerweise dreht sich alles um Wettbewerb – jeder versucht, sein Ass im Ärmel zu verstecken, geteilt wird wenig. Mit diesem Trend sind in den letzten Jahren auch die Daten hinter den Mauern weniger globaler Unternehmen verschwunden. Apple, Google und TomTom erwerben Daten und Unternehmen – alles Weitere spielt sich hinter dem Vorhang ab. Daher wollen wir mit Mapillary eine unabhängige, für alle Menschen zugängliche Plattform schaffen. Wir befürworten ein Modell der Zusammenarbeit. Alle Akteure sollten mit vereinten Kräften am Werk sein und ihre Daten auf Plattformen wie Mapillary bereitstellen. Mit Mapbox haben wir beispielsweise an der Verbesserung von OpenStreetMap für Routenplanung in den USA gearbeitet. Auch das Here-Beispiel ist sehr spannend.

Here hat seine eigene Community, die mit dem Produkt „Map Creator“ an der Verbesserung und Korrektur von Karten arbeitet. Sie haben allerdings keinen „Street-View-Layer“. Die Kooperation sieht also so aus: Here-Nutzer laden ihre Aufnahmen auf Mapillary hoch, diese Bilder sind dann auch für Bearbeitungen in ihrem Map Creator verfügbar.

Versuchen Sie somit, den Branchenriesen Google mit seinem Kartenservice Google Maps, inklusive Street View, mit vereinten Kräften herauszufordern? Ist das überhaupt möglich?

Wir konzentrieren uns weniger auf das Anwendungsfeld im Hinblick auf die Erstellung von digitalen Karten – das machen andere, wie eben Here und Mapbox. Wir dagegen fordern Google in der Rolle als Datenquelle heraus. Eines der Probleme ist, dass Google seine Rohdaten nicht teilt. Wir alle können Street View verwenden, vorausgesetzt, man hat Google Maps. Die Fotos können aber über keine andere Plattform benutzt werden, man kann sie auch nicht bearbeiten – man kann sie lediglich ansehen. Wenn jemand eine Applikation auf einer anderen Mapping-Plattform erstellen will, können die Daten also nicht von den etablierten Mapping-Firmen bezogen werden. Das gilt aber auch für all jene, die ihren eigenen Geodatensatz haben und diesen verbessern wollen. Das könnten Abholpunkte für Ridesharing-Dienste sein oder die Dokumentation des öffentlichen Raums durch die Stadtverwaltung. Google hilft hier keinen Schritt weiter. Umgekehrt verkaufen sie ihre Rohdaten aber auch nicht.

Das bringt uns zur Künstlichen Intelligenz (KI) in selbstfahrenden Autos. Geodaten sind ein essenzieller Input, um sie straßentauglich zu machen. Welche Rolle spielt Mapillary im Hype um das autonome Fahren?

Hier spielen mehrere Aspekte mit. Selbstfahrende Autos werden andere Karten benötigen als die, die wir täglich verwenden. Hilft eine Karte, von A nach B zu kommen, sind die visuelle Darstellung und die Instruktionen entlang der Route grundlegend verschieden, wenn sie an einen Menschen oder an eine Maschine gerichtet sind. Es braucht also einen neuen Typ von digitalen Karten für autonome Fahrzeuge. Dieser muss sich allerdings noch viel schneller weiterentwickeln, als das heute der Fall ist. In den nächsten fünf Jahren wird es in diesem Bereich zu einer interessanten Machtverschiebung kommen. Immer mehr Autohersteller bringen Fahrzeuge mit Sensoren zum Datensammeln auf die Straße – sie werden Datenmengen in ganz anderen Dimensionen einfach selbst generieren können. Dadurch werden die abgeschirmten Datenbanken von Google und TomTom, den globalen Mapping-Anbietern, immer unwichtiger. Je mehr solcher Autos auf die Straßen kommen, desto stärker wird sich dieser Trend zeigen. Jemand muss also das System bereitstellen, in dem all diese gesammelten Aufnahmen und Sensordaten zum Updaten von Karten verwendet werden. Hier liegen die großen Möglichkeiten für Firmen wie Mapillary, die als Sammelbecken für Daten dienen und diese in Kartenupdates verwandeln.

Das ist der eine Trend, den wir in der Kartografie für selbstfahrende Autos beobachten. Was wir aber auch bemerken, ist, dass viele Autohersteller Schwierigkeiten beim Entwickeln ihrer KI-Systeme und der zugehörigen Software haben. Diese sollen verstehen, was um das Auto herum passiert und wie es sich in einem bestimmten Umfeld verhalten soll. Ein Kernproblem ist dabei der Mangel an brauchbaren Ressourcen, konkret Trainingsdaten mit globaler Reichweite (statt Aufnahmen, die auf ein bestimmtes Gebiet beschränkt sind, Anm.). Die Autohersteller, die sich in diesen Bereich wagen, haben in erster Linie im unmittelbaren Umfeld ihrer Entwicklungszentren Daten gesammelt, also in Süddeutschland (Daimler, Porsche, BMW, Anm.) in Michigan (General Motors, Chrysler, Ford, Anm.) oder hier in Schweden (Volvo, Anm.). Es sind eigene Pilotprojekte, um die erforderlichen Daten mit entsprechender Qualität zu sammeln. Das reicht aber nicht, die Hersteller brauchen mehr Variabilität in den Trainingsdaten, weil Fußgänger, Straßen, Straßenschilder und das Umfeld von Land zu Land verschieden sind, sich aber auch das Verhalten im Verkehr unterscheidet. Für sichere KI-Systeme braucht es breite Pools an Trainingsdaten und ein hohes Maß an Variabilität. Und hier kommt Mapillary mit Straßenbildern aus 190 Ländern ins Spiel. Daraus haben wir ein Trainingsset gemacht, mit dem wir nun Autohersteller versorgen.

3-D-Rekonstruktion und semantische Segmentierung, also die Erkennung von Objekten, sind zwei Schlüsseltechnologien bei der Entwicklung von KI-Systemen für selbstfahrende Fahrzeuge. Wie verwendet Mapillary sie?

Mit diesen zwei Technologien bearbeiten wir die Street-View-Fotos und kreieren damit digitale Karten. Jeder Nutzer kann Bilder von seinem privaten Handy erfassen und hochladen. Wenn jemand eine Straße abfährt und eine Sequenz von Aufnahmen auf die Plattform stellt, dann müssen wir dafür sorgen, dass diese einzelnen Aufnahmen mit allen anderen verknüpft werden. Dazu fügen wir die einzelnen Fotos in einem 3-D-Modell zusammen. Indem wir so eine animierte 3-D-Welt der Straße rekonstruieren, kann man sich ohne Unterbrechung zwischen den verschiedenen Fotos hinund herbewegen. Alle Beiträge von Nutzern fließen also in einem großen Datenpool zusammen und werden dort weiterverarbeitet. Nachdem wir diesen dreidimensionalen Raum erstellt haben, muss das System aber auch erkennen können, was sich wo befindet. Wir verbinden Fotos also nicht nur über Raum und Zeit, sondern können Objekte auch identifizieren und sie in der Karte positionieren, indem wir ihnen 3-D-Koordinaten zuteilen. In einem nächsten Schritt ordnen wir diese Objekte aus den Fotos mittels der semantischen Segmentierung einer von etwa 100 Kategorien zu und legen ihren Standort mit Breitenund Längengraden fest. Diese Technologien helfen uns also, zu erkennen, was im Bild ist, und die Straße inklusive Umfeld in 3-D zu rekonstruieren.

Google folgt beim Sammeln von Street-View-Aufnahmen einer strukturierten Vorgehensweise mit einheitlicher Ausstattung – im Gegensatz zur Crowdsourcing-Strategie von Mapillary. Hat Google dadurch im Hinblick auf die Qualität der Daten bei der 3-D-Rekonstruktion nicht einen Vorteil?

Das ist ein wichtiger Punkt. Obwohl die meisten unserer Bilder von Smartphones oder von hinter der Windschutzscheibe befestigten Actionkameras kommen, können wir unsere Daten bis zur hochprofessionellen „Mapping-Ausrüstung“ anbieten. Manche Städte und urbane Regionen sind vollständig mit Fotos von einer Qualität und Genauigkeit abgedeckt, die jener von Google in nichts nachsteht. Das Problem ist nur, dass dies auf einen Großteil der Mapillary-Daten nicht zutrifft. Weniger die Auflösung der Fotos macht uns Schwierigkeiten, sondern, dass wir anders als Google kaum über 360-Grad-Bilder verfügen. Diese müssen wir mit Sequenzen von Einzelbildern selbst generieren. Einige Nutzer können 360-Grad-Bilder aufnehmen, das ist aber die Ausnahme. Das zweite Problem ist die Genauigkeit des GPS, dessen Verlässlichkeit bei Smartphones oft variiert. Also ja, es gibt zwischen einem professionellen Mapping-Van und Smartphones Qualitätsunterschiede, die wir zu spüren bekommen.

Können über Crowdsourcing generierte Daten jemals exakt genug werden, um an die Qualität von Googles Daten heranzukommen und ohne Bedenken für selbstfahrende Autos verwendet zu werden? Kann Googles Vorteil wettgemacht werden?

Der vorhin angesprochene Wandel wird hier in den nächsten Jahren eine wichtige Rolle spielen. Daten werden zunehmend von Autos kommen, die normale Leute fahren, wodurch ein Datenvolumen zusammengetragen wird, wie es keine Mapping-Firma selbst generieren könnte. Fahrzeuge mit GPS und Kameras sind vielleicht nicht mit den besten Sensoren ausgerüstet, eine große Zahl an Beiträgen wird aber eine höhere Qualität ermöglichen, als es seltene und spärliche Aufnahmen mit hoher Auflösung je zulassen würden. Und für KI-Systeme in selbstfahrenden Autos zählt die relative Genauigkeit, nicht die absolute. Wenn die Straße um einen Meter verschoben ist, macht das nichts. Was das Programm benötigt, ist die relative Distanz zwischen Standort und den Objekten im Umfeld. Diese Genauigkeit können wir genauso gut feststellen wie Google.

JAN ERIK SOLEM

Solem machte seinen PhD in angewandter Mathematik an der Universität Lund, wo er auch kurz als Professor tätig war. 2006 gründete er das Unternehmen Polar Rose, das Gesichtserkennungssoftware herstellte und 2010 von Apple für rund 20 Millionen € übernommen wurde. 2013 gründete er Mapillary.