Petabyte an Daten dank TimeScan-Prozessor übersichtlich

Geschätzte Lesezeit: 5 Minuten

Bis Ende 2017 werden die Satellitenmissionen Sentinel-1, -2 und -3 des europäischen Copernicus-Programms ein tägliches Datenvolumen von mehr als 20 Terabyte generieren. Angesichts dieser Datenmengen sind neue Auswertungsverfahren erforderlich.

Dazu haben Wissenschaftler am Earth Observation Center (EOC) des Deutschen Zentrums für – und (DLR) in den TimeScan-Prozessor entwickelt und nun erfolgreich getestet. Mit Hilfe der neuen Anwendung wird aus einer Vielzahl von Satellitenaufnahmen, die über einen längeren Zeitraum aufgenommen wurden, ein einziges Informationsprodukt herausgearbeitet. Für den Test wurden über 450.000 Aufnahmen des amerikanischen Landsat-Satelliten aus dem Zeitraum 2013 bis 2015 verarbeitet und jetzt als „TimeScan-Landsat-2015“-Produkt veröffentlicht.

Anwendung für Endnutzer vereinfacht

Das „TimeScan-Landsat-2015“-Produkt ist ein bislang einzigartiger globaler Datensatz, der in kompakter Form Informationen über die Beschaffenheit der Landoberfläche liefert. Die rund 500 Terabyte an Einzelaufnahmen wurden auf ein Zwanzigstel der ursprünglichen Größe komprimiert und können nun in Form eines globalen, wolkenfreien Datensatzes dargestellt werden. Die Entwicklung soll Wissenschaftler und Entscheidungsträger in Planungs- und Umweltbehörden unterstützen und unter anderem zu einem besseren Verständnis des weltweiten Phänomens der Urbanisierung beitragen.

Sobald umfassende globale Zeitserien an Sentinel-Daten vorliegen sollen diese auch als TimeScan-Datensätze verfügbar gemacht werden. Diese bieten auch außerhalb des urbanen Kontexts ein großes Potenzial für ein breites Anwendungsspektrum, zum Beispiel für Forschungsfragen des globalen Wandels mit Bezug auf Landbedeckungs- und Landnutzungskartierungen, Landwirtschaft, Forstwirtschaft, Überwachung von Polar- und Küstenregionen, Risikomanagement, Katastrophenvorsorge oder Ressourcenmanagement.

Das gesamte Verfahren ist für enorme Datenmassen ausgelegt und soll es Endnutzern ermöglichen, die Informationen aus solchen – bislang für sie nicht handhabbaren – Datenmengen zu erschließen. Anders als bisher werden die verwendeten Satellitenaufnahmen daher nicht mehr zu den Endnutzern transferiert, sondern zunächst auf großen Rechenclustern verarbeitet, idealerweise unmittelbar dort, wo die Daten von den Satelliten empfangen werden. Dadurch entfällt die Verteilung immenser Datenmengen an eine Vielzahl einzelner Nutzer, die für ihre weiterführenden Auswertungen zudem keine eigene Hochleistungsrechnerinfrastruktur haben müssen. Vielmehr wird nur das Endprodukt der TimeScan-Verarbeitung an den Endnutzer geliefert und dessen Größe nimmt lediglich einen Bruchteil des ursprünglichen Eingangsvolumens an Daten ein.

Big Data in der Erdbeobachtung

Bei dem TimeScan-Landsat-2015 handelt es sich nicht, wie bei anderen globalen Satellitenbildern üblich, um ein einfaches Bildmosaik. Stattdessen wurden von den multispektralen Landsat-Aufnahmen spezielle Parameter zu Vegetation, Gewässern oder Besiedlung abgeleitet und deren zeitliche Charakteristik in Form von Minimum, Maximum und Mittelwert statistisch beschrieben. „Die Landsat-Mission hat in den letzten vier Jahrzenten über vier Millionen Bilder aufgenommen und eignet sich daher ideal, um die Verarbeitung von Massendaten, wie sie die Sentinel-Missionen in den kommenden Jahren liefern wird, mit dem TimeScan-Prozessor zu testen.“, erläutert Projektleiter Dr. Thomas Esch.

Um das Verfahren zu testen, wurde der TimeScan-Prozessor auf das Super-Computing-Center IT4Innovations in Ostrava-Poruba in Tschechien transferiert. „Unser globaler Datensatz hat eine räumliche Auflösung von 30 Metern pro Bildpunkt. Dafür mussten wir insgesamt mehr als 1,5 Petabyte (1 Petabyte sind 1.000.000.000.000.000 Byte) an Daten verarbeiten. Ein leistungsfähiger Computer mit exzellenter Netzanbindung wie der IT4Innovations war dafür unabdingbar.“, berichtet Dr. Esch. Mit Hilfe des Endprodukts können beispielsweise global bebaute Flächen in einer bisher unerreichten Genauigkeit automatisiert kartiert werden. Dafür wird der Datensatz zusammen mit einem komplementären Produkt ausgewertet, das auf Basis von Sentinel-1 Radaraufnahmen gerechnet wurde. Darüber hinaus werden mit seiner Hilfe weltweit Bebauungsdichten und Grünflächenanteile innerhalb von Siedlungsgebieten abgeleitet.

Das TimeScan-Landsat-2015-Produkt ist auf der vom EOC koordinierten „Urban Thematic Exploitation Platform“ (U-TEP) verfügbar und kann in naher Zukunft von jedem über den U-TEP Geobrowser eingesehen werden. U-TEP ist eine von sechs „Earth Observation Exploitation“-Plattformen. Die Initiative wurde 2014 von der ESA ins Leben gerufen, um in Vorbereitung auf die europäischen Sentinel-Missionen neue Techniken zur Informationsgewinnung aus Erdbeobachtungsdaten zu entwickeln.

Auf den Bilder

  • Globaler TimeScan-Landsat-2015 Datensatz: Abgebildet ist der globale TimeScan-Landsat-2015 Datensatz, dargestellt als Falschfarbenkomposit aus temporalem Mittelwert des Bebauungsindex (NDBI) in rot, des Vegetationsindex (NDVI) in grün und des Wasserindex (NDWI) in blau.
  • Falschfarbenkomposit des TimeScan-Landsat-2015 für die Region New York: Falschfarbenkomposit des TimeScan-Landsat-2015 für die Region New York, USA, mit dem temporalen Maximum des Bebauungsindex in rot, dem Vegetationsindex in grün sowie dem temporalen Mittelwert des Wasserindex in blau.
  • TimeScan-Landsat-Produkt für Ariquemes: Das Bild zeigt das TimeScan-Landsat-Produkt für die Region um die Stadt Ariquemes, , abgeleitet für die Jahre 1985 (links) und 2015 (rechts). Aus dem Vergleich der beiden Falschfarbenkomposite mit dem temporalen Maximum des Bebauungsindex in rot, dem Vegetationsindex in grün sowie dem temporalen Mittelwert des Wasserindex in blau geht klar hervor, wie sich die Siedlung (rote Farbe), aber auch die landwirtschaftliche Fläche (gelb und orange) im Laufe der Jahre weit in die vegetationsreiche Umgebung (grün) ausgedehnt haben.

Quelle Bilder: DLR (CC-BY 3.0)

Kommentarfunktion ist geschlossen.