IT-Performance: 1 Petabyte in 6 Stunden sortiert

Big DataCloudData & StorageIAASIT-ManagementIT-ProjekteNetzwerke

Davon träumt so mancher Systemadministrator: Den Zugriff auf eine Infrastruktur haben, die solche Datenberge in nur einer Arbeitsschicht durchackert. Google besitzt so etwas.

Immerhin 4.000 Computer waren nötig, um den Rekord aufzustellen: 1 Petabyte Datenbankinhalt wurden jüngst bei Google in exakt 6 Stunden und 2 Minuten indiziert. Laut Firmenblog entspreche der Datenberg immerhin dem zwölffachen Volumen der umfangreichen Kongressbibliothek.

Der Webkonzern ist solche Datenaufkommen gewöhnt, denn allein im Januar habe die weltweite IT-Infrastruktur des Hauses täglich 20 Petabyte Kartendaten bewältigt. Die Technologie, die so etwas überhaupt möglich macht, nennt sich MapReduce, ein spezielles Rechenmodell, das die Aufbereitung und Abarbeitung großer Datensätze und -mengen optimiere. Die noch junge Technologie wird in folgendem Google-Video diskutiert. (Ralf Müller)