Java-Framework Hadoop für skalierbare Datenmengen zieht ein in Microsofts Azure

Software

Am 30. März soll Hadoop für Microsofts Cloud Azure freigegeben werden. Zum selben Zeitpunkt will MS eine Preview für den Windows-Server veröffentlichen. Zudem will Microsoft weitere tools zur Analyse großer Datenmengen bereitstellen.

Microsoft will die Big-Data-Lösung Hadoop in Windows Azure und Windows Server integrieren – was bislang nur mit teuren Zusatzprogrammen möglich war, soll nun in die Windows-Cloud-Lösungen selbst integriert werden. Neben Hadoop sollen weitere Tools und Technologien für die Analyse großer Datenmengen noch im ersten Halbjahr vorgestellt werden

Das in Java geschriebene OpenSource-Projekt der Apache Foundation setzte Microsoft zusammen mit Yahoo-Tochter Hortonworks zügig in eine eigene Distribution um. Das Framework zur Ausführung verteilter Prozesse, das eine Verarbeitung und Analyse großer Datenmengen ermöglicht, wird bereits bei Facebook Baidu, AOL, Dell, IBM und Oracle eingesetzt.

Unter dem Codenamen »Isotope« soll eine Reihe von passenden Microsoft-Pordukten und Utiities Hadoop auf Windows Azure und Windows Server unterstützen. Nach der Roadmap, die der ZDNet-Autorin Mary Jo Foley zugespielt wurde, will Microsoft die endgültige Version von Hadoop für Azure am 30. März freigeben. Damit wird erstmals ein genaues Datum bekannt.

Entwickler bekamen bereits Zugang zu einer eingeschränkten Preview von Microsofts Apache-Hadoop-Distribution, die für Datenanalysen und Analytics-Aufgaben in großem Umfang gedacht ist. Ebenfalls zum 30. März hat Microsoft die Veröffentlichung eines Community Technology Preview (CTP) von Hadoop für Windows Server eingeplant.

Die Roadmap führt außerdem die Tools an, die Microsoft für die Arbeit mit Hadoop bereitstellen will. In einem Webcast hatte Microsoft schon im Dezember erklärt, an einer bidirektionalen Integration mit dem Hadoop-Dateisystem und Hadoop-Tools wie Sqoop und Flume zu arbeiten. Isotope bezeichne mehr als nur die zusammen mit Hortonworks erstellten Distributionen, sondern vielmehr die ganze »Tool-Palette« zur Unterstützung von Big-Data-Analytics, die Microsoft rund um die Hadoop-Distributionen bereitstellt.

(Mit Material von Mary Jo Foley, ZDNet.com und Bernd Kling, zdnet.de)

Anklicken um die Biografie des Autors zu lesen  Anklicken um die Biografie des Autors zu verbergen