海量數據應用!微軟Azure推開源HDInsight
近日,微軟正式發布Windows Azure HDInsight,這是微軟Azure云端的Apache Hadoop版本,針對海量數據應用。
Hadoop為開源的軟件架構平臺,可用來存儲與處理集群服務器上的大量數據,并已成為管理海量數據的***平臺。包括Google、Yahoo、Facebook、Amazon、IBM及英特爾等業者都使用Hadoop架構來執行大量的分布式計算。
微軟表示,HDInsight是以Hadoop開源為基礎提供Azure的云端服務,已公開預覽多時,獲得客戶的支持并成為微軟企業服務的一部份。
Windows Azure HDInsight平臺
Windows Azure HDInsight采用了Hadoop的數據處理平臺與相關的工具,以及知名的Hadoop版本─Hortonworks Data Platform(HDP),同時兼容微軟的各種分析工具,包括Excel與Power BI等,并支持.NET或Java等編程語言,以更好的面對使用Hadoop的客戶。
微軟指出,HDInsight為海量數據的端對端解決方案,針對用戶可從各種方面獲取的數據以供Excel使用,涵蓋SQL Server、HDInsight、Hadoop的外部叢集或是公開的數據集等,并利用Power BI中的工具來萃取數據文件。
據了解,微軟準備在下個月正式發表HDP 2.0 for Windows Server版本,未來準備將HDInsight更新至HDP 2.0。























