業種業界を問わず、企業では業務改善や新たなサービスを創造するために、多種多様なデータ収集を行っている。収集されるデータは「広く」「多く」「深く」取得するほどに、有用性を高め輝きを増していくが、保管・取扱の難度と管理・活用負荷も同時に増大していく。

 このようにビッグデータを収集しただけでは意味をなさず、分析や業務システムとの連携を図ることによって、初めて企業価値を向上させることができる。しかし、企業ビッグデータにはHadoopのようなミドルウェアの活用は必須であり、エンタープライズクラスにするには、経験と深い造詣が必要となる。

 「Connected Data Platforms」を提唱するHortonworksでは、データ駆動型企業をサポートすべく、各種製品を展開している。本書では、各種データ形式に対応しリアルタイムにデータ収集、分析、配信を実行する統合プラットフォームである「Hortonworks DataFlow」(HDF)、オープンソース分散処理ソフトウェアであるApache Hadoop、Sparkをベースとにしたパッケージソフトウェアである「Hortonworks Data Platform」(HDP)を中心に企業への導入実績を紹介する。

 ビッグデータの特性上、企業側のシステム事情や導入背景は多種多様で、通常のエンタープライズ製品のように単純に購入するだけでは機能しない難度があり、導入企業とHortonworksとのサービス・リレーションによって実現される経緯も伺い知ることができる内容となっている。