クラウドのデータウェアハウジング 〜 我々にも可能なビッグデータ分析

はじめに

データウェアハウジングとデータ分析の重要性は、企業がその情報資産から競争力を持ち、先行者利益を得ようと模索する中で、ますます増加しつつあります。実際のところ、ソーシャルメディアやオンラインゲーム、その他のオンラインBtoCビジネスのようなデータが極めて重要なビジネスモデルの企業は日々出現しています。そういった企業にとってさまざまな情報ソースからの大量のデータを統合し、分析し、それに基づいて行動することは、これらの企業にとっては、まさに体に流れる血液のようなものです。

3つのV、すなわちvolume(量)、variety(多様性)、velocity(速さ)で定義されるビッグデータは今までよりも多くの情報ソースとより多くの量、より多様な種類で企業に迫ってきています。オンプレミスやウェブアプリケーションのような従来からあるデータソース同様、モバイル機器やソーシャルメディアアプリ、各種機械から生まれてくるデータは、今まさに従来からあるデータウェアハウスのテクノロジーやアプローチを圧倒しようとしています。

ウェブやソーシャルメディアからのデータの爆発がこのもっとも明らかな例かもしれません。ちょっとした住宅のスマートメーターでさえも1年に400メガバイトの量のデータを生み出します。例えば、Pacific Gas & Electricは70万個のスマートメーターを設置するサポートのために追加の1.2ぺタバイトのディスクストレージを購入することになりました。

我々はビッグデータが引き起こす
革新・生産性・成長のものすごい変革の波の中にいる。

出典:ビッグデータ:革新と競争、生産性のための次のフロンティア
マッキンゼイ 国際学会 2011年5月

各種システムから出てくるこれらの新しいデータは、従来からあるデータウェアハウスのテクノロジーとアプローチで対応可能な範囲を凌駕する量となりつつあります。Hadoopのような発展しつつあるテクノロジーは”ビッグデータ”分析を行い、メジャーなものにするように作られているが、それらは成功に求められる技術的なリソースと十分な資金のある規模の大きい企業だけが手に入る状況となっています。

そして、前フォレスターリサーチ社のアナリスト、ジェームス・コビエルスが指摘するように、Hadoopに対して幅広く興味が持たれているにも関わらず、実際にHadoopを利用できている企業はわずか1%にしかすぎません。

Treasure Dataはビッグデータの活用を妨げているコストと複雑さの壁を取り払うために、革新的なテクノロジーとクラウドコンピューティングによる規模の経済を合わせて利用します。Treasure Dataは企業が希少な高い技術者を雇う必要なく、1か月ではなく、数日でデータを再設置し、読み込み、生産性の分析を始められるようにします。このホワイトペーパーはビッグデータのビジネス活用が現在直面している諸問題の概要を提示し、Treasure Dataのサービスとアーキテクチャーを解説します。これから、このサービスがどうやって動きの速いデータ駆動型の企業とクラウドによるビッグデータ分析を使いたい従来型企業の両方にベネフィットをもたらし得るのか、について述べます。

» 次ページへ:いわゆるビッグデータ問題