ビッグデータ特集号 Unleashing IT - Cisco · Hadoop の登場...

20
Ϗοάσʔλಛ߸ Unleashing IT 4 ר/4 ઈͷػձ ϏοάσʔλΛ׆ڝ૪ΛشΔΊͷ ઓɺιϦϡʔγϣϯɺΑͼΞυόΠε 3 ϖʔδ Ίʹ 5 ϖʔδ ιϦϡʔγϣϯ όϯυϧ 8 ϖʔδ σʔλ ϨΠΫ

Transcript of ビッグデータ特集号 Unleashing IT - Cisco · Hadoop の登場...

Page 1: ビッグデータ特集号 Unleashing IT - Cisco · Hadoop の登場 サーバのクラスタ上の大規模なデータ セットの分散フォールト トレ ランス処理を可能にするオープンソース

ビッグデータ特集号

Unleashing IT 第 4 巻/第 4 版

絶好の機会ビッグデータを活用して競争力を発揮するための

戦略、ソリューション、およびアドバイス

3 ページ

はじめに 5 ページ

ソリューション バンドル 8 ページ

データ レイク

Page 2: ビッグデータ特集号 Unleashing IT - Cisco · Hadoop の登場 サーバのクラスタ上の大規模なデータ セットの分散フォールト トレ ランス処理を可能にするオープンソース

提携:INTEL®

競争力の発揮 ビッグデータは、あらゆる業界のすべての企業に非常に大きな機会を提供します。これらの機会を活かせるかどうかは、適切なユースケース、的確な戦略、そして良いパートナーを見つけることができるかどうかにかかっています。

今号の Unleashing IT は、競争力を発揮するための戦略、ソリューション、およびプロバイダーについての特集です。

MapR(p. 6)、Hortonworks(p. 8)、および Cloudera(p. 14)などの大手 Hadoop ベンダーによる知見と最新情報が紹介されています。ビッグデータの導入時に推測や複雑さを排除するソリューション バンドルについて説明されています(p. 5)。また、Web とビデオ会議のグローバル リーダー(p. 16)や、米国で最も人口の多い都市の 1 つ(p. 18)がどのようにデータ リソースをビジネス知見に変えているかを理解することもできます。

ビッグデータ成功の裏にある共通の要素とは何でしょうか? それは、Hadoop クラスタ、分析エンジン、レガシー システム、および新旧のデータ ソースを 1 つにまとめる、堅牢で緊密に統合されたインフラストラクチャです。絶好の機会を大きな価値に転換するインフラストラクチャが必要なのです。

詳しい情報は、文中のリンクをクリックしていただくか、お電話(1-800-553-6387)(英語)でお問い合わせください(1 を選択すると、シスコの担当者とお話しいただけます)。UnleashingIT.com では、本書の記事に関するご 意見もお待ちしております。

ぜひ貴社のビジネスにお役立てください。

Jim McHugh Cisco Systems, Inc. バイス プレジデント

Shannon Poulin Intel Corporation バイス プレジデント

『Unleashing IT』は、シスコの発行物です。ご購読または本書の記事に関するご意見については、 www.UnleashingIT.com [英語] にアクセスしてください。

Intel、Intel ロゴ、Xeon および Xeon Inside は、米国およびその他の国における Intel Corporation の商標です。

© 2015 Cisco and/or its affiliates. All rights reserved. Cisco、Cisco ロゴ、Cisco ACI、Cisco Connected Analytics、Cisco Unified Computing System、Cisco UCS、Cisco WebEx、Cisco Nexus は、米国およびその他の国のシスコおよびその他の関連会社の商標または登録商標です。シスコの商標の一覧については、 http://www.cisco.com/web/JP/trademark_statement.html をご覧ください。記載されているサードパーティの商標は、それぞれの所有者に帰属します。「パートナー」または「partner」という用語の使用はシスコと他社との間のパートナーシップ関係を意味するものではありません。(1506)

Unleashing IT 第 4 巻/第 4 版

戦略とソリューション ビッグデータのベンチマーキング 5

アーキテクチャは重要 6

データ レイクにまつわる混乱を解く 8

Hadoop への移行を簡単にする 10

データの仮想化を見直す 13

リアルタイム分析のための新しいプロセッサ 14

エクスペリエンス

ビジネスをデータ主導型にする 16

ビッグデータを活用している大都市 18

Page 3: ビッグデータ特集号 Unleashing IT - Cisco · Hadoop の登場 サーバのクラスタ上の大規模なデータ セットの分散フォールト トレ ランス処理を可能にするオープンソース

ビッグデータ オンランプ

レースは始まっています。業界の専門家がビッグデータ エンジンの今後の見通しと導入方法について語ります。

戦略とソリューション

流行りの概念から正真正銘のビジネス イネーブラとなるまでには大きなギャップがあるとよく言われます。しかしビッグデータは、過剰な期待と発展の時期を経て、そのギャップを乗り越えてきました。Gartner1 によれば、組織の 73 % がビッグデータへの投資を行った、あるいは今後 2 年以内に投資する計画があると回答しています。ただし、ビッグデータはまだ比較的新しいことから、このような投資の多くは、パイロット、概念実証(POC)、および早期展開プロジェクトに集中しています。

シスコのデータセンター システムのグローバル販売担当重役である Dave Kloempken は次のように述べています。「ほとんどの会社がビッグデータに強い関心を寄せていますが、導入方法や価値の立証方法に混乱が見られます。それは的確な使用例を見つけるためのプロセスではありますが、一旦見つかれば、展開は急速に広がっていきます」。

Intel でビッグデータ ソリューションの事業開発担当ディレクタを務める Brandon Draeger 氏は次のように述べています。「最初のハー

ドルを越えた会社は大きな手応えを感じています。Bain and Company の調査によれば、ビッグデータを適切に活用している会社は、収益性が向上しただけでなく、顧客のニーズを的確に把握して対処できるようになっています」。

なぜビッグデータなのか? なぜ今なのか?

コンピューティング デバイスとアプリケーションの爆発的増加が現在見られるビッグデータ フィーバーの主因となっています。近年のデータ セットの増え続けるボリューム、多様さ、および速度(しばしば "3V" と呼ばれる)は、組織にとって課題となるだけでなく、絶好の機会にもなります。収集、整理、および分析されたビッグデータは、ビジネス価値へと転換可能な知見の差別化につながります。

しかし、ことはそれほど単純ではありません。今や非構造化データの増殖スピードは、エンタープライズ データ ウェアハウスでよく見られる構造化され精緻化された情報をはるかに上回っています。

Unleashing IT 3

Page 4: ビッグデータ特集号 Unleashing IT - Cisco · Hadoop の登場 サーバのクラスタ上の大規模なデータ セットの分散フォールト トレ ランス処理を可能にするオープンソース

4 Unleashing IT

また、このような従来型のデータベース環境は、"3V" 用に設計されたものではないので、ビッグデータの主旨にはあまり適合しません。

Kloempken は次のように述べています。「従来のデータ ウェアハウスは、非構造化データを収容できないうえ、拡張に多大なコストがかかります。これが、Hadoop が非常な人気を博している理由です」。

Draeger 氏は次のように述べています。「問題は、ジョブに的確なツールを使用しているかどうかです。現在生成されている新しいデータの 90 % 近くは半構造化または非構造化データであり、これが 2020 年までに 40 エクサバイトの規模に達すると予想されています。控えめに見積もっても、地球全体で 1 人あたり約 5.2 テラバイトになります」。

Hadoop の登場

サーバのクラスタ上の大規模なデータ セットの分散フォールト トレランス処理を可能にするオープン ソース ソフトウェア プロジェクト、Hadoop はビッグデータの課題を克服するものとして最近大きな注目を集めています。非構造化データ用に設計された Hadoop は、さまざまなデータ セット(Web ログやセンサーから Facebook や Twitter まで)の従来のレポートを、すべて 1 つのデータベースにマージします。また、従来のデータの管理とストレージの方法に比べて 20 ~ 50 倍も安価です。

Kloempken は次のように述べています。「データ ウェアハウスがなくなるわけではありません。今でも、運用レポートなどの数多くの重要な反復可能なニーズには適しています。しかし、コスト、柔軟性、およびスケーラビリティの点で、Hadoop はさまざまなより新しいデータ ソースや使用例にとって非常に魅力的です」。

シスコのビッグデータ ソフトウェアおよびソリューション スペシャリストである Bob Fosina は次のように述べています。「これらの使用例は、必ずしも、ビッグデータを念頭に置いて生まれたわけではありません。多くの組織は、コスト節約のために Hadoop を導入し、それからそのプラットフォームを使用してビッグデータを試験的に使用しています。

企業は、Hadoop を使って、ETL(抽出、加工、ロード)プロセスをオフロードしたり、データ ウェアハウスを混雑させている古いデータの一部を除いたり、ミッション クリティカルなソフトウェア ライセンスのコ

ストを削減したりできることが分かるようになってきました。ストレージとライセンスのコストを削減する数々のすばらしい機会があるのと同時に、ビッグデータ POC 用のプラットホームを構築することができます」。

Fosina が「ビッグデータ オンランプ」と呼ぶこの状況の中で、Hadoop はデータ管理とストレージ プラットホームのメインストリームになりつつあります。そして、数え切れないほどのつぼみのようなパイロット プロジェクトが本格的な生産展開に移行して花を咲かせれば、導入数は増えていく一方でしょう。

小さく始める

Hadoop を展開する目的が、すぐにコストを削減するためなのか、長期的なビジネスの変革のためなのか、あるいはその両方なのかに関係なく、Kloempken は小さなビッグデータから始めることを推奨しています。大抵は、データ ウェアハウスの最適化が最初のステップであり、そこで時間とともに増加する運用分析やビジネス インサイトの基盤を据えます。

Kloempken は次のように述べています。「プラットホームを用意したら、使用例を定義して、いくつかのデータ ソースを 1 つにまとめて、パイロット プロジェクトを実施します。これは必ず他の使用例につながり、 さらに雪だるま式に増える傾向があります」。

もっともな理由があります。MIT Sloan Center for Digital Business2 によれば、データ主導型の企業の実績は、同業他社を最大 6 % 上回っており、収益率が最大 26 % 高くなっています。レースはすでに始まっており、前途の見通しはかつてないほど明確です。

もしまだなら、今がビッグデータ エンジンを始動させる時なのです。1 http://www.gartner.com/newsroom/id/2848718 [英語]

2 http://www.capgemini.com/resource-file-access/resource/pdf/The_Digital_Advantage__How_

Digital_Leaders_Outperform_their_Peers_in_Every_Industry.pdf [英語]

今後の Big Data Virtual Event シリーズへの登録については、UnleashingIT.com/virtualconference にアクセスしてください。

Page 5: ビッグデータ特集号 Unleashing IT - Cisco · Hadoop の登場 サーバのクラスタ上の大規模なデータ セットの分散フォールト トレ ランス処理を可能にするオープンソース

ビッグデータのベンチマーキング

詳細については、UnleashingIT.com/rn で Raghunath Nambiar のブログを参照してください。

リファレンス アーキテクチャとソリューション バンドルが使用可能に

Hadoop クラスタ、分析ソフトウェア、およびその他のビッグデータ テクノロジー。そのすべてに共通しているものがあります。それは、運用の基盤となる、信頼できる緊密に統合されたインフラストラクチャを基本的に必要とするという点です。

シスコのビッグデータ ソリューションの著名なエンジニア兼チーム アーキテクトである Raghunath Nambiar は次のように述べています。「ビッグデータというものは、さまざまなデータ ソースを 1 つの共通の環境にまとめるということです。これには、コンピューティング、ストレージ、ネットワーキング、およびアプリケーションのすべての環境を対象とした調整とオーケストレーションが必要です」。

シスコとそのビッグデータのパートナーたちは、まさしくそれを提供しています。Intel® Xeon® プロセッサ搭載のビッグデータ向け Cisco Unified Computing System™(Cisco UCS®) 統合インフラストラクチャで、組織はビッグデータ展開のために設計されたリファレンス アーキテクチャとソリューション バンドルのセットを利用できます。主要な Hadoop プラットホームと分析ソフトウェアに検証済みの設計を使用できます。

Transaction Processing Performance Council(TPC)は 2014 年 に TPCx-HS を立ち上げました。初の(かつこれまでで唯一の)ベンダー中立の業界標準ビッグデータ ベンチマーク TPCx-HS は、Hadoop のようなビッグデータ システムの価格、パフォーマンス、 およびエネルギー消費を測定します。

シスコのビッグデータ ソリューションの著名なエンジニア兼チーフ アーキテクトである Raghunath Nambiar は次のように述べています。「ベンチマーキングによって、システム パフォーマンスやほかの変数を客観的に評価することができます。これは、テクノロジー オプションの比較や選択にとって重要なだけでなく、より速く、よりコストがかからない、よりエネルギー効率の良いシステムを作るうえでも重要です」。

TPCx-HS は、Hadoop Runtime、Hadoop Filesystem API 互換システム、および MapReduce 層など、ハードウェアとソフトウェアの両方を測定するように設計されています。また、技術的に厳密かつ直接比較が可能なベンダー中立の方法で、さまざまなシステム トポロジと実装方法論を評価するために使用することもできます。

シスコと MapR は、最近、ビッグデータ システムの高性能ベンチマークを示した、最初の TPCx-HS 結果を公表しました。

Nambiar は次のように述べています。「我々は、1 つではなく、1 TB、 3 TB、および 10 TB のスケール ファクタで、3 つの結果を公表しま した」。

Nambiar は次のように述べています。「そのアーキテクチャをそのまま使用することも、特定のビジネス要件を満たすようにカスタマイズすることもできます。我々は、ビッグデータ環境の注文と展開を容易にするシングル SKU バンドルも数多く用意しています。

新しい Cisco UCS Director Express for Big Data によって、 エンドツーエンドのクラスタ管理と監視が可能になります。また、Nexus 7000 または 9000 スイッチを Cisco Application Centric Infrastructure と組み合わせて使用すれば、クラス最高のスケーラ ビリティを実現できます。

これらのリファレンス アーキテクチャ、ソリューション バンドル、そして UCS Director Express を使用すれば、組織はイノベーションとビジネスの成果にひたすら集中することができます。インフラストラクチャの全容を理解したり、使用する予定の Hadoop や分析ソフトウェア用にインフラストラクチャを最適化したりすることに、気をもむ必要はないのです」。

ベンチマーク構成には、Intel® Xeon® プロセッサ搭載のビッグデータ向け Cisco Unified Computing System™(Cisco UCS®)統合インフラストラクチャ、Cisco UCS Manager バージョン 2.2 を実行する 2 つの冗長アクティブ-アクティブ Cisco UCS 6296 ファブリック インターコネクト、Red Hat Enterprise Linux Server 6.4 を実行する 16 の Cisco UCS C240 M3 Server、および Apache Hadoop を使用した MapR Distribution が含まれます。

MapR で事業開発担当副社長を務める Jon Posnik 氏は次のように述べています。「TPC のベンチマークは業界で高く評価されており、Hadoop に関して、このような 高性能基準を示すことができて嬉しく思っています。これらの結果は、MapR Distribution のスケール、パフォーマンス、および可用性を立証するものです。我々はすでに、ユーティリティ グレードの Hadoop 環境を可能にするための、シスコとの共同ソリューションの需要が高まっているのを感じています」。

今後の Big Data Virtual Event シリーズへの登録については、UnleashingIT.com/virtualconference にアクセスしてください。

Unleashing IT 5

戦略とソリューション

Page 6: ビッグデータ特集号 Unleashing IT - Cisco · Hadoop の登場 サーバのクラスタ上の大規模なデータ セットの分散フォールト トレ ランス処理を可能にするオープンソース

戦略とソリューション

MapR エグゼクティブ:アーキテクチャが重要

ビッグデータで成功するには、データ層、アプリケーション層、ハードウェア プラットフォームのすべてが調和して機能する必要があります。

6 Unleashing IT

Page 7: ビッグデータ特集号 Unleashing IT - Cisco · Hadoop の登場 サーバのクラスタ上の大規模なデータ セットの分散フォールト トレ ランス処理を可能にするオープンソース

エンタープライズ グレードの Hadoop プラットホームを提供している MapR で最高マーケティング責任者を務める Jack Norris 氏によると、アーキテクチャの観点から言えば、ここ数十年でデータセンターに最も大きな衝撃を与えたのは、ビッグデータです。そして、ビッグデータの出現により、従来の前提やメソッドの粗が見えるようになってしまいました。

Norris 氏は次のように述べています。「コンピューティングとストレージの分離、データの扱い方や処理方法に関するすべてが見直されています。その多くはスピードが基準となっています。企業は経過を見ながらビジネスのやり方を模索しています」。

これは、お客様が会計を済ませてしまう前に、お薦めを提案したり、お得な情報を提供したりすることを意味しています。あるいはそれは、センシティブ データが漏洩する前にサイバー セキュリティに対する脅威を特定することかもしれません。もしくは、設備や重機がダウンする前にメンテナンスの必要性を予測することを意味します。

分散型、フォールト トレラント処理

従来のソリューションやアプローチでは、異なるシステムの異なるデータ セットを精緻化して正規化する必要があります。このため、リアルタイムの意思決定は、不可能と言えないまでも、非常に困難になります。しかし、分散型のフォールト トレラント処理をサポートする新しいデータ プラットホームを使えば、組織は、内外にあるデータ ソースを収集、保存、および活用する手段を考え直すことができます。

Norris 氏は次のように述べています。「企業にはもはや、データをスクラビング処理して変換する贅沢な時間は残されていません。従来のミッション クリティカルなデータだけでなく、1 秒単位で収集される大量の非構造化データを処理できる Hadoop のような、基礎となる分散データ層を必要としています。

しかし、柔軟でスケーラブルなデータ層だけでは不十分です。同等の能力を持つアプリケーション層とハードウェア プラットフォームを掛け合わせ、それらすべてが調和して動かなければなりません」。

Norris 氏にとって重要なポイントは、「アーキテクチャ」です。

エンタープライズ グレードの Hadoop デモへのアクセス MapR は、Hadoop の利点を基盤として、幅広いミッ ション クリティカルなリアルタイムの実稼働環境での使用をサポートする、定評あるエンタープライズ グレードのプラットフォームを提供します。この会社は、Hadoop の 1 つの統一されたディストリビューションで、Hadoop、NoSQL、データベース、およびストリーミング アプリケーションに前例のない信頼性、使い易さ、および世界記録の速度をもたらします。

理想的なビジネスを構築するための Hadoop アーキテクチャと使用例についてさらに知りたい方は、UnleashingIT.com/demo で、デモと活発な議論に サインアップしてください。

彼は、ビッグデータに最適なアーキテクチャとして、MapR の Hadoop Distribution と、Intel® Xeon® プロセッサ搭載の Cisco Unified Computing System™(Cisco UCS®)の組み合わせを挙げています。ビッグデータの展開では一般的なことですが、アーキテクチャが何百または何千ものノードにスケール アップすることがあるため、シスコのアプリケーション セントリック インフラストラクチャ(Cisco ACI™)ではポリシー モデルが拡張されており、ネットワーク、サーバ、ストレージ、セキュリティ、およびサービスを包含するものになっています。

「アーキテクチャが適切であれば、他のすべては、より速く、より簡単になり、さらにうまくいくようになります」

- MapR 最高マーケティング責任者 Jack Norris 氏

Norris 氏は次のように述べています。「他がどんなに強くても、弱い箇所があればそこからほころびてしまいます。ネットワークが遅延したり、コンピューティングやストレージ基盤が不安定だったりするわけにはいきません。MapR、(Cisco)ACI、そして(Cisco)UCS を使用すれば、組織は、既存のシステムを補完する画期的なビッグデータ プラットフォームを手に入れることができます」。

高速化

このようなアーキテクチャの新しいパラダイムが一般的になればなるほど、IT の専門家には進化とより迅速な行動が求められます。

Norris 氏は次のように述べています。「IT アーキテクトは長年にわたり、落ち着いてじっくりと、すべてのアプリケーションを理解し、すべてのデータベース スキーマを定義するよう訓練されてきました。間違った思い込みをしてしまうと、すべてを構築し直す必要があるからです。たとえ正しく理解したとしても、ビジネスが変化すれば、大幅な更新が求められます。Hadoop はまったく違います。強制的なスキーマは存在しませんし、柔軟性は桁違いです。以前は数週間かかっていた作業を 1 日で仕上げることができます」。

そのためには、新しい考え方、新しいスキル、そして新しいアプローチが必要です。Norris 氏は最初は小さく始めてみることを提案しています。ビッグデータ プラットホームを展開し、定義済みの使用例を試してみることができるでしょう。エンタープライズ データ ウェアハウスからワークロードをオフロードしてコストを削減すること、既存のアプリケーションに新しいデータをプルしてカスタマー サービスを向上させること、およびログ ファイルを分析して情報セキュリティを向上させることが、一般的な 3 つの出発点です。

Norris 氏は次のように提案しています。「プラットホームを展開し、そこにデータを入れ始め、概念実証ができたら、そこから徐々に拡大していきます。使用例がどんなものであれ、ビッグデータは非常に変化しやすく、ビジネスとその顧客に多大な影響を及ぼします。ビッグデータがもたらしうる競争の優位性は、誇張ではなく、現実のものです。Hadoop ユーザがこのことを何回も証明しています」。

そのすべてはアーキテクチャから始まっています。

「アーキテクチャが適切であれば、他のすべては、より速く、より簡単 になり、さらにうまくいくようになります」。と Norris 氏は語ります。

Unleashing IT 7

Page 8: ビッグデータ特集号 Unleashing IT - Cisco · Hadoop の登場 サーバのクラスタ上の大規模なデータ セットの分散フォールト トレ ランス処理を可能にするオープンソース

業界通によるデータ レイクの定義と問題

8 Unleashing IT

エンタープライズ Hadoop を体験する Hortonworks Sandbox は、インタラクティブな Hadoop チュートリアルがいくつも付属している、個人向けのポータブルな Hadoop 環境です。これには最新の HDP ディストリビューションの最も興奮を誘う開発が含まれており、15 分で稼働可能な仮想環境にパッケージ化されています。

データセンター、クラウド サービス、インターネット接続は必要ありません。Sandbox には UnleashingIT.com/hw からアクセスできます。

にごった水: データ レイ クにまつわる 混乱を解く

戦略とソリューション

Page 9: ビッグデータ特集号 Unleashing IT - Cisco · Hadoop の登場 サーバのクラスタ上の大規模なデータ セットの分散フォールト トレ ランス処理を可能にするオープンソース

Hadoop ベースのシステムは、大量の不整合データを処理する能力を備えているため、データのストレージと分析の支柱になりつつあります。データベースに読み込む前に、情報を特定の構造やスキーマに変換する必要がある従来のリレーショナル データベースと違って、Hadoop はデータを RAW 形式で保存することに重点が置かれています。そのため、アナリストと開発者は、データにアクセスする時にアプリケーションのニーズに合わせて構造を適用することができます。

企業向け Hadoop の主要なコントリビューター兼プロバイダーである Hortonworks 社の戦略担当副社長 Shaun Connolly 氏は次のように述べています。「Hadoop やその他のデータ ソースを使用したアプリケーションの適用範囲と規模の継続的な拡大に伴い、エンタープライズ データ レイクの構想が具体化し始めています。組織内外のデータ ソースを含め、複数のサイロのデータを結合すれば、組織は、これまで誰も尋ね方さえ知らなかった複雑な疑問の答えを容易に見つけることができます」。

データ レイクの定義

データ レイクの概念は、Hadoop とそのオープン ソース プロジェクトのエコシステムと密接に関係しています。従来のデータ管理の「Schema On Write」アプローチにはさまざまな事前検討と IT の関与が必要なのに対して、Hadoop の「Schema on Read」アプローチは、ユーザが必要に応じていつでもデータを任意の形式ですばやく保存し、非常に柔軟で俊敏な方法で構造を適用できるようにしています。

このように、データ レイクは組織内の任意の数のユーザが任意の種類のデータを収集、アクセス、および分析できる、共有リポジトリを意味します。

しかし Gartner1 によれば、データ レイクの概念が大きく誇張され、情報管理業界に大きな混乱が起きています。一部のベンダーは、データ レイクをビッグデータ実装の必須要素としてマーケティングしていますが、データ レイクの構成要素やそこから価値を引き出す方法に関して、ベンダー間で共通の認識はほとんどありません。

Gartner の調査担当重役 Nick Heudecker 氏は次のように述べています。「広義的には、データ レイクは、ネイティブ形式のさまざまなデータ ソースを分析するためのエンタープライズ規模のデータ管理プラットフォームとしてマーケティングされています。アイデアそのものはシンプルです。データを専用のデータ ストアに配置する代わりに、オリジナル形式でデータ レイクに移します。これにより、変換などのデータ インジェストの初期コストが排除されます。データをレイクに配置したら、それを組織内の誰もが分析に使用できます」。

管理 vs 自由

データ レイクは、個別に管理されたデータ サイロを一元化して統合したり、非構造化した大量の異種データに対する新しい処理方法を提供したりすることで、多くの問題を効率的に解決します。それと同時に、情報のガバナンス、管理、およびセキュリティにまつわるグレー ゾーンも作り出します。

Gartner の副社長で著名なアナリストでもある Andrew White 氏は次のように述べています。「データには必ず価値が埋もれています。ただし、組織は次のような質問に答える必要があります。集めたサイロやデータ レイク内の情報を 1 回限り単独で分析することを許可または推奨するのか、それとも、その取り組みをある程度形式化して、開発した価値生成スキルを維持するのか、という点です」。

Hortonworks によれば、企業にはその両方を実現するチャンスがあります。

Hortonworks で戦略的マーケティング担当副社長を務める John Kriesa 氏は次のように述べています。「Hadoop は、既存のシステムとデータ ウェアハウスを補完するもので、それらの代わりになるわけではありません。Hadoop やデータ ウェアハウス環境から、システム、入力、センサーにすべてのデータをまとめ、適用中の分析ツールにデータを生成するのが、データレイクです」。

最高度のセキュリティと最速で一貫性のある応答を必要とする情報やアプリケーションの場合、ミッション クリティカルな活動に必要な性能、ガバナンス、制御を備えたエンタープライズ データ ウェアハウスは、プロットフォームとして今でも有効な選択肢です。しかし、組織で、さまざまなシステムやサイロからの構造化ワークロードと非構造化ワークロードの両方を 1 つにまとめて探索したい場合は、Hadoop 環境とデータ レイクが、コスト効率の高い強力な選択肢となります。

Connolly 氏は次のように述べています。「Hadoop の実装は、シングル インスタンス アプリケーションから始まって、最終的には本格的なデータ レイクになるという過程をたどります。この過程は、ペタバイト単位のデータをただ集めることではありません。それは、新しいタイプのデータと既存のデータ ソースを結合するように人々を促し、彼らがデータに内在する価値を自由に引き出せるようにデータを操作できるようにすることなのです」。

1http://www.gartner.com/newsroom/id/2809117 [英語]

Unleashing IT 9

Page 10: ビッグデータ特集号 Unleashing IT - Cisco · Hadoop の登場 サーバのクラスタ上の大規模なデータ セットの分散フォールト トレ ランス処理を可能にするオープンソース

戦略とソリューション

仮想化と自動化ソフトウェアがあれば、処理とストレージをデータ ウェアハウスから Hadoop にオフロードする際の時間、複雑さ、リスクを大幅に削減できます。

多くの企業が、ビッグデータ分析用としてだけでなく、従来のデータ ウェアハウスよりもコスト効率の高いスケーラブルなストレージ オプションとして Hadoop を評価するプロセスに入っています。ただし、業界の専門家によれば、その移行は必ずしも容易ではありません。

データ統合ソフトウェアの大手プロバイダーである Informatica で主力製品マーケティング部長を務める Murthy Mathiprakasam 氏は次のように述べています。「人々は Hadoop へのデータ移行の工数と複雑さを甘く見ています。Hadoop はまだ新しいもので、すべての人がその効率的な使い方を理解しているわけでありません。また、多くの人が、独自のスクリプトとスキーマを作成してデータを手動で移動しようとしていますが、これでは時間がかかるだけでなく、エラーも誘発します」。

10 Unleashing IT

Hadoop にデータを移行するには、まず収集して処理する必要があります。移動後も、データには一定レベルの精緻化が必要です。これらの手順の 1 つでも間違えれば、悪影響が及ぶおそれがあります。バグが出るかもしれません。データの不整合が生じる可能性があります。さらに悪いことには、不完全な情報と不正確な前提に基づいてビジネス上の意思決定が下される可能性があります。

段階的な移行

幸い、データの仮想化と自動化ソフトウェアを使用することで、Hadoop への移行が容易になります。

Hadoop への 移行を簡単にする

Page 11: ビッグデータ特集号 Unleashing IT - Cisco · Hadoop の登場 サーバのクラスタ上の大規模なデータ セットの分散フォールト トレ ランス処理を可能にするオープンソース

Mathiprakasam 氏は次のように述べています。「これらのことは一夜にして起きるわけではありません。自動化ソフトウェアは、ある場所から次の場所にデータを移行する時間とリスクを削減します。また、仮想化は、データの移行元や移行先に関係なく、移行中でもデータ アクセス可能な状態に保ちます」。

彼は、処理と保存をデータ ウェアハウスから Hadoop にオフロードするための最適なプラットフォームとして、Cisco Data Virtualization、Informatica Big Data Edition、および Intel® Xeon® プロセッサ搭載の Cisco Unified Computing System™(Cisco UCS®)の組み合わせを挙げています。Informatica Big Data Edition を使用すれば、Cisco UCS サーバに実装された Hadoop クラスタ上の簡易ビジュアル開発環境を使用して、データ変換処理とデータ品質処理品質

処理を実行することができます。また、Cisco Data Virtualization を使用して分散データ環境をフェデレーションさせることによって、すべてのデータに通じる単一アクセス ポイントからビジネス インテリジェンスと分析を行うことができます。

Mathiprakasam 氏は次のように述べています。「Hadoop は効率的で安価です。しかし、簡単でも単純でもありません。複雑なのです。Cisco Data Virtualization、Informatica ソフトウェア、および Cisco UCS を組み合わせることによって、データを Hadoop クラスタに配置する時間、工数、およびリスクを大幅に削減できます」。

さらに詳しく知るには、www.dwoptimization.me で Informatica イベント、Web セミナー、ホワイト ペーパー などにご登録ください。

Unleashing IT 11

Page 12: ビッグデータ特集号 Unleashing IT - Cisco · Hadoop の登場 サーバのクラスタ上の大規模なデータ セットの分散フォールト トレ ランス処理を可能にするオープンソース

貴重だがしばしば「未開」の資産に光を当てる

センサーやソーシャル メディアなどの新しいソースからデータを収集して掘り下げることに熱中していると、情報の宝庫であるエンタープライズ ネットワークが見落とされてしまうことがあります。これらの貴重でありながらしばしば「未開」の資産に光を当てるなら、シスコにお任せください。

シスコの Connected Analytics のシニア ディレクタである Scott Bergquist は次のように述べています。「シスコはよくハードウェアの会社だと思われています。しかし、弊社は、25 年間のネットワーク イノベーションとリーダーシップに基づく強力なソフトウェアとサービスを培ってきました」。

彼は、インテリジェンスとインフラストラクチャを結び付けて新しいネットワーク ベースの知見をもたらすシスコの Connected Analytics™ ソリューションについて言及しています。他のさまざまなビッグデータ検索および分析エンジンと比べて、Connected Analytics は極めて特殊な使用例のために設計された既製のソフトウェア ソリューションです。

Bergquist は次のように説明しています。「ネットワーク環境を あまりにも多くのデータがあまりにも高速で移動しているので、そのすべてを集中型リポジトリにプッシュすることはできません。 そこで我々は、分析をデータにプッシュしてリアルタイムで貴重な

知見を抽出しながら、下流のアプリケーションとエンジンに測定基準とデータを提供します。つまり、ハードウェア プラットフォームでクリックストリーム型の分析を可能にしました」。

単体でまたはサービスとして購入した Connected Analytics パッケージは、ネットワーク配置、コラボレーション、コンタクト センター、サービス プロバイダー、小売店、イベント、モビリティ、および脅威分析に使用できます。これらのすべてが、リアルタイムのネットワーク エッジであっても、データセンターであっても、必要な場所ならどこでも分析を提供することで、より迅速な知見と決定を可能にします。

Bergquist は次のように述べています。「データ レイクや分析エンジンを使っている会社であれば、我々がその環境にデータと価値を付けることができます。また、それがコンタクト センターであろうと、小売店舗であろうと、極めて固有な課題を解決して、価値の高いインテリジェンスを提供します」。

Cisco Data Virtualization と Connected Analytics に関する Forrester Total Economic Impact 研究については、UnleashingIT.com のリソース センターを参照してください。

戦略とソリューション

12 Unleashing IT

ネットワーク: 情報の宝庫

Page 13: ビッグデータ特集号 Unleashing IT - Cisco · Hadoop の登場 サーバのクラスタ上の大規模なデータ セットの分散フォールト トレ ランス処理を可能にするオープンソース

データの仮想化を見直す 重要性が高まるミドルウェア層のデータの仮想化により、大規模で複雑なデータ環境をまとめることができます。

eBOOK を入手する Cisco Data Virtualization に関する eBook とケース スタディについては、UnleashingIT.com でリソース センターを参照してください。

データ仮想化とビッグデータ プラットホームの爆発的広がりはあまり関係ないことだと言われてきました。ビッグデータが多種多様な大量の情報に対応できるからです。シスコのデータ専門家の見解はまったく異なるものです。

シスコの製品マーケティング部長である Peter Tran は次のように述べています。「エンタープライズ データ ウェアハウスがあり、Hadoop クラスタがあり、クラウド ベースのデータ ソースがある。すべてがサイロ化されたままなのです。すべてを単一のリポジトリにまとめるのは非現実ですが、データがどこにあってもそのすべてにアクセスする必要があります」。

そこで仮想化の出番です。Cisco Data Virtualization ソフトウェアは、クエリー、コンピューティング、およびネットワーク インフラストラクチャを最適化するために、データ ソースを結合することにより、従来のデータ統合を増強します。ネットワーク全体のあらゆる種類のデータに、それが 1 つの場所にあるかのようにアクセスしたり、照会したりできます。

シスコのデータ仮想化サービスのディレクタである Rick Schreiber は次のように述べています。「それはデータ ストアではなく、適切な場所に『仮想』データを提供するミドルウェア層です。この層は、データ ソース(何百もしくは何千もの数になる)と、分析エンジンなどそのデータを消費するアプリケーションの中間にあります」。

仮想化を使用しない場合は、データが 1 つの場所から別の場所に移ったり、新しいスキーマが分析や報告のために適用されたりすると、データは継続的に複製されていきます。これは、データ スプロールを引き起こすだけでなく、不要な複雑さとコストにつながります。しかし、仮想化を使用すれば、データを物理的に移動させることなく、アクセスし利用することができます。これは、より少ないフォーマット化と複製、より速い応答、より柔軟な拡張性を意味します。

Tran は次のように述べています。「データ仮想化は大規模で複雑なデータ環境に最適です。これがエンタープライズ データ ウェアハウスと Hadoop クラスタを補完します。実際には、この 2 つの環境を揃え、それらの間でデータを取り持ち、ビジネス クリティカルなアプリケーション用のデータをそれらからプルすることができます」。

Unleashing IT 13

Page 14: ビッグデータ特集号 Unleashing IT - Cisco · Hadoop の登場 サーバのクラスタ上の大規模なデータ セットの分散フォールト トレ ランス処理を可能にするオープンソース

Intel と Cloudera は、製品の機能強化とコラボレーションによってビッグデータ イノベーションを推し進めています。

戦略とソリューション

リアルタイム分析と Hadoop 暗号用に設計 された新しいプロセッサ

14 Unleashing IT

Page 15: ビッグデータ特集号 Unleashing IT - Cisco · Hadoop の登場 サーバのクラスタ上の大規模なデータ セットの分散フォールト トレ ランス処理を可能にするオープンソース

詳細情報 インタラクティブなセルフガイドの Apache Hadoop デモとチュートリアルについては、UnleashingIT.com/ah で Cloudera Live にアクセスしてください。

データ管理、分析、およびセキュリティ用に設計された 2 つの新しいプロセッサ ファミリが、ビッグデータ イノベーションにすでにインパクトを与えています。Intel® Xeon® プロセッサ E7 v3 製品ファミリは、リアルタイム分析を提供するだけでなく、データ集約型コンピューティングの性能と信頼性も向上しています。Intel Xeon プロセッサ E5 v3 は、Apache Hadoop HDFS 暗号化を高速化し、暗号化オフロードを 2.5 倍高めます。

どちらも、新しい技術的進歩を産み出しながら、Hadoop のコア テクノロジーの最適化を支援します。エンタープライズ分析データ管理のリーダーで Intel のパートナーでもある Cloudera は、その Hadoop ディストリビューションの 4 つのリリースでこれらのプロセッサを使用して、データ パフォーマンスと保護を向上させています。その結果、今では、システム パフォーマンスへの影響を最小限に抑えながら完全なデータベース暗号化が可能になったため、処理リソースが Hadoop ジョブをより高速に実行することができています。

Cloudera の最高経営責任者である Tom Reilly 氏は次のように述べています。「昨年の Intel との提携によって Hadoop イノベーションを加速させることができました。それは、パフォーマンス、セキュリティ、管理性などの分野で、オープン ソース Hadoop プロジェクトを集中的に強化することにより成し遂げられました。わたしたちには共通の目標があります。それは、ビッグデータが持っている能力を十分に発揮させること。そして、お客様が既存の資産と投資にアクセスする必要がある場所と仕方でエンタープライズ データ ハブを展開できるようにすることです」。

知見と成果への近道

Cloudera と Intel は協力して、金融サービス、電気通信、医療、小売、およびテクノロジー業界など、さまざまな企業がデータを適切に管理し、知見をすばやく抽出し、変革的ビジネス成果を出すまでの近道を開拓してきました。多くの企業がすでにこの新しい性能を利用しています。

たとえば、Caesars Entertainment は、Cloudera ディストリビューションを使用して、カジノや娯楽施設のカスタマー エクスペリエンスを向上させています。このソリューションは、主要ジョブの処理時間を 6 時間から 45 分に短縮し、非構造化データと半構造化データの両方を含めるようにデータ分析を拡張するうえで役立ってきました。医療技術のグローバル リーダーである Cerner Corporation は Cloudera ベースのエンタープライズ データ ハブを構築してきました。大量の数のデータ ソースを 1 つにまとめて、さらに効率的に潜在的リスクを予測するために、人の健康状態をより完全に把握できるようになりました。また、出会い系サイトの eHarmony は、Cloudera ディストリビューションを利用して、複雑な分析を実行することで、よりパーソナライズされた結果を生成し、良縁に恵まれる機会を増やしています。

Intel の Data Center Group の上級副社長兼本部長を務める Diane Bryant 氏は次のように述べています。「Apache Hadoop の性能、スケーラビリティ、セキュリティを強化するための Cloudera と Intel の共同の取り組みに、データセンター テクノロジーにおける Intel の強みが加わることにより、我々はデータ管理のイノベーションをさらに加速させています。双方の技術的な取り組みを融合し、堅牢なパートナー エコシステムを構築することによって、ビッグデータ ソリューションの展開を加速させながら、あらゆる規模の企業がデータから明確なビジネス価値を容易に得られるよう支援しています」。

Unleashing IT 15

Page 16: ビッグデータ特集号 Unleashing IT - Cisco · Hadoop の登場 サーバのクラスタ上の大規模なデータ セットの分散フォールト トレ ランス処理を可能にするオープンソース

エクスペリエンス

ビジネスをデータ 主導型にする

Platfora の Big Data Discovery Platform を利用している Cisco WebEx は効率化によりその製品とサービスの質を向上させています。

コラボレーション ソリューションを使用している Fortune 100 社の 93 % において、Cisco WebEx® はすでに Web とビデオ会議のグローバル リーダーになっています。しかし、改善の余地は常にあるものです。

シスコのソフトウェア エンジニアリングのディレクタである Joe Hsy は次のように述べています。「我々は、業務を効率化し、より良い決定を下し、より質の高いサービスを提供したいと考えています。そのすべてはデータから始まります」。

その点で、WebEx には多くの利点があります。平均で 230 ヵ国から 5,000 万人以上が参加する WebEx 会議が、毎月約 1,200 万回も実施されています。毎月行われる 200 億分を超えるコラボレーションでも、収集して分析することが可能なデータが大量に発生します。最近の推計によれば、WebEx は次の 2 年間だけでもペタバイト単位のデータを収集する予定です。

「我々は、真のデータ主導型ビジネスに移行しようとしています」。と Hsy は述べています。

そのために、組織には新しいビッグデータ発見プラットホームが必要です。既存のデータ ウェアハウスより低いコストでより良いスケーラビリティを提供し、テクニカルでないビジネス ユーザ向けの簡易分析を可能にするプラットフォームが必要なのです。

すべての分析

Hsy によれば、WebEx の現在のデータ ウェアハウスではスケールにコストがかかっていました。分析できるようにワークロードを整理して準備するのに、途方もない時間と労力が必要でした。ユーザがデータにアクセスして調査するための明確な経路もありませんでした。幸いなことに、WebEx は、Platfora の Big Data Discovery Platform と、Intel® Xeon® プロセッサ搭載の Cisco Unified Computing System™(Cisco UCS®)上で動作する Cloudera の Hadoop クラスタを利用することによって、これらの課題を克服することができました。

16 Unleashing IT

Page 17: ビッグデータ特集号 Unleashing IT - Cisco · Hadoop の登場 サーバのクラスタ上の大規模なデータ セットの分散フォールト トレ ランス処理を可能にするオープンソース

ビッグデータ ディスカバリ ワークショップをスケジュールする Platfora の Big Data Analytics プラットホームは、RAW データから分析に移行する最速の方法です。ビッグデータ時代に生まれた Platfora のエンドツーエンド プラットホームは、ETL、データ ウェアハウジング、およびビジネス インテリジェンス ツールのニーズを置き換えます。

あなたの組織で Hadoop と Platfora を活用する方法に関する無料のディスカバリ ワークショップをスケジュールするには、[email protected] 経由で David Littlewood までお問い合わせください。

Platfora でアライアンスのシニア ディレクタを務める David Littlewood 氏は次のように述べています。「従来のツールでは、近代的な企業が競争力を維持するために分析する必要がある大量のデータや種々雑多なデータを処理できません。分析は、ビジネス ユーザが簡単に使え、しかも迅速に行われなければなりません。Platfora、Hadoop、および Cisco UCS の組み合わせで、複雑さを排除し、ビジネス知見をすばやく抽出する完全なビッグデータ プラットホームを実現します」。

新しいプラットホームの導入に伴い、WebEx は、会議参加時間、調査データ、および不正行為分析に焦点を当てた 3 つの初歩的な使用例を定義することができました。これらの使用例は、WebEx の技術スタッフではなく、むしろ製品管理、マーケティング、および運用チームによって推進されたものです。

すばやい知見

会議参加時間は、WebEx の重要なインジケータです。参加者がどれくらい迅速に会議に参加できるか、そしてサービスに関する彼らの全体的な体験に直接影響します。この一見シンプルなメトリックは、Web、サーバ、ゲートウェイ、ユーザ、およびバックエンド システム データなど、さまざまなソースから成り立っています。

Hsy は次のように説明しています。「Platfora を使用することで、チームは、これらすべてのデータ ポイントを 1 つにまとめた会議参加時間のわかりやすいビューを得ただけでなく、全く新しい方法でプロセスを見ることができました。プロセスのどこで遅延が発生しているかを知るだけでは不十分です。それがなぜそこで起きているのかを知る必要があります。時間的要因なのか 会議の参加者の数なのか、 使用されたデバイスが問題なのかを知る必要があるのです」。

分析に基づいて、WebEx は、会議の遅延が発生した特定の地域、インターネット サービス プロバイダー、およびユーザを正確に特定することができました。トラフィック ルーティングとセキュリティ スキャンに伴うさまざまな問題を経験している WebEx は、遅延の発生源と積極的に情報をやり取り(場合によってはそれを解決)することができました。

WebEx は、顧客アンケートと製品パフォーマンスの相関関係にも新しいデータ プラットホームを利用しています。

Hsy は次のように述べています。「これまで主に音声と画像の品質に焦点を当てたいくつかの分析ツールを構築してきましたが、製品パフォーマンスとビジネス パフォーマンスの両方を関連付けて分析することはできませんでした。新しいプラットホームにより、エンドツーエンド プロセスを分析し、完全なカスタマー エクスペリエンスの感覚がより正確につかめるようになりました」。

彼らは、サービスの不正使用などのパターンや異常も検出できます。さまざまなデータ ソースを 1 つにまとめることで、WebEx は、このようなパターンだけでなく、誰がいつどこで不正行為活動を行ったかも特定することができます。

データと分析の共有

WebEx は、現在、その分析の用途を拡大して、新しい使用例をたくさん作り出しています。たとえば、ユーザ テレメトリを調査して、顧客の嗜好、最も使用された機能、最も使用されなかった機能などをより正確に把握しています。

これらの知見は、製品と価格設定の最適化や、アップセリングを改善する推奨エンジンの開発に利用される予定です。

また、WebEx はその分析機能を他者と共有する計画を立てています。WebEx の顧客とパートナーが自分たちのサービスの利用状況に関するデータにアクセスして分析できるような、新しいポータルを製作中です。

Hsy は次のように述べています。「組み込みのセルフサービス機能があれば、安全で信頼できる方法でデータをセグメント化して公開できるため、ビジネス ユーザ、お客様、そしてパートナーのそれぞれが独自の分析を実施して新しい知見を得ることができます」。

Unleashing IT 17

Page 18: ビッグデータ特集号 Unleashing IT - Cisco · Hadoop の登場 サーバのクラスタ上の大規模なデータ セットの分散フォールト トレ ランス処理を可能にするオープンソース

エクスペリエンス

ビッグデータを活用している大都市

World Wide Technology の助けを借りて、米国の大都市の 1 つはビッグデータの機会を識別し、成功のための戦略を策定しています。

18 Unleashing IT

Page 19: ビッグデータ特集号 Unleashing IT - Cisco · Hadoop の登場 サーバのクラスタ上の大規模なデータ セットの分散フォールト トレ ランス処理を可能にするオープンソース

WWT ビッグデータ ワークショップをスケジュールする World Wide Technology は、実績のある革新的なアプローチを使用して、大規模な公共団体と民間組織がアドバンスド テクノロジーを探索、評価、設計、および実装できるように支援しています。

ビッグデータの機会と計画に関する無料の 2 ~ 4 時間の技術的および戦略的ホワイトボード セッションに登録するには、[email protected] に電子メールを送信するか、www2.wwt.com/request-workshop を参照してください。

ビッグデータを利用しているのは、Web ベースの企業、よく知られた小売業者、大手金融機関、および医療複合企業だけではありません。世界で大都市のいくつかは、新しいインパクトのある方法で情報資源をどのように活用するかを模索しています。そして、年間収益が 67 億ドルの世界的テクノロジー インテグレータである World Wide Technology(WWT)が彼らを支援しています。

WWT のビッグデータ プラクティスの契約担当マネージャを務める Chris Infanti 氏は次のように述べています。「ビッグデータに関して言えば、テクノロジーから入ってそこから何かを見出す方法もありますが、 我々は、ビジネス成果にまともに焦点を当てる正反対のアプローチを取っています」。

彼の説明によれば、機会を定義することが第一歩です。それは WWT が米国で最も人口の多い都市の 1 つに対して行ったことでもあります。IT 部門の状況や希望を掘り下げる代わりに、WWT は、警察、消防、公共事業、および人事を含む市の 11 の部署と話し合いました。

Infanti 氏は次のように述べています。「市の中央 IT グループは、さまざまな部署と共同作業をしたことがあまりありませんでした。まずそれらのビジネス グループから始めたことによって、より多くのアイデアと自由な発想が生まれました」。

WWT は、市の職員との 2 時間インタビューを 30 回近く実施して、各部署が市と市民にどのようにサービスを提供しているか、どんなアプリケーションを使用しているか、彼らの目標と課題、そしてデータがどのようにサポートできるかを理解しようと努めました。このプロセスは 3 週間に及び、100 人を超える市の職員に対して実施されました。

Infanti 氏は次のように述べています。「市ではすでに大量のデータを得ていることがわかりました。しかし、そのデータの大部分は 300 の部門アプリケーションにばらばらに散らばっている状態でした」。

そこにビッグデータの機会が眠っています。WWT は、分かったことを踏まえて 32 の使用例を特定しました。そのほとんどが効率性と価値を高めるのための異種データ セットの結合に関するものです。また、WWT は、市のために包括的なデータ管理戦略とロードマップを策定しました。

機会の優先順位付け

市のデータ評価と初期計画を完了した WWT は、使用例に優先順位を付け、実装が簡単で影響が大きいものを 2 ~ 3 選択するように提案しました。そうすれば、市は、それらの使用例に合ったサイズのビッグデータ プラットフォームを展開して、後から徐々に拡張することができます。

Infanti 氏は次のように述べています。「投資の価値を即座に示すのがこつです。そして、最初のユース ケースが成功すれば、後が簡単になります」。

使用例によっては非常に特殊なものもあります。建物査察の安全性と効率性を高めるために、資産データと警察の記録を結合するといった場合です。市の複数の部署が関係するプロジェクトの全対象範囲と状況の視覚化など、範囲が広い使用例もあります。また非構造化データを利用するものもあります。例えば、ごみ収集車や警察のダッシュボード カメラからの映像、市の 3-1-1 システムからのテキスト情報、公共事業部により使用されるビル計画や調査データな

どがそうです。さらに、市では、重要な都市インフラの予防保守の予測モデルも検討しています。

Infanti 氏は次のように述べています。「32 の使用例でそのすべてに価値がある場合、優先順位が重要になります。幸い、Hadoop のような新しいプラットホームを使用することで、市は小規模に始めて、徐々に拡大することができます」。

資本投資を行う前に、市はセントルイスにある WWT Advanced Technology Center(ATC)を使って、Intel® Xeon®プロセッサ搭載の Cisco Unified Computing System™ 上でさまざまなソフトウェア ソリューションをテストし、ビッグデータ プラットホームが既存のシステムとどのように統合するかを確認することができます。また、市とその職員はまだビッグデータ テクノロジーに慣れていないため、ATC を実践型の教育と訓練に使用することもできます。

データを新しい方法で活用するための機会を正確に示すことに加えて、この発見および計画プロセスにより市の IT グループとほかの部署との連携が強まっています。彼らが協力して、市がより効率的に市民を支援できるようにするための集中型データ インフラストラクチャ、方針、ロードマップを策定したり、設計したりするのは初めてのことです。

Unleashing IT 19

Page 20: ビッグデータ特集号 Unleashing IT - Cisco · Hadoop の登場 サーバのクラスタ上の大規模なデータ セットの分散フォールト トレ ランス処理を可能にするオープンソース

THE INTERNET OF EVERYTHING presents

データセンターは、あらゆる 場所に存在しています。

シスコでは、ビジネス向けの Internet of Everything を開発しています。それは大量のデータを利用する機会がますます増加するということです。しかし、大量のデータを処理して、大量の結果を導くだけではなく、スマートで迅速な答えが必要とされています。私たちシスコは、業界最高水準の性能と、高い柔軟性をもった Cisco UCS サーバ ソリューションによって、それを提供できます。その性能と柔軟性、知性とスピードは、あらゆる規模のアプリケー

ションの頼もしいパートナーになるのです。これでレジ待ちの行列は過去のものになります。 詳しくは、cisco.com/tomorrowstartshere をご覧ください。

Cisco UCS には Intel® Xeon® プロセッサが搭載されています

© 2015 C

isco and/or its a�liates. All rights reserved. Intel、Intel ロ

ゴ、Xeon、Xeon Inside は

、 米国およびその他の国における

Intel Corporation の

商標または登録商標です。