~新しいデータ・マネジメント機能により、Hadoop上でのアナリティクス・ライフサイクルを飛躍的に効率化~
ビジネス・アナリティクス・ソフトウェアとサービスのリーディング・カンパニーであるSAS Institute Japan株式会社(本社:東京都港区、代表取締役社長:吉田 仁志、以下 SAS)は、Hadoopをアナリティクス・プラットフォームとして確立し、Hadoopエコシステムを拡充するデータ・マネジメントの新製品「SAS/Access(R) Interface to Impala」ならびに、「SAS(R) In-Database Code Accelerator for Hadoop」を国内で提供開始しました。また、Hadoopに対応したインメモリ分散並列処理機能のプラットフォーム「SAS(R) LASR(TM) Analytic Server」、およびインタラクティブなアナリティクス・プログラミング環境「SAS(R) In-Memory Statistics for Hadoop」の機能拡張を発表しました。
ビッグデータを企業の競争優位性に活かすために、オープンなプラットフォームであるHadoop上で、データ・マネジメント、データ探索、モデル開発、および業務への適用といったアナリティクス・ライフサイクル全体を完結することがますます求められています。SASは、Hadoopを効果とコスト・パフォーマンスに優れたアナリティクス・プラットフォームとして確立し、Hadoopエコシステムを拡充することに注力しており、今回の新製品リリースと機能拡張はその取り組みの一環になります。
今回リリースされたデータ・マネジメント新製品
・SAS/Access Interface to Impala: 高速SQLエンジンImpalaへの対応
Hadoop上での代表的な高速SQLクエリエンジンであるImpalaへの接続を可能とするSAS/Access Interface to Impalaを使用することで、ビジネスに必要なデータの取得時間が、従来の方法と比較して最大で65倍高速化されます。これにより、これまで大規模バッチ処理でしか利用されなかったHadoopを、よりインタラクティブでアドホックなアナリティクス業務へ適用することが可能になります。
・SAS In-Database Code Accelerator for Hadoop: Hadoop上でのデータ・マネジメントを飛躍的に効率化
SAS In-Database Code Accelerator for Hadoopにより、Hadoopユーザーはこれまでの高度なスキルと手間を必要とするMapReduce処理の開発から解放されます。長年SASユーザーが慣れ親しんだ、分析のためのデータ加工ツールとして非常に評価の高いSAS言語を、自動的にMapReduceに変換し、Hadoop上での分散処理を実現します。SASユーザーは新たなスキルを習得することなく、従来のSASプログラミング資産をHadoop上でスケーラブルかつ高速に実行することが可能となります。
今回追加・拡張されたデータ探索・モデル開発機能
・SAS LASR Analytic Server: ROIと管理性の向上
Hadoop上でのインメモリ分散並列処理機能のプラットフォームであるSAS LASR Analytic Serverに、新たにデータ圧縮機能が搭載されました。これにより、十数倍から数十倍の圧縮率を実現し、従来と同様のHadoopクラスター環境で、より多くのアナリティクス業務を同時に実施することができるため、アナリティクス組織の生産性向上を実現します。また、Hadoop上での一元的なワークロード管理として期待されるYARNとの統合を可能にしました。
・「SAS(R) Visual Statistics」: Hadoop上での予測型モデルの開発生産性を向上
Hadoop上のビッグデータをマウスによるポイント&クリックのみでビジュアライズする「SAS(R) Visual Analytics」に加えて、プログラミングスキルなしでHadoop上で予測型モデルの開発を可能とするSAS Visual Statisticsを新たにリリースしました。これにより、従来一部のITスキルの高いユーザーの利用にとどまっていたHadoop上のビッグデータを、企業のすべてのユーザーが、インメモリ分析エンジンによって、スピーディーに活用することが可能となりました。
・SAS In-Memory Statistics for Hadoop: インメモリ・アナリティクス機能のさらなる拡張
最適化機能を強化し、時系列予測にゴール・シーク機能を新たに追加しました。指数平滑化、ARIMA、観測不能成分モデル、間欠需要モデルを含む高度な予測手法を使用した自動モデリングにより、ビジネスゴールを達成するためには何をすべきかを導き出すことを可能とします。また、クラスタリング機能、一般線形モデル、一般化線形モデル、ロジスティック回帰モデル、レコメンデーション機能など既存のアナリティクス機能が強化されています。
SASは、今後も継続してHadoopエコシステムに研究開発の投資を行い、Hadoop対応のアナリティクス製品のポートフォリオを拡充し、顧客のフィードバックのもと機能を向上する計画です。
Hadoopが選ばれる理由
米国調査会社IDCは、Hadoopの2016年の売上は8億1,280万ドル、年平均成長率(CAGR)を60.2%と予想しています。SASでは、企業や公共団体がビッグデータからの深い洞察を得るために、Hadoop上でビッグデータ・アナリティクスを継続的に導入すると予想しています。
SASのチーフ・データ・サイエンティストであるウェイン・トンプソン(Wayne Thompson)は、「膨大な価値を持つデータを蓄積している企業にとって、Hadoopは極めて大きなメリットをもたらします。SASは、この前途有望なビッグデータ・アーキテクチャを導入するお客様に対し、業界最高のアナリティクス技術をお届けできるよう取り組んでいます。SASは、ビッグデータが一種の流行語となる前から、ビッグデータを抱えるお客様を支援してきました。そして、テクノロジーが進化する中、お客様のご期待にお応えできるような形で、ニーズの変化に対応しています」と述べています。
SASは、Cloudera社やHortonworks社との戦略的提携により、顧客の選択したHadoopディストリビューション内で業界最高のアナリティクスを提供しています。
Hadoopは、コモディティ・サーバーの大規模クラスターにデータを拡散し、並列処理します。また、分散処理に欠かせない要素である、障害の検知・対応も行います。低コストの分散ハードウェアと、データの冗長性のセーフティ・ネット以外にも、Hadoopには、以下のようなメリットがあります。
・並列処理:Hadoopの分散コンピューティング・モデルによって、大量のデータを処理できます。
・拡張性:Hadoopシステムは、ノードを追加することで容易に拡張できます。
・ストレージの柔軟性:従来型のリレーショナル・データベースとは異なり、データを保存するための前処理が不要で、Hadoopは、非構造化データを容易に保存します。
<SAS Institute Inc.について>
SASは、ビジネス・アナリティクス・ソフトウェアとサービスのリーディング・カンパニーであり、ビジネス・インテリジェンス市場においても最大の独立系ベンダーです。SASは、革新的なソリューションを通じて、70,000以上の顧客サイトに、パフォーマンスを向上し、より正確で迅速な意思決定を行う支援をしています。1976年の設立以来、「The Power to Know(R)(知る力)」を世界各地の顧客に提供し続けています。本社:米国ノースカロライナ州キャリー、社員数:Worldwide約1万3千名、日本法人約250名(
http://www.sas.com/)
*SASとその他の製品は米国とその他の国における米国SAS Institute Inc.の商標または登録商標です。その他の会社名ならびに製品名は、各社の商標または登録商標です。