〔2012/6/7〕日本IBM、ソーシャル・メディアの書き込み数億件を一括分析できる非構造化データ分析ソフトを発表

 日本IBMは、非構造化データであるテキスト・データを分析するソフトウェア製品において、Hadoopとの連携が可能になったことで、従来比約10倍、ソーシャル・メディアの書き込み数億件分を一括で分析できる「IBM Content Analytics with Enterprise Search V3.0(以下 ICA V3.0)」を発表した。本製品は、分析データ容量の拡大だけでなく、検索機能と統合したことで、文脈に応じた検索結果の絞込みや、検索結果の時系列分析、相関分析など、高度な検索機能が実現した。
 IBMが世界1700人以上のCEOを対象とした調査「IBM Global CEO Study 2012」では、今後3~5年の間にCEOが顧客接点として重視する手段の第1位は現在同様に対面形式であったが、第2位はFacebookやTwitterをはじめとするソーシャル・メディアとなり、現在2番目に重視されているWebサイトを上回る結果となった。この結果から、ソーシャル・メディア上の非構造化データを分析することは、顧客行動や市場動向などを把握する上でさらに重要になっていく。IT専門調査会社 IDC Japanの調査でも、2010年から2015年まで年間平均成長率(CAGR)4.1%で成長する国内ビジネス・アナリティクス・ソフトウェア市場において最も成長率が高いのは、非構造化データを分析する「コンテンツ分析ツール」で、CAGRは27.2%と予測している。
 また、昨今のソーシャル・メディア上のデータは急激に増加している。分析ソフトウェアには大量データを処理する能力が必要となり、また、短期間のデータより長期間のデータを活用することで、より信頼性の高い分析結果が得られる。
 今回発表したICA V3.0は、IBMのHadoopソフトウェアである「IBM InfoSphere BigInsights」との連携により、ソーシャル・メディア上の書き込みでは、数億件に上る大量データを一括で分析できる。2011年10月の調査では、Twitter の言語別つぶやき件数の第2位が日本語で、1日当たりの日本語によるつぶやきは約2600万件と報告されている。ICA V3.0は、数億件規模に達する、1~2週間分の日本語による全つぶやきを1度に分析できる。
 さらに、IBMの検索ソフトウェアである「IBM OmniFind」を統合し、高度な検索機能も実現した。新機能により、例えば、企業内の膨大かつ分散した技術情報を検索する際、従来では必要情報を探すのに時間がかかっていたが、新バージョンでは、単語レベルの検索でなく、文章の意味を踏まえた検索結果の絞込みや、検索結果の時系列分析、相関分析などが検索画面に表示されることで、必要な情報により速く辿り着ける。
 さらに、新バージョンでは、従来の11言語に加えて、ロシア語、チェコ語、ヘブライ語、ポーランド語の4言語に対応したことで、計15言語、世界の総人口の約70%の言語に対応する。これにより、製品やサービスの提供に必要な市場調査や競合調査などがより広い範囲で可能となり、日本企業の海外進出を支援する。
 ICAのソフトウェア料金は、801万円 (100 Processor Value Unit)~で、日本IBMおよび日本IBMのビジネス・パートナーから販売。


PAGE TOP