米IBMは8月8日(米国時間)、文書や他のコンテンツ内のテキストを分析して潜在的な意味や事実の関連性を見つけ出す技術「Unstructured Information Management Architecture(UIMA)」をオープンソース化する計画を発表した。年内にオープンソースプロジェクトの管理サイト、SourceForgeでUIMAのソースコードを開示する。 UIMAは、IBMの研究所と米国防省の国防高等研究事業局(DARPA)が4年前から共同で研究・開発を進めてきた技術。プロジェクトでは、文書、画像、コメントやノート、電子メール、リッチメディアなど、非構造化データに含まれるテキストを分析して、潜在する意味や関係、事実を理解することを目指している。 米Googleや米Yahooなどの技術はキーワード検索技術だが、企業内データの多くは非構造化データであり、そうしたデータを文脈に応じ