昨今よく耳にするキーワード「ソーシャルグラフ」。その可能性・活用方法について様々な企業に注目されています。今回はその「ソーシャルグラフ」を「どうすればクラスタリングできるのか?」という観点で、グラフに対するクラスタリングの基礎を説明いたします。また、具体的なクラスタリング手法として Newman アルゴリズムをご紹介いたします。Read less
球面クラスタリング (spherical clustering)† ユークリッド距離ではなく,事例間の角度(コサイン)で類似度を測る場合に使う (分類する対象が比率尺度の特徴で記述されているような,文書ベクトルの分類などの場合). 次元の呪いを本質的に回避できる理論的根拠はないが,実験的には高次元でも比較的よい結果が得られるとされている. 文献1は球面クラスタリングの初期の論文.k-means法のように,中心の計算と再割当を交互に行い,次の目的関数を最小化する球面k-means法 (spherical k-means; spkmeans). \[\mathcal{Q}\Bigl(\{\pi_j\}_{j=1}^k\Bigr)=\sum_{j=1}^k \sum_{\mathbf{x}\in\pi_j}\mathbf{x}^\top\mathbf{c}_j\] ただし,\(\pi_j\)はク
用語クラスタリングの概要 単語クラスタリングとは、単語群を機械的かつ事前の学習によらず分類する処理のことです。 目的は単語の分類ですが、この分類には大きく次の2種類があります。単語クラスタリングは、 後者を用いた単語の分類手法になります。 あらかじめ人手による分類がなされたサンプルでデータを学習させておき、その学習により 作成したルールをもちいいて、新規のデータを分類する方法 学習によらず分類を行う手法。あらかじめ分類基準がはっきりしていない場合に有効。 専門用語クラスタリングは造語で、処理対象を単語から専門用語にしたものです。基本的に、 単語クラスタリングの定番の手法をなぞっています。ここでは、単語クラスタリングの手法に ついて初心者向けに解説します。 単語のクラスタリングは、おおまかに次の3つステップにより実現できます。 ドキュメントから用語群を抽出 抽出した用語同士の関連性を示す行
III. 文書クラスタリングの技法 A. 単一パスアルゴリズム 1. k-means 法の適用 2. Willett のアルゴリズム 3. 平均クラスタリング・アルゴリズム
時系列文書のクラスタリングに基づくトレンド可視化システムの開発 長谷川 幹根 † 石川 佳治 †† † 名古屋大学 工学部 電気・電子情報工学科 情報工学コース †† 名古屋大学 情報連携基盤センター 1 まえがき インターネット上の情報提供・配信サービスの進展 により,今日では,ネットワークを介したニュース配 信などが盛んに行われている.それに伴い,大量の情 報を要約しフィルタリングするための,オンラインテ キスト情報処理の重要性がさらに増してきている [1]. 大量のテキスト情報を内容に基づきグループ化する手 法として文書クラスタリング手法が存在するが,時々 刻々と配信される時系列的な文書データに適したクラ スタリング手法についての情報の要約と提示に関する 研究に関しては,新たな技術の開発が求められている. 本稿では,文書クラスタリングシステム上に構築を 行っている,トピックの推移を
嵯峨山 茂樹: 応用音響学 D2-Clustering edu/appl-acoust/2003/D2-Clustering.tex / 1 東京大学 工学部 計数工学科 応用音響学 D2 - クラスタリング 嵯峨山 茂樹 <sagayama@hil.t.u-tokyo.ac.jp> 東京大学 工学部 計数工学科 資料所在 http://hil.t.u-tokyo.ac.jp/∼sagayama/applied acoustics/ クラスタリング k-means アルゴリズム ベクトル量子化 LBG アルゴリズム セグメンタル k-means アルゴリズム 嵯峨山 茂樹: 応用音響学 D2-Clustering edu/appl-acoust/2003/D2-Clustering.tex / 2 クラスタリング1 内容 1. クラスタリング 2. k-meansアルゴリズム、LBGアル
Fairness-Aware Data Mining I am currently working on this research topic. The goal of fairness-aware data mining is to analyze data while taking into account potential issues of fairness, discrimination, neutrality, and/or independence. Studies related to fairness-aware data mining are summarized in the page: Fairness-Aware Data Mining Learning for Rankings / Orders The term order as a sequence of
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く