大規模な表構造データ(CSVデータ)を効率よく処理する目的で開発されたオープンソースのコマンド群である。一般のPCでも数千万件〜数億件のCSVデータを処理できる。
M-Command is a set of open source commands developed to process large scale data structures (CSV data) efficiently. The commands can process more than 10 million records of CSV data on a regular PC.
SOFTWARE
頻出パターンマイニングに関する各種コマンドを提供する。頻出アイテム集合、系列パターンについて、emerginパターンやtaxonomyを加味したパターン列挙が可能。コアアルゴリズムとしてLCMやVSOPを利用している。
Includes a variety of commands for frequent pattern mining. Features such as emerging pattern and taxonomy are added for the enumeration of frequent item sets and sequential patterns. LCM and VSOP is used as the core algorithm.
SOFTWARE
本パッケージは、ZDD(Zero-suppressed Binary Decision Diagrams: ゼロサプレス型二分決定グラフ)を利用し、 重み付きのアイテムの組み合わせ集合をコンパクトに格納することを可能とするVSOP (Valued-Sum-Of-Products calculator)をruby拡張ライブラリとして実装したものである。
This package uses ZDD(Zero-suppressed Binary Decision Diagrams: BDD Zero-suppressed graph), weighted item sets can be stored in a compact structure with VSOP (Valued-Sum-Of-Products calculator), implemented as Ruby extension library.
SOFTWARE
データマイニングや機械学習の手法を提供するパッケージで、大学の研究室で開発されたツールや統計パッケージRと連動したコマンドなどを提供する。
The Mining Command extends the functionality to implement experimental analysis technique in a relatively small scale.
SOFTWARE
視覚化のコマンドを集めたパッケージで、GraphVizやGephiで描画可能なグラフデータを構築したり、D3で描画可能な各種チャートを簡単に生成できるようにしたコマンドなどが含まれる。
A collection of visualization commands which allow users to build graph based data in GraphViz and Gephi. It is also possible to generate various charts with D3.
SOFTWARE
テキストマイニング関連のコマンドを集めたパッケージで、jumanやknpを用いた日本語文の形態素解析や構文解析に始まり、格フレームの抽出や辞書登録などを用意に実現できるようにしたパッケージである。
The package contains a collection of text mining-related commands which carries out parsing and morphological analysis of Japanese sentences with knp and Juman, and the command is capable of extracting from case frame and registering in the dictionary.fumi
SOFTWARE
pythonでmcmdを利用するライブラリ
NYSOLをPython上で利用できるように改良したものが nysol_python ライブラリである。 現在のところ、nysol_pythonには、 データの前処理に威力を発揮するmcmdモジュールとアイテム集合マイニングに関する多様なツールを提供するTakeモジュールが含まれている。
SOFTWARE
Ruby上で大規模なCSVデータを扱うためのRuby拡張ライブラリ。シーケンシャルな読み込み/ 書き込み関数、 そしてセル単位でのランダムアクセス関数などがある。いずれの関数もCSVの標準仕様であるRFC4180に概ね準拠しており カンマや改行を含む文字列も扱うことができる。
Ruby extension library is developed to process large-scale CSV data on Ruby. It includes sequential read (Mcsvin) and write (Mcsvout) functions, as well as random access to each cell within the CSV data table (Mtable). These functions treats newline and comma in strings according to the standard specification of CSV data compliant to RCF 4180.
SOFTWARE
KIZUNAはTAKEで開発されたパターンマイニング手法を利用して、相関ルールの可視化を行うアプリケーションである。可視化のためにFriendと呼ばれる膨大な相関ルールからノード間の関係性をうまく俯瞰できる指標を利用している。またWebbleを利用したユーザインターフェイスでKIZUNAの各種デモサイトが実行できます。
デモサイト (ID,Pass共にguest)
KIZUNAデモサイト
APP / TUTORIAL / DATA
JR大都市近郊区間内の経路を対象に、指定条件にあわせて全パスを高速列挙するアプリケーションである。パス列挙にはJST ERATO 湊離散構造処理系プロジェクトで開発された Graphillion を使っている。また新たにロンドンの路線を追加しました。
Ekillion is a web application that efficiently enumerates all JR train paths in Japan metropolitan and suburbs from startpoint to endpoint.The efficient enumeration of all paths is powered by the software Graphillion (Developed by JST ERATO Minato Discrete Structure Manipulation Project) which uses advanced algorithms to enumerate huge number of graphset.
APP / TUTORIAL / DATA
mbonsaiはオープンソースの決定木ソフトウェアで、コマンドラインにより実行できる。特徴は、説明変数の1つに文字列変数が利用でき、目的変数の分類に特徴的な文字列パターンを伴う決定木を構築することができることである。
mbonsai is an open sourced decision tree software. It lightweight and powerful which can be executable at command line. This version is a standalone release,
APP / TUTORIAL / DATA
NYSOLパッケージのチュートリアル、Q&A、様々な応用スクリプトを公開していくことで、NYSOLの学習支援を行うことを目的としたサブプロジェクトである。
This sub-project includes publication of NYSOL package tutorial, Q&A, and various application scripts to extend learning support of NYSOL tools.
APP / TUTORIAL / DATA
ファイナンスに関する以下の研究成果を公開している。
・株式市場における市場心理をニュース記事から測定する試み。
・取引コストやマーケットインパクトコストなどを考慮した株取引のシミュレーションプログラム。
M-Command is a set of open source commands developed to process large scale data structures (CSV data) efficiently. The commands can process more than 10 million records of CSV data on a regular PC.
APP / TUTORIAL / DATA
準備中 / Under construction
APP / TUTORIAL / DATA
準備中 / Under construction
APP / TUTORIAL / DATA