運営元のロゴ Copyright © 2007-2024 All Rights Reserved by Gijutsu-Hyoron Co., Ltd. ページ内容の全部あるいは一部を無断で利用することを禁止します。個別にライセンスが設定されている記事等はそのライセンスに従います。
2006年10月04日 Javascriptで形態素解析 MeCabなどの形態素解析器を使わず、正規表現とあらかじめテーブル化した助詞だけで品詞分解するJavascriptプログラムを発見。 ■[JavaScript]ボキャブラリ解析ツールに解説されているボキャブラリ解析ツール 形態素解析もどきを改良してみたと形態素解析もどきで単語の頻出度を調べる JavaScriptとブックマークレットで形態素解析もどきは、同じ作者による一連のツール。 特徴語の抽出でなく、普通に頻度情報からタグクラウドを作るのなら、Javascriptも軽快で良いかも。 ・・・で善は急げと言うことで、早速やってみた。 動作するサンプルはココ 実際にMeCabとLingua-JA-Summerize-0.06とボキャブラリ解析ツールの出力を比較してみると、 MeCab: 複合語、英単語に弱い(英語の辞書が
JavaScriptでインデックス型の全文検索エンジンを作ってみた。全文検索エンジンを作る際に問題となるのは、インデックスデータを部分的に読み込む方法である。通常はmmapやpreadなどを使ってファイルの一部を部分的に読み込むのだが、もちろん、ブラウザには使えない。ブラウザでファイルの一部分を読み込むには2通りの方法がある。1つは、ファイルを多数のファイルに分割する方法であり、もう1つはHTTPリクエストのRangeヘッダを利用して、ファイルの一部を取得する方法である。前者の利点は、ブラウザのキャッシュが効くことや、対応ブラウザが多いことである。後者の利点は、ファイル数が少なくなるので、インデックスの管理が容易になることである。今回はRangeヘッダの実用性にも興味があったので、後者の方法を用いた。 参考ページ:最速インターフェース研究会 :: Ajaxを使ったシンプルなチャット 転置イ
What's Namazu Namazu is a full-text search engine intended for easy use. Not only does it work as a small or medium scale Web search engine, but also as a personal search system for email or other files. (The Japanese word `Namazu' means `catfish' in English.) Table of contents News Features License Download Stable source code deb packages for Debian GNU/Linux Windows edition Search Tutorial Manua
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く