[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

タグ

MeCabに関するma_koのブックマーク (6)

  • Macでも”ゆっくり”できる、SayKana

    今回紹介する「SayKana」は、わかばマークのMacの備忘録さんのエントリ「SayKana」を読んで知りました。で、実際に試してみたら、面白いですね! SayKanaは、日音声合成ソフトウェアです。インストールすると、Macでも「かな(*1)」をしゃべれるようになります。Macの「say」コマンドの日語版に相当するもの、言えば分かり易いでしょうか? 例えば、こんな感じで使う事できます。 saykana -s 90 "ゆっくりしていってね"どこかで聞いた事があるような気がしますね。 SayKanaを少し使ってみて、特に賢いな〜と感心したのは、数字の扱いです。例えば... saykana "でんわば'んごーわ、<NUM VAL=01-2345-6789>です。" saykana "すみませ'ん、<NUMK VAL=10 COUNTER=ふん>+おくれま'す。 "を実行すると、上のコマン

    ma_ko
    ma_ko 2009/11/18
    echo "愛してる" | mecab -O yomi | SayKana、みたいな。アクセントとかも付けれるようだ (sayKana)。
  • 日本テレビ東京で学ぶMeCabのコスト計算 | mwSoft

    今回はこの言葉の解析をMeCab+NAIST辞書にお願いして、結果を分析することで、MeCabが行っているコスト計算について勉強してみたいと思います。 とりあえず実行してみる さっそくMeCabに「日テレビ東京」を解析してもらいましょう。 $ echo 日テレビ東京 | mecab 日 名詞,固有名詞,地域,国,*,*,日,ニッポン,ニッポン,, テレビ東京 名詞,固有名詞,組織,*,*,*,テレビ東京,テレビトウキョウ,テレビトーキョー,, EOS 「日 | テレビ東京」と分けていますね。視聴率的には負けていますが、NAIST辞書的には日テレビよりもテレビ東京が優先されたようです。 ちなみに「フジテレビ東京」ではどうなるでしょうか。 $ echo フジテレビ東京 | mecab フジテレビ 名詞,固有名詞,組織,*,*,*,フジテレビ,フジテレビ,フジテレビ,, 東京 名詞,

    ma_ko
    ma_ko 2009/10/28
  • MeCabのコマンドライン引数一覧とその実行例 | mwSoft

    -r --rcfile 使用するリソースファイルを指定する リソースファイルとは、辞書ディレクトリに入っている「dicrc」ファイルを指します。 試しにシステム辞書の「dicrc」ファイルをコピーして、「dicrc2」というファイルを作り、その中の「; simple」の「EOS」を「eos」に書き換えます。するとこんな風になります。 // リソースを指定せずに実行 $ echo テスト | mecab -O simple テスト 名詞-サ変接続 EOS // リソースを改変したdic2に指定して実行 $ echo テスト | mecab -r dicrc2 -O simple -d /usr/local/lib/mecab/dic/naist-jdic テスト 名詞-サ変接続 eos 我が家の環境では、システム辞書ディレクトリをカレントディレクトリとした状態にするか、「-d」でシステム辞書

    ma_ko
    ma_ko 2009/10/28
  • 株式会社Yostar

    最新情報 プレスリリース2019.08.01 『アズールレーン』が第3回全国エンタメまつり「ぜんため」に初出展いたします プレスリリース2019.07.12 『コミックマーケット96』企業ブースに出展決定! プレスリリース2019.04.25 対戦型麻雀ゲーム『雀魂』WEB版のサービスを開始いたしました MORE

    ma_ko
    ma_ko 2009/08/30
    naist-jdic以外にも、はてなキーワード、Wikipedia日本語タイトルをいれてる
  • マルコフ連鎖で日本語をもっともらしく要約する - ザリガニが見ていた...。

    そもそも、マルコフ連鎖とは何なのか?全く聞いたこともなかった。そして、文章を要約するのはとっても高度なことだと思っていて、自分のレベルではその方法を、今まで思い付きもしなかった。 しかし、以下のようなシンプルなRubyコードでそれが出来てしまうと知った時、目から鱗である...。一体、何がどうなっているのだ?コードを追いながら、マルコフ連鎖を利用するという発想の素晴らしさを知った! 作業環境 MacBook OSX 10.5.7 ruby 1.8.6 (2008-08-11 patchlevel 287) [universal-darwin9.0] mecab utf8環境でインストール済み マルコフ連鎖に出逢う rssを流し読みしていると、以下の日記に目が止まった。(素晴らしい情報に感謝です!) MeCabを使ってマルコフ連鎖 一体何が出来るコードなのか、日記を読んだだけではピンと来なかっ

    マルコフ連鎖で日本語をもっともらしく要約する - ザリガニが見ていた...。
  • Mechanize, Hpricot, MeCab でブログの頻出単語を調べる

    require 'MeCab' require 'rss' require 'mechanize' require 'kconv' require 'hpricot' require 'open-uri' module MeCab class Node def category return self.feature.split(/,/)[0] end def each(&b) b[self] self.next.each(&b) if self.next end end end agent = WWW::Mechanize.new page = agent.get('http://d.hatena.ne.jp/akio0911/archive') # ページを開く m = MeCab::Tagger.new h={} # エントリへのリンクを抽出 page.links_with(:hre

  • 1