<BODY> <P>このページは、フレーム機能をサポートするブラウザで表示するようデザインされています。このテキストは、フレーム機能をサポートしないブラウザで表示されます。 </P> </BODY>
<BODY> <P>このページは、フレーム機能をサポートするブラウザで表示するようデザインされています。このテキストは、フレーム機能をサポートしないブラウザで表示されます。 </P> </BODY>
TIS、自然言語処理で企業名認識を行うための辞書「JCLdic」を無償公開企業名のカバレッジ範囲が高い辞書で、自然言語処理など多様なシーンでの活用を目指す TISインテックグループのTIS株式会社(本社:東京都新宿区、代表取締役会長兼社長:桑野 徹、以下:TIS)は、自然言語処理で企業名認識を行うための辞書「JCLdic」(日本会社名辞書)を無償公開し、辞書を生成するコードをオープンソースソフトウェア(OSS)として公開することを発表します。 ・「JCLdic」公開ページ:https://github.com/chakki-works/Japanese-Company-Lexicon (利用は上記のページからダウンロード) 「JCLdic」は800万以上の企業名を収録している企業名辞書です。国税庁が公開している法人情報(2019年12月27日まで)の商号に対して、別名生成手法を適用してTI
「かつおたたき」、「りんごジュース」、「ロース肉薄切り」を MeCab + IPA 辞書で形態素解析すると以下のようになります。 % mecab かつおたたき かつ 接続詞,*,*,*,*,*,かつ,カツ,カツ お 接頭詞,名詞接続,*,*,*,*,お,オ,オ たたき 名詞,一般,*,*,*,*,たたき,タタキ,タタキ EOS りんごジュース りん 副詞,助詞類接続,*,*,*,*,りん,リン,リン ご 接頭詞,名詞接続,*,*,*,*,ご,ゴ,ゴ ジュース 名詞,一般,*,*,*,*,ジュース,ジュース,ジュース EOS ロース肉薄切り ロース 名詞,一般,*,*,*,*,ロース,ロース,ロース 肉薄 名詞,サ変接続,*,*,*,*,肉薄,ニクハク,ニクハク 切り 名詞,接尾,一般,*,*,*,切り,ギリ,ギリ EOS 日本人の感覚とはだいぶずれた結果になってしまっていますね!人間であれ
突然ですが,mecabの辞書 (mecab-ipadic) をデフォルトのまま使って,mecab意外と使えねぇとか文句言ってる悪い子はおらんかね? mecab-ipadic は比較的お行儀のよい日本語をベースに作られているので,そのままでは web上の口語文体のテキストはうまく扱えないことがあります。本来は教師データを用意し,学習させるといった手法を使うのが正攻法だと思いますが,とりあえず名詞を充実させるだけでも実用度はだいぶ上がるでしょう。 人間の話す言語には,動詞の語幹や名詞には日々新しく語彙が増えるけど,助詞や活用のルールは簡単には変化しない,という特性があります。特に「いま最もつぶやかれている単語ランキング」といった集計をするような場合は,名詞の範囲の切り出しさえ間違えなければそれなりの結果を出せることも多いのです。 ただ,辞書への単語追加はここにある通り簡単にできるのですが,単語
MeCab 用の新語辞書 mecab-ipadic-neologd を公開しました Tweet [NLP] 日本語の文書を機械的に処理しようと思った時に、ほとんどの人が MeCabとIPADIC(IPA辞書)の両方、または、どちらかを使うことになります。 IPADICはとてもよく出来ていますが、更新されないまま年月が過ぎているので、例えば2015年3月上旬に急に流行ったような言葉は収録していません。そのため、今日生まれたような新しい文書(例、Apple Watch発売)を解析する時に困ります。困らない人もいますけど、僕は困ります。 その課題に対処するために、日本全国津々浦々、自然言語処理に関わる全ての人は独自にMeCabの新語辞書を作って対応しているわけです。その際に元データとして使われることが多いのは Wikipedia 日本語版やはてなキーワードなどです。 困ったことに、新語辞書を生成
ここでスタンリー・キューブリック監督「時計仕掛けのオレンジ」の変な言葉「ナッドサッド言葉」の翻訳を公開!これでアナタも時計仕掛け!! ※ここに表記されてるナッドサット言葉翻訳は、英語版小説についてた英訳をinfoseekで和訳したモノと、小説での30年前の翻訳家がその時代の解釈とセンスと誤解で和訳したモノと、訳もついてない映画でのニュアンスをくみ取ったモノが適当におりまざったもんに管理人の意訳を込めてお送りしています 露・・・ロシア語 独・・・ドイツ語 仏・・・フランス語 英・・・英語スラング オリ・・・原作者オリジナル 学・・・向こうの学生が使うようなナメた言葉 色の薄い文字・・・どこにも載ってなかったんで勝手に読みをつけた。 カタカナ小説英訳日本語訳語源
《内容》 教団拡大のために凶悪な犯罪もいとわない《鬼神真教》の教祖・サヤ婆(鬼塚サヤ)の孫として生まれた鬼塚宏樹(主人公=私)は鬼塚一族の残酷な行為を嫌って一族の家から逃亡し、裏切り者として追われる身になる。その恐怖から彼は各地を転々として暮らすしかない。やがて彼は大都市のK市である女に出会い、一時的に幸福な暮らしを手に入れる。だが、そんなある日、大都市の町中でサヤ婆を狂信する磯崎夫妻の姿を見つける。そのときから、彼の恐怖の一日が始まる。恐るべき鬼塚一族の人々が次々と彼の行く手に出現する。…、そして、彼の逃亡がまた始まる。はたして、彼は逃げ切れるのか。鬼塚一族の魔の手を逃れ、自由な暮らしを手に入れられるのか。 ◆隊長挨拶 ◆モンスターランド全景 空 |空のモンスターについて| |リュウ|ペガサス|ヌエ|サンダーバード|イツマデ|ハルピュイアイ|バ| 海上 |海上のモンスターについて| |ス
自由診療クリニック向けのオールインワンSaaS「medicalforce」、警備事業者向けオールインワンSaaS「警備フォース」を提供する株式会社メディカルフォース。フルスクラッチでの開発を実現させるスクラムの構築をまとめました Developer eXperience Day 2024 株式会社メディカルフォース CTO 畠中 翔一(@punk_punx)登壇スライド
3D-CT深海生物 ホーム, グリグリできる!? 3D-CT 深海生物 君がグリグリしたいのはどれだ?
日本文化いろは事典が小中学生向けに再編され「日本の伝統文化・芸能事典」(汐文社)として出版されました! 2006年2月22日より書店にて販売中! 全国の「学校図書館」および「日本の伝統文化関連」の団体等への設置は、2006年の4月移行の予定。 お求めはこちらから→「日本の伝統文化・芸能事典」 [書籍]3月20日刊行の「上げスイッチ↑ 5分であなたを全開にする!」(岸紅子 著、ソーテック社)で当サイトが紹介されます。 2008年02月20日 [雑誌]「すてきな奥さん」4月号(2008年3月2日発売)にて、当サイトが紹介されます。 2008年02月07日 [出版]いろは事典が本になりました! 2006年03月03日 [ほか]いろはメルマガがナショナル MY Nタウンにて配信中! 2006年03月02日 [ほか]コンテンツ増加に伴い、サイトデザインをちょっとリニューアルしました。 2005年01
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く