3. 統計的手法による形態素解析 表記 品詞 にわ 一般名詞 に 助詞 わに 一般名詞 にわとり 一般名詞 が 助詞 い 上一段動詞 る 活用語尾:終止 。 句点 区切って、品詞を選ぶ 系列ラベリング問題 隣接する要素の情報を利用 (n-gram) 必要なリソース • 辞書 • 教師データ(学習コーパス) (ほかのやり方もあります) 3
3. 統計的手法による形態素解析 表記 品詞 にわ 一般名詞 に 助詞 わに 一般名詞 にわとり 一般名詞 が 助詞 い 上一段動詞 る 活用語尾:終止 。 句点 区切って、品詞を選ぶ 系列ラベリング問題 隣接する要素の情報を利用 (n-gram) 必要なリソース • 辞書 • 教師データ(学習コーパス) (ほかのやり方もあります) 3
なんだか超局地的にATOKブームがきてるっぽいのでちょっと書いてみるか。 ATOK入れたらそれだけ超快適になるかっていうとそうではなくて、確かに変換エンジンとか辞書とかも良いんだけど設定いじるともっと快適になるのでみんな設定画面をちゃんといじりましょう(ATOKのバーが右下に出てる人は、その上で右クリック→プロパティで開ける)。 話し言葉モード 基本→変換→表現 が「一般」になっていたら「話し言葉」にしましょう。 これでくだけた表現を変換しようとして誤変換することがかなり減ります。PCを仕事に使わない人はほぼこのモード固定で問題ないはず。 推測変換 省入力・入力補助→推測変換を有効にする をONにして、頻度を高にしましょう。 推測変換自体はONな人が多いと思うけど頻度が「高」の人は少なそう。そもそもPC版ATOKでの推測変換とは、日本語入力途中にツールチップで推測候補が出て、Shift+E
Perl 、Python を用いてプラグインを作成するには スクリプトファイル( Perl または Python で作成。UTF-8 で記述すること。) プラグインの名前などを記述する、XML 形式の情報ファイル を用意する必要があります。 ATOK ダイレクトで検索を実行した場合、入力中の文字列をプラグインで受け取ることができます。 スクリプトプラグインでは、入力中の文字列に対応する候補情報(候補表記、コメント、ツールチップ候補とその種類)を生成し、出力することができます。 Perlで記述したプラグインを作成する場合、そのスクリプトファイルに記述しなければならない情報は、以下の通りです。 ソース記述例 ################################################# # # Perlモジュール用のプラグインインターフェイス # # ※このテキストは必ずU
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く