しばらく前にCEAS 2005の論文概要を二つ紹介しましたが、ようやくそのうちの一方を真面目に読み終えました。隠れマルコフも堂々マルコフも存じあげなかったのですが、基本的なコンセプトは簡単なようです。 H. Lee and A. Ng, "Spam Deobfuscation using a Hidden Markov Model" (2月1日: 論文の後半の解説、及び考察の追加) この研究の目標 スパムメッセージによく現れる難読化された言葉を正しい表記に戻すことが目標です。この問題に面白おかしく取り組んでいるViagraには600,426,974,379,824,381,952のスペルがあるがあります。 インターネットでマーケティングをしている連中はご親切にも薬とかアルファベットを教えることに熱心なものだから、本来は"Viagra"という言葉を熱くて、新しい、ユニークなスペルで寄越しやが