scouty の高濱です。本記事では、日本人の名前の構造化のために、自然言語処理における古典的な手法である有限状態トランスデューサ (Finite-State Transducer; FST) を用いた例を紹介します。本記事で紹介するライブラリの実装や本記事のドラフトは、scouty インターンの Derick によって作成されました。 Derick による本記事の英語版も同時に公開されていますので、そちらもご参照ください。 はじめに 背景 scouty は「世の中のミスマッチをなくす」というミッションのもと、インターネット上のオープンデータを解析して人に関するデータベースを構築し、エンジニアと企業の最適なマッチングを提案するサービスを提供しています。 scouty では、scouty サービスを利用する企業が候補者に対してコンタクトをとる方法としてスカウトメールの送信機能を用意しています