Unicodeエスケープのサロゲート対応版
2008年1月28日(月曜日)
Unicodeエスケープのサロゲート対応版
先日のコードはサロゲートペアに対応していなかったので、こんな感じに修正。
def js_unicode_escape(text)
text.kconv(Kconv::UTF16, Kconv::UTF8).unpack("H*")[0].gsub(/.{4}/, '\\\\u\&')
end
参考にしたコードは「速くする」というテーマだったので正規表現置換になっていたのだと思いますが、速度にこだわらなければ、Kconv の方が楽で読みやすい感じではあります。
- 「Unicodeエスケープのサロゲート対応版」へのコメント (2件)
関連する話題: プログラミング / Ruby / JavaScript
- 前(古い): Ruby の正規表現の落とし穴
- 次(新しい): Unicodeエスケープのサロゲート対応版 (続き)