[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

タグ

unicodeに関するrnaのブックマーク (27)

  • pͪoͣnͬpͣoͥnͭpͣa͡inͥを支える技術 - Qiita

    pͪoͣnͬpͣoͥnͭpͣa͡inͥの作り方 ぽんぽんぺいんを簡単に作るサイトを作ったのでよかったら使ってみてください。 【ここをクリック】 ponponpain(haraita-i)とは 画像でいうとこんなやつのこと。 今回参考にさせていただきましたが、以下のサイトによくまとまっていると思います。 不思議な文字 pͪoͣnͬpͣoͥnͭpͣa͡inͥ | bison's brain at postachio ぽんぽんぺいん ‐ 通信用語の基礎知識 まあ要するに、不思議な上付き文字を組み合わせて、文字に副題(ルビ)をふろうって感じの遊びのことで、昔流行ったみたいです。 今回はクリックだけで上付き文字を加えられるサイトを作ったのでぜひみんなに遊んでほしいなと思っています。 投稿について UbuntuのChromeだと綺麗に表示されないのですが、Twitterだといい感じになるみたいです。

    pͪoͣnͬpͣoͥnͭpͣa͡inͥを支える技術 - Qiita
  • FAQ - Emoji Submission

    rna
    rna 2019/04/10
    “Can anyone submit a proposal for an emoji? A: The consortium has developed a submission process that is is open to anyone, from individuals to non-profits to companies to governments.” 誰でもUnicodeコンソーシアムに絵文字を提案できるらしい。
  • Unicodeの大文字と小文字のまとめ | hydroculのメモ

    Unicodeの大文字と小文字のまとめ 2014/11/09 Unicodeには、大文字小文字を変換するためのルールがUnicodeの仕様として定められている。 下の表は、それを一覧にしたもので、一番左の列が元の文字で 2列目から4列目は小文字・タイトル文字・大文字に変換したときの文字を示している。 英語で使われるアルファベット26文字しか考えないとルールは非常にシンプルでいいのだが、多言語対応しようと思うと、以下の表に基づく必要がある。 中にはドイツ語の”ß“のように2文字以上に変換されるものもある。 「タイトル文字」(Title case letter)というのは、1文字目を大文字・2文字目以降を小文字にしたときに使われる文字である。26文字しか考える必要がない場合は、このタイトル文字という概念も不要で、単にそのまま1文字目を大文字にして、2文字目以降を小文字にすればよい。しかし、Un

  • utf8_unicode_ci に対する日本の開発者の見解 - かみぽわーる

    RailsMySQLのcollationをサーバー側のデフォルトのutf8_general_ciからutf8_unicode_ciにわざわざ変えてるのどうせ大した理由じゃないだろと思って掘ってみたらやっぱり大した理由じゃなかった… https://t.co/6NeetGhTF0— Ryuta Kamizono (@kamipo) April 18, 2014 Railsでcollationとしてutf8_unicode_ci(RailsのDEFAULT_COLLATION)が採用されるのはcharsetが未指定もしくはutf8(RailsのDEFAULT_CHARSET)のときだけで、utf8mb4にすることとかは全く考慮されてない。— Ryuta Kamizono (@kamipo) April 19, 2014 @frsyuki MySQLのcharset utf8のときのデフォルト

    utf8_unicode_ci に対する日本の開発者の見解 - かみぽわーる
    rna
    rna 2015/03/08
    「utf8_unicode_ciでは'ハ'と'パ'は等価と扱われるので'ハハ'も検索に引っかかります。" "SELECT * FROM families WHERE relationship = 'パパ';」
  • Swiftでの文字列比較におけるUnicode正規化を巡る注意点 - Qiita

    これは,こちらのサイトによると, Depending on your requirements, this may or may not be what you want, but it is certainly consistent with the overall design of the String type to abstract away as many Unicode details as possible. Rule of thumb: if two strings look equal to the user, they will be equal in your code. つまり,「Unicodeでの実装にかかわらず,ユーザ側からの見た目が同じであるからには,コード上でも同一として扱われるべきである」という原則に基づいているとのことです。 実際,この仕様はApple

    Swiftでの文字列比較におけるUnicode正規化を巡る注意点 - Qiita
  • この「邉」を作ったのは誰だぁ!! - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    『Unicode IVS/IVD入門』(田丸健三郎、小林龍生)のなかで、目玉がWindows 8のIVS対応を紹介している第2章だとするなら、背骨といえるのが、IVSという枠組み自体について解説している第5章だよね。 たとえがしっくりきませんが、こだわらずに先に進みましょう。 その第5章のなかでも、IVSの基中の基をわずか1行に凝縮して視覚化しているのが、図5-7だ。 はいはい。 で、今日は図5-7に突っ込んでみようと。 もちろん、突っ込みますよー! あのさ、そういうテンションいらないから。この図なんだけど、どう? んー、解説抜きで見せられても、ちょっと難しいですね。 いや、当は難しくないんだよ。「漢字に異体字セレクタを付けるとグリフを指定できます」って言ってるだけの図なんだから。 この真ん中の「E010B」が右では「E0110」に変化してるのは、どういう意味なんですか? 誤植だね。

    この「邉」を作ったのは誰だぁ!! - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
    rna
    rna 2013/04/25
    グリフ探偵こわい
  • ぼくらを乗せた新幹線はどこへ向かっているのか - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    Mountain Lionで新幹線の絵文字が変わりましたねー。 うん。といっても、Appleカラー絵文字には、新幹線の疑いがある車両が4つほどあるんだけどね。 う、疑いですか? ほら、こんなかんじ。 いや、上の2つは新幹線でしょうけど……。 U+1F689 STATIONなんて、看板にはっきりと「新幹線」て書いてあるじゃん。 書いてあっても違います。 ふーん。U+1F686 TRAINは逆に、どこにも新幹線とは書いてないけど、車両のデザインは明らかにフランスのTGVだぞ。 でも、このレールの上で時速300キロとか出したらまずいことになりますよね? 非常にまずいだろうね。Lionには、もうちょっと丈夫そうなレールに乗ったTGVもあったんだけどね。 え? というわけで、新幹線の疑いがある車両の変遷をまとめると……。 あー、Mountain Lionでは0系で上書きされて消えちゃったのが、丈夫な

    ぼくらを乗せた新幹線はどこへ向かっているのか - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
    rna
    rna 2012/08/01
    謎の黒い新幹線。ていうかなんで駅の絵文字にわざわざ漢字で新幹線とか書いてるのか…日本人以外に使用を躊躇わせるため?!
  • iPhoneの文字化けを防ぐ魔法の呪文 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    昨日のエントリ(「iPhoneのMailから送ったメッセージ全体が文字化け」のまとめ)読みましたよー。iPhoneから送るメールの文字化け防止策は、署名に「♡」を入れておけばOKなんですよね? うん。ただまあ、ちょっと気にする人はいるかもなあ。 男子に誤解されちゃう、と? いや、そういうのじゃなくて、つまり、化けちゃうんだよね。 えっ? 相手の環境によっては「♡」が化けるんだよ。 何ですかそれ。文字化け対策で入れた文字が化けたら意味ないじゃないですか。 意味はあるよ。iPhoneから送ったメールは相手先で全体が化けて読めなくなる可能性があるけど、「♡」でcharset=UTF-8にしておけば、この「全体化け」を防げるんだから。ただし、相手がケータイだったりすると、「♡」自体は「・」とか「?」とかになっちゃうってこと。 自らは捨て石となってメッセージ全体を救うということですか。UTF-8にな

    iPhoneの文字化けを防ぐ魔法の呪文 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
  • なぜAppleカラー絵文字のプードルには眉毛があるのか - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    ここに2匹のプードルがいるんだけどね。 間違い探しですか? ズバリ、左にだけ眉毛がありますね。 うん。眉毛があるほうが、iPhoneやLionに入ってる絵文字フォントのプードル。眉毛のないほうが、Unicodeのコードチャートに載ってるプードル。 えっ、どういうことですか? そもそもUnicodeにケータイ絵文字を入れようって提案したのがGoogleAppleだからね。提案書のための絵文字Appleが用意して、それがUnicodeに収録された。そのあとで、iPhone絵文字に含まれていなかった文字については、データを流用して絵文字フォントに追加したってことじゃないかな。 だからほとんど同じなんですね。でも、眉毛はどうなりました? ケータイ絵文字をUnicodeに収録する過程では、いろいろあってさ。たとえば、日絵文字のマンガっぽさをめぐる戦いとか。ほら、アイルランド・ドイツ修正案って

    なぜAppleカラー絵文字のプードルには眉毛があるのか - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
    rna
    rna 2012/01/23
    「あらら。プードルとかも含めて、動物の眉毛は全部剃られちゃったんですか?」おなかいたいwww /なぜ剃ったのか… 眉毛が擬人化の象徴とみなされたのだろうか?
  • Unicodeで見る各国の十二支 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    もうすぐお正月だし、こんな図を作ってみたんだけどね。 十二支ですか? いろんな国の十二支? そうそう。実はこれ全部、「どこの国の十二支の何番目の動物」という情報まで含めて、Unicodeのコードチャートに載ってるものなんだよね。 いちばん左の列が標準的な十二支ってことですね。 うん。日だと、12番目のイノシシだけが独自仕様だな。それが標準仕様だとブタ。 カザフスタンでは、来年の干支はカタツムリですか。 よくわからないけど、そうなのかな。 このペルシアのネズミは、どうして小さいんですか? 標準仕様のネズミの絵を縮小したみたいに見えますけど。 それはネズミの種類が違うんだよ。ドブネズミとハツカネズミ。 え? でもこれ、文字なんだから、たとえばゾウでもアリでも同じ大きさに描かれるものですよね。 原則は、そうだね。 じゃあ、どうしてドブネズミを縮小したのがハツカネズミなんですか? まあ、ちょっと

    Unicodeで見る各国の十二支 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
    rna
    rna 2011/12/27
    国によって一部干支の動物が違うため干支の文字コードのグリフも変わるという話。でもほんとにそれでいいの〜?→動物違うとこはコードも違うらしい。それならいいのかな…
  • Lionにナマハゲと天狗が入っているのはどうして? - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    Appleカラー絵文字って何? iPhoneやLionに搭載されている絵文字フォントの名前だよ。Lionをインストールすると、iPhoneのカラー絵文字Macでも使えるようになるんだ。文字ビューアの「絵文字」から入力できるよ。 iPhoneとLionでは、絵文字に違いはあるの? いちばん目立つ違いは、Lionでは文字が増えてることかな。 わあ、どんなのが増えたの? ナマハゲとか天狗とかナルトとか。 これ、モノクロじゃん。 増えてるぶんは、ぜんぶモノクロ。Lionは、Unicodeに収録されたケータイ絵文字のうち、Softbank絵文字以外を、いわば「docomo/au互換絵文字」としてモノクロでサポートしている*1。このモノクロの絵文字は、文字ビューアの「絵文字」には表示されない。Font Bookでレパートリーを表示すると、下のほうに入ってるよ。 Gmailを使えば、以前からMacでも

    Lionにナマハゲと天狗が入っているのはどうして? - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
    rna
    rna 2011/07/28
    うわぁ
  • 覚えるテク| [Java]サロゲートペア文字列の操作

    目的 Vistaが世に出てから、サロゲートペア文字列の扱いに頭を悩ませているエンジニアの方々も多いと思うのですが、「java サロゲートペア substring」とかで検索しても、なぜかそれっぽい記事が出てきません。 毎回実装するたび忘れて再実装しちゃうので、作ったクラスをメモしときます。 (もしかして、汎用的なUtilityとかあるのか?) ソース public final class CodePointUtils { private CodePointUtils() { } /** * サロゲートペア文字を置換. * * @param str * 文字列 * @param replacement * 置換文字列 * @return 置換後文字列 */ public static String replaceSurrogatePair(String str, String replace

  • Vistaで化ける字,化けない字

    11月30日に企業向けには出荷が始まったWindows Vista。そのVistaで,“文字化け”が起こるらしい。文字化けといっても,Webアクセス中にたまに見かける全く読めない文字の羅列になることはほとんどなく,その多くは似た文字が表示される程度である。ここでは,来表示されるべき文字の形が少し違ったものが表示されるケースも“文字化け”として扱う。 Microsoftは,Windows 98日語版の発売以来,Windows 2000,Windows Me,Windows XPまでCP932(名はWindows Codepage 932,いわゆるMS漢字コード)とJIS X 0212をサポートしてきたが,最新のWindows VistaではJIS X 0213に乗り換えた。いや,乗り換えたというのは,ちょっと語弊がある。CP932とJIS X 0212に加えて,JIS X 0213もサ

    Vistaで化ける字,化けない字
  • Twitterで見かけるハミ出した顔文字の正体 - RyoAnna

    少し前からTwitterで見かけるようになった、上下に飛び出す変な顔文字。 気持ち悪いのであまり関わらないようにしていたのだが、この顔文字の謎が明らかになったのでお伝えしたい。 いつものようにiPhoneのApp Storeをぶらぶらしていた時のこと。 Unicoder Lite (App Store)というアプリが気になりダウンロードした。 起動するとなにやら見慣れた文字が。 顔文字でよく使われるギリシャ文字やキリル文字だ。 しばらく眺めているとこんな符号が。 合成用区分符号 これが上と下の行にはみ出す顔文字の正体だった。 ためしに作ってみよう。 ベースとなる顔文字を置く。 左目に合成用区分符号を入れる。 続いて右目に。 見事にはみ出す。 Unicode(ユニコード)とは、世界中のコンピュータの文字を符号化したもの。その "U+0300-036F" に配置されているダイアクリティカルマー

    Twitterで見かけるハミ出した顔文字の正体 - RyoAnna
    rna
    rna 2011/06/08
    正体は知ってたけどMac/iOS以外でこういうレンダリングする環境ってあるのかな?
  • ドコモからGmailにメールを送ると「音符」の絵文字が「うんこ」になる - 強火で進め

    TwitterでドコモからGmailに音符の絵文字メールを送ると「うんこ」に変換されるとの情報を聞き、「またまた、そりゃないでしょ?」って思って検証してみました。 ドコモの携帯で確認したところ音符はいくつか有るみたいなので「絵文字の音符」「絵文字の音符3つバージョン」「絵文字じゃない通常フォントの音符」の3つとも書いて送ってみました。 結果はこちら 問題なくちゃんとドコモで表示したものと同じものが表示されました。「Google絵文字をUnicodeに取り入れようとして動いていたりするし、そんな誤変換しないよな?デマだったか?もしかして釣られた?」と思ったのですが念のため、iPhoneでGmailを表示してみました。 結果はこちら うんこ!!うんこ出ました!! iPhoneでGmailのメールを見ると変換されるみたいです。「絵文字の音符3つバージョン」もチューリップに変わってます。ドコモか

    ドコモからGmailにメールを送ると「音符」の絵文字が「うんこ」になる - 強火で進め
    rna
    rna 2010/11/27
    ていうかなんでそんな絵文字があるのか…
  • Unicodeの似た文字を整理してみた - y-kawazの日記

    XMLやCSV等のデータをJavaで色々加工して出力したりといったことをしてると必ずハマるのが波線などの文字化け問題です。 文字化けが発覚するたびにググって場当たり的な対処を繰り返すのに疲れたのでよく問題になる文字と形が似た文字をリストアップして、更にそれをJavaで各種エンコーディングに変換したらどの文字になるかを頑張って纏めました。 ついでに文字化けしないよう上手いこと出力可能な文字に置換する関数も作ってみました。 Javaの変換テーブル 表中の U,S,W,E,J はそれぞれ、UTF-8、Shift_JIS、Windows-31J、EUC-JP、ISO-2022-JP で出力した際の文字です。 見た目で分からないくらい似た文字ばかりなので、各セルにマウスカーソルを乗せたらツールチップで確認できるようtitleにコードポイントを書いておきました。 分かりやすいよう、青は文字化けなし、黄

    Unicodeの似た文字を整理してみた - y-kawazの日記
  • Loading...

    rna
    rna 2010/07/01
  • Loading...

    rna
    rna 2010/07/01
  • 村田真のXMLブログ

    早すぎた訃報を聞いてからしばらく経つ。いままで何も書けなかった。どう書 いたらいいか分からなかった。 最初にメールをいただいたのは1997年のことだった。小林龍生さんの紹介によっ てお逢いした後のことだったように思う。その後、樋浦さんとはUnicode コン ファレンス、XML開発者の日、国際大学での講義などのさまざまのイベントで ご一緒した。 樋浦さんは言うまでもなく、文字コードと国際化の専門家である。そして、国 際的な標準化活動をされた方である。専門家であっても国際的な活動は僅かし かしていないという日人が実は多いのだが、われらが樋浦さんはそんな内弁 慶とは無縁だった。 アメリカ生活が長い樋浦さんが英語が達者なのは当然だけれど、国際的な標準 化活動はそれだけで出来るものではない。標準化手続き及び技術についての理 解があってもまだ十分とは言えない。ここから先は説明が難しいのだが、標準

  • 革命の日々! ハチクロはUnicodeの歴史を変えてしまったらしい

    togetterで「ISO/IEC JTC 1/SC 2/WG 2 ad hoc meetings: Emojiに関するTweets」がまとめられているようだ。 すばらしい。 → http://togetter.com/li/15979 と http://togetter.com/li/16108 一番面白かったのは「勝ち誇り」フェイス変更のくだりで この頭の左側のような「はぁ?なにこの鼻提灯」といった図面から 以下のような正しい鼻息に変更されたのだが そのときに使われた、日のマンガ文化の文脈で「勝ち誇り」がどのように抽象化されているのか という説明に使われたのが以下のコマだという 小形さんの多大なる貢献に経緯を表しつつ。そして同時に、森田先輩あなたって人は・・・・