[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

タグ

i18nに関するyyamanoのブックマーク (182)

  • 念のためもう一度トルコ語(等)で起こる問題について整理する - Qiita

    Qiita Advent Calendar 2020のJava Advent Calendarの12月7日のエントリです。12月9日付けで追記と内容修正あります。 トルコ語問題については、ご存知の方はご存知だと思いますが、聞いたことがない人にはなかなか理解できない問題なので2020年の今、もう一回おさらいしておくのもいいかと思い書いています。(ほかにネタがなかった、とも言う。) トルコ語の何が特殊なのか トルコ語(とアゼルバイジャン語)には、dotted-iとdotless-iの二つのアルファベットがあります。 通常私たちは「i」の大文字が「I」であり、「I」の小文字が「i」であると理解しています。しかし、トルコ語ロケール(とアゼルバイジャン語ロケール)では「I」はドットなしIであるとみなされ、その小文字は「ı」になります。逆に「i」の大文字はドットありの「İ」なのです。 このため、以下の

    念のためもう一度トルコ語(等)で起こる問題について整理する - Qiita
    yyamano
    yyamano 2020/12/16
    深い。トルコ語ロケール(とアゼルバイジャン語ロケール)では「I」はドットなしIであるとみなされ、その小文字は「ı」になります。逆に「i」の大文字はドットありの「İ」なのです。
  • FreeBSDワークショップ 41.5 - CJK Console

    CJK Console FreeBSDワークショップ 41.5 May 24th, 2018 Li-Wen Hsu

    yyamano
    yyamano 2018/05/28
  • 現在のUnicodeモンゴル文字の問題点と最近の動き - にせねこメモ

    モンゴル文字は、主にモンゴル語表記のための文字*1である。縦書き専用の文字であり、日語の場合とは反対に左から右へと行を進める。また、アラビア文字のように続け書きされ、文字が語のどの位置に来るかによって形が変わる。 モンゴル文字は現在も中国の内モンゴル自治区でモンゴル語の表記に現役で使用されている。他方モンゴル国ではソ連の影響下でモンゴル語の表記をキリル文字に切り替えたので、モンゴル文字は学校で習いはするものの一般にあまり使われない。 Unicode 3.0からモンゴル文字がシベ文字・トド文字・満州文字と統合されて収録されているため、コンピュータでこの文字を入力するにあたっては、独自の符号化方式を作成するのでなければUnicodeを利用しようとするのが当然に思える。しかし、現状のUnicodeモンゴル文字は致命的な欠陥を抱えている。 このエントリでは、2017年ころからUnicode Te

    現在のUnicodeモンゴル文字の問題点と最近の動き - にせねこメモ
    yyamano
    yyamano 2018/03/08
  • Ups and Downs of Ruby Internationalization - Ruby Kaigi 2016

    A note about Ruby versions and Unicode versions: The Ruby core team is very conservative (in my view too conservative) in introducing new Unicode versions as bug fixes. Update to new Unicode versions therefore only happens for new Ruby versions. RbConfig::CONFIG["UNICODE_VERSION"] ⇒ '9.0.0' VUnicode = y - 2007 VRuby = 1.5 + VUnicode · 0.1 VUnicode = VRuby · 10 - 15 Don't extrapolate too far! Ups a

  • 技術英語や翻訳 - Qiita Advent Calendar 2015 - Qiita

    技術英語を読んだり、翻訳したりする時のTipsとか。 単語について 文法について 翻訳ツールの紹介 訳す方法について などなど…。 自分自身はMozillaのMDNを翻訳する事が多いのですが、それ以外でもOK! 実際はプロダクトによってもいろいろ変わるとこがある気もします。 「全部俺」にするつもりはなくて、誰かの目にとまって書いてくれると有り難いです。(特に土日祝あたり) 参考(Adventarだけど…) 「MDNやFirefox OSのドキュメントをみんなで翻訳!Advent Calendar 2015」 http://www.adventar.org/calendars/1026 こちらもあわせて登録お願いします。

    技術英語や翻訳 - Qiita Advent Calendar 2015 - Qiita
    yyamano
    yyamano 2016/02/05
  • 多国対応ウェブアプリを開発する前に知っておきたかったこと - Qiita

    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? はじめに 最近仕事で多国対応(主に英語圏)のアプリを初めて作った訳ですが、わからないなりにいろいろ事前準備をしたにもかかわらず、実装から運営まであらゆるフェーズでこけました。そんなわけで、あんな苦労は二度としたくないし、他の人にもして欲しくないので、気をつけたい点を共有します。 プログラミング 日付のフォーマットは、国毎に表現が違う。Railsの場合、I18n.lで自動変換可能。 【日】2015年3月10日 【米】03/10/2015 【独】10.3.2015 国によって小数点や千単位の区切り方が違う。バリエーションが多すぎるので、ライ

    多国対応ウェブアプリを開発する前に知っておきたかったこと - Qiita
    yyamano
    yyamano 2016/02/05
  • エンジニア・Webデザイナー必読: アプリケーションを国際化・多言語展開する前に知っておくべきこと - Qiita

    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? ちょろっとメモ。の割には長くなったけど、最後の方にいいことが書いてある。 ※技術英語や翻訳 Advent Calendar 2015に参加してみました。スレ違いだったらすみません。 追記: taka-oyamaさんの記事「多国対応ウェブアプリを開発する前に知っておきたかったこと」も参考になります。 追記: 「17ヶ国の多言語対応Tips」で当記事を紹介いただきました。素晴らしいスライドです。 追記: 「当にあった怖い誤訳」によると、今でも機械翻訳をそのままウェブページで使っている自治体があるそうです。怖す。 追記: ぼくたちのかんがえ

    エンジニア・Webデザイナー必読: アプリケーションを国際化・多言語展開する前に知っておくべきこと - Qiita
    yyamano
    yyamano 2016/02/05
  • How to port your gem to Ruby 1.9 - 世界線航跡蔵

    This article shows you how to multilingualize your gem with Ruby 1.9. 6 months ago, Ruby 1.9.1 was released. Some gems support Ruby 1.9, others do not. At RubyKaigi2009 , I said that you should port your library to Ruby 1.9 now. Well, what is "Ruby 1.9-ready"? It does not mean only the library can be built with Ruby 1.9. The most important point in supporting Ruby 1.9 is M17N -- multilingualizatio

    How to port your gem to Ruby 1.9 - 世界線航跡蔵
  • 文字コード体系まとめ

    ISO/IEC 10646 / Unicode 国際符号化文字集合(UCS) 群(128)x面(256)x区(256)x点(256)の空間 群=面=0がBMP. 0群0f面までをUTF-16で表現 U+0000-U+00ffまではLatin-1と同じ U+FF00-U+FF9Fまで互換用の全角英数と半角カナ U+E0100-U+E01EF 異体字セレクタ 02面にJIS X 0213の303文字あり unicode正規化によって、合成文字や互換漢字が変化するので注意 JIS-unicode対応表 符号化方式 UTF-16 BMPはそのまま2バイト。それ以外は0xd800-dbffと0xdc00-dfffに10bitづつ分割しサロゲートペアで表現。 BOM U+0feff(ZERO WIDTH SPACE)を先頭において、エンディアンを検出 UTF-8 1-4バイト可変。1バイトはASCII

    yyamano
    yyamano 2015/08/17
  • 文字化け

    2. 文字化け Powered by Rabbit 2.1.6 自己紹介 とみた まさひろ 長野県北部在住プログラマー 言語: C(1989〜) Ruby(1998〜) 日MySQLユーザ会代表 長野ソフトウェア技術者グループ(NSEG) 3. 文字化け Powered by Rabbit 2.1.6 自己紹介 http://tmtms.hatenablog.com http://twitter.com/tmtms https://github.com/tmtm MySQL 3.21 の日語対応 (1998 ) MySQLRubyバインディング作成 (1998 )

    文字化け
    yyamano
    yyamano 2015/06/09
  • What character encoding should I use for a HTTP header?

    yyamano
    yyamano 2015/03/25
    HTTPbis gave up and specified that in the headers there is no useful encoding besides ASCII
  • Pluralization for JavaScript

    Seventy-one percent of today’s internet users don’t speak English as a first language, and that number keeps growing. But few people specialize in internationalization. As a result, most sites get it wrong—because things that seem straightforward are often anything but. Take pluralization. Turning singular words into plurals within strings gets tricky quickly—even in English, where most plural wor

    Pluralization for JavaScript
  • MySQL と寿司ビール問題 - かみぽわーる

    MySQL と Unicode Collation Algorithm (UCA) - かみぽわーる に関連するトピックで、 MySQL には寿司ビール問題というのがある。 寿司ビール問題どっかで詳しくお話を聞くべきだよなぁ。。。— RKajiyama (@RKajiyama) March 18, 2015 これはどういう問題かというと、 MySQL の Unicode では binary collation にしてコードポイントで比較しないと🍣と🍺に限らず絵文字が同値判定されるという問題です。 あれ? MySQL の utf8mb4 charset って、4バイト文字同士を比較すると同じ文字扱いされる? SELECT '🍣'='🍺' → 1 MySQL的には寿司とビールは同じ扱い。— とみたまさひろ (@tmtms) December 22, 2014 MySQLで select

    MySQL と寿司ビール問題 - かみぽわーる
    yyamano
    yyamano 2015/03/23
  • Ruby: IO and Encodings

  • Unicode2.0「ハングル大移動」の経緯

    無 @LGRikka ①さて、遅くなりましたが、ふたたび自分の備忘録として、『ハングルをUnicodeに入れる際に起きた諸問題』についてまとめておこうと思います。前回はクメール文字についてつぶやきましたが、それについては他の方がまとめてくださいました。→ togetter.com/li/752547 無 @LGRikka ②クメール文字の場合は、カンボジアに「相談すべき上の機関」がなく、「カンボジア在住の学者」もいない状況で、”外国人” たちがクメール文字を整理したことにより、いろいろな問題が起こったわけですが、ハングルの場合は、韓国政府が頑張ったおかげで、まったく違った展開を見せました。

    Unicode2.0「ハングル大移動」の経緯
    yyamano
    yyamano 2014/12/12
  • CSIとUCS Normalization | numaの日記 | スラド

    はじめに 先の記事を書くに当たっていろいろ調べていたところ、「Ruby M17N の設計と実装」という記事を見つけた。そこで、今回はこれをネタに思うところを語りたい。ダシに使われたほうはいい迷惑かもしれないが、記事を公開すればそういうこともあるので、あきらめてほしい。 なお、この文章には用語の定義らしきものがいくつか出てくるが、いずれも厳密なものではない。ここでの議論に十分な程度のものなので承知されたい。 CSIとUCS Normalization 前掲記事ではCSI (Code Set Independence) とUCS Normalization(UCSはUniversal Charcter Setの略。かならずしもUnicodeとは限らない)とを対比して議論している。 (なお、前掲記事ではCode Set IndependenceではなくCode Set Independentを使

    yyamano
    yyamano 2014/07/15
  • IVSの実装は難しい (LibreOfficeを中心に)

    IVS (Ideographic Variation Selector)は漢字の後ろに置く独立した不可視の文字なので、アプリがうまく扱ってくれないと意図せぬ文字化けを引き起こしてしまう懸念があります。最新のLibreOfficeやAdobe Illustratorでもまだ対策は完全ではないようです。

    IVSの実装は難しい (LibreOfficeを中心に)
    yyamano
    yyamano 2014/07/15
  • イコール・ランゲージ・オポチュニティー 三上喜貴、長岡技術科学大学 通商産業研究所特別研究官

    yyamano
    yyamano 2014/06/30
    しかしミャンマー語を母語とするコンピュータ専門家の用意周到な発言にも拘わらず、原提案者達は容易に自説を曲げようとしなかったのである。筆者はロンドンには同行しなかったが、あの穏やかなT君が興奮して冒頭の
  • Draft Emoji Data (Full)

    List of emoji characters, with images. For details about the format and other information, see Unicode Emoji. Count Code Browser B&W* Apple* Android Twitter Windows Name Version Default Annotations

    Draft Emoji Data (Full)
    yyamano
    yyamano 2014/06/30
    List of emoji characters, with images. For details about the format and other information, see Unicode Emoji.
  • タクシーとパトカー

    当たり前だが、タクシーとパトカーは違うものだ。「タクシーに乗った」と「パトカーに乗った」ではまったく意味合いが変わってくる。しかし、この二つの区別が非常につけにくい文章になる場合がある。それはユニコード絵文字を使った場合だ。 🚕に乗った 🚓に乗った この二つの行はOS XやiOSではフルカラーで表示されるので、この両者は容易に区別が付く。対してユニコード絵文字の実装がフルカラーになっていないSegoe UI Symbolが使われるWindows 7では以下のように表示される。 Taxi and Police Car Emoji on Windows 7 Windows 8では少しグリフは変わるが、おおむねこのような感じだ。まず区別はつかないと言って良いだろう。 絵文字は表現力に富むが、それは表示される機器に強く依存する。極端なケースでは、機器によって違う絵文字になってしまうこともある。

    タクシーとパトカー
    yyamano
    yyamano 2014/05/22
    タクシーに乗った」と「パトカーに乗った」ではまったく意味合いが変わってくる。しかし、この二つの区別が非常につけにくい文章になる場合がある。それはユニコード絵文字を使った場合だ。