[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

タグ

c#とUTF-8に関するnezukuのブックマーク (1)

  • Unicodeと、C#での文字列の扱い

    進化の過程で煩雑な文字コード体系になっているUnicodeは、プログラミングでの取り扱いが面倒だ。C#とUnicodeの関係はどうなっているのか? C#が抱える課題とその解決策について見てみよう。 ← 前回 連載 INDEX 前編では、文字コード、そしてUnicodeがこれまでにどのような進化の道程を歩んできたかを見た。そこで説明したように、文字コード自体が結構な複雑さになっている。当然、プログラミング言語における文字列の扱いにも面倒が付きまとう。 後編である今回は、C#のstring型がどういう実装になっているかや、現状抱えている課題、それに対して検討している解決策などについて説明していく(以下、文字コードは全て16進数で表記する)。 文字列型 まずは、プログラミング言語内部での文字列の扱いについて話そう。Unicodeの歴史で話した通り、もともと、Unicodeは2Bytes固定長の文

    nezuku
    nezuku 2016/11/14
    .NET FrameworkのString型に見るWindowsにおけるUnicode対応、COMとの関係みたいなのが垣間見えるのかも。今の時代に見合ったパフォーマンス、レガシーを解消するための新たな文字列型の模索と。
  • 1