Open棟梁Project - マイクロソフト系技術情報 Wiki

目次

概要

余談:・・・となると、

StreamにDecorateパターンを適用する
殆どの処理が=エンコーディングと言う事になる。

文字エンコーディング

ココでは各種、文字エンコーディングの情報を纏めています。
「外字」については、「Windowsの外字」を参照下さい。

文字エンコーディングとは、文字列データを、
異なる文字コード(コードページ)を使用したバイト表現に変換することである。

文字化け

文字化けは、一般的に、

際に発生します。

文字コード(コードページ)指定を大きく誤っている場合は、すぐ気が付くのですが、

一部だけ文字化けする場合のトラブルシュートは苦戦することが多いです。
一部だけ文字化けするパターンは以下の様に分類できると考えます。

ポイント

従って、以下に注意を払う必要があります。

事例1

プラットフォームに実装されている文字コード(コードページやフォント)に起因する文字化け。

事例2

プラットフォームで適用される標準のエンコーディングに起因する文字化け。

事例3

フォントや外字のインストール状況に起因する文字化け。

事例4

コードページによっては、変換が不可逆なケースがある。

この変換はあくまでもUnicodeからJA16SJIS方向への片方向の変換においてのみ適用される。

コードページ

その他のエンコーディング

SGML文書

HTMLエンコーディング

文字参照(数値文字参照・文字実体参照)のエンコーディング(エスケープ)を行う。

HTMLの文字エンコーディング

HTTPヘッダか、metaタグにエンコーディングを指定することで
WWWブラウザがデコードする際に指定する文字コード(コードページ)を指定する。

XMLの文字エンコーディング

ヘッダ部分の記述をDOMが理解して自動的にエンコード・デコードします。

<?xml version="1.0" encoding="Shift_JIS">

URLエンコーディング

Base64エンコーディング

各種フォーマット

Excelが開くことが可能なCSVファイル

CSVファイルを扱い際は、以下のことに気を付ける。

Excelにて文字化けやエラーが発生せず読み込めるCSVファイルは、

以下の2種類のエンコードのファイルである。

各言語(国)のANSIコード(一例)
#言語文字セット名codepage
1日本語Shift-JIS932
2英語(米国)Windows-12521252
3英語(英国)Windows-12521252
4フランス語(フランス)Windows-12521252
5スペイン語(スペイン)Windows-12521252
6繁体字中国語big5950
7簡体字中国語gb2312936
8韓国語ks_c_5601-1987949

Excel上でCSV形式で保存すると、ANSIコードで保存される。

参考


Tags: :.NET開発


トップ   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS