XML 文書を構文解析するためのコード・ページを指定する方法として推奨されるのは、文書からエンコード宣言を省略し、外部コード・ページ情報に依拠することです。
XML 宣言を省略することにより、異機種システム間で XML 文書のやりとりをする際に、伝送プロセスでやむなく発生する変換を反映するためにエンコード宣言を更新する必要がなくなります。
Unicode は実際上、単一の大規模な コード・ページから構成されるため、Unicode XML 文書では追加のコード・ページ情報は不要です。エンコード宣言を持たない ASCII または EBCDIC XML 文書の構文解析に使用されるコード・ページは、ランタイム ASCII または EBCDIC コード・ページです。
XML 宣言には、XML 文書に対するエンコード情報を指定することもできます。大部分の XML 文書は XML 宣言で開始されます。 (XML パーサーは、先頭バイトが XML 宣言で開始されていない XML 文書を検出すると例外を生成します。)エンコード宣言を含む XML 宣言の例を以下に示します。
<?xml version=“1.0” encoding=“ibm-1140” ?>
エンコード宣言は、以下のいずれかの方法で指定することができます。
| コード・ページ | サポートされる別名 |
|---|---|
| 037 | EBCDIC-CP-US、EBCDIC-CP-CA、EBCDIC-CP-WT、EBCDIC-CP-NL |
| 500 | EBCDIC-CP-BE、EBCDIC-CP-CH |
| 1202 | UTF-16 |
関連タスク
XML 文書のエンコード方式についての理解