Rational Developer for System z
COBOL for Windows バージョン 7.5 プログラミング・ガイド


XML 文書のエンコード方式についての理解

パーサーは、文書のエンコードに関する特定の情報ソースを使用して、文書の処理方法を決定します。 これらのエンコードの情報源は、互いに整合性がとれている必要があります。パーサーは、矛盾を検出すると、XML 例外イベントをシグナル通知します。

エンコード情報のソースは次のとおりです。

基本的な文書エンコード には、以下のようなカテゴリーがありますが、パーサーは XML 文書の最初の数バイトを調べていずれであるかを判別します。

文書を含む データ項目のタイプ も関連する情報です。パーサーは、以下の組み合わせをサポートします。

エンコードが UTF-16 であるというディスカバリーによっても、コード・ページ情報 CCSID 1202 UTF-16LE (リトル・エンディアン) が提供されます。Unicode は事実上、単一の大きなコード・ページだからです。 したがって、パーサーは UTF-16 文書が国別データ項目であることを検出すると、外部コード・ページ情報を無視します。

ただし、基本的な文書エンコードが ASCII または EBCDIC で ある場合、正しく構文解析するために、パーサーは特定のコード・ページ情報を 必要とします。この追加のコード・ページ情報は、文書エンコード宣言または外部コード・ページから取得されます。

文書エンコード宣言 は、XML 宣言のオプション部分で、文書の先頭にあります。 (詳細は、コード・ページの指定についての関連タスクを参照してください。)

ASCII XML 文書の 外部コード・ページ (外部 ASCII コード・ページ) は、現行のランタイム・ロケールによって示されるコード・ページです。 EBCDIC XML 文書の外部コード・ページ (外部 EBCDIC コード・ページ) は、次のいずれかになります。

最後に、エンコード方式はサポートされるコード・ページ のいずれかである必要があります。 (詳しくは、以下の関連参照の XML 文書のコード化文字セットに関する説明を参照してください。)

関連タスク
コード・ページの指定

関連参照
サポートされるロケールおよびコード・ページ
XML 文書のコード化文字セット
継続を許可する XML PARSE 例外
継続を許可しない XML PARSE 例外


ご利用条件 | フィードバック

Copyright IBM Corporation 1996, 2008.
このインフォメーション・センターでは Eclipse テクノロジーが採用されています。(http://www.eclipse.org)