XML 文書のためのコード化文字セット
XML PARSE は、国別データ項目、英数字データ項目、および UCS-2 および 1 バイト CCSID を持つ IFS ファイルの XML 文書をサポートしています。国別データ項目の文書は、国別 CCSID コンパイラー・オプションまたは NTLCCSID PROCESS オプションで指定された Unicode UCS-2 CCSID を使用してエンコードされなければなりません。 英数字データ項目の文書は、XML 文書のための「XML 文 書でサポートされている EBCDIC CCSID」 (表 1) で示されている単一バ イトの EBCDIC CCSID で明示的にサポートされているものの 1 つ、 または「XML 文書でサポートされている ASCII CCSID」(表 2) で 示されている ASCII CCSID のうち 1 つを使用して、エンコードされなければなりません。
| CCSID | 内容 |
|---|---|
| 1140、37 | 米国、カナダなど。ユーロ国別拡張 CCSID (ECECP)、国別拡張 CCSID |
| 1141、273 | オーストリア、ドイツ ECECP、CECP |
| 1142、277 | デンマーク、ノルウェー ECECP、CECP |
| 1143、278 | フィンランド、スウェーデン ECECP 、CECP |
| 1144、280 | イタリア ECECP、CECP |
| 1145、284 | スペイン、ラテンアメリカ (スペイ ン語) ECECP、CECP |
| 1146、285 | 英国 ECECP、CECP |
| 1147、297 | フランス ECECP、CECP |
| 1148、500 | 国際 ECECP、CECP |
| 1149、871 | アイスランド ECECP、CECP |
| CCSID | 内容 |
|---|---|
| 813 | ISO 8859-7 ギリシャ語/Latin |
| 819 | ISO 8859-1 Latin 1/オープン・シ ステム |
| 920 | ISO 8859-9 Latin 5 (ECMA-128、ト ルコ TS-5881) |
ASCII XML 文書を解析する場合、特殊レジスター XML-TEXT にあ る処理プロシージャーに渡される文書のフラグメントは、ASCII でエンコー ドされます。 移動や比較のような ILE COBOL 操作は、適切な操作 に対する EBCDIC エンコードまたは国別文字に依拠しているので、文書フラ グメントを変換してから、それらを使用しなければなりません。 XML 文書が COBOL プログラムにあるときにこれを行うには、MOVE ステートメントを使用して、まず XML 文書の ASCII CCSID から 国別文字に変換します。 次に、必要な場合、MOVE ステートメントを使用して、その結果を国別文字から EBCDIC に変換します。
他の CCSID でエンコードされた COBOL プログラムの XML 文書については、MOVE ス テートメントを使用して、それらを国別文字に変換することで、解析できます。 特殊レジスター XML-NTEXT にある処理プロシージャーに渡された 文書テキストの個々の部分については、その後、必要に応じて、MOVE ステートメント を使用して元の CCSID にもう一度変換できます。
- 各 xml レコードの開始で '<' タグに先行する文字を除去する必要があります。
- IFS ファイルでの各行の終了は、LF (改行) ではなく、CR (復帰) のみを持つ必要があります。
- XML 文書を国別 CCSID コンパイラー・オプションまたは NTLCCSID PROCESS オプションで指定された UCS-2 CCSID に変換するか、または XML 文書をジョブの CCSID に変換します。
- XML 文書のエンコード宣言を手動で変更し、文書の実際の CCSID を指定します。
文書のエンコードの指定およびパーサーがエンコードを決定する方法について詳しくは、「ILE COBOL プログラマーの手引き」を参照してください。