COBOL 言語の最も基本的で最小の単位は、文字 です。基本文字セットには、ラテン・アルファベット、数字、および特殊文字が含まれています。COBOL 言語では、個々の文字が組み合わされて、文字ストリング および分離文字 が形成されます。文字ストリングおよび分離文字を使用して、言語を形成するワード、リテラル、句、節、ステートメント、および文が形成されます。
ソース・コードの文字ストリングおよび分離文字の形成に使用する基本文字セットは、表 1 に示されています。
一部の言語エレメントでは、この基本文字セットは EBCDIC 2 バイト文字セット (DBCS) で拡張されています。
DBCS 文字は、ユーザー定義語の形成に使用することができます。
英数字リテラル、コメント行、およびコメント項目の内容には、コンピューターのコンパイル時文字セットの任意の文字を 使用することができ、1 バイト文字および DBCS 文字をどちらも使用することができます。
実行時データには、コンピューターの実行時文字セットに含まれる任意の文字を使用することができます。コンピューターの実行時文字セットには、英数字、DBCS 文字、および国別文字を含むことができます。 国別文字は UTF-16 (Unicode の 16 ビット・エンコード形式) で表記されます。
NSYMBOL (NATIONAL) コンパイラー・オプションが有効なときは、開始区切り文字 N" または N' で識別されるリテラルは、国別リテラルであり、有効になっているコンパイル時のコード・ページ (デフォルトのコード・ページまたは CODEPAGE コンパイラー・オプションで指定されたコード・ページ) に有効な任意の 1 バイト文字または 2 バイト文字 (あるいは両方) を含むことができます。国別リテラルに含まれる文字は、実行時に国別文字として表記されます。
詳細については、DBCS 文字を含むユーザー定義語、 DBCS リテラル、および 国別リテラルを参照してください。