SGMLの応用言語であるHTMLやXML、XHTMLでは、2重引用符 (") やアンパサンド (&)、不等号 (< >) は特別な意味を持つ特殊文字として扱われるため、そのままでは文字データとして使えません。
そこで、文字参照または実体参照という方法でこれらの文字を表します。
文字参照は、文字を直接記述するのではなく、文字コード(Unicode)の形式で記述することです。 「アンパサンド記号」+「シャープ記号」+10進数の文字コード+「セミコロン記号」の形式で指定します。
文字コードでは覚えづらいため、DTD で実体(エンティティ)定義を行ったものが実体参照です。 文字コードの代わりに文字列で指定できます。 「アンパサンド記号」+文字列+「セミコロン記号」の形式で指定します。
特殊文字の文字参照と実体参照の一覧を次に示します。
| 文字参照 | 実体参照 | 文字 | 備考 |
|---|---|---|---|
| " | " | " | quotation mark |
| & | & | & | ampersand |
| < | < | < | less-than sign |
| > | > | > | greater-than sign |
HTMLで「Jack & Betty」と表示させる例を次に示します。
<p>Jack & Betty</p>
なお、特殊文字だけでなく普通の文字も文字参照で表すことができます。
| 文字参照 | 実体参照 | 文字 | 備考 |
|---|---|---|---|
|   | | no-break space = non-breaking space | |
| ¡ | ¡ | ¡ | inverted exclamation mark |
| ¢ | ¢ | ¢ | cent sign |
| £ | £ | £ | pound sign |
| ¤ | ¤ | ¤ | currency sign |
| ¥ | ¥ | ¥ | yen sign |
| ¦ | ¦ | ¦ | broken vertical bar |
| § | § | § | section sign |
| ¨ | ¨ | ¨ | diaeresis = spacing diaeresis |
| © | © | © | copyright sign |
| ª | ª | ª | feminine ordinal indicator |
| « | « | « | left-pointing double angle quotation mark = left pointing guillemet |
| ¬ | ¬ | ¬ | not sign |
| ­ | ­ | | soft hyphen = discretionary hyphen |
| ® | ® | ® | registered sign = registered trade mark sign |
| ¯ | ¯ | ¯ | macron = spacing macron = overline = APL overbar |
| ° | ° | ° | degree sign |
| ± | ± | ± | plus-minus sign = plus-or-minus sign |
| ² | ² | ² | superscript two = superscript digit two = squared |
| Œ | Œ | Œ | latin capital ligature OE |
| œ | œ | œ | latin small ligature oe |
| Š | Š | Š | latin capital letter S with caron |
| š | š | š | latin small letter s with caron |
| Ÿ | Ÿ | Ÿ | latin capital letter Y with diaeresis |
| ˆ | ˆ | ˆ | modifier letter circumflex accent |
| ˜ | ˜ | ˜ | small tilde |
| ₢ | € | € | euro sign |
| ™ | ™ | ™ | trade mark sign, U+2122 ISOnum |
| ∞ | ∞ | ∞ | infinity |
| ♠ | ♠ | ♠ | black spade suit |
| ♣ | ♣ | ♣ | black club suit |
| ♥ | ♥ | ♥ | black heart suit |