文字 (Char)
Char は 32bit の Unicode コードポイントを表現します。
通常、シングルクォートでUTF-8でエンコードされた文字を囲って文字リテラルを記述します。
'a'
'z'
'0'
'_'
'あ'
バックスラッシュによる名前つきのエスケープスーケンスかコードポイントの数値表現で、特別な文字を記述できます。
次のエスケープシーケンスが有効です。
'\'' # シングルクォート
'\\' # バックスラッシュ
'\a' # アラート
'\b' # バックスペース
'\e' # エスケープ
'\f' # フォームフィード (改ページ)
'\n' # 改行
'\r' # キャリッジリターン (復帰)
'\t' # タブ文字
'\v' # 垂直タブ
'\uFFFF' # 16進数によるユニコード文字
'\u{10FFFF}' # 16進数によるユニコード文字
バックスラッシュにu
を続けることでユニコードのコードポイントを記述できます。ユニコードの文字を表現するため、ちょうど4つの16進数の数値か (\u0000
to \uFFFF
) かひげ括弧で囲った6つまでの16進数の数値が利用できます (\u{0}
to \u{10FFFF}
'\u0041' # => 'A'
'\u{41}' # => 'A'
'\u{1F52E}' # => '🔮'