コンテンツにスキップ

文字 (Char)

Char は 32bit の Unicode コードポイント を表します。

通常、シングルクォートでUTF-8でエンコードされた文字を囲って文字リテラルを記述します。

'a'
'z'
'0'
'_'
'あ'

バックスラッシュによる名前つきのエスケープスーケンスかコードポイントの数値表現で、特別な文字を記述できます。

次のエスケープシーケンスが有効です。

'\''         # single quote
'\\'         # backslash
'\a'         # alert
'\b'         # backspace
'\e'         # escape
'\f'         # form feed
'\n'         # newline
'\r'         # carriage return
'\t'         # tab
'\v'         # vertical tab
'\0'         # null character
'\uFFFF'     # hexadecimal unicode character
'\u{10FFFF}' # hexadecimal unicode character

バックスラッシュにuを続けることでユニコードのコードポイントを記述できます。ユニコードの文字を表現するため、ちょうど4つの16進数の数値か (\u0000 to \uFFFF) かひげ括弧で囲った6つまでの16進数の数値が利用できます (\u{0} to \u{10FFFF}

'\u0041'    # => 'A'
'\u{41}'    # => 'A'
'\u{1F52E}' # => '🔮'