文字を入力するとき、IMEの不確実な変換に頼らずに直接コードポイント入れたくなることはよくありますよね。
たとえば
- U+2D(HYPHEN-MINUS)
- –
- U+2012(FIGURE DASH)
- ‒
- U+2013(EN DASH)
- –
- U+2014(EM DASH)
- —
- U+2015(HORIZONTAL BAR)
- ―
- U+2500(BOX DRAWINGS LIGHT HORIZONTAL)
- ─
- U+30FC(KATAKANA-HIRAGANA PROLONGED SOUND MARK)
- ー
- U+00FD(FULLWIDTH HYPHEN-MINUS)
- -
- U+FF70(HALFWIDTH KATAKANA-HIRAGANA PROLONGED SOUND MARK)
- ー
とか、IMEでうまく入力し分けて目視で違いを判別できたらカッコいいと思いますが、僕にはできません。
うっかり、直前に変換した履歴に引きずられて長音がダッシュになってたり。
Word でコードポイントを入力する
Word 2003以降(ワードパッド含む)では、次の方法で、簡単にコードポイントを入力できます。
- まずはコードポイントを16進数で入力します。「U+」はなくてもよいです。
- Alt + Xを押すと、文字に変換されました。
素晴らしく簡単ですね。エディタとして結構便利。
HTMLで同じことをする
この方法使う人も多いと思います。
適当なHTMLファイルを作って、以下のように文字参照を入力してブラウザで開く方法です。
―
Rubyで同じことをする
いつでもirbやpryが開いている人はこれもお手軽です。
[0x2015].pack('U')
# ブラケットを入力するのは地味にかったるいので、こっちの方が楽かも
0x2015.to_a.pack('U')
Rubyならついでに文字をコードポイントに変換するのが楽なので、やっぱりirbは常時起動に限ります。
# to_s(16)しないと10進数になってしまうので読みづらい
'―'.unpack('U').first.to_s(16)
# 1.9以降ならこっちでも良いです
'―'.codepoints.first.to_s(16)
Pythonで同じことをする
僕はpythoniaではないのですが、RubyよりPythonのほうがタイプ数が少ないので(・ω・)
u"\u2015"
文字をコードポイントに変換するのもpythonのほうが簡単です。
hex(ord(u'―'))
でも、strとunicodeで型が違うの気持ち悪いですよね。Rubyの方が可愛いですよね。
Python 3でも良いですが...