Rubyでかな/カタカナ(全角のみ)の濁点を本体の文字と分ける

Gem unf を使って次のようにすると、濁点を分割できる。ニッチな用途だけど便利ですな。。

require 'unf'
'ざぱザパ'.to_nfd.split('')
#=> ["さ", "゙", "は", "゚", "サ", "゙", "ハ", "゚"]

NFDというのはUnicode正規化の方法で、この方法では濁点と本体文字を分けて表現する。濁点が本体と一緒になるほうはNFCというみたい。

[参照]