日本語を切り詰める

日本語を切り詰める処理(substrみたいな処理)っていうのはいつも面倒な事が付きまとう。2バイト文字をsubstrすると、文字の途中で切ってしまい、文字化けしてしまう。

で、まぁ、回避方法は無い訳ではない。まず、普通にsubstrして、最後の文字が2バイト文字特有のコードならば…、っていう処理をすれば良い訳だ。面倒だからちょっとネットで探してみたら

日本語文字列を切り詰めるPerlの関数 : blog.nomadscafe.jp

っていうそのものズバリの関数を発見。さらにこのサイトからのリンクでLingua::JA::Jtruncate - module to truncate Japanese encoded text. - metacpan.orgというCPANモジュールを発見。これでばっちり上手く行きました。すばらしい。

ってかこのモジュールリリースが1999年だけど大丈夫かな?