pslaboが試したことの記録

はてなダイヤリーからはてなブログに引っ越してきました

この日記は現在実行中の減量記録を含む個人的なメモとして始めましたが、最近はコンピュータやガジェット、ハック、セキュリティネタのほうがメインになっております。

はてなダイヤリー時代はカテゴリ分けが適当だったのですが、これはそのうち直します。


日本語文字列に含まれるカタカナをひらがなに変換したい

単なるメモです。

アプリケーション内にロジックを組み込むなら、基本的に正規表現を使用しつつ、一部の文字はマッピングで対応させる必要がありそうです。このページにはJavaScriptの実装例があります。とりあえず参考になりそうなので例示していますが、内容をきっちり確認したわけではありません。 qiita.com

コマンドラインツールでやるならkakasi が使えます。 manpages.debian.org

文字コードは自動判定するようですが、文字列長が短いと判定を間違える場合があるので、明示的に指定しておくのがよいようです。

$ echo "漢字カタカナひらがな" | kakasi -KH -i utf-8
漢字かたかなひらがな