日本語文字列に含まれるカタカナをひらがなに変換したい
単なるメモです。
アプリケーション内にロジックを組み込むなら、基本的に正規表現を使用しつつ、一部の文字はマッピングで対応させる必要がありそうです。このページにはJavaScriptの実装例があります。とりあえず参考になりそうなので例示していますが、内容をきっちり確認したわけではありません。 qiita.com
コマンドラインツールでやるならkakasi が使えます。 manpages.debian.org
文字コードは自動判定するようですが、文字列長が短いと判定を間違える場合があるので、明示的に指定しておくのがよいようです。
$ echo "漢字カタカナひらがな" | kakasi -KH -i utf-8 漢字かたかなひらがな