cygwinのターミナル上では両方違う文字で表示されるんですけどねぇ…。
やり方
$ sed 's/\xef\xbd\x9e/\xe3\x80\x9c/g' 元ファイル > 出力ファイル
下の画像をクリックすると Download できると思います。
macOS 10.12 Sierra と 10.13 High Sierra で動作確認した版
これは、macOSで PDFの表示などから濁点や半濁点を含む文字列をコピーしてペーストする際に、「コヒ゜ー」のようになってしまうのを、「コピー」としてコピーするための popclip Extensionです。(なのでペーストは ⌘V でもいけます)
なお、編集中のテキストを選択して実行すると、元の文字列を書き換える事ができます。
意図しないでやるとびっくりするので注意してください。(Base64encodeを参考にして作ったらこうなった)
動作は、選択された範囲に対して perlの Unicode::Normalize を使って変換しているだけです。
多分この Extensionは、日本語の文字列で濁点や半濁点がバラけている文字列を選択しない限り有効にならないはずです。
アイコンが表示される箇所は、濁点や半濁点が分かれているとも言えます。
続きを読む PDFとかの濁点、半濁点をくっつけてコピーする NFD → NFC 変換 popclip extension