ノーブレークスペース(\u00a0)への対処
HTML を解析するプログラムを書いていたら置換などが出来ない 空白( ) を発見しました。
調査
該当の文字列のユニコードの値を取得するため json にしてました。
| |
※サンプルの空白は通常のスペースになっています。
| |
これで文字列を特定出来ました。
\u00a0
このスペースは ノーブレークスペース というもので HTML の   の事。
対処
文字列として対処
| |
正規表現で対処
| |
HTML を解析するプログラムを書いていたら置換などが出来ない 空白( ) を発見しました。
該当の文字列のユニコードの値を取得するため json にしてました。
| |
※サンプルの空白は通常のスペースになっています。
| |
これで文字列を特定出来ました。
このスペースは ノーブレークスペース というもので HTML の   の事。
| |
| |