ノーブレークスペース(\u00a0)への対処
HTML
を解析するプログラムを書いていたら置換などが出来ない 空白(
) を発見しました。
調査
該当の文字列のユニコードの値を取得するため json
にしてました。
|
|
※サンプルの空白は通常のスペースになっています。
|
|
これで文字列を特定出来ました。
\u00a0
このスペースは ノーブレークスペース
というもので HTML
の  
の事。
対処
文字列として対処
|
|
正規表現で対処
|
|
HTML
を解析するプログラムを書いていたら置換などが出来ない 空白(
) を発見しました。
該当の文字列のユニコードの値を取得するため json
にしてました。
|
|
※サンプルの空白は通常のスペースになっています。
|
|
これで文字列を特定出来ました。
このスペースは ノーブレークスペース
というもので HTML
の  
の事。
|
|
|
|