【PHP】DOMDocument を利用して HTMLを解析する
PHP で DOMDocument
を利用して HTMLを解析する
今回はPHPの DOMDocument
を利用してHTMLを解析してみます。
PHP: DOMDocument - Manual
先に記載しておきますが 大変使いにくくかゆいところに手が届かないもの になります。
簡単な解析程度には使用できますがタグの属性など取れないこともありますのでHTML解析ライブラリを使用することをオススメします。
HTMLを解析する
指定のID、タグの情報を取得してみます。
|
|
HTMLを配列化させる
|
|
上記のPHPを実行すると下記のような解析になります。p
タグのIDなどが消失するので使用する際は注意してください。
array(2) {
["head"]=>
array(2) {
["meta"]=>
array(1) {
["@attributes"]=>
array(1) {
["charset"]=>
string(5) "utf-8"
}
}
["title"]=>
string(12) "タイトル"
}
["body"]=>
array(3) {
["h1"]=>
string(1) "1"
["p"]=>
array(4) {
[0]=>
string(7) "1行目"
[1]=>
array(2) {
["@attributes"]=>
array(2) {
["id"]=>
string(4) "row2"
["class"]=>
string(3) "row"
}
["input"]=>
array(1) {
["@attributes"]=>
array(2) {
["type"]=>
string(4) "text"
["value"]=>
string(7) "2行目"
}
}
}
[2]=>
string(7) "3行目"
[3]=>
array(2) {
["@attributes"]=>
array(2) {
["id"]=>
string(4) "row4"
["class"]=>
string(3) "row"
}
["input"]=>
array(1) {
["@attributes"]=>
array(2) {
["type"]=>
string(4) "text"
["value"]=>
string(7) "4行目"
}
}
}
}
["h2"]=>
string(1) "2"
}
}