URL先の文字列解析をできるプログラムを作成しようと考えています。下記のようにコードを作成したのですが、文字列の取り出し方が分からなくて困っています。
$array['head']['title'];とすると、headタグ内のtitleタグに入っている文字列を取り出してくるのはわかるのですが、bodyタグ内の文字列の取り出し方が分かりません。文字列の取り出しを試みようとしているURL先のページソースのリンク先を添付しています。わかる方、何卒宜しくお願い致します。
リンク内容
test.php
<?php $search_url = $_GET["url"]; $html = file_get_contents($search_url); $domDocument = new DOMDocument(); $domDocument->loadHTML($html); $xmlString = $domDocument->saveXML(); $xmlObject = simplexml_load_string($xmlString); //var_dump($xmlObject); $array = json_encode($xmlObject,JSON_UNESCAPED_UNICODE|JSON_PRETTY_PRINT); echo $array; echo "<br>"; $array = json_decode(json_encode($xmlObject), true); echo $array['head']['title']; /* foreach($array['head']['meta'] as $key){ echo $key; echo '<br>'; } */ echo "<br>"; echo $array['body']['div']; ?> <!DOCTYPE html> <html lang="ja"> <head> <meta charset="UTF-8"> <meta http-equiv="X-UA-Compatible" content="IE=edge"> <meta name="viewport" content="width=device-width, initial-scale=1.0"> <title>Document</title> </head> <body> <?php echo "<br>"?> <?php echo $search_url;?> </body> </html>
0 コメント