gasでのスクレイピングができない

実現したいこと

このサイトのブログ記事からURLとブログタイトルをスクレイピングしたいです。
https://makoto1688.com/blog

参考記事
https://tetsuooo.net/gas/82/

よろしくお願いいたします。

前提

12個の記事をスクレイピングして次のページという風に全部の記事をやりたいです。

発生している問題・エラーメッセージ

<article class="grid_post-box" role="article"> <div class="post-box-contents clearfix" onclick="location.href='https://makoto1688.com/non-stock-resale/'"> <figure class="grid_post_thumbnail post-box-thumbnail"> <span class="newlabel"><span>NEW!</span></span> <div class="post_thumbnail_wrap post-box-thumbnail__wrap"> <img src="" data-src="https://makoto1688.com/wp-content/uploads/2023/06/165_non-stock-resale-1024x740.png" width="850" height="614" class="lazyload ewww_webp_lazy_load" alt="無在庫転売とは?無在庫転売の方法やメリット、利益を上げるコツを解説" data-src-webp="https://makoto1688.com/wp-content/uploads/2023/06/165_non-stock-resale-1024x740.png.webp"> </div> </figure> <section class="post-meta-all"> <div class="post-cat" style="background:#828282"><a href="https://makoto1688.com/china-import/china-import-nonstock/" rel="category tag">無在庫</a></div> <div class="post-tag"><a href="https://makoto1688.com/tag/china-import/" rel="tag">中国輸入</a><a href="https://makoto1688.com/tag/china-import-nonstock/" rel="tag">無在庫</a><a href="https://makoto1688.com/tag/chinai-import-instock/" rel="tag">有在庫</a></div> <div class="post-title"> <a href="https://makoto1688.com/non-stock-resale/" title="無在庫転売とは?無在庫転売の方法やメリット、利益を上げるコツを解説" rel="bookmark">無在庫転売とは?無在庫転売の方法やメリット、利益を上げるコツを解説</a> </div> <div class="post-substr"> この記事は、無在庫転売に関する記事です。無在庫転売は低リスクで利益を伸ばせる可能性があり、初心者の方におすすめの手法です。リサーチをしっかりと行い転売する商品を選定すれば、初心者でも利益を出せます。転売が初めての方やうまく売上が伸ばせない方は、自分の好きな分野や得意なジャンルの商品を扱うと結果を出せる可能性があります。 </div> 13:30:09 情報 [ '>\n\t\n\t\t\t\t\t<article class="grid_post-box"' ] 13:30:09 情報 [ '>\n\t\n\t\t\t\t\t<article class="grid_post-box"' ]

該当のソースコード

let response = UrlFetchApp.fetch("https://makoto1688.com/blog"); let text = response.getContentText("utf-8"); // console.log(text); // トップニュースのブロックを抽出 let topic_block = Parser.data(text).from('class="wrap-grid-post-box"').to('</section>').build(); console.log(topic_block); // ulタグで囲まれている記述(トップニュース)を抽出 let content_block = Parser.data(topic_block).from('class="grid_post-box"').to('</article>').iterate(); console.log(content_block); let newsList= new Array(); function myFunction() { console.log(content_block); }

試したこと

最初の記事しか取得できないので、iretate()でaタグやclass="post-meta-all"でブログ記事のブロックを抽出しようとしたが、初めの一個しか取れない。

補足情報(FW/ツールのバージョンなど)

Parser 8
windows
chrom

コメントを投稿

0 コメント