開発

2019.05.31

Puppeteerで簡単にホームページのキャプチャ画像を取得

wingdoor

シェア
ツイート
ブックマーク
LINE

BPSの福岡拠点として一緒にお仕事させて頂いてます、株式会社ウイングドアのアリタです。

今回は、サイズ指定のホームページのキャプチャ画像を簡単に取得する方法のご紹介です。
（Puppeteer知っている方は読み飛ばしていただいて大丈夫です）

追記（2019/06/19）: waitForNavigation()を使わない方法に修正しました。

はじめに

ホームページのキャプチャを取りたいけれど、毎度

キャプチャ画像を取得
* Windowsの場合：Snipping Tool を使ってキャプチャ画像を取得（参考）
* Macの場合：「Command + Shift + 4」でキャプチャ画像を取得
指定サイズに画像切り抜き

など手動で行なっていたら・・面倒ですよね。
そこで、Puppeteerを利用したキャプチャ画像の取得方法をご紹介します。

Puppeteerとは

Puppeteer

Puppeteer is a Node library which provides a high-level API to control Chrome or Chromium over the DevTools Protocol.
Puppeteer runs headless by default, but can be configured to run full (non-headless) Chrome or Chromium.

Chromeブラウザを操作できるNodeのライブラリです。
デフォルトでは、Chromeのヘッドレスブラウザ（GUI が無いブラウザ）で実行されます。
また、設定により通常のChromeでも実行可能です。

Q: Who maintains Puppeteer?
The Chrome DevTools team maintains the library, but we'd love your help and expertise on the project! See Contributing.

Chrome DevTools teamの方がメンテナンスしているみたいですね。
コントリビューター（Contributor）として手伝ってくれる方も募集しているようです。

Puppeteerインストール

1. 事前準備

はじめにnode、npmが実行できる環境を準備してください。
（ここではnode、npmのインストール方法は省略します）

$ node -v
v12.3.1
$ npm -v
6.9.0

2. インストール

$ npm i puppeteer
$ npm ls | grep puppeteer
/Users/osamu.arita/xxx/web/puppeteer
└─┬ puppeteer@1.6.0-next.1532381444032

以上です。

Puppeteerをちょっと触ってみたいなどであれば、
Puppeteerが提供しているWebのTry Puppeteerを利用することも出来ます。

ホームページのキャプチャを取得してみる

1. ファイルを準備

capture.js

const puppeteer = require('puppeteer');

(async () => {
  const browser = await puppeteer.launch({headless: true});
  const page = await browser.newPage();
  page.setViewport({width: 1024, height: 800})
  const url = 'https://techracho.bpsinc.jp/'
  await page.goto(url, { waitUntil: 'domcontentloaded' });
  await page.screenshot({path: 'capture.png', fullPage:false})
  console.log("save screenshot: " + url)
  await browser.close()
})();

今回は、「https://techracho.bpsinc.jp/」のキャプチャ画像を「1024x800」pxで取得してみます。

2. あとは実行するだけ

$ node capture.js
save screenshot: https://techracho.bpsinc.jp/

無事、ホームページのキャプチャが取得できました！
URLの部分を変更すれば、どのようなホームページのキャプチャもサイズ指定で取得可能です。

備考

Basic認証がかかっている場合は、await page.goto(url); の前に下記を入れてください。
（USER、PASSWORDは要修正）

const USER = 'user';
const PASSWORD = 'password';
await page.setExtraHTTPHeaders({
  Authorization: `Basic ${new Buffer(`${USER}:${PASSWORD}`).toString('base64')}`
});

まとめ

このように、サイズ指定のホームページのキャプチャ画像を取得するだけであれば
簡単に取得出来るかなと思います。

参考までに、ソースコードの説明も下記に記載します。
ソースをいじればスクレイピングなども可能なので、是非色々試してみてください！

参考：ソースコードの説明

1. puppeteerのnodeライブラリ読み込み

const puppeteer = require('puppeteer');

2. async開始

(async () => {

3. ヘッドレスブラウザ（GUI が無いブラウザ）起動

const browser = await puppeteer.launch({headless: true});
const page = await browser.newPage();
page.setViewport({width: 1024, height: 800})

※viewportは1024 x 800 px
※async内では、awaitが完了するまで次の処理が実行されません。
（asyncがPromiseを返すようになっており、awaitがPromiseが返ってくるまで処理を中断するため）

4. URLを開く

const url = 'https://techracho.bpsinc.jp/'
await page.goto(url);

5. スクリーンショットでキャプチャ画像を取得

await page.screenshot({path: 'capture.png', fullPage:false})

6. ヘッドレスブラウザを終了する

await browser.close()

株式会社ウイングドアでは、Ruby on RailsやPHPを活用したwebサービス、webサイト制作を中心に、
スマホアプリや業務系システムなど様々なシステム開発を承っています。

シェア
ツイート
ブックマーク
LINE

株式会社ウイングドアは福岡のシステム開発会社です。Ruby on RailsやPHPを活用したwebサービス、webサイト制作を中心に、スマホアプリや業務系システムなど様々なシステム開発を承っています。中途採用を絶賛募集しています！ https://wingdoor.co.jp/

Puppeteerで簡単にホームページのキャプチャ画像を取得

はじめに

Puppeteerとは

Puppeteerインストール

1. 事前準備

2. インストール

ホームページのキャプチャを取得してみる

1. ファイルを準備

2. あとは実行するだけ

備考

まとめ

参考：ソースコードの説明

1. puppeteerのnodeライブラリ読み込み

2. async開始

3. ヘッドレスブラウザ（GUI が無いブラウザ）起動

4. URLを開く

5. スクリーンショットでキャプチャ画像を取得

6. ヘッドレスブラウザを終了する

週刊Railsウォッチ（20191202前編）Rails 6のimplicit_order_columnはカスタマイズ可能、rubocop-rails 2.4.0リリース、Capistrano記事ほか

Kotlinの拡張機能で冗長な〇〇Utilsから脱却する

Rails: ビューでstrftimeを直書きするのはたぶんよくない（翻訳）

週刊Railsウォッチ（20191119後編）メソッド参照演算子が廃止、GitHub新機能続々、平成Ruby会議、GitHub OAuthバイパスほか

Rails 6の新しいデフォルト設定と安全な移行方法を詳しく解説（翻訳）

電子書籍でよく耳にする「EPUB」っていったい何者？なんて読むの？非エンジニアが簡単にまとめてみた

正規表現: 元号の漢数字「〇一二三四五六七八九十」にマッチさせる

[Windows] PowerShellで環境変数を取得する方法

python-oscを使ってみる：前編

Web開発環境をMacBook ProからWindows機に移行してみた話

Rails: ViewComponent の call と erb_template と html.erb を適切に使い分ける（翻訳）

Rubyのbundlerを劇的に高速化するShopifyの取り組み（翻訳）

Ruby の'include?'より Rails の'in?`の方が読みやすい（翻訳）

Rails の try メソッドと Ruby のぼっち演算子 '&.' の違いを理解する（翻訳）

Claude Code Agent Teamsをうまく働かせるコツ（参考プロンプト付き）: 2026/03版

関連記事

CONTACT

Puppeteerで簡単にホームページのキャプチャ画像を取得

はじめに

Puppeteerとは

Puppeteerインストール

1. 事前準備

2. インストール

ホームページのキャプチャを取得してみる

1. ファイルを準備

2. あとは実行するだけ

備考

まとめ

参考：ソースコードの説明

1. puppeteerのnodeライブラリ読み込み

2. async開始

3. ヘッドレスブラウザ（GUI が無いブラウザ）起動

4. URLを開く

5. スクリーンショットでキャプチャ画像を取得

6. ヘッドレスブラウザを終了する

週刊Railsウォッチ（20191202前編）Rails 6のimplicit_order_columnはカスタマイズ可能、rubocop-rails 2.4.0リリース、Capistrano記事ほか

Kotlinの拡張機能で冗長な〇〇Utilsから脱却する

Rails: ビューでstrftimeを直書きするのはたぶんよくない（翻訳）

週刊Railsウォッチ（20191119後編）メソッド参照演算子が廃止、GitHub新機能続々、平成Ruby会議、GitHub OAuthバイパスほか

Rails 6の新しいデフォルト設定と安全な移行方法を詳しく解説（翻訳）

電子書籍でよく耳にする「EPUB」っていったい何者？なんて読むの？非エンジニアが簡単にまとめてみた

正規表現: 元号の漢数字「〇一二三四五六七八九十」にマッチさせる

[Windows] PowerShellで環境変数を取得する方法

python-oscを使ってみる：前編

Web開発環境をMacBook ProからWindows機に移行してみた話

Rails: ViewComponent の call と erb_template と html.erb を適切に使い分ける（翻訳）

Rubyのbundlerを劇的に高速化するShopifyの取り組み（翻訳）

Ruby の'include?'より Rails の'in?`の方が読みやすい（翻訳）

Rails の try メソッドと Ruby のぼっち演算子 '&.' の違いを理解する（翻訳）

Claude Code Agent Teamsをうまく働かせるコツ（参考プロンプト付き）: 2026/03版

関連記事

Basic認証をかけているRailsサイトにResqueをマウントする

CakePHPで簡単Basic認証

CONTACT