Seleniumを使ってWebスクレイピングを行う方法について

Seleniumとは

Seleniumは、Webブラウザの操作を自動化するための仕組み(フレームワーク)です。
もともとは、ThoughtWorks社によってWebアプリのE2Eテストの目的で開発されましたが、現在ではテストの目的だけではなく、業務効率化のためにさまざまなシーンで利用されています。
自動操作の対象ブラウザ: Google Chrome, Mozilla Firefox, Microsoft Edge, Apple Safari, Opera
対応OS: Windows, MacOS, Linux

Seleniumでできる事

スクレイピング、クローリング

Web上の特定の定形情報を自動的に収集するスクレイピング、クローリングの用途で使用できます。スケジュールを設定して、毎日定時に最新情報を収集し蓄積していくこともできますので、常に最新の情報を収集する必要がある業務に有効です。

業務の自動化(RPA)

Web上のアプリケーションにおける定形業務の操作を自動化できます。伝票や日報など、まとまった大量データの入力において有効です。アプリケーションへのログイン処理も含めて自動化できるので、日頃の業務を完全に自動化することも可能です。

アプリケーションテスト

WebアプリケーションのE2Eテストに使用できます。反復的に行うテスト(リグレッションテスト)を自動化することにより、システム品質の担保に貢献します。

Seleniumの種類

SeleniumでWebの自動化を行う方法として、2つの選択肢があります。

1.Selenium IDE

お使いのブラウザの拡張機能としてSelenium IDEをインストールします。IDEでは、自動化手順を視覚的に記録できるため、使い始めの敷居が低いです。

2.Selenium WebDriver

プログラム言語とSelenium WebDriverを用いて、プログラミングによる自動化を行う方法です。IDEと比べて、プログラミングの知識が必要になるため難易度は高くなりますが、柔軟な自動化を実現できます。

Selenium IDEのインストール手順

ここでは、簡単にSeleniumを試してみるために、Selenium IDEをインストールします。

・chromeウェブストアから、拡張機能「Selenium IDE」を追加します。


Chromeウェブストアの「Selenium IDE」

・拡張機能から「Selenium IDE」を起動できます。


拡張機能から「Selenium IDE」を起動

SeleniumでWebスクレイピングを行う方法について

Webサイトから特定のテキストをスクレイピングする自動操作をSelenium IDEで記録する方法を、順を追って解説します。

  • 「Selenium IDE」を起動します。
  • 「Record a new test in a new project」をクリックして、プロジェクト名を入力します。
  • BASE URLの入力を求められるので、スクレイピング対象のWebページURLを入力します。ここではIPAの新着情報ページを対象とします。
    IPA 新着情報ページ: https://www.ipa.go.jp/news/index.html
  • 「Start Recording」ボタンを押すと、記録用のブラウザタブが立ち上がります。
  • 今回はWebページ上からテキストを取得するスクレイピングを行いたいので、取得対象のテキストを範囲選択して右クリックします。メニューから「Selenium IDE」→「Store」→「Text」を選択します。

テキストを取得するスクレイピングの設定
  • 「Enter the name of the variable」と値の名前を入力するよう求められるので、ここでは「新着情報」という名前にします。
  • ここまでで、「①目的のページを開く」「②対象のテキストを取得する」手順が記録されました。正しくデータを取得できたか確認するために、取得データをログ出力してみます。3つ目の操作を次のように設定します。
    Command: echo
    Target: ${新着情報}
    設定ができたら、再生ボタンを押して、自動処理を初めから実行してみます。
    「Log」欄に「新着情報」が出力(echo)されました。

出力結果

Selenium WebDriverによる柔軟なスクレイピング

Selenium IDEでは簡単に操作を記録することができますが、一覧から表データとして取得するような柔軟な取得が行えません。また、取得したデータをファイル保存することもSelenium IDEだけでは実現できません。
Selenium IDEで記録した自動操作は、PythonやRuby向けのプログラムとしてエクスポートできます。これがSelenium WebDriverを使った自動化プラグラムの元となり、ファイル保存などの処理を書き加えることで柔軟な自動化を作り込むことができます。

Webスクレイピングをお考えなら『クラウドBOT』をお試しください

クラウドBOTはブラウザ操作を自動化できるクラウド型のRPAサービスです。完全クラウド型のため、環境構築も必要なく、手軽にブラウザ操作を自動化できます。定期的なWebスクレイピングも実現できますので、ご活用下さい。


クラウド型RPAについてもっと詳しく


  1. クラウド型RPAを低価格で導入!そもそもRPAとは?導入ニーズが高まった背景 無料体験も実施!活用事例も参考に
  2. クラウド型RPAを導入するメリットとは?専門知識がなくても簡単に活用できるのが魅力
  3. クラウド型RPAツールを無料体験!代表的なRPA製品「オンプレミス型」と「クラウド型」について
  4. クラウド型RPAツールの導入事例をご紹介!RPAツールの選定ポイント 使い方簡単で格安
  5. iPaaS製品の必要性 iPaaSとの連携が可能なクラウド型RPA『クラウドBOT』 無料プランから利用可能!初めての方は事例を参考に
  6. iPaaS製品とRPAツールの違い 日本でも普及が広がる!iPaaSを導入するメリット
  7. SaaSを連携させてワークフローの自動化・効率化を実現!クラウドサービス「SaaS」の連携手段とクラウド型のRPAツールを利用した連携
  8. SaaSの連携に有用な2製品「iPaaS」と「クラウド型RPA」とは SaaSの連携なら各APIに対応可能◎活用事例も多い『クラウドBOT』の導入を
  9. webブラウザ操作の自動化なら『クラウドBOT』 RPAツールで自動化・効率化できる業務 データ抽出を効率化するなら
  10. webブラウザ操作の自動化ならプログラミング不要で更新も手間いらずの『クラウドBOT』 自動化できる操作をご紹介
  11. ブラウザ操作を自動化する『クラウドBOT』は、日常的に行っているブラウザ操作をノーコードで自動化する事ができます
  12. ブラウザを自動操作する方法 - 『クラウドBOT』を使用して、ブラウザを自動操作する方法を解説します。
  13. Google Chromeのを自動操作するならインストール不要・プログラミング不要で自動操作を実化できる『クラウドBOT』がおすすめ
  14. 初心者でも簡単に使えるおすすめのRPAツール3選 | RPAの選定ポイントについても解説
  15. ブラウザのスクリーンショット撮影を自動化する方法をご紹介
  16. Seleniumを使ってWebスクレイピングを行う方法について
  17. Web上の業務を効率化できるツールをご紹介 | iPaaS、RPAの違いとは
  18. 総務におすすめRPA活用事例をご紹介 | クラウド型RPA活用事例
  19. ブラウザ上で行っている業務を効率化できるおすすめツール3選
  20. PuppeteerとNode.jsを使用してブラウザ操作を自動化する方法
  21. Selenium×pythonでWebスクレイピングを実現する方法(ソースコード付き) | Seleniumとpythonの環境構築と実行手順も解説
  22. クラウド型RPAを用いたカートシステムとWMSのデータ連携事例をご紹介 | ローコストで始める受注データの連携、出荷データの連携
  23. Chromeの拡張機能を使用してWebページのスクリーンショット撮影する方法
  24. Playwrightを使用して、Webページのスクリーンショット撮影を行う
  25. 無料で使えるおすすめのRPAをご紹介 | 無料RPAのメリット・デメリットや選定基準も解説
  26. APIがないWebシステムとデータ連携する方法
  27. Puppeteerを使用してテストを自動化する方法
  28. 簡単にできる!Webサイト画像の一括ダウンロードガイド
  29. 税理士・会計士におすすめ!RPA活用事例 RPAを使って業務効率改善を
  30. RPAとAIの組み合わせ事例をご紹介 | RPA、AIのそれぞれの特徴と組み合わせで実現できる自動化について解説
  31. playwrightを使用してブラウザのテストを自動化する方法について