ExcelマクロVBAサンプル集
WEBデータの取得方法

ExcelマクロVBAの実用サンプル、エクセルVBA集と解説
最終更新日:2019-10-25

WEBデータの取得方法


WEBページのデータを取得して、エクセルのデータとして取り込みたいとの要望が多いようです。


マクロVBAでWEBページのデータを取得する方法はいろいろあります。
QueryTables
InternetExplorer
MSHTML
MSXML2

順番に、以下で説明します。

サンプルページ

まず、サンプルページとして、ヤフーファイナンスの、以下のページを使います。

vba マクロ webページ取得

http://info.finance.yahoo.co.jp/ranking/?kd=1&mk=1&tm=d&vl=a
このページの一覧表の部分をエクセルに取り込みます。
このページは、ランキングですので、複数ページあります。
上のURLは、最初のページです。
では2ページ目はと言うと、
http://info.finance.yahoo.co.jp/ranking/?kd=1&tm=d&vl=a&mk=1&p=2
このようなURLになります。
この場合、最期のp=2がページ数になっています。
これを変更すれば、各ページが取得できます。
p=1なら、最初のページも取得可能です。
従って、以降のマクロでは
http://info.finance.yahoo.co.jp/ranking/?kd=1&tm=d&vl=a&mk=1&p=1
として取得しています。
この数値を順次変更して取得すれば、複数ページの取得も可能です。

ただし、このページは近年アクセス方法に制限が書けられています。
そこで、制限のない当サイトの祝日一覧のページもサンプルとして使います。

QueryTables

まずは、
エクセル本来の機能で、Webクエリです。



Sub sample1()
  With ActiveSheet.QueryTables.Add(Connection:= _
    "URL;http://info.finance.yahoo.co.jp/ranking/?kd=1&tm=d&vl=a&mk=1&p=1", _
    Destination:=Range("$A$1"))
    .Name = "?kd=1&tm=d&vl=a&mk=1&p=1"
    .FieldNames = True
    .RowNumbers = False
    .FillAdjacentFormulas = False
    .PreserveFormatting = True
    .RefreshOnFileOpen = False
    .BackgroundQuery = True
    .RefreshStyle = xlInsertDeleteCells
    .SavePassword = False
    .SaveData = True
    .AdjustColumnWidth = True
    .RefreshPeriod = 0
    .WebSelectionType = xlAllTables
    .WebFormatting = xlWebFormattingNone
    .WebPreFormattedTextToColumns = True
    .WebConsecutiveDelimitersAsOne = True
    .WebSingleBlockTextImport = False
    .WebDisableDateRecognition = False
    .WebDisableRedirections = False
    .Refresh BackgroundQuery:=False
  End With
End Sub

太字のxlAllTablesの指定で、tableのみ取得しています。
これで済む場合は、これが最も簡単です。
マクロの記録を使えば、そのまま使えます。
上記も、マクロの記録のままです。

InternetExplorer

次は、
InternetExplorerを、VBAから操作します。

Sub sample2()
  Dim i As Long
  Dim j As Long
  
  Dim objITEM As Object
  Dim objIE As New InternetExplorer
  objIE.Visible = False
  
  objIE.Navigate "http://info.finance.yahoo.co.jp/ranking/?kd=1&tm=d&vl=a&mk=1&p=1"
  Call untilReady(objIE)
  
  Range("A1").CurrentRegion.Offset(1, 0).ClearContents
  i = 2
  j = 1
  For Each objITEM In objIE.Document.getElementsByTagName("td")
    Cells(i, j) = objITEM.innerText
    j = j + 1
    If j > 10 Then
      j = 1
      i = i + 1
    End If
  Next
  objIE.Quit
  Set objITEM = Nothing
  Set objIE = Nothing
End Sub

Sub untilReady(objIE As Object, Optional ByVal WaitTime As Integer = 10)
  Dim starttime As Date
  starttime = Now()
  Do While objIE.Busy = True Or objIE.ReadyState <> READYSTATE_COMPLETE
    DoEvents
    If Now() > DateAdd("S", WaitTime, starttime) Then
      Exit Do
    End If
  Loop
  DoEvents
End Sub
※「Microsoft Internet Control」を参照設定して下さい。

問題は、HTMLを取得後の解析になります。
For Each objITEM In objIE.Document.getElementsByTagName("td")
Tableのtrの中のtdで、必要なデータのみ取得しています。
これについては、VBAの知識ではなく、HTMLの知識が必要になります。
Table、tr、td等が分からない場合は、HTMLの勉強をして頂く必要があります。
ここでは、HTMLの解説は省略します。

※注意
untilReady内のループでは、本来なら、Sleepさせた方が良いのですが、
APIの使用になるので、ここでは省略しています。
Declare Sub Sleep Lib "kernel32" (ByVal dwMilliseconds As Long)
を先頭に記述し、
ループ内で、適宜、
Sleep 100
程度を入れておくと良いでしょう。

MSHTML

さらに、
MSHTML.HTMLDocumentを使った方法です。



Sub sample3()
  Dim i As Long
  Dim j As Long
  Dim objXML As New MSHTML.HTMLDocument
  Dim htmlDoc As New MSHTML.HTMLDocument
  Dim objITEM As Object

  Set htmlDoc = objXML.createDocumentFromUrl("https://excel-ubara.com/EXCEL/EXCEL910.html", vbNullString)
  Call untilReady(htmlDoc)

  Range("A1").CurrentRegion.Offset(1, 0).ClearContents
  i = 2
  j = 1
  For Each objITEM In htmlDoc.getElementsByTagName("td")
    Cells(i, j) = objITEM.innerText
    j = j + 1
    If j > 3 Then
      j = 1
      i = i + 1
    End If
  Next

  Set objITEM = Nothing
  Set htmlDoc = Nothing
  Set objXML = Nothing
End Sub
Sub untilReady(htmlDoc As MSHTML.HTMLDocument, Optional ByVal WaitTime As Integer = 10)
  Dim starttime As Date
  starttime = Now()
  Do Until htmlDoc.ReadyState = "complete"
    DoEvents
    If Now() > DateAdd("S", WaitTime, starttime) Then
      Exit Do
    End If
  Loop
  DoEvents
End Sub
※「Microsoft HTML Object Library」を参照設定して下さい。

先のヤフーファイナンスでは、この方法ではアクセスできなくなっています。
以前は、この方法でも取得できたのですが、近年はいろいろ制限のあるページが増えてきたようです。
そこで、当サイトの祝日一覧のページを取得するようにしています。

InternetExplorerの部分がMSHTML.HTMLDocumentになった程度で、
後は、ほとんど同じです。

MSXML2

さらに、
MSXML2.XMLHTTPを使った場合です。

Sub sample4()
  Dim i As Long
  Dim j As Long
  Dim objXML As New MSXML2.XMLHTTP
  Dim htmlDoc As Object
  Set htmlDoc = New MSHTML.HTMLDocument
  Dim objITEM As Object

  With objXML
    .Open "GET", "https://excel-ubara.com/EXCEL/EXCEL910.html", False
    .send (Null)
    htmlDoc.write .responseText
  End With
 
  Range("A1").CurrentRegion.Offset(1, 0).ClearContents
  i = 2
  j = 1
  For Each objITEM In htmlDoc.getElementsByTagName("td")
    Cells(i, j) = objITEM.innerText
    j = j + 1
    If j > 3 Then
      j = 1
      i = i + 1
    End If
  Next

  Set objITEM = Nothing
  Set htmlDoc = Nothing
  Set objXML = Nothing
End Sub
※「Microsoft XML, v3.0」(v3.0以上を指定して下さい)を参照設定して下さい。

サンプルとして書いてみましたが、HTMLの解析ができないので、
結局、MSHTML.HTMLDocumentを使う事になってしまいました。
また、
Dim htmlDoc As New MSHTML.HTMLDocument
としたのでは、
htmlDoc.writeでエラーになってしまいますので、ちょっと面倒です。
結果的には、MSHTML.HTMLDocumentの方で良いのではないかという気がします。

WEBデータの取得方法の最後に

番外編としては、Seleniumを使う方法もあります。
VBAのスクレイピングを簡単楽にしてくれるSelenium
VBAでWebスクレイピングする方法としてIE自動操作がありますが、VBA記述が結構面倒になります、もっと簡単にスマートにVBAを書きたいと思ったら…SeleniumBasicを使ってみましょう。SeleniumBasicは、エクセルVBAでのWeb閲覧を自動化することを強力かつ簡単に実現してくれます。
VBA+SeleniumBasicで検索順位チェッカー作成
VBAでSeleniumBasicを使って検索順位チェッカーを作ってみます。SEO対策として各キーワードでの検索順位チェックは欠かせませんが、簡単に使えてキーワードを大量に指定できる良いツールがなかなかありません。Google検索をスクレイピングすることは、Google利用規約に反する可能性があります。
VBA+SeleniumBasicで検索順位チェッカー(改)
VBAでSeleniumBasicを使って検索順位チェッカーを作り、Google検索順位の履歴を管理します、既に作成解説した、VBA+SeleniumBasicで検索順位チェッカー作成こちらの改訂版になります。Google検索をスクレイピングすることは、Google利用規約に反する可能性があります。

いずれの方法にしても、
最初のWebクエリ以外では、HTMLの知識が必要になります。
ここが書けない場合は、Webクエリでシートに貼り付けた後で、
シート内のデータを解析して、必要なデータだけに編集する等が良いでしょう。



同じテーマ「マクロVBAサンプル集」の記事

ストップウォッチ(1/100秒)(Timer)
ストップウォッチ改(1/100秒)(Timer)
重複の無いユニークなデータ作成
WEBデータの取得方法
右クリックメニューの変更(CommandBars)
エクセルのアイコン取得(FaceID)
素数を求めるマクロ
入力規則のリスト入力を確認する
配色を使用したカラー設定を固定カラーに再設定
指定セルに名前定義されているか判定する
Excel2003(xls)を2007以降(xlsx,xlsm)に変換する(HasVBProject)


新着記事NEW ・・・新着記事一覧を見る

VBAでのCSVの扱い方まとめ|VBAサンプル集(11月9日)
VBAにおける変数のメモリアドレスについて|VBA技術解説(11月8日)
空文字列の扱い方と処理速度について(""とvbNullString)|VBA技術解説(1月7日)
Errオブジェクトとユーザー定義エラー|VBA入門(11月5日)
シングルクォートの削除とコピー(PrefixCharacter)|VBA技術解説(11月4日)
ユーザー定義型の制限とクラスとの使い分け|VBA技術解説(11月3日)
クリップボードに2次元配列を作成してシートに貼り付ける|VBA技術解説(11月1日)
VBAクラスを使ったイベント作成(Event,RaiseEvent,WithEvents)|VBA技術解説(10月31日)
VBAクラスのAttributeについて(既定メンバーとFor Each)|VBA技術解説(10月19日)
VBAの用語について:ステートメントとは|VBA技術解説(10月16日)


アクセスランキング ・・・ ランキング一覧を見る

1.最終行の取得(End,Rows.Count)|VBA入門
2.セルのコピー&値の貼り付け(PasteSpecial)|VBA入門
3.RangeとCellsの使い方|ExcelマクロVBA入門
4.Range以外の指定方法(Cells,Rows,Columns)|VBA入門
5.変数宣言のDimとデータ型|ExcelマクロVBA入門
6.繰り返し処理(For Next)|ExcelマクロVBA入門
7.マクロって何?VBAって何?|ExcelマクロVBA入門
8.ひらがな⇔カタカナの変換|エクセル基本操作
9.空白セルを正しく判定する方法(IsEmpty,IsError,HasFormula)|VBA技術解説
10.セルに文字を入れるとは(Range,Value)|VBA入門



  • >
  • >
  • >
  • WEBデータの取得方法

  • このサイトがお役に立ちましたら「シェア」「Bookmark」をお願いいたします。


    記述には細心の注意をしたつもりですが、
    間違いやご指摘がありましたら、「お問い合わせ」からお知らせいただけると幸いです。
    なお、掲載のVBAコードは自己責任で使ってください。万一データ破損等の損害が発生しても責任は負いません。




    このサイトがお役に立ちましたら「シェア」「Bookmark」をお願いいたします。
    本文下部へ