2020年3月10日火曜日

webscraping by python

#web scraping by python

#bs4からBeautifulSoupを読み込む
from bs4 import BeautifulSoup


#他にurllib.requestを使うこともある
import urllib3

#urlの定義
url="https://myhome.nifty.com/"

# httpとrの定義をしている
#rを定義するためにhttp
http = urllib3.PoolManager()
r = http.request('GET', url)

#soupを定義している。
soup = BeautifulSoup(r.data, 'html.parser')

#soupの中のtitleをtitle_tagとして取り出している
title_tag = soup.title

#titleを定義している
title = title_tag.string


print(title_tag)
print(title)

0 件のコメント:

コメントを投稿