采集wordpress

0

采集wordpress 目标网站:https://kinsta.com/knowledgebase/what-is-taxonomy/ 一、如何同时采集h2,h3,p标签? 使用下面的方法可以,不过如果使用get_text(),连p标签也去掉了。 from urllib.request import urlopen #获取请求打开网页的库 from bs4 import BeautifulSoup #获取解析网页的库 def get_detail(url): # artitl……