スクレイピング
requestsであるサイトにアクセスすると以下のようなエラーが発生しました。 HTTPSConnectionPool(host='www.xxx.jp', port=443): Max retries exceeded with url: /rss/feed.rss (Caused by SSLError(SSLCertVerificationError(1, '[SSL: CERTIFICATE_VERIFY…
requests.getを実行するとステータスコードに403が設定されていました。
最近は、BeautifulSoupを使用してWEBサイトの更新情報を取得しています。 RSSをサポートしていないサイトが結構あるので自前で作成してみることにしました。 関連記事 Python BeautifulSoup4でパーサーとしてlxmlを指定するとエラーが発生する - Why it does…
PythonでWebwebスクレイピングに挑戦していますが、 BeautifulSoupを実行時に、パーサーとして"lxml"を指定すると下記エラーが発生しました。 bs4.FeatureNotFound: Couldn't find a tree builder with the features you requested: lxml. Do you need to in…