Python requestsで SSLError(SSLCertVerificationError)が発生する

Python Python3検証済みスクレイピング

requestsであるサイトにアクセスすると以下のようなエラーが発生しました。 HTTPSConnectionPool(host='www.xxx.jp', port=443): Max retries exceeded with url: /rss/feed.rss (Caused by SSLError(SSLCertVerificationError(1, '[SSL: CERTIFICATE_VERIFY…

2019-07-11

Python requests.getで403

Python スクレイピング

requests.getを実行するとステータスコードに403が設定されていました。

2019-04-04

Python BeautifulSoup 不要なタグを削除

Python スクレイピング

最近は、BeautifulSoupを使用してWEBサイトの更新情報を取得しています。 RSSをサポートしていないサイトが結構あるので自前で作成してみることにしました。関連記事 Python BeautifulSoup4でパーサーとしてlxmlを指定するとエラーが発生する - Why it does…

2018-08-24

Python BeautifulSoup4でパーサーとしてlxmlを指定するとエラーが発生する

Python スクレイピング

PythonでWebwebスクレイピングに挑戦していますが、 BeautifulSoupを実行時に、パーサーとして"lxml"を指定すると下記エラーが発生しました。 bs4.FeatureNotFound: Couldn't find a tree builder with the features you requested: lxml. Do you need to in…

Why it doesn't work?

作業のメモ、記録をブログに残しています。

スクレイピング

Python requestsで SSLError(SSLCertVerificationError)が発生する

Python requests.getで403

Python BeautifulSoup 不要なタグを削除

Python BeautifulSoup4でパーサーとしてlxmlを指定するとエラーが発生する