Why it doesn't work?

作業のメモ、記録をブログに残しています。

スクレイピング

Python requests.getで403

requests.getを実行するとステータスコードに403が設定されていました。

Python BeautifulSoup 不要なタグを削除

最近は、BeautifulSoupを使用してWEBサイトの更新情報を取得しています。 RSSをサポートしていないサイトが結構あるので自前で作成してみることにしました。 関連記事 Python BeautifulSoup4でパーサーとしてlxmlを指定するとエラーが発生する - Why it does…

Python BeautifulSoup4でパーサーとしてlxmlを指定するとエラーが発生する

PythonでWebwebスクレイピングに挑戦していますが、 BeautifulSoupを実行時に、パーサーとして"lxml"を指定すると下記エラーが発生しました。 bs4.FeatureNotFound: Couldn't find a tree builder with the features you requested: lxml. Do you need to in…