Webスクレイピングとは、インターネットからデータを機械的に集め、必要な情報を抽出する技術のことです。2019年の第2版発刊から約5年が経過し、生成AIの台頭で情報を得る方法も大きく変わりましたが、本当に欲しい情報を正しくピンポイントで得るためには、依然としてWebスクレイピングについての知識とスキルが必要です。本書では、インターネット上の膨大な情報の中から、生成AIや検索エンジンだけでは集められない本当に必要な正しい情報を入手する方法を、基礎からていねいに解説し、データの抽出、格納、収集後のクリーニング、さらにはJavaScriptの実行、OCRを含めた自然言語処理、並列処理などの高度なトピックもカバー。プログラミングテクニックとテクノロジー全般だけでなく、法律面の解説も加え、問題に遭遇した際の対処法まで紹介します。
PythonによるWebスクレイピング 第3版
Ryan Mitchell 著、嶋田 健志、新井 翔太 訳
![[cover photo]](https://www.oreilly.co.jp/books/images/picture_large978-4-8144-0122-2.jpeg)
- TOPICS
- Python
- 発行年月日
- 2025年06月17日 発売予定
- PRINT LENGTH
- 356 (予定)
- ISBN
- 978-4-8144-0122-2
- 原書
- Web Scraping with Python, 3rd Edition
- FORMAT