Skip to main content

Ctrl+K

CATLISM | Online Compendium

Ctrl+K

On scripts and tools
Using the online compendium
From the book
Setting up the working environment
- Using conda
Metadata evaluation
Data collection
- General purpose scrapers
- Social Media Platforms
  - Facebook
  - Instagram
  - Twitter
  - Youtube
Data processing
Data exploration
- OpenRefine
Data preservation
- Wayback Machine
- Git 101: the basics
Case-studies: CATLISM practical applications
Reading list
FAQs
Acknowledgments
Changelog
References

.md

General purpose scrapers

General purpose scrapers#

#LancsBox
Archivebox
Trafilatura
BeautifulSoup
- Extracting the data

previous

Data collection

next

#LancsBox

By Matteo Di Cristofaro

© Copyright 2023-2025, Matteo Di Cristofaro.

Built with Sphinx book theme