awesome-crawler-cn
github.com/liinnux/awesome-crawler-cn ↗互联网爬虫,蜘蛛,数据采集器,网页解析器的汇总,因新技术不断发展,新框架层出不穷,此文会不断更新...
335
GitHub Stars
74
Curated Resources
13
Categories
5 hours ago
Last Refreshed
PythonJavaC#JavaScriptPHPC++CRubyRErlangPerlGoScala
Use this list with your AI agent
Add the Context Awesome MCP server to Claude, Cursor, or any MCP client, then ask:
"Show me c# resources from awesome-crawler-cn"
Installation instructions →What's inside
C#
- Abot
具有很好效率和可扩展性的C#网络爬虫.
- ccrawler
一个简单的Web内容分类方案,它可以根据其内容分开网页,基于C#3.5.
- DotnetSpider
基于C#开发的一个轻量级,交叉平台的网络爬虫.
- Hawk
用 C#/WPF开发的网络爬虫,具有简单的ETL功能.
- SimpleCrawler
简单的多线程网络爬虫,基于REG表达式.
- SkyScraper
一个支持异步网络和有很好扩展性的网络爬虫.
Java
Go
Python
- brownant
一个轻量级的网络数据抽取框架.
- cola
一个分布式的爬虫框架.
- crawley
基于非阻塞通信(NIO)的python爬虫框架.
- Demiurge
基于PyQuery的微型爬虫框架.
- distribute_crawler
基于Scrapy内核采用redis, mongodb开发的分布式爬虫框架。
- django-dynamic-scraper
基于Scrapy内核由django Web框架开发的爬虫。
Ruby
Scala
PHP
- dom-crawler
易于抽取DOM文件的网络爬虫.
- Goutte
基于Laravel 5 的网络爬虫.
- laravel-goutte
基于Laravel 5 的网络爬虫.
- php-spider
一个基于PHP的高可扩展的网络爬虫.
- pspider
基于PHP的并发网络爬虫.
Erlang
- ebot
一个分布式,高可扩展的网络爬虫.
Showing a sample of 74 resources. View the full list on GitHub →