《163滚动新闻采集器》

该日志由 samool 发表于 2007-09-17 2:32 PM

功能简介:
自动采集新闻标题,网站URL地址,新闻详细内容,新闻description部分自动过滤HTML代码,自动采集完整的新闻详细内容。
定时采集,自动过滤重复的新闻,导出RSS XML文件,
日志管理,数据支持ACC数据库和MSSQL数据库(也可以用于其它网站的导入功能)

» 阅读该日志全文...

该日志标签: 163, 新闻, 采集器, sablog

我也写了一个“网易163新闻采集器”

该日志由 samool 发表于 2007-09-13 1:02 AM

前两天测试采集器,一共采集了近4000篇新闻,来回导入测试大概9000篇,大家可以看看这个篇文章的编号,快要到10000了吧,

上星期六晚上最初只想搞一个收集一些最新新闻,可以换点IP流量,在网上找了很久,有不少的采集器,以前有“百度小偷”、“天空小偷”类似的程序,所以想找一个可以采集最新新闻的工具。百度Google的很久,下了几款工具来测试,都不是很满意,要么是软件要收费,要么是功能不怎么样的,居然弄到3点过,然后郁闷地去睡觉了,第二天早上(10点过才起床)起来马上开工,自己搞个吧,于是乎“网易163新闻采集器”就这样产生了,为什么没有取名为“163新闻小偷”呢,因为我讨厌现实中“小偷”,听起来很不爽,所以直接取名“采集器”

» 阅读该日志全文...

该日志标签: 网易, 163, 新闻, 采集器