(转)Nutch 0.8笔记–Google式的搜索引擎实现
星期四, 02月 21st, 2008Nutch是一个基于Lucene,类似Google的完整网络搜索引擎解决方案,基于Hadoop的分布式处理模型保证了系统的性能,类似Eclipse的插件机制保证了系统的可客户化,而且很容易集成到自己的应用之中。
Popularity: 19% [?]
阅读全文...建站相关文章,工具,技巧。
Nutch是一个基于Lucene,类似Google的完整网络搜索引擎解决方案,基于Hadoop的分布式处理模型保证了系统的性能,类似Eclipse的插件机制保证了系统的可客户化,而且很容易集成到自己的应用之中。
Popularity: 19% [?]
阅读全文...对于Heritrix和Nutch这两个比较出名的开源网络爬虫的比较。
Popularity: 27% [?]
阅读全文...