add by zhj: Nutch是一个开源的web搜索引擎,呵呵,它跟商业搜索引擎如Google,百度的技术差不多,原来自己一不小心就进入了商业搜索引擎的领域,之前还以为商业搜索引擎离自己非常遥远呢,今天我还要想Solr, Elasticsearch这些全文搜索引擎与Google,百度这些商业搜索引擎有什么区别,看了一些文章后知道了,原来主要差别就是Solr, Elasticsearch没有网络爬虫。我们可以近似的认为Nutch是在Solr, Elasticsearch的基础上加了网络爬虫功能。不过,我还是不明白搜索引擎与数据库查询到底有什么技术方面的区别,反正都是用的索引嘛,为何需要专门的搜索引擎呢?有时间还要好好研究一下