一直搞不清楚nutch中的depth是什么意思,就照着字面意思理解,认为是指html文件所在文件夹的相对于网站的深度。今天做了个小实验,证明并不是这样,下面来看看
先在Tomcat里面建一个示例网站Test,网站根目录下建四个网页index.html, a.thml, b.html, c.html.建一个文件夹1,内有1.html,在文件夹1中建文件夹2,建2.html。它们的链接关系:index.html中有a.html和1.html的链接,a.html中有b和c的链接,1.html中有2.html的链接。这个示例网站是按我原来的意思建的:第一层有四个文件,且包含了蜘蛛能访问到的链接,第二 ...
- 15:18
- 浏览 (1621)
- 评论 (2)
- 分类: lucene/nutch
- 进入论坛
有段时间没来这里了,有点想念:)。最近老感觉有些慌,毕竟是快毕业了,论文也还没写。也出去找过次工作,面试了两次没谈成,倒是自己觉得可以了所以请客吃饭把自己灌得七荤八素的。还有自己感觉和计算机专业出来的人相差很大,时刻督促自己要学习。有了这些,自然会有一些紧张的情绪左右自己。不知道这样的日子什么时候才能过去。
想想时间过得真快,弹指间来北京已经四个月。还记得刚到北京时对北京印象很差,北京站三句话问不出一个屁的警察(也许该说三拳头打不出一 ...
在tomcat5中发现了以前处理tomcat4的方法不能适用于处理直接通过url提交的请求,上网找资料终于发现了最完美的解决办法,不用每个地方都转换了,而且无论get,和post都正常。写了个文档,贴出来希望跟我有同样问题的人不再像我一样痛苦一次:-)
问题描述:
1 表单提交的数据,用request.getParameter(“xxx”)返回的字符串为乱码或者??
2 直接通过url如http://localhost/a.jsp?name=中国,这样的get请求在服务端用request. getParameter(“name”)时返回的是乱码;按tomcat4的做法设置Fil ...
- 浏览: 11027 次

- 详细资料
搜索本博客
我的相册
J2SE
共 1 张
共 1 张
最新评论
-
lucene中增量索引的方法!
仅是简单的将create参数设为false,操作不当可能造成索引重复。
-- by aya331 -
lucene中增量索引的方法!
-- by ckangtai -
lucene中增量索引的方法!
-- by baidongli -
SDK、JDK、JRE和JVM的 ...
和具体操作系统通讯的当然都是c了
-- by skyi -
一个比较偏的问题,java序 ...
javaeyes 写道做rome 解析RSS的时候发现一个奇怪的现象,先看代码 ...
-- by xin_wang






评论排行榜