人,多面体,博客
Nov 17
小时候学画画,先画球体,正方体,圆柱体,圆锥体,然后就就是各种各样的多面体。多面体有很多面,每个面都有自己的特质,但是画他的时候只能看见他的一部分,一个完整的面和几个残缺的面。
人也是这样,有很多面,向着不同的方向,对着不同的人、事和时间。
Nov 17
小时候学画画,先画球体,正方体,圆柱体,圆锥体,然后就就是各种各样的多面体。多面体有很多面,每个面都有自己的特质,但是画他的时候只能看见他的一部分,一个完整的面和几个残缺的面。
人也是这样,有很多面,向着不同的方向,对着不同的人、事和时间。
Nov 15

好久好久自己都没有来过,别人也没有来过(Google analytics 数据)。
工作太忙了,自己太懒了,有好多好多想法想写下来,可是借口更多,没办法,让自己懒死吧……
Nov 09
好久没blog了,这些日子总是被莫名其妙的事情缠着,烦着。我被迫的解决了一件又一件曾经纠结我很久的问题。我发现被动的做决定实在不是什么上策,今后要努力做到早计划,早决定,早实施……
人总是会长大的,不知不觉,一步一步。回头看,幼稚,但不可笑。先前看,怕自己变得世俗。我渐渐的变成了从前认为的俗人,但是真的俗吗?
我不想也不是一个多愁善感的人,我要努力,只是努力……为了上海这个曾经令我魂牵梦绕的地方,为了妈妈爸爸的爱,为了承诺,为了脑子了对未来的破碎但晶莹的碎片,为了朋友们fb的据点…… 其实都是为了自己,为了自己活的心安理得,无怨无悔。
每天都要有新的思考,这是我给自己的目标。
Jun 07
互联网, 电子商务 blog, thisnext, 电子商务 1 Comment
thisnext.com 是一个国外很好的商品分享与推荐网站。
以上都是泛泛的说一下,真正的解剖图在这里。
thisnext已经做的很好,他的功能以及演变肯定都是经过深思熟虑的,我们根本没资格对他指指点点。所以我们能做的就是学习一下他的长处。
Apr 12
Oct 05
分享 blog, nutch, wiki, 企业, 搜索 No Comments
网上有好多的Nutch使用的文章,但其实只是几篇文章翻来覆去的拷贝而已!
很经典,讲了nutch与lucene 以及其他一些爬虫的比较。和建立一个抓取企业内部网(Intranet crawling)实例。但是可能是版本的问题。其中少了关键的一步。
这里是官方的那个文档,补全了少的那一步。
否则出现后果为
Fetcher: segment: info/segments/20061207221006
Fetcher: threads: 4
fetching http://student.ustb.edu.cn/
fetch of http://student.ustb.edu.cn/ failed with: java.lang.NullPointerException
Fetcher: do
看这个一可以解决问题
http://lucene.apache.org/nutch/tutorial8.html
讲了一些nutch全网crawl的东西,其实这些都可以在nutch的wiki里找到!就是那里是英文,不太舒服!这个文章挺不错得!
主要是说Cygwin的安装,Cygwin是个挺好的东西,建议大家即使不用Nutch也装一个,因为用bash确实很爽!
5。nutch中文分词
http://www.rxiao.com/blog/article.asp?id=138
基本上是和Nutch 初体验之二一样的内容。
7.试用nutch
http://hedong.3322.org/archives/000247.html
这个太老了,好像多不太适用了。
8。Nutch9.0 的lucene好像有问题,要重新编译,本人没有测试。
个人观点:结合我的项目这个东西不适合我。理由是:
nutch是一个完整的搜索引擎,但是它只是一个搜索引擎他可以订制的东西太少!例如加中文分词好像要改动源文件,这样做对以后的升级维护都是麻烦。