人,多面体,博客

No Comments

51Qc6rd8gVL._AA500_

小时候学画画,先画球体,正方体,圆柱体,圆锥体,然后就就是各种各样的多面体。多面体有很多面,每个面都有自己的特质,但是画他的时候只能看见他的一部分,一个完整的面和几个残缺的面。

人也是这样,有很多面,向着不同的方向,对着不同的人、事和时间。

More

长草了,长草了……

No Comments

未命名导出

好久好久自己都没有来过,别人也没有来过(Google analytics 数据)。

工作太忙了,自己太懒了,有好多好多想法想写下来,可是借口更多,没办法,让自己懒死吧……

More

每天都要有新的思考

2 Comments

好久没blog了,这些日子总是被莫名其妙的事情缠着,烦着。我被迫的解决了一件又一件曾经纠结我很久的问题。我发现被动的做决定实在不是什么上策,今后要努力做到早计划,早决定,早实施……

人总是会长大的,不知不觉,一步一步。回头看,幼稚,但不可笑。先前看,怕自己变得世俗。我渐渐的变成了从前认为的俗人,但是真的俗吗?

我不想也不是一个多愁善感的人,我要努力,只是努力……为了上海这个曾经令我魂牵梦绕的地方,为了妈妈爸爸的爱,为了承诺,为了脑子了对未来的破碎但晶莹的碎片,为了朋友们fb的据点…… 其实都是为了自己,为了自己活的心安理得,无怨无悔。

每天都要有新的思考,这是我给自己的目标。

解剖 thisnext.com

1 Comment

thisnext.com 是一个国外很好的商品分享与推荐网站。

  • 网站的所有商品都是用户手工推荐的,所以商品多数以一些创意新奇的东西。
  • 网站的网站联盟的模式(类似返利的模式)很有特点,以前的文章里面说过这个东西。
  • 最新的一次改版加强了人与人的关系,能够在个人首页上显示好友的最新推荐。
  • 有丰富的Blog工具。

以上都是泛泛的说一下,真正的解剖图在这里。

ThisNext.com大图

thisnext已经做的很好,他的功能以及演变肯定都是经过深思熟虑的,我们根本没资格对他指指点点。所以我们能做的就是学习一下他的长处。

关于Blog里的废话

No Comments

  1. 自己觉得我的blog里面似乎有很多废话,一句话能说明白的,偏偏用多余一句话。
  2. 写废话是一件非常不好的事情,不仅浪费了自己的时间,更浪费了别人的时间。
  3. 废话多的原因应该是结构问题:写blog之前没有想好到底要写什么,想到那里写到那里。所以瞬间的思考中的对话就写了出来,成了废话。
  4. 拒绝废话的方法很多,比如,想好了都要些什么东西以后在写,但这样写blog的人(我)很累。
  5. 有一个好方法就是传说中的“刘韧 体”(一种用列表代替段落的高深书法)。写的人轻松,看得人更爽。

ps:我是刘韧 的粉丝,我不怕别人说我“跟人学长白毛

Hello Worlld

No Comments

曾经就是想有一个自己的blog写一些自己觉得值得写的东西。但是好事多磨,曾经写过无数个,没有一个坚持下来的。

我发誓:“这是我的最后一个blog。”

Nutch使用汇总

No Comments

网上有好多的Nutch使用的文章,但其实只是几篇文章翻来覆去的拷贝而已!

1.Nutch 初体验

很经典,讲了nutch与lucene 以及其他一些爬虫的比较。和建立一个抓取企业内部网(Intranet crawling)实例。但是可能是版本的问题。其中少了关键的一步。

2.Tutorial (0.8.x) 

这里是官方的那个文档,补全了少的那一步。

否则出现后果为
Fetcher: segment: info/segments/20061207221006
Fetcher: threads: 4
fetching http://student.ustb.edu.cn/
fetch of http://student.ustb.edu.cn/ failed with: java.lang.NullPointerException
Fetcher: do

看这个一可以解决问题

http://lucene.apache.org/nutch/tutorial8.html

3。Nutch 初体验之二

讲了一些nutch全网crawl的东西,其实这些都可以在nutch的wiki里找到!就是那里是英文,不太舒服!这个文章挺不错得!

4。NutchWindows中安装之细解

主要是说Cygwin的安装,Cygwin是个挺好的东西,建议大家即使不用Nutch也装一个,因为用bash确实很爽!

5。nutch中文分词

http://www.rxiao.com/blog/article.asp?id=138

6。Nutch 使用之锋芒初试

基本上是和Nutch 初体验之二一样的内容。

7.试用nutch

http://hedong.3322.org/archives/000247.html

这个太老了,好像多不太适用了。

8。Nutch9.0 的lucene好像有问题,要重新编译,本人没有测试。

个人观点:结合我的项目这个东西不适合我。理由是:

nutch是一个完整的搜索引擎,但是它只是一个搜索引擎他可以订制的东西太少!例如加中文分词好像要改动源文件,这样做对以后的升级维护都是麻烦。