《易》曰“君子以自强不息”,又曰“君子以向晦而明”,余虽不敏,请事斯语。
    Technorati Profile
    buluzhai @ 2008-03-27 20:00

    歪酷要变成facebook,校内网吗,没创意。



     
    buluzhai @ 2008-03-27 19:58

    今天在网吧看到了分众的广告屏,江南春的触角又伸过来了,我在想下一次会在什么地方看到。




     
    buluzhai @ 2008-03-21 09:58

    REST提出了一些设计概念和准则:
    1. 网络上的所有事物都被抽象为资源(resource);
    2. 每个资源对应一个唯一的资源标识(resource identifier);
    3. 通过通用的连接器接口(generic connector interface)对资源进行操作;
    4. 对资源的各种操作不会改变资源标识;
    5. 所有的操作都是无状态的(stateless)。



     
    buluzhai @ 2008-03-21 09:30

    REST软件架构遵循了CRUD原则,该原则告诉我们对于资源(包括网络资源)只需要四种行为:创建(Create)、获取(Read)、更新(Update)和销毁(DELETE)就可以完成对其操作和处理了。其实世界万物都是遵循这一规律:生、变、见、灭。所以计算机世界也不例外。这个原则是源自于我们对于数据库表的数据操作:insert(生)、select(见)、update(变)和delete(灭),所以有时候CRUD也写作为RUDI,其中的I就是insert。这四个操作是一种原子操作,即一种无法再分的操作,通过它们可以构造复杂的操作过程,正如数学上四则运算是数字的最基本的运算一样。



     
    buluzhai @ 2008-03-21 09:16

    让我想想,大概是如下几块吧:

     -- 攫取(fetching):就是把被指向的网页下载下来。
     -- 数据库:保存攫取的网页信息,比如那些网页已经被攫取,什么时候被攫取的以及他们又有哪些链接的网页等等。
     -- 链接分析:对刚才数据库的信息进行分析,给每个网页加上一些权值(比如PageRank,WebRank什么的),以便对每个网页的重要性有所估计。不过,在我看来,索引那些网页标记(Anchor)里面的内容更为重要。(这也是为什么诸如Google Bombing如此高效的原因)
     -- 索引(Indexing): 就是对攫取的网页内容,以及链入链接,链接分析权值等信息进行索引以便迅速查询。
     -- 搜索(Searching): 就是通过一个索引进行查询然后按照网页排名显示。

    当然,为了让搜索引擎能够处理数以亿计的网页,以上的模块都应该是分布式的。也就是说,可以在多台机器上并行运行。

    摘自《Doug Cutting 访谈录



     
    buluzhai @ 2008-03-21 08:50

    最近了解了云计算,amazon 3s ,Hadoop,SSDS,地球正在变成一个大脑拉。变化太快了。
    这里有一个介绍SSDS的




     
    网志分类
    所有网志 (105)
    看看 (6)
    google (9)
    search (0)
    古人的经济学 (1)
    未分类 (89)
    最新的评论
    日历

    站内搜索
    友情链接
    · 我的歪酷 非非共享界 · 云水明奘 · 胡说 · 对牛乱弹琴 · steve yegge · 炎龍的筆記本 · 长东 · xerdoc · canonical · Raw

    订阅 RSS

    0012623

    歪酷博客