Archives for July 2009

关于聚类算法的一些资料

由于太广,聚类算法领域的文章层出不穷,却纷杂混乱,很难理清头绪。及时是jiawei Han大师写的那本data mining课本,对Cluster这一章的讲解也非常不明了。面对这种现状,Utah大学一个教授专门针对Clustering领域搞了一个Seminal,里面是Clustering算法按照分类关系归纳的各种各样的资料,教科书和paper,相当清晰,有搞这方面的朋友可以看看 另外,关于incremental clustreing的发展,包括incremental hierarchical clustering以及incremental non-hierarchical clustering,卡耐基梅隆这篇paper讲解得非常详细,也推荐一下。虽然它后半部分提出的算法都是基于text的特征来演绎公式的,比较specific,但前半部分的综述倒是很有价值。

无图了

没什么说的,我一直都是用Picasa存图,我实在没有精力去把所有的图转到别的地方然后还把所有链接改一遍,所以就这样吧,让红叉留在这里。 实在有些文章图很重要的,请自行用代理。 你说你都有发改委这种终极武器了,为啥还这么封闭呢。贵国经济增长喜人,社会一片安定和谐,国际交锋咄咄逼人,为啥就永远学不会大国心态呢? WTF PS: According to one of the remark by junxiu6, 使用这个很不错。可以翻墙。

发改委打飞机实在一流

2009年6月1日: 发改委发布调价通知,上涨油价。 法航飞机失踪,后证明失事,全机遇难 2009年6月30日: 发改委再次发布调价通知,上涨油价 也门飞机失事,全机遇难 2009年7月15日: 发改委就成品油价格问题发表说明,称价格未调整到位 伊朗飞机失事,全机遇难

配合eclim的Android纯命令行开发流程

在开发Android的程序员中,应该说使用Eclipse或者Netbean的是最多的。考虑到Google推出了一整套开发插件,让用户从项目到写代码到编译运行链接模拟器一气呵成,用Eclipse这样的IDE无可厚非。不过,总有一些用户不喜欢IDE,不想用类似于Eclipse的方式开发,他们的想法包括 任何编辑器都比不上vim/emacs 我电脑太慢,不想跑IDE 纯命令行形式,我就喜欢,每天打10000个命令我也喜欢,反正我选择,我喜欢 ^_^ 而本文,就是为这部分用户而写。其实对于Google这样的Linux气氛浓厚的公司,它本身提供的命令行工具就已经足够你脱离IDE了,就是编辑上,很多Eclipse优秀的功能都没有。但是,配合本文介绍的eclim,你会发现,你把Eclipse嵌进了vim中!现在,建立项目之后,从编辑源代码到编译到管理项目最后到安装程序到模拟器,所有任务都可以在一个vim里面完成,我们真正把vim当成了IDE!

买车记

先放一张玉照(角度不好,拍的时候太慌乱) 动机 其实很早就受够了没有车的郁闷了,Boulder是一个富人小城,然后还特别在意居民成分,为了限制人口数量和质量,不允许很多大型便宜超市进驻城内,比如沃尔玛啊,比如一系列亚洲超市。每次买菜都在附近的美国超市买,一年来,每天做菜的种类就那几样,都快吃腻了。没有饺子,没有汤圆,没有老干妈,没有木耳,没有面条,靠,除了肉,什么都没有了。对于我这种以吃为命的人来说,这无疑等于要杀了我。其实周末还是经常有有车的师兄会带着人去买的,不过首先我这人最讨厌的就是麻烦别人,其次还是发扬雷锋精神,尽量让师兄们多接触师妹而不是师弟,所以自己从来没有坐别人的车去过。

动态模型及其求解介绍—下

之前,我们大致介绍了解线性动态模型的前三种代表性方法,并画了这么一张图来表示他们之间的关系。这一篇文章中,会对最后一种方法,CRF进行一些介绍。建议看这一篇文章之前,至少先把最大熵模型复习一遍,方便理解两者的关系。然后看看动态模型及其求解介绍—番外篇,对示意图的表示有一个比较清晰的认识。

动态模型及其求解介绍–番外篇

上一篇文章(中篇)里面,我用的示意图是因子图,而里面也出现了Psi函数,本来应该当时就解释清楚的,但实在没有精力写那么多东西,所以就想放到下篇讲的。后来发现,讲条件随机场要结合有向无向图和independence graph,来推导模型,必须又花一些篇幅讲一下,这些都是基础背景,所以就一起推到这里来讲了。起名字还让我头疼,下已经被条件随机场预订了,这篇反正都是背景知识,所以就叫番外篇吧。建议看整个系列的时候先看这篇,理解中和下(预计一周后动笔)就好理解多了。 其实感觉我不大适合写很长的东西,目前所有的内容,我本来准备集中一篇文章搞定的,后来想分上下部,写到中途又决定分上中下,再到现在的番外……到目前为止,我觉得写个人博客的人里面,Pongba是最擅长写篇幅很长的经典文章的,好像这小子自从去macrohard之后,就没出过什么大手笔了。我是只要内容一多,写起来自己的觉得烦了,所以每次都拿一部分推到后面写。 好了废话不多说,开始吧。

动态模型及其求解介绍—中

在上一篇文章里面,我们提到了解线性动态模型的四种代表性方法,并画了这么一张图来表示他们之间的关系。这一篇文章中,我就针对他们的原理以及相互关系,来进行一些介绍。

动态模型及其求解介绍—上

动态模型的应用在移动计算中可谓日渐繁荣,不管是从传统领域转移过来的识别,智能控制等领域,还是新兴的情景信息利用,都需要对动态模型应用的掌握。正好下一个项目可能会用到通过动态模型做机器识别的算法,就在这里整理一下以前的课程和看的paper获得的知识。 这个上篇不会具体介绍算法,而是先大致介绍一下线性和非线性模型,然后从大方向上介绍一下解线性模型的一些常用方法。等下一次有一段连续空闲时间的时候,我准备将这几种常用方法的详细介绍和比较写成下篇。非线性模型解法的数学推导过于复杂,我也不用,就不准备说了。