8千克

January 14, 2010

2009年小结,顺带push个豆瓣的数据

Filed under: 未分类 — admin @ 11:29 am

09年一直在忙,有时候想想都不知道在忙什么。

压力不小,各种麻烦也很多,当然还有很多看不见的麻烦。

关于数据统计分析这块,除了豆瓣,还有淘宝等等都可以纳入考虑的范围,但是时间太少。

如果可以有一个月或者两个月完整的时间,那么完成的东西会更加的详尽些。

下面是09年豆瓣的用户总数变化。

09年豆瓣的走势是有点匪夷所思,有好有坏,或许应该要感谢腾讯。

06年,07年和08年的数据有些不全,再补充个05年的。

September 11, 2009

the InterfaceError when moin joined redmine

Filed under: Uncategorized — admin @ 12:57 am

我们的tracker系统是redmine。但redmine自带的wiki非常恼人,所以,我们最近上的wiki是python开发的Moinmoin.

为了把moinmoin和redmine桥接起来,需要为moinmoin写一个插件。

虽然wiki可以在某个功能完成后,再进行整理。我的一个想法是,功能产生的任务,是从wiki的内容描述中产生的。

但wiki不容易用作这些动态关系型的管理;而同样,redmine此类的项目管理软件,则在可视性上欠缺很多。

btw,此处并不是对两个软件评头论足,只是,因为,自己是个懒人,懒人就会有自己的偷懒方法,更何况,负责开发的哥们们,更是懒人,易事贴只是拿来装饰的,俗话说好记性不如烂笔头,coder有时候不好的毛病就在于,推卸责任,因为任务上没有说清楚,比如此类的理由。大家都是懒人,但责任这事情,就不用推来推去了,把事情做好才是最终的目的,PD的描述要被查看过,PD自己也要反复的修正,Coder也要多做笔记、备忘录。

不过,种种原因,需要把这些分散的资源整合起来。插件的名字就叫做task,用来跟踪和批量发布任务到redmine上。

不过遭遇了一个比较头大的问题,就是InterfaceError的异常。

如果哪位朋友也在写moinmoin的plugin,以及使用了MySQLdb这个库来连接MySQL,并且遭遇InterfaceError的异常,以下或许有帮助。

1,把MySQLdb.connetction 写到execute这个函数内,而不能写在函数外

2,如果运行execute时,还有其它函数调用相关的cursor、connetcion,把这两个对象,global 声明一下。

demo效果图在这里,看起来还蛮酷的

(more…)

September 3, 2009

豆瓣前2W用户的数据统计分析-简况

Filed under: Uncategorized — admin @ 12:21 am

最近抽空,在Lab Day中,改了以前的GSM程序留下来的bug,并做了个应用。Sign,真是一个不务正业的产品策划……

相信大家对豆瓣都比较感兴趣,那个GSM的应用是一个跟时光机有关的,所以,我的兴趣就来了,我们坐着时光机,回到过去看看,豆瓣是怎么发芽开花的?

下面先简单介绍下收集到的数据,(前2W用户只是号称,实际上,简况里的数据是1.8W的样子。)

1,第一张图是从2005-3-2到2005-8-27为止的(X轴),每天增加的用户人数(Y轴)。

2,第二张图则是第一张图的汇总,Y轴是当前天为止的总用户人数。

显而易见,豆瓣的发展在数据上呈现出了比较明显的里程碑时期。

注:简况中的这两张图中,用到的活跃用户的概念,其界定的阀值非常简易,那就是用没有给自己设过头像。

?

douban-2w-1

?

douban-2w-2

?

@@@@@@@@@@@

两张图只是一个小预告,1.8W的数据也太少。所以接下来可能要写的东西有。

1,豆瓣发展的里程碑事件的推演,这个对大家在理解流行点上,可能会有帮助,当然,这里面,数据只是占了一部分比重而已。

2,前10w用户(全样本集)的数据详细分析,这就包括了注册情况、活跃度、产品使用程度等多种参数分析了。

3,豆瓣从开始到现在的,所有的数据趋势。这个估计同2会比较像,但是它取的数据将不是全样本集,而是会取800w中的4w的样子。

4,八卦性质的参数分析。特别是豆瓣最近的读书API在腾讯登陆后,用户量激增。估计可以弄出一个非主流参数的建议模型来……还有比如阿北(或其他程序员),手动更改了一些数据的痕迹……比如头像更改次数最多的人是谁…….etc

5,注意上图2中,红线、蓝线的斜率差别很大,这说明进入的增长率要高于(其实是远高于,因为简况用到的活跃阀值很低)留驻的增长率。而这个是一种普遍现象,手头也有其它的几个数据可以辅助说明。简单的说,就是人们习惯于一时兴起,而已。关于这点,特别想展开说明一下。关于这点,确实是自己对互联网一些事物、概念,产生悲观、抵制(有时真的是理智……)的潜意识的重要因素。

August 26, 2009

面试还是很重要的

Filed under: Uncategorized — admin @ 12:22 pm

就跟标题一般,很平实,很简单的道理。但经常会被忽略掉。

最开始的时候,对招聘的事情,觉得好玩。从招聘文书,到招聘海报(这个犯过错误,打出来的字太小)。在招聘会上,看到娃哈哈等大牌的人潮涌动,到自己前面冷清的很,遇到过奇怪的研究生,遇到过奇怪的本科生。有没有被别人当做奇怪的招聘人员,这就不清楚了。也只有站在过两种对立的角色,才会愈发清楚,这些过程是怎么运作的,要注意些什么。

如果写一个list,上书,简历要如何写,面试要如何装扮。它的意义并不太大,就好像list中如果告诉你,要穿正装,呃,如果你并不喜欢正装,如果要去的公司也并不喜欢正装,不就是弄巧成拙了么。但是,如果简历中只写自己的名字,学校,跟石头一般,还期望有个list帮助自己,这叫做妄想;如果面试时候,约定的时间到了,因为昨晚太happy结果还在迷糊的睡觉,或者一副邋遢,还期望有个list帮助自己,这也叫做妄想。list只有两种,一种是实践过属于自己的,第二种则是,你压根不需要list(对于极少数的牛人,确实如此)。

但自己要严重的反省,在招人的过程中,犯了一个致命的错误,那就是,面试还是很重要的

现在这个队伍里,我招进来(过)的人,有7个了。

这7人当中,有4人,都是面试的过程中,感觉不怎么样,但看看作品,都还不错。那就试试。结果就是,这4位同学都是问题。

1号,底子不好,但是自我感觉不错,没文化是最大的一个问题。后来,找到“更好”的工作,走了。(应届生)

2号,底子不错,但好像还处在大学时候去上课报点的状态,工作时候无所事事,比较被动。一个月不到,(赶)走了。(应届生)

3号,底子不错,可惜对互联网的界面设计没有什么感觉,做一件事情反复问,凡是涉及要考虑用户怎么用的场景,完全无能;但也很有自信,告诉她要多思考,多想一点,效果不理想,因为,她觉得自己一直在思考。还在,到现在为止,都不知道如何“培训”她,给她安排任务,但人不错,“尽职”,就是做出来的东西很不理想。(应届生)

4号,底子不错,严于待人,宽于待己,非常自我中心。你不能说她的东西不好,要说出理由,要说出她能接受的理由。后来,发生一次严重的抄袭事件。再接着,走了。(应届生)

另外3个。则是面试的过程中感觉也很不错。

5号,底子很好,上进好学,交给他的事情,比较放心。就是感觉少了些什么,说不清。(应届生)

6号,底子不好(非设计专业出身,这个是没有办法的),上进好学,但很遗憾,没有留住她,自己跑去学画画,半年多后,在某家公司,做纯的设计师。(非应届生)

7号,底子不错,上进,略显急躁,(当面)不太容易接受别人的意见。还在考察中。应该会有不错发展潜力。(应届生)

1-4号,都令自己头大的很。其实一针见血的问,既然看作品就可以了,那还要面试干什么呢?

5-7号,也不都是完美的。但是哪有完美的人呢?他们就可以成为伙伴。

是呀。面试的重要性,是看对方与我们的队伍合不合。每招一个人进来的成本都非常的高,工资是一个硬性的成本,软性的成本就更高了。现在,谨慎了很多,面试感觉不可以的,那就算了,不耽误你了。队伍,它从某种角度也是一个拟人化的产物,因为队伍当中的一些人,或者某个人,它也会有自己独特的优点,也会有自己糟糕的缺点。

不管你信不信一个人的天性,对多数人而言,到了20多岁的时候,就已经很难去评判好与不好了,“感觉不可以”只是一种不合适的表现。

招人是一件重要的事情,其中,却犯了这么多的错误。却还得坚持下去继续犯别的、普通的错误。

但咖啡还会有的,水果还会有的,奶茶也还会有的。

产生错误,通常是双方的,而我们现在要按照自己的节奏行走,所以,错误只能是对方的。

等我们走过了一个又一个里程碑的时候,自己的错误也改得差不多了,能否发现别人错误的几率,也会越来越小。

所以,还要努力。朋友们。

August 19, 2009

云计算:如果云端失控

Filed under: 散思, 趋势 — admin @ 12:20 am

将近一年没有在这个博客上写新东西。先说些题外话。

这一年的时间里,发生的事情不算少。目前生活的意义在于积累。最近愈发觉得,它们需要重新梳理一下,也愈发觉得,要同人们分享自己的成功与失败,尝试与放弃。

日省三身。这并不是一件容易的事情。但愈往这个方向努力。影响自己非常大的一个人文学家,是蒙田米歇尔,加上各种要素对自己的综合作用,内省主义最终产生虚无主义或者犬儒性质的想法,都也是正常的。而在这个过程中,一切源自于积累。

昨天晚上,临睡的时候,自己跟自己说了一些话。然后莫名的想法,就让人觉到一丝快乐。

今天,在Evernot上写给自己:夭折了这么多个博客,应该知道了,怎么去相对不怎么失败的去经营一个博客了吧?

其实,更重要的是,这是在经营人生的某个阶段。

我也相信,自己不是孤独的一个。当想要改变,而改变的时机都成熟了,不会有剧痛,那我们就不要去拒绝这种潮流。若是此潮流发生在自己身上,更当积极的去拥抱。

The one or the next one,u know the answer.

在最新的评论中,看到的唯一一条是左岸读书的,看他去年的时候,换了一个新的地方,如今亦是经营的有声有色。起码,自己是一个忠实读者。改变,在那一些“莫名”的时刻里,会变得无比的正确。

8千克,会把内容的重点放在一些数据上的分析,一些态势的了解,一些个人的管理,一些团队的养成,一些产品开发的流程实施,还有一些纯私人并不成熟的思考。因为遇到了许多问题,解决了不少,但还有很多,并未知晓。

@@@@@@@@@@@@@@@@@@@@@正文@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@

云计算,这个名词听起来已经不陌生了。

“云”是什么,云就是“讲不清楚”,也就是“云里来雾里去”。讲不清楚你看到的应用后面的“云”它有几颗硬盘,需要安装什么程序。这种情景就类似“上帝说要有光然后就有了光”。云计算是把人们从硬件中解放出来,其实也是人类想象力的一种解放。

倒腾云计算的服务商,除了很多人的梦想、成就感支撑着外,另一方面是未来巨大盈利的诱惑。

但我们也面临着一个问题:如果云端失控,这个世界会不会太可怕?

云端失控,就好像,银行突然被挤兑或者倒闭,电厂突然负载或者爆炸,作为资金链、能量链的源头,突然失控,这是巨大的灾难。

且不说单纯的云端失控,另一方面产生的问题,是安全的问题。就好像,银行的保险箱的安全机制要比私人的而言,不是在一个数量级上的。而且,抢银行–》这是很多人的(白日)梦想。

说这些,并不是暗示我是一个悲观者或者对云计算的怀疑论者,正相反,自己是云端的一个使用者。并且,不久后的日程安排上,还负责部分云端的产品设计。这些情绪并不是悲观或者消极,就好像支付宝的初始阶段,没有人把它当银行,但到了一定阶段,没有人不把它当银行。(这里说句题外话,知道淘1站么,或许再某个阶段,没有人不把它当物流大鳄或者超市大鳄)。

如果云端失控,这个如果在将来必定会成为现实。到时候就会变得非常好玩,商人有自己的眼光,技术天才也乐得往里面凑活,政府有自己的安全要料理,甚至,花边新闻出来的都可能会莫名其妙。

至于会突然明显的提出这个问题,是因为最近几天发生的事情。

1,我使用的云端有微软的skydriver,还有amazon的S3,前者是免费,有25个G,后者是收费的。这两个云端是用来存储一些资料的,笔记本有可能被偷,移动硬盘有可能摔坏。自己这些年也积累了一些数据性资料,比较害怕这样的万一发生。btw,我这边skydriver的速度能到200k,而S3基本上市20K,似乎还是免费的划算。

2,所谓的云端,其实是一个黑匣子,它可不是我们操作系统上看到的那样子,哪个盘符是哪个盘符,哪个文件夹是哪个文件夹,它只是提供一些接口。因此,我用的一个第三方的客户端,是叫Gladinet,如果有兴趣找一下amazon的S3其它的客户端,应该能发现一个比较好用,但是要收费的软件,那在这里就不说了。

3,Glandinet需要特殊说明的是,它是一个云端的综合连接器,它能连通S3/Skydriver/Google Picasa/Google Docs .etc 听起来好像很好用吧?试试就知道了,现实可能有些残酷,有些操作的时候,让你的机器卡死。另外需要再说下的是,Glandinet占用了80端口,如果你装了apache或者iis之类的,会报错,安装的时候,它会自动安装一个虚拟网卡的程序。新生成的虚拟网卡要自己设定下IP,然后在(比如)Apache的配置文件里,把Listen 80 改成Listen 具体的IP(虚拟非虚拟自己选):80就可以了。不过,我想是,其实一个网卡设置两个IP,不用装虚拟网卡估计也是可以的。但没有尝试过。

4,今天,我们国家的海底光缆出问题了。Glandinet几乎是挂掉,不停的有Fail的任务在进行。而且非常耗费资源。照理说,直接关掉Glandinet就可以了。但不行,因为想用云端的文件作一些事情。结果导致白白浪费了一个多小时,在做无谓的努力。

5,S3和skydriver都是云端存储的,而google也宣传即将推出基于Linux内核上的Web OS来,据说是通过chrome浏览器来部署这个战略的。最近下了一个名叫jolicloud的Web OS(还没有安装到自己电脑上试过),这是一个很实在的OS,ISO文件有600M,也是在Linux的内核上,据说战略是试图占领netbook(上网本)的市场。国内、国外在做纯粹基于浏览器的Web OS的人也不少,但这里有个根本性的悖论,就是这些Web OS是基于浏览器的,而浏览器又是基于(Win)OS的,那Web OS还有什么意义呢? 但是,悖论在某些条件改变之后,就不会再是悖论。

6,忽略以上5条的细枝末节,总结,云端是一个还很云里雾里的一端,其艰辛程度,非凡。

Older Posts »

Powered by WordPress