All posts by zr9558

大厂的激励,年轻人们不买账了

本文来自微信公众号:界面新闻(ID:wowjiemian),作者:佘晓晨,采访:佘晓晨、陆柯言、司林威,编辑:文姝琪,题图来自视觉中国

腾讯宣布给特别贡献员工发100股股票的那天,李剑锋的反应颇为平淡。

在别人看来,这是一份令人艳羡的年终奖励。作为一家成熟且庞大的互联网公司,腾讯选择用股票这样看得见、摸得着的东西激励员工,也起到了不错的效果:一些入职未满一年的员工也得到了这份奖励,恰逢过年前夕,“感谢小马哥”在社交网站上刷屏了。

但李剑锋觉得,和自己付出的劳累和巨大的工作压力相比,6万多的股票“真的不算什么”。

一个不可否认的事实是,如今,当互联网大厂采用各种各样的途径激励员工时,很多方法不管用了。

还有相当一部分年轻人,在进入大厂的时候就未曾“被激励”。入职一家国内TOP3的电商大厂之后,张微非常明白自己想要的是什么。她不需要鸡汤、也不需要公司的承诺。她看中的,只是自己的发展前景,和当下可见的物质回馈。

2021年3月,一篇来自于阿里内网的文章《致阿里》出现在社交网络上。《致阿里》基于年轻基层员工的视角,表达了他们对于工作、待遇和公司价值观等等的看法。重点在于,文章把年轻基层员工和职级更高的老员工进行了对比,引发了阿里内网激烈的讨论。

很多和发帖者处于同一“阵营”的年轻员工认为,如今公司用心灵鸡汤鼓励员工奋斗的价值观已经过时,也不该强求员工“热爱公司”;另一批站在对立面的高管和老员工则表示,想要获得回报就应该拼搏奋斗,用热情激励员工干活没有错。

关于公司应该如何激励自己,发帖者还在文章中表示:“温饱只是最基本的需求,可问题是一家文化拉垮待遇也拉垮的公司,只会不断的抹黑消耗阿里巴巴这个曾经让人看起来羡慕和憧憬的光环。”

过去十年间,互联网的飞速发展让彼时的年轻一代感受到巨大的机会。很多人走进大厂,期冀着物质和自我价值的双重发展。但在进入大厂之后,很多激励过他们的东西正在失效。对于早期入职互联网大厂的老员工来说,公司的价值观却是的的确确“深入人心”的。

是大厂的激励不够,还是年轻人太难被满足?答案可能都不是。互联网行业发展至今,个体和组织都在变化,而两者之间,还存在着不小的沟壑。

消退的“价值观” 

很难说那些口号有没有发挥作用。

“创新”、“正直”、“协作”,这些词出现在大厂的新员工培训手册上,出现在公司的墙上,也出现在高管的演讲里;有时候,张微能感觉到它们实实在在地渗透到了岗位里。

比如在具体的运营工作中,她会记得坚守原则,留意和其他小组同事的合作,以及回绝供应商逢年过节的一切礼物。但说到底,这也是因为公司的价值观和个人做事的原则相吻合,而非刻意为之。

对于苏曼来说,口号就更加熟悉了。

毕业参加面试,HR问她怎么看待华为的“狼性文化”。她表示认同,不单单是为了通过面试。在她心里,这种文化本质上是强调奋斗者为本。对于一个初出茅庐的大学生来说,这意味着多劳多得。而华为给她的薪资也远远高于同班同学,为公司奋斗成了理所当然的事情。

《华为传》一书中,“狼性文化”被概括成“一种推崇激进、坚韧、善于发现新机遇的品质”,同时,狼性文化强调集体意识,围绕项目或任务进行团队作战。

在一些前辈身上,这种精神体现得格外明显。他们经常告诉苏曼这样的年轻员工,大家要“一起打胜仗”、“一起分享胜利的果实”。苏曼会因此设想未来可能拥有的职级和收入,“你会觉得他们的状态似乎不错,所以愿意朝着那个方向努力。”

崇尚“狼性文化”的华为有一个激励的传统为人熟知:员工全员持股。直到今天,这依然是华为用来激励员工的一个重要方式。苏曼坦言,在公司内部,他们戏称,工资是零花钱,真正的回报是股票。

但等待更多的分红意味着什么?和公司共进退,一年、两年、三年,甚至更久。

有老员工起到表率作用,他们告诉新入职的员工,“刚开始工作,不要在乎一两千的工资差异,三年之后绩效好的话,收入会呈指数级增长。”

根据媒体报道,华为19级(在华为,员工的职级分为13~23级)以上的员工年薪在150万~200万之间。据一位华为员工描述,在现阶段,表现较好的情况下,应届生入职5年之后才可以达到18级。

此外,在华为,员工的薪酬除了工资和股票分红之外,还有海外补助。后两者是很多员工收入构成的重要部分,而不少老员工正是通过早年开拓海外市场实现了“财富自由”。

“一开始是挺受激励的,但过了一段时间,你就会在日复一日的工作中感到疲惫。”随着工作压力的加大,苏曼的热情正在消退。她意识到,老员工说的这些回报,前提是熬过了三年,并且继续熬下去。

张微没有感受到太大的落差,因为从一开始,她就没有被公司的激励打动过。

入职之后,公司领导在大会上鼓励年轻人多多奋斗,传达“能奋斗也是一种幸运”的观点。在张微看来,这些分享完全谈不上“激励”,更不用说那些华而不实的公司周边了。

一些手段甚至起到了反作用。

在现代社会的公司组织中,团建是一种常见的激励方式。促进员工之间的感情、传递企业的价值观、让公司变得更有趣,团建会将这些目的一一覆盖。尤其是在人员复杂、强调团队合作的互联网公司,人力资源部门将团建视为一种必要的激励方法,费尽心思组织员工活动。

张微对公司的团建甚至到了反感的地步。一次团建中,公司让大家进行“花式”的自我介绍,还要用表演的方式学习企业的价值观。“非常尴尬,我不明白这样对提升工作能力到底有什么好处,有的团建还会占用周末。”

十年前的“热情” 

时间拉回到2010年以前,对于当时的年轻人来说,互联网公司的吸引力远比不上光鲜的外企。但他们却更加认同公司的价值观;与此同时,他们也得到了实打实的“物质激励”。

2007年,张建波从一所国内知名技术院校毕业,和同批应届生相比,他拿到的offer算不上突出。但回望在华为工作的这些年,他觉得公司在精神和物质上的激励都很有效。

一些激励方式延续到了现在——例如为期两个月的、纯粹的“价值观培训”。更多的传递是“集体主义精神”在日常工作中的体现:张建波清楚地记得那句口号:“胜则举杯相庆,败则拼死相救。”

“对于大公司来说,这并不是一个口号,它需要有一整套的流程机制去支撑。”入职之后,这种价值观的传输实施到了工作中。他认为,这套口号背后是上一环和下一环之间、跨部门之间的紧密合作机制,“某一个环节出问题很容易被发现,最终形成了一个自觉的、责任制的工作状态。”

同样在2010年之前入职腾讯的郝强有相似的感受。入职腾讯之后,他遇上了“3Q大战”,整个公司在内部时刻强调价值观,尤其是在做产品的时候。团队开会时,大家会考虑产品设计和功能是否符合公司的原则。“不一定是特别认真的强调,但也随时挂在嘴边。”

除了股权之外,郝强印象最深的激励是公司评选的荣誉奖项。在他看来,虽然腾讯当时的发展比不上现在,但当时的员工还是很看重这些荣誉带来的激励。“并不能带来多少钱,但比钱带来的动力要更强。”

将“多劳多得”贯彻到底的华为则把荣誉直接转化成了收入,对于被外派到海外的张建波来说,这种即时的激励格外有效。

在当时,华为的基本工资和涨幅并不高,而海外市场急需扩张,项目奖金鼓励员工持续奋斗。“把一件事情做好之后,可能下个季度一笔钱就到你的账户里了。如果一年做了2-4个项目,激励就会反映到年终奖里,这个感觉是很好的。”

一些看起来仅仅是头衔的荣誉,例如“金牌员工”,也意味着相当一大笔物质回报。张建波称,这意味着你的考评是A,能够比别人多出2-3倍的年终奖。

“当时的我们,对物质生活还是有强烈的向往。”张建波说。

自我和组织发生碰撞

时代变了。

“既得利益者”——一位阿里的员工这样形容那些认同公司文化的前辈。张微的看法也一样,“可能在行业的起步或爆发阶段是有很多机会,当时的奋斗者相比身边人确实会得到巨大的回馈,但在今天,付出和回报的比例和当时一定不同。”

随着人员的扩张和公司架构的成熟,日益庞大的中国互联网公司都在建立更完善的考核体系,和创业时期的“X号员工”相比,年轻人获得回报的周期更长,难度也更大了。

对于80后来说,他们虽然没有经历过物质匮乏的时代,却在大厂的起步期加入了公司,见证过公司的发展给自己带来的改变。

而物质收入只是造成看法差异的因素之一。更多的区别在于,组织发展到了新的阶段,员工们成长的环境也完全不同。

苏曼和张微都毕业于中国顶尖的985高校,同批进入公司的同事大多拥有漂亮的履历和较高的学历水平,找到一份薪资不错的工作对他们来说不是难事。

他们代表的,是一群生于90年代中后期、受过良好高等教育的新一代“互联网人”;这批年轻人成长于中国经济高速发展的时期,也更加重视人文关怀和自我价值。

根据脉脉发布的人才报告,2020年,19家互联网企业的人才平均年龄为29.6岁,其中字节跳动和拼多多的人才平均年龄仅为27岁。

张微认为,大厂激励效果减弱的原因在于,每代人的观念不同,社会发展到今天,很多年轻人意识到自己不是“工作机器”。“在工作以外,这个世界有太多美好的风景、事情和情感需要去体验;在一个相对丰富复杂的环境里成长,完全丢掉生活去工作很难保持心态的稳定。”

时不时的,一些不好的消息还会让张微更加警惕公司的激励。“每次看到拿着稍高一些薪水的同龄人猝死的新闻,我都去提醒自己,无论如何,生理和心理健康是最重要的。”

在张建波周围,一些老同事经常抱怨,“现在的年轻人不好管”、“都要哄着”。老领导觉得他们“太喜欢反抗”,但张建波和郝强能够理解年轻员工的看法。

他们一致认为,80后虽然没有经历物质匮乏的时代,但受到的教育相对保守,更加服从“家长制的管理”——更不用说从“苦日子”过来的70后。

一位阿里高P级别员工表示,他也明显感受到《致阿里》中提到的一些问题,但对于公司的制度和价值观,他认为,“谈不上认不认可,只能说这是合理的。”

看起来,大厂的价值观和对于员工的激励方式,这十年来并没有发生太多的变化。但这也正是矛盾所在:当自我和组织发生碰撞,擅长“拥抱变化”的互联网大厂需要思考的是,如何让自己的激励方式持续行之有效。

郝强认为,大企业的价值观通常都是一些基本的工作原则,这是任何时候都通用的;问题在于,团队中有老员工和新员工,在激励的细则上,需要做出更多的调整。

归根结底,这是一场关于大厂组织架构和组织文化的考验。也许,应该调整的不一定是价值观,而是传达价值观的方式;应该调整的不仅是激励的数量,还有激励的内容和初衷。

(应采访对象要求,文中李剑锋、张微、苏曼、张建波、郝强为化名)

本文来自微信公众号:界面新闻(ID:wowjiemian),作者:佘晓晨,采访:佘晓晨、陆柯言、司林威,编辑:文姝琪


本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系hezuo@huxiu.com
如对本稿件有异议或投诉,请联系tougao@huxiu.com

普林斯顿大学数学系的崛起:把研究生”扔到河里”,游过去的就成为博士

王则柯

(中山大学岭南学院教授)

普林斯顿大学数学系和普林斯顿高等研究院数学部,在20世纪30和40年代迅速成为美国学术界冉冉上升的明星,不仅在拓扑学、代数学和数论方面独占鳌头,也在计算机理论、运筹学和新生的博弈论处于领先地位。

第二次世界大战以后,大家都返回普林斯顿,科学和数学被视为战后创造更加美好的世界的关键。由于数学在战争年代对于美国的贡献,政府似乎突然意识到纯粹研究的重要性,军方尤其如此,纷纷拨款资助纯粹理论方面的研究项目。人们充满热情地筹划举办新的一届世界数学家大会,而上一届大会是在战前的阴郁日子里召开的。

1948年秋天,数学系主任所罗门·列夫谢茨教授在西休息室召集所有一年级研究生谈话。他用浓重的法国口音给他们讲述生活的道理,整整讲了一个小时。他的目光锐利,情绪激动,大声说话,还不断用木头假手敲桌子。

他说他们是最优秀的学生,每个人都是经过精心挑选才来到这里的,但是这里是普林斯顿,是真正的数学家从事真正的数学研究的地方,和这里已经成名的数学家相比,他们只不过是一群无知可怜的娃娃而已,普林斯顿就是要把他们培养成人。

他说他们可以自己决定要不要上课,他不会骂他们,分数没有任何意义,只是用来满足那些”讨厌的教务长”的”把戏”

他对大家的唯一要求就是每天参加下午茶的聚会,在那里他们会见到世界上最了不起的数学家

当然了,如果他们愿意,他允许他们参观高等研究院,看看他们能不能幸运地见到爱因斯坦、戈德尔或者冯·诺伊曼。

他一再重复的一点是,教授们绝对不会把他们当做娃娃。对于年轻研究生们,列夫谢茨的这番话无异于美国作曲家苏萨的鼓舞人心的乐曲。

毫无疑问,列夫谢茨富有企业家精神,精力充沛。他在莫斯科出生,在法国接受教育,酷爱数学,却由于不是法国公民而不能选修数学,只好学习工程学,后来移民美国。

23岁那年,他正在著名的电气公司西屋公司工作,一场严重的变压器爆炸事故发生,夺去了他的双手。用了几年时间,他才得以康复。其间他深感痛苦绝望,不过这场事故最终促使他下定决心,追求自己的真爱——数学

他到克拉克大学攻读博士学位,那里因为1912年弗洛伊德曾经举办精神分析讲座而闻名。不久,列夫谢茨和那里的另一位数学系学生相爱,两人结为秦晋之好。毕业之后,他在内布拉斯加州和堪萨斯州教了将近10年的书,一直寂寂无名。

课余时间他撰写了多篇具有原创思想的精辟的论文,渐渐引起学术界的重视,终于有一天,来自普林斯顿大学的一个电话邀请改变了他的生活道路,他成为普林斯顿大学数学系首批犹太人教师之一

列夫谢茨身材高大,举止粗暴,衣着毫无品味可言。刚来的时候,因为人们常常在走廊里假装看不见他,避免和他打招呼,他常常自称为”看不见的人”。但是他很快证明自己具有非凡的魄力,可以跨越远比这些过分拘谨、媚上傲下的同事更加困难的障碍,一手将普林斯顿数学系从一个”有教养的平凡之辈”培养成为令人景仰的”巨人”。

列夫谢茨招聘数学家只有一个条件,这就是原创性的研究。他注重独立思考和原创精神高于一切,蔑视那些优美或刻板的证明据说他从来没有在课堂上做完一个正确的证明

他的第一部全面论述拓扑学的著作提出了”代数拓扑学”的术语,影响深远,其主要价值在于体系,而不是细节,细节方面的确有很有一些欠斟酌的地方。有人传说他是在”一个休息日”里完成这部著作的,他的学生们根本没有机会帮助他整理。

他了解数学的绝大多数领域,但是他的演讲往往没有条理。他的编辑作风专制而又有个性,使普林斯顿一度令人厌倦的《数学年刊》(Annals of Mathematics)一跃成为世界上最受推崇的学术刊物。

有人批评他将许多犹太学生拒之数学系的门外,他却辩解说这是因为担心他们毕业之后多半找不工作。不过,没有人可以否认他确实具有极佳的判断力。他训斥别人,独断专行,有时相当粗暴,但是他的目标只有一个,就是为数学系赢得世界声誉,将学生们培养成和他自己一样坚韧不拔的真正的数学家

列夫谢茨关于研究生数学教育的思想是以德国和法国名校的传统为基础的,很快就成为普林斯顿的指导纲领,其核心是尽快使学生投入到他们自己的研究工作中去。由于普林斯顿数学系本身就积极从事研究工作,同时有能力对学生进行指导,列夫谢茨的想法得以付诸实践。

博学固然是一项值得尊敬的才能,但这并不是列夫谢茨的目标,他更强调学生应该有能力提出自己独特的看法,作出重要的原创性的发现。

普林斯顿给予学生最大的压力和最小的管制。列夫谢茨就说过,系里不要求学生非来上课不可。数学系确实设立了自己的一整套课程,不过考勤和分数一样,几乎只是幻象

到了在学生的成绩报告上打分的时候,一些教授会给所有学生判C,另一些教授则会都给A,装装样子而已。一些学生根本不需要上一节课就可以得到分数。的确,所谓成绩单只是用来讨好那些墨守成规、被称为”俗人”的教务长之辈。

比如数学系传统的口试,可能只是要求学生翻译一段法语或德语数学论文。由于选定的论文充满数学符号,文学极少,即便没有多少外语知识的学生也能看出个大概头绪。如果实在搞不清楚,只要学生许诺回去好好研读这份论文,老师们也可能判他合格。

真正要计算成绩的是”总考”,包括5个题目,其中3个由数学系选择,另外2个由考生自行选择,在第一年的年终或第二年进行。不过,即便是这次考试也可能依据每个学生的具体优缺点而进行设计

举例而言,如果某个学生对一篇论文掌握得很好,而且他总共就知道这一篇论文,那么考官确实有可能大发善心,出题时自觉把内容限制在这篇论文里,好让这个学生顺利通过考试。

学生动笔写毕业论文之前,最重要的事情是要找到一个高资历的教授支持自己选择的题目。整个数学系的教师对学生都相当了解,如果他们认为某个学生实在没有能力完成自己的题目,列夫谢茨就会毫不犹豫地更换导师或干脆叫他离开因此,通过了总考的学生通常在两三年里就能取得博士学位,而在哈佛则需要六七年,甚至更长的时间。

则柯(即作者本人——编者注)在1981-1983初次到普林斯顿大学进修的时候,当时的系主任项武忠教授还在津津乐道列夫谢茨建立的传统:普林斯顿数学系把研究生”扔到河里”,游过去的,就成为博士

普林斯顿总是有最好的教授,最好的访问学者,他们授业解惑,可以说是有问必答,但是决不关心考试。如果你自己不思进取,没有人会逼迫你。

普林斯顿总是开最先进的课,每周好几次请世界一流的数学家讲演自己的最新发现。她提供最好的环境,是不是能够利用这个环境,是研究生自己的事情

至于列夫谢茨,教授们都有点儿夸大地说,正因为他从来没有在课堂上完整地做完一个正确的证明,他的学生不得不把他的漏洞补上,从而练就了本事。

如果教授在课堂上讲的都已经十分正确十分完备,而学生能够把教授所讲背得滚瓜烂熟,那不叫本事。懂得高等教育的人都知道,如果每一步都要讲解得十分完备,你根本不可能在大学讲授一门象样的课程

本文转自《书城》2000年第3期文章仅作分享,不代表一读EDU观点和立场。一读EDU编辑部对原文略有编辑、调整,如需引用,请参考《书城》2000年第3期原文。

博士后老张归国记

【注:本文几乎没有版权可言,或者说,即使有版权,也很难找到当初的作者群了——是的,这篇小说甚至没有一个明确的作者。最早大概是在2009年开始在留学生论坛里流传的一个故事,当时只有第1、2部分,大家的猜测却出奇的一致:一定是某位在美留学的大龄生物学博士或博后写的,毕竟写得太真实了,很多人表示自己感同身受,几乎要读哭了。后来,大概在2012年,第3部分开始出现在国内论坛里。基于这一部分的情节中透漏出来对国内工作的熟稔程度,大家猜测这位作者应该是在国内郁郁不得志的青年高校教师或师资博后。很快,在水木社区上开始流传以女主角为主线第4部分。由于这一部分对女性心理的准确把握,大家又开始怀疑这是一位女网友的作品。然而,争议最大的也就是这一部分。因为初次发布的版本就是文中的悲剧结尾,所以作者收到了“你太恶毒”的评价。几天后,网上出现了不悲不喜的结尾。至此,《博士后老张归国记》正式完篇。另外,需要提醒的是,第3部分的最后一个自然段与第4部分的悲剧结尾是互相矛盾的,但与不悲不喜的结尾完美契合,这也证明了不悲不喜的结尾才是符合作者原意的续作。虽然不断有人对后两部分不满,要求写出一个喜剧结局来,但是因为前两部分的基调已定,再怎么改,也只能做到不悲不喜。】

第一部分:老张相亲

老张不老,博五快要结束,博六就要开始。

且慢,这博士咋读了五年还没读完?

这个问题已经被老张的爸爸妈妈爷爷奶奶叔叔阿姨包括刚学会说话的侄子侄女问了无数遍,老张的耳朵都快起了老茧,回答也快把嘴皮磨破老茧了。

读个生物博士我容易么我。老张心想。

可是老张父母等不及啦,左邻右舍拼命地问:张爸,你儿子咋读书读到30岁还没个完呢?还真读上瘾啦?怎么,到现在对象还没找上?那你们老两口可得趁着这个机会好好享享清福哟……唉,不能和你多说了,我那孙子一准醒了……

老张父母心里那个不是滋味呀。想着当初从老张出生开始,他们为了老张跑在别的孩子前头,费了多大力气。老张这孩子以县第一名考上名牌大学的时候,老张父母多荣耀。后来老张又出国了,老张父母多扬眉吐气光宗耀祖。可是这跑着跑着,老张这孩子咋还是不争气,落到别人后面了呢。眼见着隔壁那跟老张同年的学习不好的王二孩子都光屁股满地跑了,学说广告词了,这老张咋还对象都没个影呢。
当然了,在老张父母心目中,老张那是老张他爸,而老张依然是张娃子。

老张很想把父母签过来玩玩,可是他离家五年,对父母的感情越来越捉摸不定起来。有时候他觉得心里很想爸妈,简直想到骨头里去了。但有时候吧,他想到父母那两张喋喋不休的嘴巴,他就恨不得离他们越远越好。

这周末给家里电话,张爸又唠叨了:隔壁王二他小子今天学会了一句英语了,见人都说好肚油肚。老张不耐烦地说,那都是哪辈子的英语了,人都说 howareyou。张爸气愤地说:你会说有啥了不起,人小孩说稀罕。你啥时候给整个小孩出来说好肚油肚你就烧高香吧。张妈一看苗头不对立刻从张爸手里抢过电话,边数落张爸“你怎么还老跟孩子急”,然后对老张说:“儿啊,最近有碰到啥中意的姑娘没?”老张说“中意的姑娘没碰到,小伙倒是认识了好几个”。张妈柔中带刚地说“你别老和你妈打岔,你看我和你爸也老了,再老都不能帮你们带孩子了……”老张打呵欠:“那个‘们’一撇还没有呢”。听着老张那吊儿郎当的口气,张妈的好脾气也受不了了:“你这孩子,咋就不让我和你爸省点心呢?你看隔壁王二跟你同年的,小孩都学会说英语了……”

每次电话都是这样的死循环,老张每次挂了电话都想,这人生真是三十年河东三十年河西,想当初小时候父母老是说“再和王二那没出息的厮混,小心我(你爸)打断你的腿!”或者就是说“跟好学好,跟叫花子学讨,你别老跟着王二学坏,是不是人家讨饭你也跟着讨饭去?”结果这还没过三十年,就变成了“你看看人家王二,跟你一样大,不但媳妇娶了,儿子生了,这生的儿子还都会说英语了。”

说真的,老张自己心里也着急。咋不着急?这眼看着大好春光都陪着小白鼠度过,为啥那红袖添香夜读书的姑娘她就是迟迟不出现呢?难道我老张真的是命犯孤星?不能啊。

总结来总结去,原因只有一个:僧多粥少。

老张在学校五年了,除了第一年,年年接新生。可是接来接去接的都是男生。偶尔接到个把女生吧,安置下来后就杳无音信。很多女生刚来的时候都有海誓山盟的男友,纯洁美好的让老张不敢作任何妄想。等几个月一过这些女生同国内男友吹灯拔蜡之后,老张又发现她们不管丑的美的统统让别人捷足先登了。没办法,谁让他除了带TA写paper做实验之外还得伺候小白鼠呢。

有时老张甚至幻想,有一天某只小白鼠含情脉脉地看着他,偷偷咬他一口。他正要生气的时候,发现一貌美如花的白衣MM正咬着手指巧笑倩兮地看着他呢。

可是老张的白鼠姑娘依然没有出现,这春节一过,老张立刻被打上了30的标签。虽然老张自己一再重申这30岁是野蛮的毫无道理的,因为他明明还未满29岁,可是老张爸妈不干了:“儿子,人家都说30而立,你咋什么都没立呢?书书没念完,老婆老婆没找到,儿子更是没个影。”

老张还想像往常一样打马虎眼过去,可是老两口认真了:“今年你安排个时间回来,我们托人找些姑娘你相一相。”

“那哪成?那没有感情基础。”老张嗫嚅地说。

老张爸在电话那头把眼珠子一瞪:“要个屁的感情基础!你要是有那本事找个有感情基础的,你也不至于到30了还光棍一条!”

老张想再次重申自己还未满30,可是想到电话那头老爸直飙而上的血压,忍了口气,陪笑说“行,我跟老板商量商量,今年回趟家,找个老婆给我爸生孙子!”老张爸再一吼:“这是正经事情,别跟你爸嬉皮笑脸的。”“是是”,老张无奈地说。

老张的飞机一落地,老张就不是实验室那个勤勤恳恳伺候小白鼠的老张了。老张是学业有成年轻有为青年老张。这是老张爸给他的定位。老张对自己的定位稍土一些,头衔叫相亲别动队。本来他觉得此行是一个搞笑的主题,但当他见到已经老态明显的父母时,忽然意识到他爸说的是正确的:“这是正经事情”。他决心把它当成一个project来搞。

第一个星期老张分别见了A,B,和C。说实在的她们挺好的,长的挺好的,谈吐挺好的,家境挺好的,什么都挺好的。但是老张相亲的时候老容易走神,这让她们觉得老张这人挺不靠谱的。A说的是,你这人挺好的,但是我不太想去美国发展,真不好意思。B说的是,你挺好的,可是吧我觉得我不适合你。C什么也没有说,礼貌地说了再见,就再也没有见过。

第二个星期老张又见了D,E,F和G。这四个姑娘也都挺好的,老张也没有再走神发呆,他开始进入状态。他觉得D虽然漂亮,但是学历有点低。E谈吐不错,但长的有点那个,还赶不上学校女生的平均水平。F挺有趣,但是她年龄太小,他怕和她有代沟,跟不上她的步伐。G各方面平平朝上,但是怎么说呢,略显精明,她甚至还说“听说你们生物在国外挺不好混的”,害的老张一口热茶差点噎进气管里。

第三个星期老张见了H,I,J,K,L…他发现原来世界上单身的女孩还挺多的。但是他见得越多,她们在他心里就越平面,变得像一张张扑克牌。他抽一张出来还挺好的,再抽一张出来也挺好的。但一张和一张之间,他看不出有什么分别。

于是后来,老张只好做了一张Excel表格,给她们每人各项打分,再加权平均。外貌的权重是20%,学历加专业权重20%,做饭手艺权重10%……渐渐的这些活色生香的女子在他心里就变成了一个一个的数字:8.5,9.3,7.6……9.3不错,可惜9.3没有看上他。也许还是8.5好,会做一点饭,人也算温柔,妈说屁股有点大能生孩子……

一个半月的相亲生活,在飞机的轰鸣声中渐渐远去。

老张定了8.5和另一个8.8的作为可行性发展对象,回到学校后继续联系。老张发现原来从未谈过恋爱的自己居然有不少恋爱天赋,可能是因为隔着屏幕看不到脸,老张的脸皮也就厚了起来。8.5和8.8都挺爱和他聊天的。再后来,老张就定了8.5,因为张妈听介绍人说8.5的个性好一些,于是就逼着老张和8.8断了。据说8.8为此还哭了,老张说不清楚,感觉也有点难受,但是既然妈说了8.5就8.5吧,本来就是为了爸妈找的老婆,还是听他们的吧。

老张和8.5谈了半年的msn恋爱,婚期定了,国庆。

老张其实挺不喜欢国庆结婚的,但是老张的爸妈和8.5的爸妈都挺喜欢的,普天同庆嘛,再者亲戚朋友也抽的出空来吃酒席。所以老张又跟老板请假。老板有点不高兴,可是人结婚大事,总不能不让人去,但也很是给了老张几天脸色,并暗示像他这样休假下去六年毕业都挺困难的。
但老张终于要结婚了啊,老张已经过了29岁生日,再过一年就要满30岁了。古人云30而立,又云先成家后立业,所以这家是一定要成的了。老张想到终于要有红袖添香了,心底挺高兴的。但转眼又想到自己真要独自承担起一个家了,心底又有点乱。临近回国,他又开始想就这样和一个见过几面的人结婚是不是太草率仓促了。可是,一切都在如火如荼的准备之中,他更像是一只流水线上等待宰割的鸭子。

直航飞机经过气流层,上下颠簸着老张醒来了。其时老张正在梦里快速回放相亲过的ABCDEFG,以及后来的9.3,7.6,8.5。他恍惚地睁开朦胧的眼睛,看见飞机椅背上的飞机航行状态图,原来真的是三万英尺。他想起大学毕业时候吼的歌,悄悄爱过的女孩,想起她的长长黑发,透明眼睛,芊芊背影。她的笑声,她在操场上跑过的姿势,每一丝每一时都那么立体。老张不由得想出了神。

他终于明白为什么自己在和ABC相亲的时候会走神:他在想她。

他终于明白为什么自己总是在追女生的时候后知后觉:他一直爱她。

原来他的潜意识里,是有一个女孩的,只是他一直强迫着自己遗忘。

这世上竟然没有真正的相忘于江湖。至少他老张没有做到。但,又怎么样呢,此刻他已是一个待婚的男人。

下了飞机,老张在接机口看到了他的8.5。老张看过她很多照片,所以一眼认出她来。她有点羞涩的笑着,挥手叫老张的名字。老张拖着行李箱大踏步地走过去,一直走到她面前。老张的手在衣兜里摸到一枚戒指,这戒指是用来向她求婚的。但老张终究没有在众目睽睽之下单膝跪地,他把戒指塞到她手里,她说“谢谢”。因为这事情早就计划好,这也就算求婚成功了。

婚礼办的盛大而热闹,东方而西方。老张的姑姑说老张穿着西服也有点人模狗样起来了,老张的阿姨说这就叫佛靠金装人靠衣装。酒店里宾客来来往往,热热闹闹,老张父母简直比老张还激动,脸上笑起的皱纹好像绽放着一朵大菊花。

老张站在台上,听着欢快的音乐以及嘈杂人声,忽然想这究竟是不是一场梦。或者自己是主持人,身边的主持人才是新郎。但他有点想不通自己到底是怎么卷入这一场闹剧里来。可是忽然一切都安静下来,婚礼进行曲响起,红地毯的一端,是他的新娘披着白纱,挽着她父亲的手臂款款走来。

不知为什么,老张忽然有些不忍看这一幕,抑或是不敢。他偏过头,看到主宾席上盛装的父母婆娑泪眼中期待的目光。他忽然明白,他是在这期待的目光里越走越远:他在这期待的目光里迈出人生的第一步,他在这期待的目光里独自踏上北上的列车,他在这期待的目光里抛下曾经的她赴美追逐梦想,他又是在这期待的目光里一次又一次地流水相亲。而此刻,他在这从未改变的期待的目光里,不能不再次勇敢地直面现实,甜蜜而微苦地傻笑着伸手接过他8.5的妻。

第二部分:老张的人生全线溃败

老张的博士整整读了六年。

这六年中,他无数次地憧憬过拿到那张毕业证书,正式成为一个有Dr头衔的人时的场景。他是会大笑,还是会哭泣?也许会呐喊,更可能会绕着会场狂奔。他想像过无数个场景,而当他真的从老教授手里接过那张薄薄的纸时,他却什么感觉也没有。像是一只刚刚被注射了麻药的小白鼠,从汗毛末梢一直麻木到心里。是无比空洞的茫然。而这种茫然直接地反射到他的脸上,使他在余雨的相机里怎么看怎么平面,有点像是一个活死人。

“你又怎么了啊?天天吵着要毕业,现在毕业了,还板着个脸。我跟着你真是他妈的倒霉透了,瞧瞧你那副棺材脸,看着都折寿!”老张回到座位上之后,余雨不满地挖苦他。老张对此没有作出任何回应,甚至连一丝愤怒也没有——他已经习惯了。有时候他想这究竟是不是一个规律:婚姻使女人聒噪,使男人沉默,然后女人的聒噪使男人愈加沉默,而男人的沉默则导致女人的更多聒噪。不过,不管这个规律是否适用于大部分婚姻,老张的婚姻早就陷入了这个恶性循环是确定一定以及肯定的。

老张只是不太明白余雨为什么会变成现在这个样子。在相亲的时候,她虽然不是最出众,但也是十分美好的。那时的她不讲脏话,也不摔东西,也不会用恶毒的语言诅咒老张。但即使余雨变成如今这个样子,在老张心里,她依然是他相濡以沫的妻。他从来没有后悔过当初回国相亲,也从来没有后悔在众多的相亲对象里挑中了余雨。在老张的世界里,这个世界上没有所谓“如果”这个命题,存在即是合理。已经发生的就是既定事实,所能做的就是积极勇敢地去面对它。所以当老张面对余雨暴风骤雨般的辱骂时,没受过什么情感教育的他所能做到的最好就是沉默地包容以及忍让。

但余雨和老张想的不一样。她无时无刻不在后悔。如果时间可以倒回到她的25岁,她绝对不会同意和老张相那个莫名其妙的亲,又鬼使神差地被老张的美国博士光环蒙蔽,抛却工作,家人,亲戚,朋友,跟着老张一起来到这个鸟不生蛋的混蛋美国。自从来美国之后,她的脾气变得越来越坏,学会了讽刺,挖苦,诅咒,歇斯底里的怒吼以及摔东西。更让她生气的是,她所有讽刺,挖苦,诅咒,怒吼,以及摔东西的影响对象只有一个,那就是老张,这个一棍子打不出一个闷屁的老张。她讽刺挖苦诅咒老张的时候,老张从来不还嘴,甚至连一点生气的表示都没有,好像她根本不存在,她所采用的一切恶毒词汇对他没有任何撼动力。当她怒吼或者摔东西的时候,老张倒确实会紧张,但他紧张的并不是她,他是害怕余雨的动静太大吵到邻居报警。每次余雨看到老张紧张地搓着手,一副小心翼翼叫她不要吵到邻居的样子她就越发生气:她怎么会嫁给一个这样窝囊的人!从头到脚,怎么看怎么窝囊!

余雨并不知道,任何一个人如果在老张的实验室干上六年活,基本上都会变得像老张差不多窝囊。而老张之所以比其他人要显得更窝囊,则完全应该归功于余雨这一年零四个月以来的陪伴与照顾。

不过,对于老张成功地博士毕业以及找到一个博士后职位,余雨和老张两个人都很高兴。虽然博士后的钱不多,只有三万出头,但是毕竟比老张博士时候的奖学金高出来不少,手头可以宽裕一些,甚至还可以存上一点钱。让余雨非常高兴的还有一点就是他们终于要离开这个荒无人烟的农村了,这让她从心底里觉得欢畅起来。晚上余雨在电脑上看碟的时候看一个当年的下放知青描述当年知道终于可以回城时的激动澎湃的心情,忘我地笑着跟老张说,你知道吗我现在的心情跟她还真是他妈的像。而好久没有听过余雨高兴口气的老张反应又不适时宜地慢了半拍,表情尴尬地给了一个“哦”字,又招来余雨对他的一个白眼和一顿抱怨。

抱怨归抱怨,老张从余雨的口气里还是听出来她心情不错。于是晚上上床的时候,老张壮起胆子,半开玩笑地跟余雨说:“余雨,要不咱们也生个娃吧。”

黑暗中的余雨没有作声,老张便将这看作是余雨的默许,开始往她身上爬。

余雨睁着眼睛,悲哀地看着激动到有点战战兢兢的老张。跟激动的老张相比,没有一丝感觉的她好像是一具解剖台上的尸体——她太清楚他下面都要做什么,因为他每一个步骤都像完美设计的实验程序,每次与每次之间哪怕相隔数月,都几乎没有太大误差。有一刻她看着胸脯白白胖胖松松垮垮估计有A-罩杯的老张,忽然觉得心里有一股说不出来的恶心。这恶心终于让她猛然醒悟过来今天忘记提醒老张采取必要的安全措施,但老张已然完成了他的最后一个步骤,满足地趴在了她的身上。

余雨推开他走进洗手间去冲水,一边冲一边怒气冲冲地对老张吼:“如果怀孕了怎么办?如果怀孕了怎么办?”老张还沉浸在征服的喜悦中,高兴地回答说:“怀上了就生呗!”但是余雨一边冲着一边就开始哭了,一边哭一边诅咒老张顺带问候老张全家,老张就拿着她的洗澡毛巾唯唯诺诺地靠在浴室门口讨好地看着她。老张没有反对余雨问候他全家是因为余雨也不能算是完全冤枉他父母。老张的父母没有太多文化,不懂得什么叫做越俎代庖,在他们看来,他们所做的一切都是为老张,为余雨,为他们家庭的将来好。而且在他们看来,结婚就是为了生孩子,否则干嘛还要结婚呢。所以从余雨刚刚嫁给老张开始,他们就开始督促余雨生孩子的事情,而他们的不当沟通方式也引起了余雨的直接反感。余雨说,我是一个有血有肉的人,不是生孩子的机器,我生孩子是我的事,关你父母什么事?他们想生让他们自己生去。在老张听来,这话实在是大逆不道,且不说让两个五十多岁的人生孩子是否具有可行性,自己活了三十岁也从没能为父母做点什么,生个孩子让他们尽天伦之乐享绕膝之欢是一件怎么也不能说过分的事情。但是余雨说的话从她的角度看,也并非没有道理。所以在这件问题上,他保持缄默了很久,平常也不触及这个敏感话题,直到今夜。所以此刻靠在浴室门口的老张虽然表面上唯唯诺诺,心里却是酣畅淋漓,心里反反复复地回荡着一句“春风得意马蹄疾,一朝看尽长安花”。虽然余雨在哭,但她经常哭,哭哭也就过去了。夫妻吗,就是床头吵架床尾合,何况她即使再生气,她也没有朋友可以找,没有娘家可以回。生活空间被限制在这小小的一室户里,再大的矛盾它也顶不上天去。

过了几天,老张和余雨把家里的旧家具能卖的卖了,该扔的扔了,把其他东西零零总总地收拾了一下塞进车后备箱和后座里,在空落落的房子里留了个影,就开车奔向了新生活。老张告别的时候,眼里闪过一丝泪光,但兴高采烈的余雨并没有注意到。也幸好她没有注意到,否则她一定会嘲笑老张窝囊,受虐狂,在这样的鬼地方呆了六年居然还产生感情了,真是天生蠢材。余雨已经想好了,到了城里,她要好好地学习,狠下一把劲,把托福和GMAT考了,申请读研,结识新的朋友,走出老张阴影笼罩下的小世界,走进五彩斑斓的大世界。至于几天前夜晚的突发事件则已被余雨远远地抛在了脑后,因为她的哭不过是为了震慑老张,而潜意识里觉得窝囊的老张就那一次绝对搞不出什么来。

然而余雨错了。老张就像她当时诅咒的那样,是坏到骨子里的坏。他成功算计了她,先是把她算计到了美国,接着又算计着她怀了孕,让她的完美计划彻底泡汤。但余雨怀孕这件事在老张看来却完全不一样,是件值得昭告天下的大喜事。他在读博士的时候做了无数个实验,最后才勉强成功了一次发了个论文毕了业。这样一比较,他在造人方面的天赋就显著的多,只一次就成功了,就那么一次。年满三十岁的老张终于要成为一个父亲,他多么高兴,他多么骄傲。他觉得这个孩子是他人生的转折点,分水岭。为了孩子,老张想,自己一定要好好干,多出结果,早日结束博士后的生涯,做上助理教授,将来带着余雨和这个孩子,以及可能会有的下一个孩子,吃香的,喝辣的,其乐融融,做一个美国社会的典型中产幸福之家。老张并没有把这些憧憬告诉余雨,原因有很多。一,他觉得这种话在现实生活中说出来非常恶心,毕竟人生不是小说,更不是电视连续剧;二,他认为只要自己认真去做,余雨一定能够懂他;三,他没有必要为自己找麻烦,接受余雨的再一次打击及嗤之以鼻;四,因为荷尔蒙水平不稳定,余雨的脾气变得比怀孕前更差,所以基本上没有一个合适的机会和气氛对余雨做以上煽情温情矫情的表白。事实上老张在余雨怀孕后,说的话并没有比以前更多。有次余雨发脾气的时候,老张斟酌了很久,跟她说“老婆,不要生气,生气对宝宝不好”,立刻被余雨吼了回去 “宝宝宝宝,你就知道宝宝,我不是个人?!哪条法律规定我不能生气?我一生气我还跑去堕胎呢!”吓得老张赶紧闭嘴。

好在余雨不会真的去堕胎。有时候老张觉得美国确实还是有些非常好的规定,比如禁止妇女随便堕胎。有天他看国内的新闻,说一个怀孕七八个月的80后妻子跟丈夫吵架,决定不跟他过了,便立刻去医院做了引产,引产完就提出离婚,看得他一身冷汗。余雨也是一个80后,所以老张深信如果自己和余雨身在国内,他在余雨肚子里播种的孩子可能真的无法撑到安全落地。每每想到这点,老张都不由得深吸一口气,虔诚地感谢上苍及美国成全了他一颗赤父之心。

老张的博士后生涯开展的不太顺利,准确地来说其实是开展的太不顺利。老张的新老板和旧老板在行事风格指导下属上的背道而驰,让从火焰山跳进北冰洋的老张极端无所适从。老张的旧老板是一个有无数想法的人,老张所要做的就是尝试他这些想法看是否可以实现。因为旧老板的想法太多期限很紧,老张并没有时间考虑这些想法是否愚蠢,更不要说培养自己独立找想法的能力。但新老板居然没有一个想法给他。第一次和老张碰面,新老板说完“张,你可以先构思一个项目,想出了轮廓之后再来和我讨论”就拍拍屁股去开会了,将目瞪口呆的老张撂在一片苍茫茫前不见古人后不见来者的异度空间。

总是会有办法的,老张安慰自己说。多看论文,勤思考,一定会有想法的,一定会有的,一定。但是老张发现不知道从什么时候开始,他已经无法坐下来安静地思考,或者说,余雨没有给他任何安静思考的机会与空间。即使他不在家去了图书馆或者呆在实验室,他的心里也无时无刻不牵挂着余雨和她肚子里的孩子,或者说,是他的心已经被余雨的声音和动静填满了。因为效率低下,老张不得不更长时间地泡在图书馆或者实验室里。老张想起来小的时候母亲挑选用来孵小鸡的鸡蛋,对着光照一照,中间有一个小黑点就证明这个鸡蛋可以孵出小鸡。他真想把他要看的那些论文对着光照一照,看哪些论文看了之后会孵化出新的论文来。

老张看完了近期的所有期刊后,却依然没有归纳出任何属于自己的想法。老张是一个纯粹的接收者,像一个黑洞。或者说老张是一个男人,要一个男人努力地去怀孕生孩子确实是太过于难为他。而更大的痛苦是,老张好不容易想出了一个构思,去网上一谷歌发现早在两三年前人家就已经写成论文发表了。老张没有想当初决定读博士是不是一个错误,因为后悔与反思不是他的风格。老张也没有想过转行,因为他的人生已经有十年投入到这个行业当中去,那是他的黄金十年,他不能说放弃就放弃。也许再挖一寸就能见到井水。也许,可能,或者。老张越来越害怕那一个月一次的组会。

余雨不知道老张在新的实验室的所有挣扎,她所看到的只是一个早出晚归的老张,一个对老婆和孩子不负责任的老张。她和老张的交流越来越少,老张似乎也并没有注意到。余雨想通了,她是不可能和这个人过一辈子的,尽管她已经有了他的孩子。

在心理上把老张当成是一个陌生人以后,余雨平静了很多,在挺着大肚子为自己做饭的时候也不再会哭,也不会在去论坛上讨伐老张的不管不问,让他在无数的跟贴中被骂得死无全尸灰飞烟灭。余雨开始认真地学习准备考试和申请学校。余雨发现这个失败的婚姻让她认识到了自己的坚强。未来不管怎么样,应该都不会比现在更差,更可怕。

该来的终于来了,周日的时候老张的新老板给老张发了一封信,要求和他单独谈谈。老张颤抖着手关掉了邮件窗口,像一个老年帕金森综合症患者,余雨斜着眼角看了他一眼,便低下头继续做题。余雨对他这种惊弓之鸟的状态已经习惯了,烂泥是永远扶不上墙的。她做着手里的题,想像它们是一双翅膀两双翅膀,可以终于带着她逃跑,离开,飞翔。她觉得由衷的愉悦。

进了老板的办公室,老张小心翼翼地在老板对面的位置上坐下来。
老板:“张,你知道我找你来是为什么。”
老张:“其实不太清楚。”
老板:“你已经连续五个月在组会上没有任何发言了。”
老张:“我一直在努力,我在努力。”
老板:“我是付你薪水的。”
老张:“嗯,我知道,谢谢。”
老板:“你有没有想过,也许你并不适合学术这条路。”
老张:“不会,我知道有志者事竟成,努力一定会有回报的,在将来的某一天。”
老板:“也不是所有的努力都会有回报,进行学术研究是需要创造力与天分的。”
老张:“我觉得我会有。”
老板:“我欣赏你的态度,但是还是要尊重现实。现在全球性的经济危机袭来,实验室的资金到位并不是很理想。”
老张觉得一股寒气从脚心直升到头顶,他说:“您能再给我六个月时间吗?”还没等老板说什么,老张听见自己继续在用磕磕巴巴的英语说: “我妻子还有两个月就生孩子了,她没有工作,可不可以再给我六个月时间,我一定加油,一定。”
老板:“张,很抱歉,但我的实验室不是慈善机构。”
老张:“我求你,我们全家求你了。”
老板:“如果六个月之内还没有进展,我是没有办法再继续雇佣你了。”
老张:“那一定,谢谢。”

老张和余雨的孩子提前了半个月诞生了,是个女孩,只有六磅重。老张捧着小小的女儿,心里百感交集。他给孩子取名叫Ann,中文名叫安安,希望她能够平平安安地长大。而余雨因为产后晕厥,错过了对孩子姓名的否决机会,否则她是绝对不会给女儿取这样一个土了吧唧的名字的。不过她在这件事上并没有纠缠太久,因为她的大部分精力都用于和前来给她坐月子的老张妈作斗争上了。

余雨不爱老张,更不会爱他妈。对于她一个年过半百的人来给她照顾月子,她并没有太多的感激之情。因为这个孩子本身就是他们全家算计她的,他们自然应该负责任。余雨在过去近两年里学会了无视老张,其实与老张的沉默有着密不可分的关系。她发现她就无法无视絮絮叨叨的老张妈。她出了月子就要考试,所以月子里依然还在看书做题。老张妈一看到就要说她,说月子里不能劳神,看书容易变瞎。余雨不睬她,她就说余雨目无尊长。在余雨看来,没有直接顶撞她,已经证明了自己的极高修养和良好家教。

老张没有卷入这场家庭斗争,因为他已经自顾不暇了。有很多时候人们相信奇迹,但奇迹永远只会发生在小说里,电影里。现实中你以为你在最无助的时候买个彩票就能中上五百万,往往是对号码对了半天发现连50块都中不了。所以如果你要是认为老张真的能够在那宽限的六个月中进行头脑风暴,构思风起云涌,那不过是你同情老张,愿意陪他一起意淫做梦。

老张在挣扎了三个月之后,终于意识到他的唯一出路跟网上的建议一样,就是寻找下一个实验室做他的冤大头。于是他跟余雨建议让他妈把孩子带回国去带,这样节省生活开支,更不至于让孩子在很小的时候就跟着他们颠沛流离。余雨二话不说就同意了,孩子对于她来说完全是个累赘,在肚子里的时候是,生出来之后依然是。她的考试结果出来都不错,申请顺利的话到了九月份就可以开始上学读研了。而开始上学就意味着她终于可以摆脱死气沉沉的老张,絮絮叨叨的老张妈,以及哭哭啼啼的老张女儿。现在有这样一个机会让她提前摆脱掉后两者,有什么理由能让她不欣然接受呢。至于骨肉情深,余雨并没有太多的体会。她认为,只有和爱人生的孩子,才是值得疼爱与珍视的。对于安安,她只能说妈妈对不起你,因为她真的爱不起来。

原来经济危机不仅仅会出现在历史和政治课本上,它是一场能够真正波及到每个人的风暴。老张从来没有想过自己和经济能扯上任何关系,在这场危机中他却好像和经济是绑在一根绳上的蚂蚱。他联系了很多实验室,都是一句话:没钱。在危机中依然有钱的实验室都是厉害的实验室,看不上老张这个在实验室做了一年就被老板扫地出门的Loser。但老张还是要感谢美国政府,体贴地把他的OPT从一年延长到了二十九个月,让他尚可以苟延残喘一把,也好歹可以支撑到余雨开始上学。余雨并不知道老张已经失业了,因为他依然每天早出晚归。大部分的时间老张是去公共图书馆,有的时候只是在公园里闲逛。他只是不想让余雨沮丧,担心,难过。她已经好久不再苛责他,这让他非常感激,又非常不安。老张喜欢余雨的安静,像他最初认识她时的样子。而余雨的安静又让他觉得无比的不安,就好象暴风雨来临之前,总是无比的宁静。他知道余雨拿到了录取通知书,但是什么专业哪个学校一无所知,余雨不说,他就不敢问。余雨依然给他做饭,两个人一起吃饭的时候却尴尬的只有咀嚼食物的声音。老张有时候想开口发声,但看到余雨那张漠然的脸,千言万语往往只化成几个字“嗯,不错,这个挺好吃的。”余雨也并不回答他,仿佛他是个透明的泡泡。

转好身份的那天,余雨给老张摆了一桌鸿门宴。

老张回到家,看见桌上的酱鸭,蒸鱼,西红柿炒蛋,鱼香肉丝,茶树菇排骨汤以及香槟,堆出一个笑脸,装作很快活地问余雨:“哟嗬,今天伙食不错,有什么可庆祝的吗?”

余雨打开香槟,为他斟满酒杯,浅浅地笑了笑:“我转好身份了。”
“不错啊,独立了。”老张抿了口香槟,“是该好好庆祝一下。”
“吃吧,你回来的晚,都快凉了。”余雨说。

得妻若此,夫复何求啊,老张心想。所有的困难都会过去的,哪怕他转行,对,哪怕他转行。最近他在图书馆博览群书,大开眼界,学会了沉没成本这个词。他终于明白他的黄金十年已经像泰坦尼克号一样沉没了,他不适合学术界,他要去工业界,老老实实找一份工作,养家糊口。他依然可以带着余雨和安安奔上小康之路。

但是在老张大快朵颐风卷残云觉得生活掀开新的篇章的时候,他听见余雨说:“张晓翔,我觉得咱们就到这里吧。”“啊,我还可以再吃一点。”老张说。

“我不是说吃饭,”余雨说,“我是说我们。”

老张含着鸭子放下筷子:“余雨,这是什么意思。”

余雨说:“我们离婚吧。”

老张偏头看她,一副不敢相信的样子。但是他的大脑却仿佛早已预知这一切的发生,迅速接受了现实,并且让他的眼泪以最快的速度充满他的眼眶,并且沿着脸颊流下来。余雨看着他这幅窝囊的样子,有些不忍,但她心里清楚地明白,长痛不如短痛,一个错误的不修正,只会引起更多的一连串的错误。在她心里,她和老张这两年多的婚姻,也是一个沉没成本。

在冷静的余雨面前,老张的心像是被石头撞着,是巨大的闷痛。他从来没有像此时此刻觉得自己那么失败过。当他流着泪跪在老板面前请求他再宽限六个月的时候,他觉得不能比这更失败了;后来他抱着安安去打针,小小的安安被护士扎了好几针哇哇大哭,他抱着安安就陪她一起哭,他觉得不会有比这更无力的时候了;然而他的人生却像是一架笔直向下的过山车,带着惊恐无助的他一路冲向深不见底的地方。他没有想余雨的行为是忘恩负义,是过河拆桥,他只是在想他到底是怎么走到了这一步,到底是哪里走错了。怎么会到今天这样,四面楚歌。想到头痛的老张把脸埋在手里,发出受伤的兽一般低沉哀嚎的声音。

余雨不知道老张的心里一直背着那么重的包袱,也不知道他是在一直怎样努力地用他的方式保护着她。否则她不会选择在老张最无助的时候提出离婚,也或者她根本会爱上他。但是正如老张所坚持的那样,这个世界上是没有如果的。如果老张没有那么沉默,也许他就不再是老张,而是老李,老王,老吴了。老张最终没有告诉余雨他的处境,而是同意了离婚。老张把所有积蓄的一大半给了余雨,虽然没有很多钱,但是尚可以缓解一下她要开始念书的经济压力。余雨同意把安安留给老张,因为她知道老张爱安安比她爱的多的多。老张收拾好自己的东西离开之前,余雨说,有空还可以像朋友一样聚聚。老张看着她,说:“余雨,我没有照顾好你,你一定要幸福。”余雨从来没有听过老张这样讲话,她忍不住抱住他哭。老张小心翼翼地拍着她,没有流泪。因为他的泪水在过去的半个月里已经流尽了,结了痂,成了厚厚的盔甲。他也知道,他不会再和余雨像朋友一样聚聚了,他的失业期已经超过了规定期限,失去了在美国的停留权。

老张回国的机票已经订好了,在五天以后。因为并没有什么地方可去,老张拖着箱子,买了一张不知道去哪里的火车票。他在美国七年,勤勤恳恳,兢兢业业,基本上没有出去旅游过。现在要走了,倒是可以看看美国的大好河山。老张坐在靠窗的座位旁,如饥似渴地盯着路边的风景。而那些风景都是转瞬即逝的,就像老张的青春。他想起高中毕业上大学的时候也是坐的火车,也是一样地看风景。那时的老张还是小张,没有现在这么胖,瘦瘦的,浑身透着一股灵气。然后他想起和前老板的那次谈话,他说,做学术是需要天赋的。然后很久以前,余雨最常挂在嘴边的话就是“张晓翔你怎么那么窝囊”。老张眼里的风景和脑子里的画面交织在一起,难解难分。于是他长长地叹了一口气。

“哥们,咋了?”老张旁边的黑人问叹气的老张。

老张说:“我刚刚离婚了。”

“那确实他妈的糟糕”,黑人说,“不过,女人嘛,没什么。走一个,自然会再来一个,这就是人生啊,哥们。”

这段话让老张想起那首王洛宾的歌:太阳下山明早依旧爬上来,花儿谢了明年还是一样的开,我的青春一去无影踪,我的青春小鸟一去不回来
于是老张就不再和他搭话,开始眯起眼睛睡觉,他实在是太累太累了。

终于,老张拿着登机牌坐在候机厅里,透过巨大的玻璃窗户看着外面的飞机,以及像蚂蚁般繁忙的人们。当初他就是这样一个人来的美国,如今他又要一个人回去了。未来的路怎么走,他不清楚。他是否留恋这里,他也不清楚。如果是几个月以前的他,他可能会哭,但是这几个月他坚强了很多。他知道即使他哭,他也不会是为离开美国而哭泣,他哭的不过是自己的韶华。但自从他明白了这些过去的投入都是沉没成本之后,他就不容易为这个哭。他也不再留恋余雨,他能够衷心的祝愿她幸福,说明他不够爱她。他们两个本来就是不对的两个人,余雨没有错。过去的已经过去,而未来即将到来。当飞机升空,再次将老张推向椅背的时候,他紧紧地闭上了眼睛。

祝老张幸福。

第三部分:老张祝福大家,世事静好,平安喜乐

老张不记得自己是怎么下飞机,然后又是怎么到宾馆的。他一路上并没有喝酒,却老觉得自己醉醺醺的,看什么都不太真实。好像有一刻他曾拉着行李箱狂奔,越跑越觉得自己是一头被拴在一个巨大的磨上的驴——他那么努力地往前狂奔,却逃不了回到原点的命运。

老张没有告诉任何人回国的事,连自己爸妈也没有讲。以前听别人说出国就是一条不归路,总觉得有点装B。真到了自己头上,就发现这话说的其实一点也不假。虽然大家嘴里都说如今中国往上美国往下,但谁也不会真以为老张这种裸归族是识时务的俊杰。至于老张父母,虽然总跟邻居叨叨说羡慕人家儿孙绕膝,但提起老张“在美国”时还是不免有种半惆怅的欢喜。所以老张决定还是等找到工作后再分次告诉爸妈他海归及离婚这两件事,好歹不会显得他的人生多么苍凉,也略微缓冲下对二老造成的冲击。

可是没有想到,原来拿着海归文凭在自己的祖国找工作居然也这么难。虽然老张经过博士后经历的洗礼明白了自己不是块做学术的料,但不知道为什么,回国后的第一想法还是去学术界试试。于是老张拿着简历找了几所高校,转了好几圈找到所谓的“相关负责人”。

“相关负责人”的态度却相当傲慢,拿着老张印着J. Biochem.文章的简历对老张说:“你这个条件——虽然是海归,但论文的数量不多,质量也一般哪。博士后做了一年,什么结果都没有——为什么不继续做了?”老张有些尴尬,刚要回答,对方却自己接下去了:“我看你也是没有办法才回来的吧?这样吧,我们这里正在招师资博士后,你要是觉得有兴趣就把简历留下,如果有教授对你有意向的话再跟你约面试的事情。”老张第一次听说“师资博士后”这个名词,本来还想问问清楚,结果对方一副日理万机的样子,直接给老张下了送客令。

回去一百度,才知道师资博士后是个畸形产物,跟大学扩招差不多,主旨是为了构建和谐社会。简而言之是又要做科研又要去教书,并且永远都在考核期。至于待遇就更不清楚,居然是按照人事部全国博士后管委会相关文件制度发放工资。还有这么个部门。老张思来想去,觉得自己虽然对学校留恋,但实在犯不着去做个师资博士后,于是决定还是找个工业界的位置算了。

以前听别人说找“学术界”“工业界”的工作,基本上论调是“唉,混AP无望,只好去工业界了”,好像只要一个有志于学术界的人声明放弃搞学术了,就会立刻被工业界喜出望外地一抢而空。但这事没有发生在老张身上。老张海投了无数份简历,收到的回音却寥寥无几。后来才想到是投工业界的简历需要重新修改的缘故。但不知不觉好几个星期已经过去了。老张本来打算工作定下来后再就近租个房子的,结果发现找工作居然要打持久战,才退了宾馆在光华BBS上找人合租了个廉价的两室一厅。

跟老张合租的是一个大学刚毕业的男生,叫何方。说来也巧,居然也是生物专业的。重点大学本科毕业,不想再继续往上读了,所以也跑来上海找工作。听说老张在美国拿了博士学位,还“读”了一年博士后,景仰不已。结果何方找到工作两个星期以后,老张才拿了三个面试,而且有两个已经明确地黄了。两人晚上在一起喝酒的时候,何方说,兄弟,没事,工作和感情一样,都是水到渠成的事。他们不要你是他们的损失,别跟他们一般见识。再说了,你不是还有一个面试吗,还是美国企业,大公司,好好把握呗。老张抿了口酒,苦笑着说,怎么感觉啥事儿到你嘴里都不算个事儿?何方装作老朽的样子捋了把不存在的胡子说,年轻人,万般皆浮云哪。兄弟,干杯!

老张跟美国公司的面试还挺顺利的,因为方向对口,老张几乎没有在任何一个技术问题上面卡壳。最后一轮面试是见大头。大头说,你的专业知识不错啊。老张谦逊地说,还好,还好。大头说,你填的期望薪资有点偏高嘛。老张有点怀疑自己的耳朵——他明明只填了八千月薪。大头说,我也理解你的想法,博士,海归,还发了一篇非常不错的论文,怎么样都值八千一个月。但是我们公司是按职位来定薪水的,这个职位呢本来就是硕士也可以,所以薪水我们最高只能开五千。你也是找第一份工作,对薪水有期望正常,但是更应该看公司给你提供的发展空间,你认为呢?听了这番话,老张觉得全身的血都刷地一下子涌到头顶上来了。月薪五千,二十多年的寒窗苦读就这样被标了价。老张很想吼一句F word,但是沉默了半晌之后,他听见自己的声音说:“谢谢您,请您再给我一点时间考虑一下吧。”然后轻飘飘地,他被自己的脚带离了那个尴尬的地方。

晚上回去跟何方说的时候,何方说,妈的,兄弟你真是虎落平阳遭犬欺。老张说,没错,就是那种感觉。何方说,不过我要是你,就先把那份工作接了,以后再慢慢跳呗,骑驴找马总比走路找马强。老张说,兄弟,你年轻,有的是资本。我年纪已经大了,第一份工作起点重要。我就不信我他妈的找不到一份像样的工作。何方说,对!不蒸馒头也要蒸口气呀!兄弟,干杯!

然而老张仿佛是被诅咒了,接下来整整一个月,他居然连一个面试都没有。何方的培训期结束,基本上每天都要加班到很晚才回家,自然也无暇再陪老张喝两杯小酒。老张开始每晚做同一个主题的梦,那就是他在各种胡同或者迷宫或者森林里迷路,找不到出口。或者好不容易找到了出口,伸头一看,小路原来通向万丈深渊。

比工作毫无着落更糟糕的是老张的储蓄也日渐减少。他起初以为余雨比他更需要钱,所以把大部分储蓄都留给了余雨,结果到了上海才知道为什么大家都管这儿叫魔都。这地方真的能把一个正常的人变成魔鬼,连从来视金钱如粪土的老张,如今也是满脑袋地在想着马内这种阿堵物。老张后来打电话给那个美国公司的人力资源部,告诉他们说可以接受月薪五千的条件,结果他们说招的人已经上班两个多星期了。老张想,实在不济就去学校做那个劳什子的师资博士后,结果也再没有教授电过他。

老张也开始赶场各种招聘会。但是就像何方说的那样,除了高校里的正式招聘会,外面的大部分都是些低层工作,不适合他这种级别的人去跑。但是和一个人在家里憋着等电话相比,老张还是更宁愿去赶招聘会,可以些微弥补点内心的空虚。但是当他真的跟那些刚毕业的年轻面孔挤在同一个招聘台位前时,心里又是另一样的惶恐。后来招聘会赶多了,感觉就有点像当年去相亲:回到家以后,根本想不起来今天又给哪几个公司递了简历,又分别申请的是什么职位。后来就根本不看是哪些公司在招聘了,就随着人潮走到各个台子前看看。遇到并没有合适的位置的地方,也装作专业地瞅着招聘职位发一会儿呆。

“嘿,张晓翔!”有人狠狠地拍了一下正在发呆的老张的肩膀。

老张吓了一跳,定神一看,居然是高中同桌林立群。

“你不是去美国了吗,怎么回来了也不说一声?”林立群说,“还真不把咱当哥们儿了?”

这话老张还真不知道从哪里接起,因为他从来没有觉得自己跟林立群是哥们儿过。那时候老张是班里的尖子生,林立群是班里的“害鬼”,两人同桌纯属班主任一厢情愿的“一帮一”想法。结果一学年结束,老张还是那个老张,林立群还像老师说的那样“鸡立鹤群”,两人虽然没起过冲突,但也基本没有过共同语言。可是老张还没怎么反应过来,林立群已经吆喝着收了招聘的摊子,把老张押到他的车里去共赴午餐了。

吃饭的时候老张才了解到林立群出现在招聘会场纯粹是个偶然事件。因为他已经是一个不大不小的生物科技公司老总了,这天公司没什么事,才想起去招聘会凑凑热闹。推杯换盏之间,两人不知不觉都有些醉。十几年没怎么联系过的两个人,此刻竟像生死之交似的开始互诉衷肠。老张基本上半带哭腔地说完了这些年发生的事情后,林立群拍着他的背说:“晓翔,跟你说句真心话,我觉得你挺傻的。你会念书考试,这个不假。但你还是傻。有本畅销书叫什么来着,对,穷爸爸富爸爸,回头你得看看!那里面说有些人就爱买些实质上是负债的资产,这说的不就是你吗?你说你当年高中的时候考试,每次你都非得憋着考个全校第一。看上去光鲜吧,其实是给自己下套。后来你有次不小心考了个第二,你眼泪噼里啪啦往下掉的事儿你还记得不?后来你上了名牌大学热门专业,咣,又一个套。大家都觉得你该往上念,你就又往上继续念了,咣咣又两个套,对不,一个是美国留学一个是博士学位?

现在你海归了,看着光鲜,事实你心里也清楚。套儿哽在那儿呢,上不去下不去的,别人看着好,自己难受,其实不值当!你再看看我,当初那老班怎么说我的,说我‘鸡立鹤群’,‘害群之马’。但是我高中乐得轻松,我爸妈也对我没期望,后来我上了个大专他们还给祖宗上香祭拜,搞笑吧!大专毕业,他们都觉得我要是能找到个工作就谢天谢地,结果我找了份工作,月薪八百,他们高兴的什么似的。后来我不高兴干了,把工作辞了,我爸妈伤心也伤心,但也没觉得天要塌下来了,反正我就是那么一个败家子,他们习惯了。后来我开始捯饬保健品,瞎打瞎闹的,运气不错,居然搞了个公司出来。他们还是对我没期望,觉得我搞起来的公司,不是今天就是明天就会倒掉。结果,嘿,后来我给公司换了个时髦名字,如今快要做上市了,我这也算是给自己下了个套。不过有过去的基础摆在那儿呢,我没压力,反正该怎么着就怎么着吧。”
老张借着酒劲,腆着脸说:“立群,不如你招我去你们公司干吧。”林立群立刻打了个哈哈,说:“晓翔,你现在有点儿饥不择食了啊。我这个破公司,对你来说就是个小庙堂,留你是耽误你。哥们儿还是看好你的。”老张还想说点儿什么,林立群抬腕看表,说:“哎呀晓翔,真不好意思,一不小心都这个点儿了,我晚上还约了一个经销商吃饭。那我们改日再聚,好吧!”

跟林立群吃过饭后的一个多星期,老张都没有再去赶过招聘会的场子。他好像是害怕再碰见林立群或者其他什么混的风生水起的熟人,又好像是病了。他的时差明明几个月前就倒过来了,如今白天却老想睡觉。一睡觉就又重复地做万丈深渊的梦,有时他还梦见自己义无反顾地跳下去,然后一头冷汗地被吓醒过来。老张也没有办法再想任何关于钱的事情。

他查账户余额的时候一身冷汗,何方跟他提起很快要交下面一季度房租的时候他也是一身冷汗。为什么啥都那么贵?只买打折商品也那么贵?为什么还是找不到工作,连面试也没有?为什么,为什么自己的人生就像他们调侃的那样是个茶几,上面摆满了杯具?难道还要跟着摆放上餐具?

“你看了浙大那个讣告没有,简直是太可笑了。干杯!”难得没有加班的何方又跟老张喝上了。

“什么讣告?”老张随口问。

“啊?你不知道?就是浙大那个跳楼海归博士的讣告啊。上面居然还注明了微波炉,空调什么的,在网上都被人骂死了。哪有这样恶心人的讣告。”

可是老张听到何方说“跳楼海归博士”六个字,一下子被吓的清醒了,以为何方说的是自己。去网络上一搜,果然是铺天盖地的讨论以及媒体报道。老张仔仔细细读了浙大的讣告,句句都像是写自己的。原来人如果活得卑微,连死了也不会有尊严。浏览完几乎所有的相关讨论,老张觉得被代入着死了一次,然后有幸看到了自己死去之后发生的所有事情,忽然觉得好轻松,想好好地睡上一觉。

老张这一觉睡了整整十六个半小时,异常踏实,连梦都没有做。醒来之后何方说,兄弟,你这一觉睡的够久的,有点吓人。老张说,还好还好,十六个半小时不就等于正常睡眠八小时吗。何方说,看来这一觉睡的精神可以啊,都会开玩笑了。老张说,必须的。何方说,哇,兄弟你不是被穿越了吧,整个人说话口气都变了。老张只是笑笑。

老张的钱本已所剩无几,便给安安买了满满一旅行箱的廉价玩具和一张回家的火车票。看着路边变得越来越熟悉的风景,老张想起很多少年时的时光,真的就如歌里唱的那样:还记得你说家是唯一的城堡,随着稻香河流一路奔跑,微微笑小时候的梦我知道。

老张的父母看到老张回家,惊喜多过于诧异。安安已经开始认生了,开始甚至不要老张接近她,过了一段时间之后就开始张开胳膊要求老张抱抱。老张抱她抱上了瘾,手都麻木了还不舍得放。老张没有想到原来父母已经知道了他离婚的事,因为余雨的爸妈已经为此事登门道歉过了,并且还送了一副金手镯给安安。老张解释了一下决定回国发展的事,老张爸说:儿子,这些天来我跟你妈思来想去,觉得我们自始至终都在包办你的人生。你也三十好几了,大了,你想过怎样的生活,就去过怎样的生活吧。你要是想留在老家去县中当个老师我们也不反对。

老张他爸只是随口一说,老张却觉得这个提议不错,于是就去县中找了下校长。当年的高考县状元,现在的海归博士后,居然要回母校当老师,校长当然是乐开了花,还给开了两千五百元月薪的高工资,至少校长觉得已经够高了。条件嘛,就一条儿,老张必须在两年内考取教师资格证。老张自我调侃说,这真是雄关漫道金如铁,而今迈步从头越啊。他的同事也开他玩笑,说,海归博士后有什么了不起,我有教师资格证书,他还没有!这件事还差点儿被电视台炒作,后来由于老张实在不愿露面才作罢。不过还是有小报记者找到了老张,想知道他的心路历程。老张说,我一个同学跟我说,有些东西,看似光鲜,其实是给自己的人生下套。我当时觉得他是小人得志,在找机会揶揄我,回头一想可不就是那么回事吗。所以我就把我自己的套给砸碎了,过我自己真正想过的日子。

后来,擅长考试的老张很快拿到了教师资格证,反正他也就只擅长这事儿而已。正如何方当初说的那样,感情和工作是一回事,要讲究水到渠成的缘分。老张再婚的那天,还接到了余雨的电话。余雨在电话里说,当初是自己不懂事,对不起老张。如今她也只能祝福他。电话这头的老张笑一笑,宽厚地说:没事儿,都过去了。对了,安安很喜欢她的新阿姨,你放心。你也要幸福。

最后,老张祝福大家,世事静好,平安喜乐。

第四部分:余雨的故事,以及主角们的结局

老张刚刚离开美国的时候,余雨看着变得有些空荡荡的家,心里也有些空荡荡的。离婚这件事她向往已久,但如今真的发生了,却又仿佛变了味道。晚上一个人吃饭的时候,余雨忍不住趴在和老张一起搬回来的二手桌子上哭了起来。记得那时她和老张刚刚搬到这里,家里什么都没有。隔了几条街刚好有个台湾女生要搬家甩卖家具,余雨一眼就看上了这个桌子。付完钱后才知道桌子有多重,没几条街的距离,余雨和老张愣是花了四十多分钟才磕磕碰碰地把它弄回家,还调整了好几次姿势才顺利地把它从门里塞了进来。余雨不知道为什么自己要想起这些事,她明明从来没有爱过老张,也不想再那么窝囊地生活,否则她干嘛要跟老张离婚呢。可是环顾四周,好像每件东西都跟老张有着千丝万缕的联系,都要叫她忍不住放声大哭。

哭归哭,余雨明白她和老张是再也回不去了。她打电话告诉爸妈离婚的事情,差点没把他们气晕过去。余雨从小到大都是一个听话的孩子,在离婚这件大事上居然自己拿了主意。余雨的妈妈又着急又生气,质问她老张到底是哪里不好,不抽烟不喝酒不赌博不嫖娼,又对她一心一意,基本上可以算是新好男人。余雨说她从来没有爱过老张,余雨的爸爸火了,问那么当初她为什么要嫁给他。余雨也不知道怎么回答这个问题。彼时的余雨在一家民企做着一个不上不下的职位,几乎每天都幻想着有王子骑着白马来救驾,然后老张就出现了。结果结婚了她才发现老张根本不是个王子,甚至连白马都算不上,充其量只能算是一头闷驴。但余雨作为一个活生生的人,怎么能就这样和一头驴共度余生。所以余雨说,也许是时过境迁吧。余雨的妈妈直说她糊涂,连孩子都生了,还以为人生可以从头再来。余雨的爸爸吃了几片降压药还是愤怒,说他决不会养出余雨这种忘恩负义的女儿,叫她以后再也不要打电话回家,回国也不准再踏进他的家门。

余雨没有料到父母的反应会如此强烈,而且她不明白爸爸为什么会说她“忘恩负义”。且不说老张到底对她有没有恩情,即便有,她为他尽心尽力地做了两年多的饭,又生了个女儿,基本上也算还的差不多了吧。但是这些话她没法和父母讲,就像她没法和父母讲她这几年过的是怎样的日子一样。挂了电话,余雨用手环抱住自己,哭到胃痛。

原来人真的是越长大越孤单,有那么一天连家都不再是温暖的港湾。是这样的无路可退。好在学校很快就开学了,余雨的生活一下子变得忙碌起来。因为老张给她留下的钱最多只能支撑两个学期的花费,所以除了注册课程和参加社团,她还费了好一番力气在学校找了一份校内工作。余雨发现人果然是一充实就快乐的多。坐在教室里的时候,余雨看着身旁错错落落各色各样的人们,怀疑自己是不是在做梦:昨天她还像一只被关在笼子里的仓鼠一样因为没有出路对老张大发雷霆,转眼她已俨然是一名重返校园前程似锦的独立女性,人生是如此奇妙。

但是这种快乐的感觉并没有持续多久,烦心事就接踵而至了。起先是学校对于国际学生的英语摸底考试成绩出来了,余雨有三门不及格,所以还要额外修三门英语课,平白无故多了好几千的开销。然后是她发现她很难跟上老师讲课的进度,尤其是印度老师的课,基本上属于无解的听不懂状态。而最让她感觉烦恼的是,她发现自己不知道从什么时候开始,好像失去了与人交往的技能。出国之前,余雨还有一帮要好的小姐妹,不管是知心的还是不知心的话,凑在一起总能唧唧喳喳说上一天。后来余雨出国了,发现美国的生活原来根本不像她们想象的那样美好,更要命的是她才知道原来自己拿的陪读签证根本是二等公民的标志,现实中受歧视,连在网上也要被侮辱。老张本来想介绍实验室的女生给余雨认识,拓展一下她的生活圈子,结果人家高高兴兴地来吃了余雨做的饭,却自始至终没有正眼瞧过一下余雨。后来那帮女生走了以后,余雨生气地跟老张大吵了一架。老张好心办了坏事,从那以后再也没有提过帮余雨介绍朋友的事。余雨日子过得不好,自然也不愿意跟国内的小姐妹再联系,甚至连和父母打电话都不再有什么话讲。她一直以为自己的话越来越少只是因为心里不高兴,等高兴了自然就好了,可是现在才发现原来这种退化竟然是永久性的。她心里很期待交往新的朋友,可是别人一和她说话或者微笑,她就不知道该怎么办才好。甚至连上课老师要求做自我介绍的时候,轮到余雨,她都有些手足无措,不知道眼睛要向哪里看,手该往哪里摆。

余雨在学校正式交到的第一个也是唯一一个朋友是李芸。

那天余雨正在学校的餐厅专心地对付一块两美元的廉价皮萨,李芸一手端着盒饭,一手掂着一个大书包走过来,用中文跟余雨说:“嗨,我可以坐在这里吗?”余雨慌忙点点头。李芸便说:“我在英语课上看到过你,你也是来读会计的吗?”余雨又点点头。

熟了之后,李芸说,要不是在课上听过你回答问题,那天八成要以为你是个哑巴呐,你怎么那么金口难开啊。余雨就对她笑笑。

李芸比余雨小两岁,也是从陪读签证转的学生签证,不过性格上跟余雨相差了十万八千里,更准确地说,是和现在的余雨性格相差了十万八千里。她虽然是跟余雨同时入学的,却基本上已经跟学校里所有的中国人混了个脸熟。李芸说:“开始我还以为会计真的是F2专属专业呢,没想到还有国内名校过来的F1,哈哈。不过他们的眼睛都长在头顶上,不爱跟我们这些奸懒馋滑的F2一起玩儿。”

没多久余雨就发现李芸说的没错,甚至连上课的时候,都是F1和F1坐一块,F2和F2坐一块,也不知道他们最开始是怎样分辨出各自所属的群体的。

余雨没有告诉别人她也是从F2转的F1,但是她只和李芸熟点,所以也就和李芸一起跟F2同学扎堆。时间久了,大家也就默认她也是F2出身,只是有点奇怪她从来没有提过任何关于她老公的事情。但因为余雨向来都比较沉默寡言,她们就没有指望从余雨那里探出什么口风来,也算是相安无事。

不知不觉中,一个学期就过去了,冬天到了。余雨陆陆续续地收到了老师伊妹儿来的成绩,除了印度老师给的B+,其他三门都还不错,两门拿了A-,一门拿了A。虽然不能和李芸的全A比,但她已经很开心了。可是这样的开心却有找不到人分享的感觉。余雨后来打过几个电话回家,但是只要爸爸听出是她打的电话,就立刻给掐掉,也不知道他怎么对自己的女儿有这么深的仇恨。余雨的妈妈虽然要好的多,但是她也依然不能接受余雨跟老张离婚这事,每次电话基本上都围绕着余雨糊涂不懂事以后要吃亏展开。尤其是后来老张回到县中去教书,余雨妈妈说:“我们被你方阿姨(当初给余雨和老张介绍牵线的媒人)说的要死,说当初不该把你介绍给张家,把人家害到这个地步。唉,我和你爸爸现在都不太敢出门,怕出去给别人戳脊梁骨。”余雨本来听说老张回到县中去教书心里还有点难过和不忍,后来被妈妈说的多了也觉得很烦,心想他自己不争气关我什么事。于是后来余雨也渐渐地不爱给家里打电话了,什么都放自己心里闷着。

第二个学期上到一半的时候发生了一件大事:李芸突然退学了。那时余雨正和所有的同学一起为了找暑期实习的事情忙的晕头转向,也没有对李芸几天没来上课这事特别上心。后来听同学说是因为李芸在学校交男朋友的事情被她老公发现了,所以逼着她退学的。余雨对于这件事一直都有点将信将疑,因为李芸虽然活泼开朗爱交朋友,但是基本上张口闭口都是“我老公”,一副幸福甜蜜的样子。但大家都有点言之凿凿的样子,搞得余雨也不是很确定。在四大皆空之后,余雨一度想给李芸打个电话,可是她不知道如果真的接通了电话后该和李芸说点儿什么,所以一拖再拖,最终没有打。

改了无数次简历,对着镜子练了无数次面试之后,余雨最终拿到了一个小会计师事务所的暑期实习 ,时薪二十块。她辞掉校内工作的时候,一直对她很苛刻的老太太忍不住抱着她哭,说余雨是她最好的助手,搞得余雨也有些伤感。为什么人总是这样呢,拥有的时候不好好珍惜,直到失去的时候才追悔莫及。但是她知道李芸会撇撇嘴说:“美国人都这样,就会搞些台面上的东西。”李芸好像对什么都看得比较透。但就在余雨正式开始实习之前,传来了李芸自杀未遂然后脑子出了点问题的消息。不多久以后就听说李芸被她爸妈接回国去了。

此后余雨的日子就开始平淡得像翻日历,每天都游走在家,学校,公司的三点一线之间。在念会计之前,余雨还为选专业的事情很是纠结了一番,真正上班了才发现原来会计真的很适合自己。整理那些乱七八糟的数字的时候,就好像也连带着梳理自己的心情。余雨的老板也很喜欢她的认真和聪明,经常对余雨说,雨,你实习完之后可一定要留下来啊,我们这儿需要你。后来余雨真的留在那里做了整整一年的实习生。然而就像李芸以前常讲的那样,美国人最擅长搞的就是台面上的东西,而美国人中最最奸诈的就要属犹太人。但是李芸以前讲的话实在太多,余雨并没有句句都听进去,所以在这上面吃了一个大亏。当余雨的犹太老板明确告诉余雨说因为公司没有名额不能将她转成正式员工的时候,距离余雨毕业只剩一个月的时间,而数天前他还真诚地看着她的眼睛恳求她不要出去找工作就留在这里。这一切来的太突然,简直将余雨一下子打懵了。

自从打算跟老张离婚以后,她就下定决心要努力为自己挣一个美好的明天,当初选择无爱的会计也无非是为了找工作容易。可是此刻余雨终于明白命运对人的嘲弄,也开始理解当初老张的失败并不是因为他不够努力不作为。就好像会计基础说的那样,有借必有贷,借贷必相等,也许出来混的,都是要还的吧。

余雨就是在这个时候认识廖芹芹的。说刚刚认识也不确切,因为她们明明在一起修了好几门课,只是此前从来没有交谈过。那天也不知道是因为什么原因,两个人都脱离了各自的群体落了单,坐在了一起。余雨那时的心情已经糟糕到极致,连上课都忍不住一直流泪。廖芹芹给她递了一张纸巾。下课后廖芹芹才知道余雨是因为工作的事情哭,让她有些惊讶。她一直以为只有没有退路的F1才会为了找工作这种事情抓狂,F2再不济总是可以回去让老公继续养着。余雨沉默半晌,告诉她自己在两年前就离婚了,把廖芹芹吓了一跳,因为她还是第一次在现实生活中近距离接触一个离婚女人,还颇像网上流传的搬运工版本。于是她和余雨说,你连婚都敢离,还有什么好怕的,回头我把一个会计师事务所的单子发给你,你挨个给他们发简历,实在不成就打电话去一个一个骚扰,登门拜访都成。反正you have nothing to lose。虽然后来基本上所有同学都知道了余雨离婚的事,余雨还是因为廖芹芹那句话一直对她心存感激。在这种光脚不怕穿鞋的精神鼓舞下,余雨居然拿到了两个公司的聘请通知。

刚刚到新公司上班没几天,余雨就发现背后老是有人冲她丢纸团。她有点不敢相信这年头还有人玩高中时逗女生的把戏,回过头想瞪人,却看见一群故作无辜却忍俊不禁的笑脸。看见余雨回头,他们很高兴,连忙凑过来跟她做自我介绍。而事实是余雨根本不擅长记美国人的名字,直到一个多星期以后才把他们各人和名字对上号。但那帮家伙俨然已经把余雨当成了自家姑娘,成天玉玉玉地叫个不停,虽然他们在工作方面和余雨并没有什么交集。

后来余雨一直想不起来自己是从什么时候开始记住杰森的名字的。杰森也是“那帮家伙”中的一个,也是最年轻最帅的一个,比余雨还要小三岁。余雨也想不起来自己到底是从什么时候开始和他渐渐地熟稔起来的,是第一次杰森给她听他IPOD里面的老乐队Phish的歌,还是下雨天在公司的内部messenger上面给她说“Rain rain go away, come here another day”,又或是那天余雨问他周末是不是打算和女友去看电影时他说“why you think I should have a girlfriend”?和杰森在一起,余雨觉得自己变得快乐了很多,他总有那么多好玩的事情可以讲。余雨听说美国人不打小孩,就问他小时候有没有被爸爸打过,他说,哦,我爸爸拿着皮带跟在我后面追,我就在前面疯跑,但是我知道他不会打我,他也从来没有打过我。余雨说,那你为什么还要跑呀。杰森说,如果你是我,看见我爸拿着一根皮带跟在后面怒气冲冲地追赶,你也会跑的呀。然后两人在一起笑的抹泪。杰森还给她看非死不可上面他幼儿园时的照片,小小的杰森灰头土脸地坐在教室一角,丝毫没有要长成玉树临风的迹象。公司summer party结束的时候,杰森第一次短暂地抱余雨,说,路上小心哦。余雨说,我又没有喝酒。杰森莞尔一笑,说,傻瓜,你得当心我们这些喝了酒的坏人呀。过三十岁生日的那天,余雨有些沮丧,杰森说,你要是真的那么在意年龄,我们交换好了呀,那么就是我三十岁了,哇哦,确实有点大了哦。

即使心底再怎样不愿承认,余雨也清楚地知道自己是喜欢上杰森了。跟老张提离婚的时候,她从来没有想过这辈子还要再恋爱结婚。后来经不住妈妈一再唠叨,她也去交友网站注册了个帐号,但是联系她的几个男人没有一个稍微靠点谱的,后来就不了了之。但是无论如何她也没有想过要喜欢一个美国男人,还是搞的姐弟恋。李芸以前一直说美国人就喜欢搞台面上的东西,所以余雨也不清楚杰森到底是喜欢她呢,还是完全出于人道主义精神地逗那时成天不开心的她欢笑。甚至于像网上说的那样,这个年纪的美国男人约会无非是为了玩玩而已。

杰森是在他家的船上和余雨表白的,那时余雨正在出神地看船底溜过的水母泛起盈盈的蓝光,而不远处的公园正在放着烟火。后来的事情就比较美国化了,杰森领她回家去自己的房间,看桌上摆着的童年少年青年的照片。聊了一会儿天,杰森便去洗手间淋浴,留下余雨坐在桌边,不知道该怎么样开口和他坦白自己的过去以及怎么样继续。然而想想又觉得可笑,自己明明已经是结婚又离婚连孩子都生过的过来人了,面对男人居然还拘谨的像个处女。也许爱一个人的时候就是这样,有点像政客竞选时希望自己的过去光辉灿烂,一丝污点也没有。等杰森出来的时候,他惊讶地发现余雨竟然已经把桌上放的红酒喝掉了半瓶,而她根本是从来不喝酒的人,连summer party那么多人劝她都没有喝。更令他惊讶的是,余雨喝了那么多居然还没有醉倒,英文居然也流利了很多,不停地要跟他说这样说那样,而且句子跟句子之间毫无逻辑可言。

第二天早晨,余雨头疼欲裂地在杰森的床上醒来,却发现杰森已经不在身边了。她发现自己居然是和衣而睡的,难道昨天晚上什么都没有发生?桌上是杰森倒好的牛奶和一张龙飞凤舞的便条:雨,面包在冰箱,早餐愉快。余雨满心欢喜地讲便条收起,好像是得了一条“存在过”的凭证。吃过早饭,到了公司却发现杰森并没有去上班,一连好几天都没有消息。余雨有些忐忑地试着问了一下他们组的人,他们说,啊,你不知道啊,杰森忽然大姨妈来了,吵着闹着要去滑雪,请了两个星期的假,也不知道是不是真的跑澳大利亚去了——这个疯子,老板都差点儿把他给开了。嘿嘿,你已经开始想他啦?整整两个星期。余雨觉得自己的心里凉凉的,每天都像在深海里行走。空气像水一样厚重,压得她喘不过气来。这就是爱情吗。幸好还有工作可以填补这样空虚的灵魂。但是即使在忙碌地工作,她依然觉得整个人都空空的。两个星期之后,杰森回来了,还是年轻阳光的样子,只是皮肤好像又晒黑了一点。他还是跟余雨笑着打招呼,说自己怎样跑去悉尼滑了好多天的雪,但是余雨知道和以前不一样了。而那个表白,好像当时的烟花一样绽放又消泯了,仿佛从来没有存在过。留着便条又有什么用呢?三十岁的余雨还是那么傻。

余雨是最后一个知道杰森要换工作的人。而且是最后一天才知道。她问杰森为什么,杰森说,更高的工资,更自由的工作时间,更好的职位,为什么不呢。余雨说,杰森,你知道我问的是什么。杰森说,如果你真的想知道为什么,我们可以去街上走走。余雨想也没想放下手上的工作就出去了。在熙熙攘攘的街头,杰森说,雨,我去悉尼滑雪其实也是想冷静一下。其实我还是喜欢你的,只是……只是你配不上我。

然后你可以找到更好的吗?那你为什么要跟我表白呢?余雨想到那句经典拒人台词,有点恼怒地问。

杰森笑了一下,说,雨,你不要生气,其实我能接受你结过婚的事,活了这么多年,谁的身后没有点阴影呢。我和家人谈了一下,他们也不是不能接受你离过婚,雨,他们只是没办法接受一个不要自己小孩的母亲做我的妻子。你能理解吗?

余雨没有想到他要说的是这些,一下子愣住了。是连眼泪都流不出来的痛。余雨开始零零星星地想起那晚和杰森说的那些话,说自己这些年是怎样的痛苦,一直到工作才真正甩掉F2的帽子,还是因为美国人压根儿搞不懂自己国家签证的事儿。她当初是怎样和老张相亲,稀里糊涂地嫁人,直到现在都不愿意回想自己曾经怀孕生女的事实,却每次洗完澡看着依然松弛的小腹感伤。还有小学时的梦想,大学时妈妈怎么样叫她小小年纪不要交男朋友,后来工作了又开始急着让她相亲结婚。反正正如杰森当时所体会到的那样,乱七八糟,毫无逻辑。然而也是狼狈得一览无遗。

回到公司,两个人都装作好像什么都没有发生过。下午的时候,杰森像每个离职的同事那样平常地来和余雨道别。余雨看着他,快要哭出来。但是因为他们平常本来感情就不错,所以别的同事也不以为意,还起哄说,哈,傻瓜小雨想要一个拥抱来着。于是拥抱。是那样近,又那么远。

没有了杰森的生活好像也没有多少的不同,余雨的生活只是越来越趋于平淡。她健身,上班,烹饪,偶尔酗酒。杰森的家人说的没有错,不要小孩的母亲心得有多狠。余雨无论如何也不明白当初是怎么毫无表情地让老张妈把小小的安安带走的,甚至连一张合影都没有和她照。和杰森分手之后,她好像越来越想念安安,甚至于看到街上玩耍的孩童都要心痛。她想过给安安打电话,也真的打过,但是每次听电话的都是老张妈或老张爸。他们问她要找谁的时候,她说张安安。可是张安安还那么小,他们就奇怪地问她是谁,她就不知道该怎么回答,做贼心虚一般地挂了电话。次数多了,他们也猜出来了,问她“你是余雨吗”。从那以后,余雨就再也没敢打过电话。

老张妈打电话告诉余雨妈老张要再婚的消息时,客客气气地说“其实也没什么,就是亲家一场,跟你们知会一声。”但是余雨妈可不会这么想。老张自从回了县中教书之后,人变得开朗许多,学历又高,自然有不少姑娘倾慕。余雨妈本来就为余雨当初草率离婚恨的不得了,如今又被亲家有意无意地示威抢白,忍不住又叨叨余雨一番,说她当初昏头昏脑不想好,有了孩子还离婚,如今看她一个二婚头还没嫁出去,老张已经香饽饽一样被下街头抢跑了。但经过多年的历练,余雨只抓住了重点,那就是老张要再婚的事,于是回她说,那也挺好的,晓翔确实是个好人,他会幸福的。余雨妈一时竟然不知道该怎么把话题继续下去。

可能不仅仅是女人,应该是每个人都会犯贱。就好像小孩子明明已经不要的玩具丢掉,如果被别的小孩捡走,却又要去生生地要回来,其实自己并不是真的珍惜。而成人的世界又有不同,不是什么东西说要回来就要回来的。给老张打完电话,余雨躺在床上,回想起和老张半路夭折的婚姻,忽然有点面目模糊的感觉,也不明白自己当时哪来那么多的愤怒。如果当初没有离婚,现在是不是也还不错,有个完满的三口之家。可是在老张那里哪里有如果这种事,余雨想着他一根筋的样子又有点明白当初为什么要那么生气。更可恨的是这个人居然连回国都没有告诉自己一声。早知道他这么薄情,当初那么多追求的男生里就不该挑中他。那么也就不会遇见杰森。好像也没有后悔遇见他。这些乱七八糟的事情让余雨想的有些头痛,直想睡觉,可是头越痛就越睡不着,越要想事情,成了恶性循环。

喝了几杯酒,又分次吃了十几粒安眠药以后,余雨终于把困倦不已的脑袋成功地放进梦境里了。这感觉真是又甜美又舒服。她好像是躺在船上被海浪轻轻地摇着,像一个襁褓中的婴儿。很多亲人和朋友和她招手问候,有国内的也有国外的,她真没想到这些人能聚在一块儿。然后她梦见自己漂到了一处古色古香的地方,池塘里荷花开的正好,水波清澈见底,像是仙境一般。最后是大片大片盛开的郁金香,而一个亭亭少女站在最那头。不知为什么,余雨知道那就是安安,于是叫:安安。安安看了她一眼,说,你不是我妈妈。余雨说,我是妈妈呀。但自己吐出的妈妈这两个字生涩无比。安安转身就跑,一边跑一边说,你不要我了,你不是我妈妈。余雨急了,一边叫着安安一边跟着她跑,却跑进越来越浓的雾里面去。

【不悲不喜的结局】

翻江倒海无休无止的催吐洗胃过后,余雨终于醒了过来。护士说,你真是太幸运了,要不是电话打的及时不知道会发生什么事情。

余雨疲倦地对她笑笑,说,我可以吃点东西吗,好饿。护士笑,每个洗完胃的人第一句话都是这个啊,连自杀的都没有说让我去死的。余雨也笑。

死里逃生的感觉原来是这么好,所有稀松平常的事情都有异常幸福的味道。余雨满足地啃着三明治,庆幸自己当时居然醒悟过来且死撑着拨打了911。

重新回公司上班的时候,余雨照见自己在玻璃门上的影子。那种感觉,就好像是和另一个自己迎面走来,又擦肩而去。她对自己提醒着不要放弃自己,永远不要。

感恩节假期的时候,余雨回到了阔别几年的家。余雨爸看到女儿瘦弱的样子,将扬起要打她的手放下,又抬起去拭眼角的泪花。余雨抱住他和妈妈,说,对不起,让你们担心。

余雨还去见了安安,没想到她已经长到这么大了。安安有些警惕地看她,老张说,安安,这是你的妈妈呀,去,让妈妈抱一抱。安安看看老张,扑闪扑闪几下眼睛,听话地走到余雨的怀里。余雨小心翼翼地抱着安安,问她:可以让妈妈亲一下吗?安安摇摇头,又点点头。老张笑着说,她现在有时还把摇头和点头搞混呢。

经过老张老婆的批准,两个曾经剑拔弩张的人如今隔着一张茶桌遥遥相对,都有一种恍若隔世的感觉。老张说,好像是掉进水里差点儿被溺死了,如今终于站在桥上看云淡风轻。余雨跟他不经意地提了过量服用安眠药的事。老张惊讶于余雨竟然因为他再婚而“殉情”,余雨笑他自作多情,那不过是心里有事儿,又喝了酒,不小心drug overdose罢了。老张心有余悸地说,以后别再喝了,酒多误事也伤身。余雨说,已经戒了。老张说,现在这状态看上去还行。余雨说,嗯,昏睡时我想通的最大一件事就是要学着接受自己。老张说,没错儿,我们都是普通人。余雨说,确实没错儿。

老张送余雨下楼。看着她渐远的背影,老张听到风里传来甲壳虫的Yesterday,这歌声让他想起不知什么时候在网络上看到的一篇短文:

如果,你就这样轻飘飘,轻飘飘地
跌落在风里
你会飞到哪去
是飞到云上,还是飞进溪流里
在最后的一瞬,你会看到谁的名字
它让你叹息,还是欣喜
后来,谁在为你唱最后一首歌
她唱的轻缓,而又湍急
她唱你的一生就像个夏季,五月方始,八月就结束
你的微笑像干掉的花瓣被镶在透明相框中,她一边唱一边看着你哭
而那天你是见了谁微笑,然后,跌落在风里
要相信人的一生大多是骗局,误会,以及不必要的相逢,和擦肩而过
谁叫你依旧心怀感激,为了那些相逢,相识,和所有来不及的不悲,或喜

【悲剧结局】

手机响起的时候,老张正带着安安在操场上放风筝。

那边说:您好,这里是纽约警署,请问您是余雨的丈夫吗?

老张说:呃,我是她前夫。

那边说:哦,不好意思,她填的紧急联系人还是您的信息。我们有一个不幸的消息要通知您。余雨已经在两天前去世了,我们初步怀疑她是自杀,但具体原因还在调查中。无论如何,希望您能通知她的家人来处理一下后事。

老张说:对不起,我没太听懂,您可以再说一遍吗?

对方一共重复了三遍,可是老张还是听不懂,或者他的脑子根本已经是一片空白,又或者他根本就不想听懂。

风筝的线不知道怎么搞得断了,安安一边追一边嚷嚷着“爸爸风筝飞跑跑啦”,老张也听不懂她在嚷嚷什么。他好像一下子被扔到一段真空里,树是漂浮的,云是漂浮的,一切都是漂浮的,包括他自己。

老张从来没有想过自己还会再回到美国,还是和余雨的爸妈一起。离婚后他也做过好几个与余雨重逢的梦,但从来没有现在这个场景。

余雨的公寓在十七楼,她以前总相信这种所谓的幸运数字,居然现在还是相信。老张看到她桌上摆的还是她大学一年级时和室友拍的照片,笑容还是无忧无虑得让老张觉得那不是他所认识的余雨。余雨的妈妈一边哭一边唱着悔不该当初让老张把余雨带到美国来,老张好像是第一次听到“悔不该”这个词,然后又想起以前最讨厌的“如果”。

他从来没有像现在这样强烈地盼望世界上有所谓“如果”:如果可以退回到“悔不该”的时候,那么那天电话里他就不要叫余雨“放心”;如果时间可以再倒退一点,他就可以直接从余雨汗津津的手心里把那枚求婚的戒指抠回来,那么他们就不会结婚;如果干脆再倒回一点,那么他自己当初就不要来这个操蛋的美国。这些无数令人憎恨的如果在老张的心里撞击着,一度要使他窒息。于是他走到窗边,把窗子拉开,是那么新鲜的空气,那么好的街景。隔着十七楼的距离,来来往往的车流也有了远离尘嚣的宁静。余雨是那么热爱生活的一个人,他从来没有试图了解过。是他将她归纳成一个数字,又变成如今这个小小的盒子的。余雨的妈妈说的其实都对。

“张,你在做什么!?”美国警察惊呼。

然而老张已经像一片羽毛一样,轻飘飘地从窗口跃出去了。他有些惊异于人的身体可以如此轻盈,于是他像无数个梦里那样舒展开双臂。只是和梦里不同的是,此刻的他没有一丝恐惧和哀伤,反倒有种投入一场爱情般的欣喜。

离地面越来越近的时候,老张听到风里传来甲壳虫的Yesterday,这歌声让他想起不知什么时候在网络上看到的一篇短文:

如果,你就这样轻飘飘,轻飘飘地
跌落在风里
你会飞到哪去
是飞到云上,还是飞进溪流里
在最后的一瞬,你会看到谁的名字
它让你叹息,还是欣喜
后来,谁在为你唱最后一首歌
她唱的轻缓,而又湍急
她唱你的一生就像个夏季,五月方始,八月就结束
你的微笑像干掉的花瓣被镶在透明相框中,她一边唱一边看着你哭
而那天你是见了谁微笑,然后,跌落在风里
要相信人的一生大多是骗局,误会,以及不必要的相逢,和擦肩而过
谁叫你依旧心怀感激,为了那些相逢,相识,和所有来不及的不悲,或喜

字符串相似度的数学原理和开源工具

在 DNA 测序,蛋白质测序,计算语言学等研究领域,其研究对象可以是一个字符串,也可以是一个短文本,甚至一篇完整的文章。例如:

  1. 在蛋白质测序领域,其案例形如:Cys-Gly-Leu-Ser-Trp;
  2. 在 DNA 测序领域,其案例形如:AGCTTCGA;
  3. 在计算语言学领域,其案例形如:it is rainy today;

在以上的科学领域中,如何对字符串进行研究就显得尤其重要,一种方式是直接对字符和字符串本身进行研究与分析,另一种方式是对字符,单词,句子进行嵌入式的操作,将其映射成欧式空间中的向量,然后再对其进行数据分析和机器学习建模。本篇文章将会从字符与字符串本身出发,分析字符串与字符串之间的性质。

如果需要研究字符串之间的相似性与距离,大致有以下两种方案:

  1. 基于序列的方法(sequence-based);
  2. 基于集合的方法(set-based);

顾名思义,可以将字符串看成序列,然后使用序列的相似性或者距离来计算两者之间的性质;也可以将字符串看成集合(或者多重集合),然后使用集合(或者多重集合)的相似性来计算两者之间的性质。

基于集合的方法

n 元语法

n 元语法(n-gram)是自然语言处理中最常见的模型之一,它指的是文本中连续出现的 n 个词语。例如 X="\text{it is rainy today.}" 其 n 元语法分别是:

  1. 1 元语法(unigram):it, is, rainy, today
  2. 2 元语法(bigram):it is, is rainy, rainy today
  3. 3 元语法(trigram):it is rainy, is rainy today

对于一个长度为 m 的字符串 X=X[0,\cdots,m-1]=[X[0],\cdots,X[m-1]] 而言,其 unigram,bigram,trigram,multiset(多重集合)分别是:

  1. 1 元语法集合:unigram(X)=\{X[i], 0\leq i\leq m-1\};
  2. 2 元语法集合:bigram(X)=\{X[i]X[i+1], 0\leq i\leq m-2\};
  3. 3 元语法集合:trigram(X)=\{X[i]X[i+1]X[i+2], 0\leq i\leq m-3\};
  4. 1 元语法多重集合:multiset(X)=\{X[i]:d[i], 0\leq i\leq m-1\},

其中 d[i] 表示 X[i] 出现的次数。通过 n 元语法,我们可以将一个字符串转换成一个集合,然后通过计算集合之间的相似性来评估字符串的相似性。对于字符串 X,Y 而言,其相似度可以转换为:

sim(X,Y)=\begin{cases}fun\_sim(unigram(X),unigram(Y)),\\ fun\_sim(bigram(X),bigram(Y)),\\ fun\_sim(trigram(X),trigram(Y)).\end{cases}

其中 fun\_sim 表示集合的相似度计算函数。

dis(X,Y)=\begin{cases}fun\_dis(unigram(X),unigram(Y)),\\ fun\_dis(bigram(X),bigram(Y)),\\ fun\_dis(trigram(X),trigram(Y)).\end{cases}

其中 fun\_dis 表示集合的距离计算函数。

集合的相似性或者距离有很多方法可以计算。对于集合 A,B 而言,其 fum\_sim 的选型就包括但不限于以下几种:

\text{Jaccard Coefficient}(A,B)=|A\cap B|/|A\cup B|;

\text{Overlap Coefficient}(A,B)=|A\cap B|/\min(|A|,|B|);

\text{Dice Coefficient}(A,B)=2\cdot|A\cap B|/(|A|+|B|);

\text{Cosine Coefficent}(A,B)=|A\cap B|/\sqrt{|A|\cdot|B|};

\text{Tversky Index}(A,B)=|A\cap B|/(|A\cap B|+\alpha\cdot|A-B|+\beta\cdot|B-A|);

其中,\alpha, \beta \geq 0. 同时,不仅集合之间可以进行交集,并集的计算,多重集合之间同样可以进行类似的操作,于是上述方法同样可以应用在多重集合上。

而在字符串距离中,有一个特殊的方法叫做 bag distance,也就是将字符串转换成 unigram 的多重集合,然后计算其距离。令 bag(X),bag(Y) 表示字符串 X,Y 的 unigram 多重集合,然后 bag distance 就可以定义为 \max(|bag(X)-bag(Y)|,|bag(Y)-bag(X)|). 其中 |\cdot| 表示多重集合的 SIZE,减法 - 表示多重集合的差集。

基于序列的方法

最长公共子序列与最长公共子串

在数据结构这门课中,在讲解动态规划的部分,一般都会提到最长公共子序列(Longest Common Subsequence)和最长公共子串(Longest Common Substring)。而子序列和子串其实定义是不一样的。对于序列 [x_{0},x_{1},x_{2},\cdots,x_{n}] 而言,其子序列(subsequence) [x_{n_{1}},\cdots,x_{n_{k}}] 指的是从原始的序列中通过去除某些元素但不破坏余下元素的相对位置(在前或者在后)而形成的新序列。子串(substring)是相对于一个字符串而言,它是其原始字符串中的完整一段。例如:对于“苹果手机”而言,“苹手”是其子序列,但“苹手”并不是子串。

在这里,如果需要计算两个字符串 XY 的最长公共子序列的长度和最长公共子串的长度,就需要使用动态规划方面的知识,构建其边界条件和动态转移方程。

首先,我们来计算两个字符串 XY 的最长公共子序列。假设 mn 分别是字符串 XY 的长度,i.e. X=X[0,\cdots,m-1], Y=Y[0,\cdots,n-1].

L(m,n)=L(X[0,\cdots,m-1], Y[0,\cdots,n-1]) 表示字符串 X[0,\cdots,m-1]Y[0,\cdots,n-1] 的最长公共子序列的长度。则可以得到其状态转移方程如下:

L(m,n)=\begin{cases} L(m-1,n-1)+1, \text{ if } X[m-1] == Y[n-1] \\ \max(L(m-1,n), L(m, n-1)), \text{ else }. \end{cases}

其边界条件是 L(0,j)=L(i,0)=0, \forall 0\leq i\leq m, 0\leq j\leq n. 返回 L(m,n) 即可表示最长公共子序列的长度。

例如,X="abcd", Y="ced", 则有

L(4,3)=L("abcd", "ced")=L("abc","ce")+1

=\max(L("abc", "c"),L("ab","ce"))+1=\max(1,0)+1=2.

其次,我们来计算两个字符串 XY 的最长公共子串。假设 mn 分别是字符串 XY 的长度,i.e. X=X[0,\cdots,m-1], Y=Y[0,\cdots,n-1].

L(m,n)=L(X[0,\cdots,m-1], Y[0,\cdots,n-1]) 表示字符串X[0,\cdots,m-1]Y[0,\cdots,n-1] 的最长公共子串的长度。则可以得到其状态转移方程如下:

L(m,n)=\begin{cases} L(m-1,n-1)+1, \text{ if } X[m-1]==Y[n-1] \\ 0, \text{ else }. \end{cases}

其边界条件是 L(0,j)=L(i,0)=0, \forall 0\leq i\leq m, 0\leq j\leq n. 返回:\max_{0\leq i\leq m,0\leq j\leq n}L(i,j) 即可表示最长公共子串的长度。

例如:X = "abc", Y="bcd", 则有最长公共子串的长度是 L(3,3)=2.

Jaro 和 Jaro-Winkler 相似度

首先,我们来定义两个字符串之间的 Jaro 相似度。对于两个字符串 X, Y 而言,如果两个字符 X[i], Y[j] 满足以下两个条件:

  1. X[i]=Y[j];
  2. |i-j|\leq [\max(|X|,|Y|)/2]-1;

X[i],Y[j] 被称为匹配(matching),其中 |\cdot| 表示 string 的长度,[\cdot] 表示高斯取整函数。在此定义下计算出 X,Y 的匹配字符为 X',Y'. 从定义可以得到 X',Y' 的长度是一样的,记为 m.t=[\#\{0\leq i\leq m-1:X'[i]\neq Y'[i]\}/2] 称为 transposition。于是,Jaro 相似度就可以定义为:

\text{Jaro Similarity}(X,Y)=\begin{cases}0,\text{ if } m=0;\\ \frac{1}{3}\bigg(\frac{m}{|X|}+\frac{m}{|Y|}+\frac{m-t}{m}\bigg).\end{cases}

例如,

  1. X="martha",Y="marhta", 可以得到 X'="martha",Y'="marhta", 于是 m=6,t=1, 因此,Jaro 相似度是
    Jaro("martha","marhta")=\frac{1}{3}\bigg(\frac{6}{6}+\frac{6}{6}+\frac{6-1}{6}\bigg)=0.94.
  2. X="DWAYNE",Y="DUANE", 可以得到 X'="DANE",Y'="DANE", 于是 m=4,t=0, 因此,Jaro 相似度是
    Jaro("DWAYNE","DUANE")=\frac{1}{3}\bigg(\frac{4}{6}+\frac{4}{5}+\frac{4-0}{4}\bigg)=0.82.
  3. X="DIXON",Y="DICKSONX", 可以得到 X'="DION",Y'="DION", 于是 m=4,t=0, 因此,Jaro 相似度是
    Jaro("DIXON","DICKSONX")=\frac{1}{3}\bigg(\frac{4}{5}+\frac{4}{8}+\frac{4-0}{4}\bigg)=0.77.
  4. X="arnab",Y="aranb", 可以得到 X'="arnab",Y'="aranb", 于是 m=5,t=1, 因此,Jaro 相似度是
    Jaro("arnab","aranb")=\frac{1}{3}\bigg(\frac{5}{5}+\frac{5}{5}+\frac{5-1}{5}\bigg)=0.93.

其次,我们来定义两个字符串之间的 Jaro-Winkler 相似度。对于字符串 X,Y 而言,其 Jaro-Winlker 相似度定义为:

\text{Jaro-Winkler Similarity}(X,Y)=\text{Jaro Similarity}(X,Y)

+ \ell\cdot p\cdot(1-\text{Jaro-Winkler Similarity}(X,Y)),

其中 p 表示系数(默认是 0.1,可以调整),\ell 表示 |X|, |Y| 的最长前缀子串的 SIZE,并且不超过 4。

例如:X="arnab",Y="aranb", 可以得到 \ell=2. 因此,Jaro-Winkler 相似度为 0.9333333+0.1\cdot 2\cdot(1-0.9333333)=0.946667.

Levenshtein 距离

Levenshtein 距离是编辑距离的一种形式,所谓编辑距离,指的是在两个字符串之间,由一个转成另外一个所需要的最少编辑次数。在这里的编辑操作包括:

  1. 更换:将一个字符更换为另一个字符;
  2. 删除:删除一个字符;
  3. 插入:插入一个字符;

对于字符串 X,Y 而言,|X|,|Y| 分别表示字符串 X,Y 的长度。则可以用动态规划的思想来计算 Levenshtein 距离。用 Lev(i,j) 表示 X 的前 i 个字符和 Y 的前 j 个字符的 Levenshtein 距离,L(|X|,|Y|) 表示两个字符串的 Levenshtein 距离。

Lev(i,j)=\begin{cases} j, \text{ if } i=0,\\ i, \text{ else if } j=0,\\ \min\begin{cases}Lev(i-1,j)+1,\\ Lev(i,j-1)+1,\\ Lev(i-1,j-1)+1_{X[i-1]\neq Y[j-1]} \end{cases}\text{ otherwise }.\end{cases}

其中 1 表示指示函数,1\leq i\leq |X|, 1\leq j\leq |Y|.

例如:kitten -> sitting 的 Levenshtein 距离就是 3。因为

  1. kitten -> sitten:替换 k -> s;
  2. sitten -> sittin:替换 e -> i;
  3. sittin -> sitting:增加 g.

距离与相似度的转换

对于相似度 sim 和距离 dist 而言,只要找到某个递减函数就可以将其互相转换。

  1. f:[0,+\infty)\rightarrow [-1,1] 是将距离转换成相似度的函数,则可以表示为 sim = f\circ dist, 其中,f 是严格递减函数,值域属于 [-1,1], f(0)=1.
  2. g:[-1,1]\rightarrow [0,+\infty) 是将相似度转换为距离的函数,则可以表示为 dist=g\circ sim, 其中,g 是严格递减函数,值域属于 [0,+\infty), g(1)=0.

例如:

  1. Levenshtein 相似度就可以用函数 1-lev(X,Y)/\max(|X|,|Y|) 来转换;
  2. 基于最长公共子串/最长公共子序列的相似度既可以使用函数 1-lcs(X,Y)/\max(|X|,|Y|), 也可以使用函数 1-lcs(X,Y)/\min(|X|,|Y|) 来计算。

开源工具 py_stringmatching

如果需要计算两个字符串的相似性,可以直接使用开源工具 py_stringmatching。通过 py_stringmatching 的官网可以看到,其主要功能分成两个部分,第一部分是 Tokenizers 的介绍,第二部分是各种相似度的计算。

Tokenizer

在第一部分 Tokenizers 中,本质上就是将一个字符串切分成一个序列。其主要的切分函数分成五种,分别是:

  1. Alphabetic Tokenizer:返回最长连续的英文序列;
  2. Alphanumeric Tokenizer:返回最长连续的英文/数字序列;
  3. Delimiter Tokenizer:根据某个指定的字符串来进行切分;
  4. Qgram Tokenizer:基于 Q 元语法的切分;
  5. Whitespace Tokenizer:基于空格的切分。

从以上的切分方式来看,py_stringmatching 更适用于英文,因为中文需要使用专门的切词工具。这里的 return_set=True 指的是返回 set(去除重复的元素)。

首先来看 Alphabetic Tokenize 的案例:

from py_stringmatching import AlphabeticTokenizer

al_tok = AlphabeticTokenizer()
print(al_tok.tokenize('algebra88analysis, geometry#geometry.'))

# 输出:['algebra', 'analysis', 'geometry', 'geometry']

al_tok = AlphabeticTokenizer(return_set=True)
print(al_tok.tokenize('algebra88analysis, geometry#geometry.'))

# 输出:['algebra', 'analysis', 'geometry']

其次来看 Alphanumeric 的案例:

from py_stringmatching import AlphanumericTokenizer
alnum_tok = AlphanumericTokenizer()
print(alnum_tok.tokenize('algebra9,(analysis), geometry#.(geometry).88'))
# 输出:['algebra9', 'analysis', 'geometry', 'geometry', '88']

alnum_tok = AlphanumericTokenizer(return_set=True)
print(alnum_tok.tokenize('algebra9,(analysis), geometry#.(geometry).88'))
# 输出:['algebra9', 'analysis', 'geometry', '88']

然后看 Delimiter Tokenizer 的案例:

from py_stringmatching import DelimiterTokenizer
delim_tok = DelimiterTokenizer()
print(delim_tok.tokenize('algebra analysis geometry  geometry'))
# 输出:['algebra', 'analysis', 'geometry', 'geometry']

delim_tok = DelimiterTokenizer(delim_set={'$ #$'})
print(delim_tok.tokenize('algebra$ #$analysis'))
# 输出:['algebra', 'analysis']

delim_tok = DelimiterTokenizer(delim_set={',', '.'})
print(delim_tok.tokenize('algebra,analysis,geometry.geometry'))
# 输出:['algebra', 'analysis', 'geometry', 'geometry']

delim_tok = DelimiterTokenizer(delim_set={',', '.'}, return_set=True)
print(delim_tok.tokenize('algebra,analysis,geometry.geometry'))
# 输出:['algebra', 'analysis', 'geometry']

再次来看 Q 元语法的案例:QgramTokenize 的参数包括:

  • qval = 2:q 元数组;
  • padding = True:是否需要加上前后缀;
  • prefix_pad =‘#’:前缀;
  • suffix_pad = ‘$’:后缀;
  • return_set = True:是否去重
from py_stringmatching import QgramTokenizer
qgram_tok = QgramTokenizer()
print(qgram_tok.tokenize('algebra'))
# 输出:['#a', 'al', 'lg', 'ge', 'eb', 'br', 'ra', 'a$']

qgram_tok = QgramTokenizer(qval=3)
print(qgram_tok.tokenize('algebra'))
# 输出:['##a', '#al', 'alg', 'lge', 'geb', 'ebr', 'bra', 'ra$', 'a$$']

qgram_tok = QgramTokenizer(padding=False)
print(qgram_tok.tokenize('algebra'))
# 输出:['al', 'lg', 'ge', 'eb', 'br', 'ra']

qgram_tok = QgramTokenizer(prefix_pad='^', suffix_pad='!')
print(qgram_tok.tokenize('algebra'))
# 输出:['^a', 'al', 'lg', 'ge', 'eb', 'br', 'ra', 'a!']

最后来看 Whitespace Tokenize 的案例:

from py_stringmatching import WhitespaceTokenizer
ws_tok = WhitespaceTokenizer()
print(ws_tok.tokenize('algebra analysis geometry geometry topology'))
# 输出:['algebra', 'analysis', 'geometry', 'geometry', 'topology']

print(ws_tok.tokenize('algebra analysis geometry  geometry topology'))
# 输出:['algebra', 'analysis', 'geometry', 'geometry', 'topology']

ws_tok = WhitespaceTokenizer(return_set=True)
print(ws_tok.tokenize('algebra analysis geometry  geometry topology'))
# 输出:['algebra', 'analysis', 'geometry', 'topology']

Similarity Measures

下面来介绍开源工具 py_stringmatching 的常见相似度函数。

Bag Distance,Levenshtein 函数的使用:

from py_stringmatching import BagDistance
bd = BagDistance()
print(bd.get_raw_score('algebra', 'algebraic'))
# 输出:2

print(bd.get_sim_score('algebra', 'algebraic'))
# 输出:0.7778

from py_stringmatching import Levenshtein
lev = Levenshtein()
print(lev.get_raw_score('algebra', 'algebraic'))
# 输出:2

print(lev.get_sim_score('algebra', 'algebraic'))
# 输出:0.7778

其中 bag,Levenshtein 相似度的定义是 1 - raw\_score/\max(|X|,|Y|), 其中 |\cdot| 表示字符串的长度, X,Y 表示字符串。

Cosine,Dice,Jaccard,OverlapCoefficient,TverskyIndex 函数的使用:

  • 这些函数的输入都是 set 或者 list;
  • 如果是需要比较字符串,则可以使用 Tokenizer 函数将其切分或者转换,例如 1 gram;
  • 这些函数的 get_raw_score 与 get_sim_score 是一样的,因为都是相似度函数。
from py_stringmatching import Cosine, Dice, Jaccard, OverlapCoefficient
cos = Cosine()
print(cos.get_raw_score(['algebra'], ['algebra', 'analysis']))
# 输出:0.7071

dice = Dice()
print(dice.get_raw_score(['algebra'], ['algebra', 'analysis']))
# 输出:0.6667

jaccard = Jaccard()
print(jaccard.get_raw_score(['algebra'], ['algebra', 'analysis']))
# 输出:0.5

overlap = OverlapCoefficient()
print(overlap.get_raw_score(['algebra'], ['algebra', 'analysis']))
# 输出:1.0

tversky = TverskyIndex()
print(tversky.get_raw_score(['algebra'], ['algebra', 'analysis']))
# 输出:0.6667

Jaro,Jaro Winkler 函数的使用:

  • 这两个函数的输入都是 string;
  • 这两个函数的 get_raw_score 与 get_sim_score 是一样的;
from py_stringmatching import Jaro
jaro = Jaro()
print(jaro.get_raw_score('algebra', 'algebraic'))
print(jaro.get_sim_score('algebra', 'algebraic'))
# 输出:0.9259

from py_stringmatching import JaroWinkler
jw = JaroWinkler()
print(jw.get_raw_score('algebra', 'algebraic'))
print(jw.get_sim_score('algebra', 'algebraic'))
# 输出:0.9556

Hamming 距离的使用:

  • 只能适用于长度一致的字符串;
  • 相似度的计算是通过 1-raw\_score/length 得到的;
from py_stringmatching import HammingDistance
hm = HammingDistance()
print(hm.get_raw_score('algebra', 'algebri'))
# 输出:1
print(hm.get_sim_score('algebra', 'algebri'))
# 输出:0.8571

开源工具 FuzzyWuzzy

FuzzyWuzzy 是一个计算 STRING 相似度的开源工具库,其值域是 [0,100]. 如果需要计算相似度,直接除以 100 即可。

from fuzzywuzzy import fuzz
print(fuzz.partial_ratio('algebra is interesting', 'algebraic is good'))
# 输出:65
print(fuzz.partial_token_sort_ratio('algebra is interesting', 'algebraic is good'))
# 输出:59
print(fuzz.partial_token_set_ratio('algebra is interesting', 'algebraic is good'))
# 输出:100
print(fuzz.token_sort_ratio('algebra is interesting', 'algebraic is good'))
# 输出:62
print(fuzz.token_set_ratio('algebra is interesting', 'algebraic is good'))
# 输出:62

开源工具 python-Levenshtein

Levenshtein 距离也可以使用开源工具 python-Levenshtein 来计算,形如:

from Levenshtein import distance
print(distance('algebra', 'algebraic'))
# 输出 2

参考资料:

  1. 最长公共子串:https://www.geeksforgeeks.org/longest-common-substring-dp-29/
  2. 最长公共子序列:https://www.geeksforgeeks.org/longest-common-subsequence-dp-4/
  3. Jaro 与 Jaro-Winkler 相似度:https://www.geeksforgeeks.org/jaro-and-jaro-winkler-similarity/
  4. Levenshtein 距离:https://en.wikipedia.org/wiki/Levenshtein_distance
  5. n 元语法:https://zh.wikipedia.org/wiki/N%E5%85%83%E8%AF%AD%E6%B3%95
  6. 开源工具 py_stringmatching:https://anhaidgroup.github.io/py_stringmatching/v0.4.2/index.html
  7. 开源工具 FuzzyWuzzy:https://github.com/seatgeek/fuzzywuzzy
  8. 开源工具 python-Levenshtein:https://github.com/ztane/python-Levenshtein/
  9. Cui, Yi, et al. “Finding email correspondents in online social networks.” World Wide Web 16.2 (2013): 195-218.
  10. Rieck, Konrad, and Christian Wressnegger. “Harry: A tool for measuring string similarity.” The Journal of Machine Learning Research 17.1 (2016): 258-262.

昨夜无眠,为了一个学生

程代展:昨夜无眠,为了一个学生

昨夜无眠,为了一个学生。

五年前,他在清华大学数学系四年级。他可以保送直接攻读博士学位,参加了我们所的入学考试后,研究室建议我考虑他。面谈后,我同意了。

事情开始得非常顺利,他请我担任他大学毕业论文的导师,我给了他一个解矩阵半张量积方程的小题目。讨论了几次之后,他就做下去了。他很快进入角色,做了一些小的结果。他的毕业论文,我修改过。后来他告诉我,得了“优”。我也比较满意,觉得他赢在了起跑线上。

硕博连读的第一年,他在研究生院上课,接触不多。第二年回所,我很快发现了他的优点。从素质上说,他数学基本功扎实,和他讨论数学问题是一种享受。一些需要细想或计算的问题,交给他就好了。少则数小时,多则一、两天,一定会给你一个“Yes”或“No”的解答。

他在科研上的敏感性也很难得。例如在讨论布尔网络可控性时,他首先发现了控制传递矩阵的特性,我们一起,很快导致了一个很简洁的能控性公式。这个公式不久后被两个以色列人重新发现。碰巧我是他们文章的审稿人,我告诉他们:一模一样的公式我们已经发表了。这是一个比较深刻的结果,后续引用也很多。没有他,这就不是我们的了。

他在实验室口碑很好,他负责研究生的一些组织工作,很负责,室领导也很满意。他被认为是室里最用功的学生,白天、黑夜都在实验室干活。虽然家在北京,但周末常不回家,有时回家看看,半天就回来了。

他几乎是个无可挑剔的好学生,听话出活,对我的要求(现在反省可能有些过份了),从来不说:“No”。我渐渐地被他感动了,将自己的希望寄托在他身上。我跟他说:“我是一个失败的运动员,当我成了教练员,就把全部希望放在了学生身上,但愿他们能实现自己当年的梦想。”

当博二开始的时候,他的研究成果已经相当多了。为了他的成长,我对他提了个要求:30%时间做研究,70%时间念书。这一年,他主要上了微分几何以及相对论的课。另外,由于自己主要在确定性方向工作,我不希望他在随机方面有缺陷。

我让他自学“随机过程”,每周报告一次,用的教材是Z. Brzezniak, T Zastawniak, Basic Stochastic Processes。我要他连每一道习题都要讲清楚。到了第二学期,听众只剩我一个人,我们还是一直坚持到讲完。事实证明,这些结果在他后面关于概率布尔网络及混合策略博弈的工作中得到很好的应用。

我自己一生吃了英语的不少亏,因此,我一再强调他英语一定要过关。从博一开始,我每年都安排他出国开会至少一次。博三,在我的协助和支持下,安排他到英国、美国、新加坡等进行学术访问。上个暑假,他到英国Glasgow访问了两个半月,他明天就要去美国Texas Tech Univ.访问四个月。新加坡的Xie教授答应他什么时候去都可以。

他有一张令人羡慕的成绩单。他已经发表了十几篇期刊论文、十几篇会议论文(至少一半是国际会议)。还有一本和我及我另一个毕业学生合写的专著:“Introduction to Semi-tensor Product of Matrices and Its Applications”,World Scientific (600 pages) 。他的论文包括IEEE TAC的Regular Paper (第一作者),Automatica的Regular Paper (第二作者),Systems and Control Letters (第一作者),中国科学 (第一作者),等等。同行一看就知道这些文章的份量。

他还有若干在审或待发表的文章。例如,他在Glasgow大学访问时写的一篇文章。他曾要求我参加,我要他把我名字去掉,给我道个谢就行。我就是希望培养他真正独立从事科研的能力。这篇文章投IEEE TAC,最近编辑部来信,作为 Regular Paper,一次就接受了。IEEE TAC是IEEE CSS的旗舰杂志。

他多次被评为三好学生,获得若干种奖学金,今年得了数学院的院长特别奖。他还得过控制界很有影响的关肇直奖。他才二十五岁!我对他充满期待,也充满信心。他成了我对未来的一个梦!

我坚持要求,他毕业后到国外做两年博士后。他已经得到英国Glasgow Univ.和瑞典Royal Institute of Technology的博士后邀请(注意,不是“申请获准”,而是“邀请”)但我认为他应当到正在最前沿做最好的研究工作的地方去。半年前我和UCSB大学的一位当红教授联系,他当时口头同意接受他。不久前在日本见到该教授,确定在今年CDC两人见面一谈,算是Interview罢。

这似乎是一个美丽的故事。然而,矛盾出现在半年前。一天,他突然跟我说,毕业后他想去银行,或者到中学当教师。他还告诉我,他已经考过会计师。我大吃一惊,但以为是年轻人一时头脑发热。几次争辩后,我甚至义正辞严地对他说:“你就死了这条心罢,我是绝对不会答应的。”

后来,他同意了我这样的建议:先做两年博士后,两年后再做决定。我跟他明确说:“我既不要你跟我做,也不要你做与我有关的题目。但你天生就是做科研的材料,不能自暴自弃。”

时间过得飞快,上周五,他突然对我说,北京某中学给他Offer,要在本周二(今天)前签约,而他明天就要到美国去了。我一下子急了,和他谈了两个钟头。好话坏话都说尽了。好话是:“你这样做,中国,甚至世界可能会失去一个优秀的科学家。”坏话是:“年轻人要有理想,有抱负,怎么可以向往‘老婆孩子热炕头’的生活?”我告诉他:“你一定会悔的。”可不管我怎么说,他就只重复一条理由:“做研究太累,没兴趣,不想做了。”最后,他答应再好好想一想,大家就不欢而散了。

周一见了他,就问他想得如何。他说回了一趟河北老家,和父母以及老家亲戚都谈过,他们都支持他。我傻眼了,说他们不了解科研,也不了解你的情况,你应该和教授们谈谈。昨天,室里许多人跟他谈。我还搬兵找到陈老师,心想:“我的话你不听,老院士劝你,总该听罢?”陈老师是个爱才的人,一听这事也急了,立刻答应:“我可以找他。”可惜,陈老师似乎也没能动摇他的决心。

昨天我们对他是连番轰炸,直到晚上,几位年轻人,还有一位来访的年轻教授,一起请他吃饭。准备在席间再劝劝他。昨晚我回到家里,饭后一个人发呆,欲哭无泪。我曾对他说过:“我的底线是:最后的决定权还是你的,我不会强迫你。”那位访问教授背后曾问我:“你明明是为他好,明明知道他的决定是错的,为什么不能强迫一下?”这勾起了我的心病,我告诉她:“因为强迫儿子按我的意志生话,我把他逼上了绝路。我不能再……”

昨天晚上十点多,我实在忍不住,给一位年青同事打电话。他告诉我:他们的“鸿门宴”还在继续,只是仍无进展。现在,也许他正在签约……反省自己,我一直把他当着一个听话的好孩子。总是像父母亲一样强行安排他的一切,很少了解和尊重他的意愿。

我对这一切的解释就是:“我是为了你好!”可这够吗?现在的我,是又一次“哀莫大于心死”。

可谁能告诉我:是我错了,还是他错了?

程代展,2012年11月13日

…………………………………………………

学生:我为什么逃离科研

在来美国的前一天晚上和程老师吃饭的时候,师兄告诉我们程老师下午发的博客已经上科学网首页了,但当时也只有40多个回复而已,我们也没有在意,毕竟程老师的博文经常上科学网首页。当晚我们并没有继续讨论我工作选择的事情,而是像往常一样随便侃了侃,甚至还讨论了点学术问题。回宿舍以后我还跟几个好友开玩笑的说“哥出名了,上科学网首页了”。但没想到的是,我真的出名了,第二天我下飞机开了手机以后,短信不断。这几天很多朋友、同学、实验室老师、甚至毕业后就一直没有联系过的本科辅导员都纷纷对我表示关心,或支持我的决定,或劝我重回科研道路,不管怎样,我都很感动,在这里先向他们的关心表示感谢。当然也还有几位记者发邮件过来要采访。我本来不想回应,想继续沉默下去的,但是程老师说他认为这个事情的讨论对许多年轻博士生是有好处的。仔细想一想,这也许是我这个科研逃兵在离开前能对科研界做的最后的,其实也是唯一的贡献了。反正也已经出名了,程老师把书名、奖项都列出来了,想肉我的早就肉到了,死猪不怕开水烫了,就发在人人吧。

前面两部分我要先帮程老师和我家里人说几句话,对这些不感兴趣的可以直接从第三部分开始看。

一、关于程老师

首先要帮程老师说几句话,因为很多支持我的都说程老师太push了。其实我一直觉得程老师是国内科研界少有的非常nice的导师之一,不但不push,还经常告诫我要多休息,多出去玩玩儿。另外程老师也给我们之间创造很多学术之外的沟通机会,会隔三差五的带我们出去吃饭,和我们几乎是无所不谈。我研一的时候在程老师面前还是非常拘谨的,但没多久就能畅所欲言了。实验室秘书都说程老师的学生都跟他“没大没小”的。只是在和他的交流中我一直不敢说自己以后不想搞科研了,因为我深知程老师对我寄予厚望,我说出来他肯定非常失望的,而又因为这几年和程老师培养出的感情,我不想让他失望。我甚至一直在想就这样坚持搞科研搞下去,但真正到了该抉择的时候,我还是选择了自私的按自己的意愿。

二、关于家里的意见

还好我父母都不上科学网、水木这样的网站,不然看到那些说我是因为他们给的压力而放弃科研的猜测后,不知他们会不会鸭梨山大。我父母确实是没钱没权也没啥本事的,不过因为有单位分的房住,他们靠自己不高的工资在北京也是生活无忧的,所以他们也从来没有要求过我赚大钱养活他们,只要我过得开心就好,他们甚至还认为家里如果能出个科学家是件光宗耀祖的事情。我年轻的时候也是向往过赚大钱的,不过渐渐的觉得自己其实更喜欢稳定安逸的生活,钱够花就成,当然能保证稳定安逸的话钱还是多多益善哈。所以如果不是我彻底厌恶了科研的话,我觉得科研这工作挺符合我的要求的,社会地位不低,待遇也足够过比较体面的生活了,关键是极度自由。我光棍节那天回姥姥家(程老师听成了老家,差了个lao,不过这无所谓了)算是开了个会,并不是他们劝我赶紧去挣钱,而是我想问问他们对我选择中学这样一个地位不高,挣钱也不多(不算自己外面接活的话,挣钱真的多不到哪去,被it民工们秒杀,更别提金融界的温拿了。而以我的性格,除非真的缺钱,不然应该不会去接活的),还挺累的职业有没有什么意见。最后大家一致认为我真的厌恶科研的话,坚持干一辈子科研一定不会幸福的,而他们并不在意我的名利地位什么的,中学老师也挺好。

三、我为什么逃离科研

其实很简单,唯一的原因就是没兴趣了。没兴趣还算个比较中性的词的话,我其实可以说我已经厌恶科研了,主要原因有两个:

1. 累。但再次强调这不是程老师强迫的,程老师给我安排的大多数任务都没有给定deadline,只是因为我从小被教育成听话的“好”孩子,只要别人给了我任务并且应该是我做的任务,不管我喜不喜欢,都会尽力去完成,不只是科研问题,甚至是帮实验室干杂活,都是完成的既快又好。这样的结果就是导致了程老师以为我喜欢做科研,所以就忍不住不停的给我安排任务。如此恶性循环了下去。后来实验室秘书也说,如果当时我能更加变通的面对程老师安排的任务,给三件就做一件,程老师也不会批评我什么的,而我也不会被自己给自己的压力压垮了。当然比体力累更重要的是心累,体力其实有时候根本就谈不上累,我甚至可以好几天在实验室坐着无所事事的刷着微博逛着人人,甚至干脆出去跟朋友打牌爬山什么的去了,但这时脑子里还一直装着那些想不出来的问题,还有一些该做但实在是很烦,不想去做的任务(比如审一些很水很水很水的文章…),半刻也不得安宁。当我决定退出科研的时候,心里是久违的无比的轻松,而这样的轻松,更加坚定了我的决心;

2. 没能力。这真不是装13。我虽然是有几篇控制界顶级期刊的文章,但顶级期刊的文章不等于是顶级文章。说实话,我还真是觉得我这几篇大文章无论理论上还是应用上都不算真的有用,甚至技术难度上也没啥挑战性,只是相比当今大批的水文,这些算是矬子里拔将军,我也没有为这些文章以及由这些文章而带来的荣誉真正的兴奋过。然后发的那么多其他文章中还有一半以上是程老师被一些国内期刊、会议邀稿而又不好不给面子,临时凑的没啥营养的综述类文章,而且真的是程老师自己主笔的,我只是帮帮忙而已。反正我是觉得这些只能证明我比较勤奋,根本不能说明我有天赋有能力。如果我继续搞科研的话,我能想象出的结果只有两个,要么迫于学校要求发文章的压力沦为灌水机器,虽然还能混得不错,不过天天自己鄙视自己,要么就是坚持不发水文,但又因为能力不足以做出真正有价值的工作而混得很惨。我觉得程老师的博文下面有一条回复对于我的看法是相当正确的:

“[682]kanhaoxi

2012-11-17 04:42

From what you described, especially“听话出活,对我的要求,从来不说:‘No’”, this student is clearly not a top student. If he is not even a top student, he will definitely not be a top researcher. In this case, it is better to advise him to get into some other things. Unfortunately, many Chinese professors’ definition of top students are different from other people. They usually promote those students similar to this student of yours. This is unfair to truly top students.”

当然也有一些对现在科研界风气的不满,不过这个我了解不深,就不胡说了,说多了被人笑话,还有推卸责任之嫌。

四、我为什么选择中学

1. 我觉得我有足够能力应对中学数学的知识。这与我觉得我完全没能力做有价值的科研工作形成了鲜明的对比。不过除了知识能力,教中学更重要的是授课能力。我很清楚我现在的授课能力和优秀教师还有很大差距,但通过了学校的试讲,也在试讲中pk掉了不少北师清华北大的硕士博士们,至少说明了我还是具备基本的授课能力,我也相信授课能力是通过我自己的努力可以提高的。当然除了授课以外,优秀的中学教师还需要很多其他素质,比如基本的师德,对孩子的关心,亲和力等等,但这些我觉得我都还是不错的。

2. 我也很喜欢教会别人知识的那种成就感。我也做过家教,我觉得当几个小时的家教比搞几个小时的科研舒服多了。我今年寒假还帮一个微积分挂了的大一孩子补了两天的微积分,当她告诉我她补考得了90多分的时候,那成就感啊,杠杠的。

3. 生活比较稳定。以后生活中比较麻烦的事情,比如住房、子女入学等都可以解决了(房子不给产权,只是在职就可以住),但是中学老师的工资对一个博士毕业生来说确实不算多。

4. 我真的是没时间找其他工作,找工作的黄金时间我在美国啊。其实我之前真的都准备听程老师话,毕业去做博后了,因为我本来是要10月底就来美国访问的。但签证意外的被check了,于是要晚走半个月。然后没事干,就投了投简历,其实我也只投了4所高中,没有投其他行业,甚至我投的时候我也觉得我一定是赶不上试讲了,其中我在投给人大附的简历中还写道“因为本人11月至3月在美国,如果有幸能有资格通过初选参加试讲,是否可能将试讲安排在3月?”。但没想到有两所学校很快就通知试讲了,其中某个学校的效率意外的高,上午试讲下午群面第二天终面,终面后不让走,等都面完了直接出结果,于是赶上了我能在出国前签约,要不我觉得他们也不会把职位给我留到回国后。这种种意外也算是一种缘分吧,再加上该学校也是所很好的学校,他们的教育改革理念(至少是宣传片上的)我也很欣赏,并且他们的待遇在高中也是很好的,跟家里商量后我就同意了。另外我真的没有考CPA啊,程老师记错了,我怎么会有时间准备CPA…..

当然我也知道当高中老师并不是很轻松的事。比如说很累,不过这点搞过科研的表示呵呵。比如遇到实在不听话的孩子和无理取闹的家长,这种事情比较棘手,我有心理准备,但现在还不知道要怎么处理,以后会从同事那里得到经验的吧。再比如我虽然觉得我通过努力能提高自己的授课能力,但万一再怎么努力也真的不行呢?这个….到时再说吧。

写了这么多废话,总之就是我确定我对搞科研没兴趣了,而我觉得我对教中学是有兴趣的。我也觉得中学需要引进优秀博士,前提是得保证他们的教学质量,他们会给学生带来更广阔的视野。当然科研界更是亟需人才的,其实哪里都需要优秀的人才的(这是一句废话)。只是我自己肯定不是科研界需要的人才,对科研没有兴趣的人是不可能做出真正有意义的成果的,我希望自己可以是教育界需要的人才吧。就说这么多了。

————————————————

看了大家的评论,这里再多啰嗦几句,要说的不多,就不另开一贴了。

1. 辟个谣,我去的不是人大附中。帖子里说的是我在给人大附中投的简历中写了什么什么,后面说的签约的是“某个学校”。

2. 我强调的对科研失去兴趣是累和没能力,也就是两者交互作用的结果,并不是单纯的累。如果只是累,而我很有能力,能够或者相信自己能够在长久的辛苦后可以得到令自己满意的成果,哪怕中间会经历很多次失败,也会是痛并快乐着,甚至很享受这样的过程。但我现在没有并且也不认为自己有能力可以取得令自己满意的成果,所以这一过程只是痛苦。至于我该不该认为自己没能力,该不该不满意我现在的成果,其他学生如何避免我这样的想法,都是另一层面的问题,也不在我有能力讨论的范围了。而我现在已有的自我认知,是短期内无法改变的了。

3. 有批评说我没有国家使命感没有献身科学的精神,这些批评我都同意,但无法改正。

4. 还有人说我这篇文章会使很多彷徨的年轻学者放弃科研,于是我成了中国科研界的千古罪人什么的。这我就真不敢苟同了。能被我影响而放弃科研的人,一定是跟我一样没兴趣没能力的人,我们的离开不会对真正的科研界造成任何损失。真正的有意义的科研成果也绝不是靠人海战术完成的。中国的国际论文发表量已是世界第二了,但又如何了呢?

5. 确实我投身教育并不是我对教育有多么的热爱,因为我还没从事过,热爱无从谈起。只是我现在相信我有能力,我也觉得我有兴趣。也许几年后,像部分网友们说的那样,我会像现在逃离科研界一样逃离教育界,哪里都是围城,在外面永远搞不清里面是什么样子的。以后的事情以后再说了,也许我会再次厌恶逃离,但也许会很热爱呢,也抑或不喜欢也不讨厌,就这样平淡的继续下去。现在我只是从一条确定性的不幸福的道路,转到了一条有可能幸福或者说是未知的道路。

程代展的学生 

2012年11月23日

…………………………………………………

程代展:我的反思(续:昨夜无眠,为了一个学生)

因为明天一早就要飞成都开会, 科学网的访谈参加不了了, 就以这篇博文作为我的答卷罢. 
 
那是一个难眠之夜过后, 自己坐在办公室, 想到此时我的学生可能正在签约, 心头怅然若失, 手中的工作做不下去, 就将心里话写成《昨夜无眠》. 没想到这成了引玉之砖, “一石激起千重浪”. 说明“如何培养学生”,“怎样才能将有天分的学生留在科研第一线” 等问题是科学网上的青年学生和老师们共同关心的焦点. 事件本身和所有网友的意见, 都给我启迪, 催我反思. 现在将我反思的心得提交出来, 算我的回答, 也算我的致谢, 当然, 还是一块再次的抛砖.
 
(1)    我的最大错误是把学生当作我自己的“替身”, 盼着自己没有实现的人生梦想能在他身上实现. 但他是有血有肉、有个性、有想法的年青人, 我却把他当作自己的创造物. 我想让他吸取我人生的教训、克服我身上的弱点. 潜意识里我是在制造完美的自我. 我时时在他身上寻找年轻时我的影子, 我觉得我对他倾注了无数心血和真诚的爱, 实际上也许我却成了说一不二的暴君, 强迫他按我的意志去念书, 去做研究. 也许正是这个让他厌倦了科研.
 
(2)    我只关心他的三件事: 数学基础打得怎么样? 英语口语讲得怎么样? 科研做得怎么样? 对于他个人的思想感情, 生活, 以及家庭情况等都知之甚少. 两人见面, 除了学术还是学术, 没有朋友般的交心, 更没有刻意培养他对学术的兴趣. 对学生, 我只有梆梆控制, 却无视反馈.
 
(3)    网上许多年轻朋友用自己的亲身经历说明: 应当尊重年轻人选择自己生活道路的权利. 我的学生其实也说过, 他的价值观和我不一样. 我接受了大家的观点, 中午给他发了个 E-mail, 告诉他 (他现在还在去美国的飞机上) : 不管他最终的选择是什么, 我都支持他.  
 
(4)    中午, 一位清华年轻教授给我来电话, 他曾是我的博士后, 他用自己的经历给我上了一课: 他是正宗清华子弟兵, 从本科到博士, 在清华上了十年. 然后跟我做了两年博士后. 也是一个极聪明的好学生. 但上完博士后他却要去公司, 当时我也很不理解. 他说, 他当时也是厌倦了学校和科研所的生活, 想过一种新的生活. 他后来又回了清华, 而且做得很好. 我相信, 我的这位学生如果真喜欢科研, 将来某一天他也会回归的.
 
怎么带好学生, 让他们健康成长, 是值得老师们反思的一个问题. 但是, 事情还有另一个方面: 
 
(1) 我仍然相信, 一个博士生去当中学教师是一种教育资源和人力的浪费. 他学的许多知识: 例如微分流形, 鞅不等式之类的东西, 到中学不成了天方夜谭? 那怕微积分, 线性代数这些初等数学知识, 都不会有用武之地. 这不是看不起中学教师, 中学教师对社会, 对民族科学文化水平的提高同样至关重要, 但一个师大本科毕业生会比像我的学生这样受过专问训练的高等人才干得更好得多. 因此, 让博士们, 特别是像我的学生这样优秀人才去教中学, 是教育制度的失败, 社会人才分配的失衡.
   
(2) 据说北大清华本科毕业生, 一等的上公司, 二等的出国, 三等的才去读研. 中国要走科技强国之路, 如果不能将有天分, 有潜质的年轻学子推上和留在科研岗位上, 将会后继无人. 国家花大力气从国外引进百人计划, 千人计划, 这我不反对. 但是, 难道国内就没有可以与他们一较上下的优秀人才, 为什么就不重视他们呢? 难道就不相信, 中国人自己也可以培养出一流的人才? 引进总是有限的, 国家应当为年轻人的成长创造条件. 
 
(3) 高校和科研院所待遇低, 是人才流失的一大原因. 还拿我的学生说罢, 他到的中学可以给他提供住房和不错的工资. 他们说, 他如果到大学, 要奋斗五到十年才能达到这个水平. 据我所知, 他家境欠佳, 他面临生活的压力. 正像许多参加讨论的年轻人说的, 大学的青年教师工资低, 没住房. 许多得了博士学位的年轻人, 他们多半都小三十了, 面临着结婚生子的压力, 靠空洞的 “理想”, “事业”,  “追求” 等能拴得住他们吗?
 
(4) 虽然近年来国家对教育与科研的经费投入不断增加, 但目前高校与科技机构经费分配极不合理. 少数特权者占有大量资源, 各种基金重叠分配. 而身缠多金的“学术带头人”却常常只是“学术捎客”, 弄了钱让下面的年轻人干活, 自己挂名. 国家应当更多关心那些高校和科研院所中的“小博士”们的疾苦, 给他们创造安心工作的条件, 他们才是科研的主力. 再强调一次, 高校和科研院所中的贫富悬殊一点不比社会上轻. 
 
最后, 谢谢所有网上给我留言的朋友. 也感谢那么多给我打电话、发 E-mail的朋友. 十八大刚过, 愿它给年轻学子带来实质性的改善, 中国的科技进步归根到底靠的是他们.

程代展
写于2012年11月14日

评复旦姜文华事件 — 国际经济学家张五常

关于复旦大学青年教师姜文华刺杀王永珍教授的事,当然是悲剧。我不想评论,但好些朋友问及,我不妨将自己的观点说说。首先要说的,是我知道的只是一些网上数据,没有其他。

姜文华显然是一个天赋不俗的数学家。这样说不仅因为他在国际的知名学报发表过好些文章,重要是有一篇据说被“大量引用”。作为一个炎黄子孙,文章在西方被引用不容易。种族歧视明显。

举一个例,诺斯的一本说明是拜我为师的书,被引用了约四万次,但我这个可怜的师傅的所有英语作品加起来,被引用还不到九千!杨小凯就曾经为文直指斯蒂格利茨抄袭我的一个脚注获诺奖而破口大骂。

其他还有几位诺奖得主也被中国的同学替我骂了。这些事我历来不管,因为认为将来的经济思想史会有公论。不要误会,我绝对不是说文章被引用的次数多有什么了不起。

在经济学来说,无数的被引用次数多的文章是废物,何况我对姜文华从事的数学一无所知。我只是要说,一个炎黄子孙在西方发表学术文章,多被引用不是那么容易。


姜文华的学术生涯本来不错。他在美国攻读博士的Rutgers University有水平,而博士后参与研究的NIH与Johns Hopkins University皆属世界级。2012年回国后任教于苏州大学五年,其后姜文华进入复旦大学任教职。从美国的常规看,过了五、六年,姜文华从一家大学转到另一家,复旦聘请他时应该给予他终身雇用合约。这是美国的惯例。

这里,姜文华从苏州大学转到复旦,是往高处转,应该获终身雇用合约为起点才对。但没有。算是有学术贡献的姜文华,博士后在美国研究两年,苏州大学五年,复旦大学五年,共十二年,还没有获得终身雇用合约,被解雇,不是悲剧是什么?


也不要误会,我绝对不是说姜文华应该被升为副教授或获终生雇用合约。我不知道。我要说的,是纵观上述的姜文华的履历,他的上司应该在两三年前就给他信息,让他知道获取终身雇用合约的机会如何。

美国的大学就是这样处理的。姜文华从苏州转到复旦是向上走,复旦给他的合约应该是tenure track的,即是走向有机会获取终身雇用合约之途。


从我知道的美国的制度看,这一关的重要性难以夸张,因为如果拿不到终身合约,一定要离校。离校的选择,要向档次较低的学校走,较高的免问。我很怀疑,姜文华走的数学研究路线会有多少家档次较低的大学让他选择。


听说姜文华在复旦教书教得不怎么好。然而,在复旦这种高水平的大学,教书不好不应该是问题:转去主持一些研讨班就是。以研究为主的大学,从来是管思想的深度,不多管教书的如何好听,更不应该讲什么人际关系的。这里的关键,是姜文华今天三十九岁,再不年轻,被复旦革职,于是前无去路,而纯数学家是不容易转业的!


数学的天才稀有。印度的拉马努金的数学天赋不见古人;美国的纳什百年一见。但我们要知道,数学天才患上精神失调的或然率是比较高的。纳什曾经患上严重的精神分裂症,但普林斯顿没有炒他。天赋更高的拉马努金,虽然在精神上属正常,但他曾经说,他有些写出来的令人叫绝的数学方程式,是在梦中母亲告诉他。这不是有点不正常吗?


人的脑子是有着很特别的生理机能。弗里德曼曾经告诉我,思想是脑子的运动,要持续操作才有可为。可惜我们也知道,脑子不停推敲或思考,跟任何体力运动一样,可以受伤闯祸。脑子受伤,小小的伤,也是灾难!


在学问的思想上,我是个可以持久地拼搏的人,但唯恐自己的脑子会出事,就需要混合着多项的其他造诣或玩意。这些行为在香港惹来非议,但在美国却被赏识。我还是幸运的,因为当年博士后正式出道的第一天,就获终生雇用合约,几个月后无端端地被升为正教授。

然后,重要的帮忙是西雅图华大的系主任诺斯与社会科学院的院长鲍特文清楚地告诉我,算文章数量与论学报高下这些衡量准则完全与我无干。我要做什么都可以。只这一点,我就自由自在地在完全没有压力下写出一系列今天一律被认为是经典的文章。

要是我出道时有今天美国或中国的大学初出道的教授遇到的发表文章的压力,我那些经典文章不可能写出来,也可能弄出精神问题了。


最后要说的,据网上所载,这次被杀的王永珍书记是一位忠厚随和的教授,出现这样的不幸让我心境难平,这里我谨向王书记的家人表示慰问。

怀念黄渝 — 一位科大数学怪才在美国的经历

按语:

黄渝出生於云南砚山县,为家中次子,天资聪颖,特别是对数学有着特别的兴趣与爱好。1981年,以云南省高考第六名的成绩考入中国科技大学数学系。在科大读本科时,黄渝逐渐显示出了他在数学领域的杰出才华。大一时就曾解决了所用教材《线性代数》中悬而未决的一个公开问题,后来被该专著作者,著名数学家许以超先生写进了再版书中的前言。1986年,本科毕业黄渝留校在科大北京研究生院读研。1989年获得了美国约翰·霍普金斯大学的全额奖学金,赴美攻读博士学位。

2004年12月25日凌晨4点,黄渝死于车祸。当时他正前往投递报纸的工作途中,由于爆胎下车检修,被一个醉酒驾驶的司机从后面撞击而死。黄渝死时没有留下任何财产。银行里的存款不足100美元。

怀念黄渝 

作者:曾思欣 

黄渝是1989年底来到Johns Hopkins的,我是1990年10月来的,他比我高一个年级,我们虽然不久就认识,但成为很熟的朋友大概是在一两年后了。同在数学系的时候,我和他办过讨论班,还试图合作做过问题(很可惜没有结果)。2000年他搬到纽约后,更是我们家的常客,我们一起吃过无数次的饭,吹过无数次的牛,实在是熟得不能再熟的朋友,他这些年的生活,我应该是最了解的人之一。 

黄渝是2000年12月搬到纽约的,他在我所在的公司工作了近八个月,2001年7月份被layoff。其后的一年多他没有工作,然后从2002年9月份开始他在CUNY的John Jay College当Tutor(他跟我说过这是沈珂兄给介绍的)。后来为了增加收入,大概从2003年初开始他开始早上送报纸。这两个工作他一直干到了最后。此外在CUNY的这两年半他每个星期四都去听数学系的一个俄国教授Kolyvagin的课。Kolyvagin是数论学家,原来在Johns Hopkins待过,那时黄渝就听过他的课。 

黄渝是个非常奇特的人,是我见过的人里最有特点的人,非常与众不同。他的故事多的说不完。有时候我觉得他不象个生活在尘世间的人,好象是生活在一个另外的世界里一样。其实细想起来,这都是有原因的。 

首先黄渝的英文非常差,他是我见过的中国学生里英文最差的。那时Johns Hopkins的学生都知道黄渝闹的笑话,他资格考试的时侯,考他的是数学系的两个教授,Igusa和Zucker,他们问了黄渝三个问题,黄渝全说错了,都是答非所问。好象是问他什么是sheaf,他说成了什么是scheme,问什么是variety,他说成了什么是valuation,等等。Zucker非常恼火,要fail他,但德高望重的Igusa先生坚持让他过了。最后Zucker 对他说:“OK,you passed。”但这句话黄渝也没听懂,所以他考完后不知道过了没有。等过了两天黄渝找到另外一个同学刘刚,请他到Zucker那里去问问到底通过了考试没有。Zucker气得跳出来对他吼:“You must improve your English!”黄渝只是愣愣地看着他,不知道这句话听懂了没有。 

黄渝私下里和我说起过他的英文问题,他说一讲起英文来他嘴里说的和他脑子里想的不是一回事,他也不知道该怎么办,我劝他要多大声朗读,最好要背一些经典的文章。我记得我还借给他一本凯恩斯的小书,要他把前言给背下来,但估计他也没看。 

到纽约之后,我发现他的英文比以前反而还要退步了!两年前我知道他有意在CUNY把Ph.D读完,就劝他尽早去和Kolyvagin谈一谈,黄渝为难地说怕英文不好讲不清楚,我说如果实在不行就把要说的话写在纸上给他看。几个星期后黄渝拿了一页纸来,说写好了,给我看看。我看了之后哭笑不得,大概有十行字,几乎每一行都有语法错误,还有一句的意思正好是说反了!全是小学生都不应该犯的错误,我不明白怎么会写成这样,他不是每天都在看NewYork Times么?我不相信他是不认真,这个语言问题真的成了他的一个无法克服的障碍了。在美国的十几年,他的英文交流障碍一直困扰着他,不知让他受了多少罪。 

有一次出于好奇我问他中文的作文怎么样,他告诉我中学的时候他最怕写记叙文,不知道该写什么好,但不怕写议论文,“只要瞎议论就行了。”黄渝好高谈阔论政治问题,2004年初的时候他从我这儿借去了《走向共和》的VCD,看完之后非常激动,和我讨论了好多次。他非常关注去年的总统大选,和我说过竞选造成的社会分裂很明显,连他的同班同学都出现了矛盾。 

黄渝另外的一个特点是一种出自天性的宽厚和善良,这方面他也是一个极端,从来只考虑别人,不考虑自己。到美国十五年来他孤身一人,贫困潦倒,好象什么厄运都撞上了,不知道吃了多少亏,但我从未听他抱怨过。黄渝跟我说:“我这人没什么,就是有点脾气。”他对生活要求得很少,既使这样他也长期挣扎在边缘,可他的脾气从来没变过,我们总说,黄渝永远是黄渝,总是这个样。 

在Johns Hopkins的时侯黄渝是有名的夜猫子,每天半夜三更叼着根烟在校园里走,谁要找他讨论问题只要半夜去数学系找就行了。黄渝总说:“晚上多安静呀,是看书的好时间。”但他好象白天也不太睡,我们的同学庄德谦说他是“无时不睡,无时不醒”, 是很传神的写照。

大约在92年左右数学系决定黄渝的英文没法上习题课,把他的钱扣了一些,那时黄渝在感情上好象也有些挫折,一度挺消沉的。那时黄渝的导师Shalika,在数学研究上早就不活跃了,而且还在闹离婚,是个在生活和事业上都在走下坡路的人。Shalika开始的时侯对黄渝是基本不管,到了93,94年就催他快毕业。 我不是很清楚他们之间到底发生了什么事,据黄渝说是Shalika给他了一个题目,但他实在没有兴趣,就没做。大概还有其它的一些miscommunication,总而言 之,94年的时侯Shalika对系里说黄渝已经不准备读学位了。从那时起黄渝就离开了Johns Hopkins。 

但是黄渝对Shalika一点怨言都没有,他总说:“Shalika其实对我不错。”我说:“可他把你的前途都毁了。”黄渝说:“我其实无所谓。”怎么可能无所谓?我觉得他是不愿在别人面前说他老师的坏话,他为人的厚道在此也可见一斑。 

94年的夏天黄渝回国住了三个月,这是他在美国的十五年中唯一的一次回国。他虽有美国的绿卡,但没有工作,所以回来后就开始在外面打工。那时他还住在学校附近,我们还能经常见面。他找的工作也是在晚上的,所以有时白天他还到学校来听课。我问他干什么工作,他说:“就是干点活。”我说:“到底干什么活?”他说:“你问那么多干什么?在一个仓库里扛东西。”从那时起黄渝在经济上就一直生活在边缘,一贫如洗,到最后都没有翻身。 

我太太问他:“黄渝,你为什么总是生活在边缘?”黄渝说:“很多人生活在边缘啊。” 我太太说:“可你并不deserve这个样呀。”黄渝默然不语。别人经常为他着急,而他自己反而是有些漠然了。黄渝是个明白人,我觉得他不是不想去改变现状,而是觉得已经是无能为力了。我对他说:“咱们在这世道上混,心不一定要黑,但脸皮一定要厚,是不是?该吹就得吹,该要就得要,否则岂不亏了!” 但黄渝的脸皮从来没厚过。 

几年前我的同学告诉我黄渝从前的朋友徐飞,在Harvard访问的时候一直在找黄渝。徐飞在国内已是晨兴数学所的负责人了。我因此问黄渝愿不愿意回国发展,还能回数学界去。黄渝坚决地否定了这个建议,并叫我不要把他的现状告诉国内数学界的人。我知道他是放不下面子,黄渝毕竟是当年最有希望的学生之一, 这也是人之常情。 

去年四月份我回国探亲,我父母家离苏州大学不远,我抽空去那里找到黄渝以前的好友余红兵兄,我们谈了很久黄渝的事。临走的时候余红兵对我说:“请你转告黄渝,我现在也不是以前的余红兵了,为了钱我也干很多下三滥的事。”我知道他这话是真心的,只有黄渝的朋友才会说这样的话。 

虽然为了基本的生存黄渝都不得不苦苦挣扎,但他从来不是个悲观厌世的人,恰恰相反他非常热爱生活,我们见面的时候他总是有说有笑。黄渝还特别擅长做菜,自己还独创了一些新的花样,这些年来不知有多少人吃过他的菜。来到纽约后黄渝的主要业余爱好好象是钓鱼,这两年来他很多个星期六都是在海边度过的,他说在海边时他一边钓鱼一边有时还读读数学文章。 

几年前的一天黄渝到我们家吃饭,他拿来一本读书杂志指着一篇文章说“这是篇好文章!”要我好好读读。这真是篇美文,在读书的2001年第4期上,题目是“信仰只一细柱香”,说的是二三十年代著名的才女林徽因的故事。我暗暗地想:“看不出来黄渝这小子还这么小资,这么sentimental!”这是黄渝难得的流露这方面的感情世界,谁知道呢,也许在他笑咪咪的外表之下,他真是一个多愁善感的人。 

我和黄渝虽然无所不谈,但我们说的最多的还是数学。众所周知黄渝是个非常有数学才能的人,李尚靖兄说黄渝是最应该拿Ph.D的人,我完全同意。他在数学上非常早熟,来美国的时候就已经是一个成熟的数学家了,这在我所见过的中国学生里是独一无二的。此外他在数学上有非常准确的判断力,而且他在数论,代数和表示论方面的知识几乎是百科全书式的。 

李尚靖兄提到的黄渝在本科时就解决了一个open problem,黄渝和我仔细讲过这段经历。这个问题好象是某种矩阵的分类,在许以超的书上做了正定的情况,黄 渝的一位学兄做了半正定的情况,而黄渝做了所有不定的情况。他说那段时间每天晚上开始算,算到深夜好象差不多了,但第二天早上一下就发现了问题,于是到了晚上又从头开始算,如此反复算了一个多月才最后成功。那时真是黄渝的 一个创造高峰期。黄渝说他的文章由他的同学窦苍柱帮助译成了英文,两部稿子都没发表,还在箱底放着。我想如果在他的遗物里能找到这篇文章,应该找个机会把它给发表了,这大概是黄渝唯一写成的数学文章了。 

最近我读到一篇吴文俊先生纪念陈省身的文章,提到早年做数学的历程,竟有和黄渝完全类似的经历,英雄的道路大概都是一样的。本来我想和黄渝说这事,可惜现在已经没有机会了。 

到美国之后黄渝没能做出和他的才能相称的数学结果,这是非常令人遗撼的。有时我想也许是他渊博的知识和敏锐的判断力多少影响了他的创造力。黄渝经常说:“这些问题都做不动。”好象数学里的问题都做不动一样。科学创造是个复杂的过程,有时不一定需要很多知识,反倒是更需要一些false sense of self-confidence,或者是reckless self-regard,简单说就是要一些狂妄,一些冲劲。现在的著名数学家年轻时多半是个狂人,而这些东西黄渝一点都没有。不过话说回来,任何好的数学工作都需要一些起码的外界条件来支持,而这些条件黄渝早就没有了。 

在所有的数学问题里,黄渝最喜爱的是Hilbert第12问题,我清清楚楚地记着,十几年前的一个晚上,在Hopkins数学系的Help Room里面,黄渝仔细地给我讲了这个问题,说是给定一个数域,如何找到一个超越函数,使得它在某些特殊点上的值生成了给定数域的所有阿贝尔扩张。当这个数域是有理数域时这是分圆域的 理论,当这个数域是虚二次域的时候这是复乘法的理论,所以Hilbert第12问题问的就是如何推广分圆域和复乘法的理论到任意的数域上去。学过数论的人都知道,这个问题有个诗意的名字,出自于当年Kronecker给Dedekind的一封信中,“The dearest dream of my youth。”所以经常被称为“Kronecker青春之梦”,我想这也是黄渝从青春时代就开始的梦想,这个梦他一直做到了最后。 

大概是两年前,对一类特殊的数域,所谓全虚域或者CM域,我有一些新的想法, 我把这些想法和黄渝讨论过,黄渝大概是挺受刺激,也开始重新想这问题。在2004年春天的时候他告诉我对所有的数域他觉得都能解决这个问题了,我问他在全虚域的情形下他找到的超越函数是什么,他说他不是在这种意义下来解决这题的,他用的是一个抽象的方法,类似于形式群的理论,他说主要是从函数域的Drinfeld模理论中得到了启发,关键要把函数的意义进行推广,但推广成什么?他没说,我现在也不知道。 

黄渝嘱咐我不要把他的想法告诉任何人,他说要利用暑假的空余时间好好地把这想法给检查一遍,如果没有问题再告诉我细节。夏天过后我问他进展怎样,他说看上去好象过去了,但有一步总是有问题,他还需要时间。年底前我又问他,他还是说有一步有问题,需要再看看。黄渝是个懒于笔墨的人,我怀疑他是否把自己的想法给写了下来,如果没有的话,他到底是怎么想的就真成一个谜了。 

说实话我一直对他的想法有些怀疑,因为我觉得任何关于Hilbert第12问题的解答都必需和Hecke L函数的变化相符合,也就是要和所谓Stark猜想相符合。按黄渝所说他的解答是一种抽象的函数,我不知道和L函数会有什么关系。这好象也不是Hilbert提这个问题的本意。我把这些疑问和黄渝说过,黄渝并不以为然。谁知道呢,也许他看到了些我没看到的东西,黄渝是能创造奇迹的人。 

在他出事三个星期前的星期六晚上十点,他突然跑到我家里来,原来是他的车坏在了去钓鱼的路上,他辗转坐火车跑了回来。我对他说:“你的这个老破车,如果修要超过1000块钱,就不值得去修了。”他表示同意,但有些惶然地说:“我现在这个样子,如果没了车就好象什么都没有了一样。”最后他的车修了700多块钱。 

事后我和公司的同事刘怡说起这事,刘怡要我劝黄渝不要再去想读Ph.D了,应该去学校里找一份稳定的技术工作,把生活安定下来。我觉得也有道理,在学校里工作也符合他的性格,准备过了年和他好好谈一谈,没想到再也不可能了。 

上个星期一,12月27日我接到他的凶讯,欲哭无泪。这么一个至善至诚的人,竟会死得这么惨烈。我没法接受他的死,我们全家包括小孩早就把他当成了家中的一员了,叫我怎么去和他们讲。我再也见不到他笑眯眯的样子了,再也不能和他吹牛了,再也不能吃他做的菜了,他的突然离去留下来的空白我不知道该怎么样来填补。 

古人云:“死生亦大矣。”面对生死总让人多想想生活的意义,生命的本质。黄渝这后半生,漂泊异乡,历尽磨难,到死也没有翻身。说实话,我看不出什么意义来,我只知道,我再也不会有这么好的朋友了。我会常常想他的。 

有时我想做数学这东西也会害人的,象黄渝这样痴迷数学的人,数学就是他的命,一旦离开数学界,他的精神就全垮了,生活上就随波逐流无所谓了,以至于一路沦落到这个地步。 

最近一两年来,黄渝常常和我们说起他小时候的一些往事,在上学以前他住在云南的一个小县城里,那时总是阳光明媚,四面是郁郁的青山,山上有无尽的野果和野蘑菇。黄渝说这些时,眼睛里闪着光。我知道他是有些想家了,游子悲故乡,自从94年后,他已是离开故乡十年了。有时见到我们为了照顾小孩而狼狈不堪,黄渝会说起小时候因为父亲在外地工作,他的母亲一个人照顾他们兄妹三个的故事。那时他母亲从事一些农业技术的推广工作,经常需要下乡去。每次下乡都带着他们三个,母亲推着一辆车,他的妹妹坐在车里,他和哥哥在后边跟着走在乡间的路上,周围是青青的山,天上飘着白云,我想着这幅图画,这是多么温馨快乐的时光。这些童年的点点滴滴,一直深深刻在他的心里。 

现在这流落异乡的游子就要回到他梦魂萦绕的故乡,永远地安息了。愿故乡的青山和白云永远陪伴着他! 

曾思欣 

2005年1月3日 

【转载】我所认识的姜文华

姜文华是我在Rutgers统计系博士班的学弟,他2004年秋季从复旦数学系本科直接考来,2009年毕业,去NH做博士后,2011年回国。

在美国我和他有7年的overlapping。在Rutgers的头几年,我们做为TA合教过的一二个学期的课,周末定期一起打篮球,但是文华是典型的书呆子,孤傲,害羞,木纳寡言并不善言辞的人,我又比他大,我们俩并不熟,客客气气而己。

我和文华走得很近,能够很长时间的聊天,其实是在文华博士生的最后一年和他博士后的最后一年,当他在生活与事业遇到一些困难的时候。

我所认识的文华是这样一个人:

1,学业和学术都是一流,如果当年,他能随他自己的心愿,毕业之后进美国顶级大学做博士后继续钻研自己感兴趣的学术(当时这扇门对他是开着的,虽然这扇门对于Rutgers多年来的绝大多数博士生是关着的),而不是很不正常地去NH那种学术三流,官僚一流,金玉其外,败絮其中的机构稀里糊涂地做了很多在他眼里的又苦又累又耗时又对他的学术没有帮助的杂事,他今天应该是美国学术圈里一个小有名气的教授。

2,内心干净,心底非常善良,不撒谎也不会撒谎,不害人也不知怎么害人;对别人不设防,不太知人情事故,不知江湖险恶;正因为他太干净,太善良,一旦遇到他认为的不公正,他完全不知所措,心里的反应会比普通人激烈,会有一些极端负面的想法,但他绝非是心里不正常的人,他会咬着牙,把咽不下的那囗气咽下去。

3,在师道尊严的环境中成长,从小的学霸,对老师言听计从,对领导唯唯诺诺,不敢越雷池半步;从不惹事,如果别人和他发生争执,文华习惯性地会以自己退让的方式去解决问题。

4,生活规律,洁身自好,不抽烟,不喝酒,不打牌,不玩游戏,没有任何嗜好,准时上课,从不迟到旷课,每周的生活规规矩矩地安排好,什么时候锻练,什么时候买菜,什么时候在图书馆,什么时候就寝都按定好的时间表走。工作认真负责,兢兢业业,在美国,没有几个TA会像他那样认真备课,耐心给学生答疑。

5,做为一个家中独子的上海人,对钱有概念,但不贪钱,也不追求金钱,绝对不占别人小便宜。文华和我一起吃饭,从来没有让我替他买过单,即使我一再坚持,他也坚决不花别人的钱。

6,对爱情与婚姻很向往,对于自己爱的人和他认为爱他的人,他会用心去交往。文华在Rutgers的头4年,应该半个女朋友也没交,一门心思做学问。快毕业的那年,不知道是他忽然想恋爱了,还是有人看好他的未来,陆陆续续就有人给他介绍对象。

有一阵子,他似乎是系里最popular的钻石王老五。但是许多媒人只看availability(有时这一点也搞不清楚)不看compatibility,给他介绍了许多在我看来非常不合适的candidates。但文华做为nerdy式的爱情小白,完全看不清楚这里面的弯弯绕绕,对于每一个约会都拿出做学问的态度规规矩矩认认真真地对待。


对于约会地点来回的交通线路以及约会地点周围的情况会上网仔细看看,对于约会餐厅的菜谱会提前研究透彻,对于约会对象可能提的问题会在脑子里想象出来,然后沙盘推演。

虽然几乎每个约会都无疾而终,但他还像虔诚的信徒那样,神圣般地对待每一个下一次。有一次他从曼哈顿中城约会回来,大约晚上十点钟来找我,难得地很兴奋,很开心。他告诉我,中间人跟他捎话了这个女生喜欢他,愿意和他继续交往。

我先恭喜他,但是很skeptical,就又问了他一些具体的问题,比如,他们一起吃饭的时候,当他说话的时候,她的眼睛是在盯哪里,在看他,还是桌子上的菜,还餐厅进出的客人?约会完了,各回各家之后,谁跟谁在几点钟先打的电话?

当文华把我的一堆问题回答完之后,他自己也明白,中间人大概没有和他说实话,这个女孩和以前的女孩子们一样大概不会再找他了。他原本阳光灿烂的笑容慢慢消失的他阴郁地安静了下来。

十几年过去了,今天我还对那晚他最终落寞的样子印象深刻,am still feeling such guilty,似乎是我把他捧在手里的希望给拿走了,是我打碎了他那种对前所未有的开阔壮丽之新世纪的无限渴望。

还有一年的夏秋之际,国内有人给他介绍了一个国内某大学教授的千金小姐,马上要到马里兰大学来上研究生,双方通过网络见过面,聊过天,介绍人和双方都父母都很熟,女孩对他很满意。他高兴地给我看那个女孩的照片,一个非常漂亮,极有气质的上海女孩,在国内,追她的人估计可以塞满黄浦江,到了美国,怎么会看上他这样没钱,没工作,没绿卡,前途不明的穷学生呢?我当时强烈怀疑不他又把对方理解错的但这种话我不能说,也没办法说。

从那女孩办签证开始,文华就开始眍心沥血地帮她,女孩飞到美国来,他又亲自过去帮这帮那,安排一切,并拿出这几年从奖学金中攒下的钱,为那女孩买了一辆他付的起的最贵的车。没过多久,那个女孩就列出一堆理由要和他分手,他急得够呛,也完全不知道自己做错了什么,就咨询师姐师兄,看怎样可以弥补,据我所知,他那时努力研究菜谱,提高手艺定期做一些好菜,然后开车200多英里送给女孩吃,还时不时地买一些在他眼里很贵重的礼物,寄给她。但最终这段他非常认真

付出的感情又不了了之。

他处理这件事的善后,彰显他为人的品质:第一,分手之后,他从来没有和那女孩讨论过他花在她身上的钱,总数虽然不会太多,但对于一个学生来讲肯定是巨款;我曾经拿出中国男人特有的狭隘,撺掇过他几次,让他和她把帐算清楚,至少结一点,但每次他都不接我的话。

第二,分手之后,他深受打击,但他也就自己一个人忍了下去,没有追着她死烂打,也没有哭天呛地,絮絮叨叨,惹事生非。那女孩和他分手,我一点也不惊讶,但我一直不明白,她为什么最初会答应他。我的猜测,女孩子马上就要从父母的呵护中到一个完全陌生的环境,她需要一个知根知底,忠厚老实的同乡来帮助她的smooth transition。一旦她过了这个坎儿,他的价值也就不存在了。

7、文华毕业后去NH做了两年博士后,据他说,博士后导师水平低(am not surprised),学术上帮不了他,只一味地给他一堆没什么学术价值的事情做,让他荒废了两年宝贵时光,没能如愿以偿重回美国的顶级大学做tenuretrack,他只好选择回国。

总之,文华是一个纯洁,纯粹的象牙塔里的人,他唯一的passion就是做学问,他不爱财,也不图名,渴望爱情,但是顺其自然,不善也不爱交际,人际冲突中选择退让。有才华,很能干的学者,但需要一个合适的环境,他人生唯一的要求是象牙塔里的一张安静的课桌。如果毕业之后,他能够在一个真正的学术圈里,我坚信,他现在己经成为许多人仰视的偶像。

我不知道文华能否看见我这里写的这些东西,事发那天,消息迅速传到美国,好几个许多年没有联系过的Rutgers校友和我联系。大家为你痛心,为你叹息,不只一个人为你掉了眼泪。

我们一致认为你一定是受到了莫大的委屈,如果我们当中任何一个人前几天在国内,能够和你说说话,事情不会发展成这样;你一生孤单,现在又要以最孤独的方式一个人去面对未来,我们都想为你做点什么。

在这里,我必须为文华做博士时候的导师讲几句话。坊间流传的关于文华的博导的评论和我所了解的情况并不相符。文华的博导很欣赏文华,对他关爱有加,因为对他不善和人打交道的书呆子气很了解,博导对文华的帮助远远超过一般的师生之谊。

文华在做博士后的第二年出困境时候能够在第一时间拿到苏州大学的offer,在苏州大学6年后不续签的情况下能够顺利上升进入复旦大学都是他的博导倾力帮助的结果。明白人都知道,复旦大学的faculty不是一般人可以进去的:每个位子被无数有背景的人盯着,有真本事有名气也不一定能进去。一位教授愿意拿自己的一生攒下来的名誉,动用自己的人脉,冒着风险,去帮助一个已经毕业8,9年,陷在困境中的学生,这是一位非常难得的导师。

随笔(五)— 有哪些东西是读博了之后才懂的

知乎链接:https://www.zhihu.com/question/49608607

博士毕业已经快六年了,距离博士入学已经十一年的时光,在这十一年的时间里,无论是读博还是工作都能够给人一定的成长。后来回想起来的时候,整个博士生涯其实对个人的影响还是非常深刻的,除了学术上的一些进展之外,对人生或许又有了一些新的理解。

这些年来时不时地也会写一些文章和回答,但是每次回头看前几年的文字,总觉得当时对生活的理解还不够。这次的文章或许几年之后也会觉得十分略显不足,但还是有必要记录下来,毕竟人在不同的阶段对人生的理解是不一样的。

好的导师就是成功的一半

古人云:“师如父母,一日为师,终身为父”。一位靠谱的导师在博士生阶段真的是可遇不可求。在读博士之前,笔者一直觉得教授们都比较靠谱,虽然偶尔有不靠谱的导师但也是极少极少的比例。但整个博士阶段读下来,无论是身边的同学,还是网上的吐槽,都能够看到不少导师不作为甚至作恶的案例。见过长期拖延学生不让其毕业的,见过跳槽之后把学生放在原校不闻不问的,还见过把学生的论文送给其他人的,甚至还有博士生毕业之后拒绝给博士生写推荐信的导师。在博士阶段,学生对导师的依赖性是非常高的,可以说导师决定了这位博士生能否顺利拿到博士学位。学术圈的某些圈子是非常封闭的,常见的情况就是几十个人甚至几百个人一起做类似的课题,大家一起来瓜分这块蛋糕。如果博士生毕业的时候没有还不错的论文,导师的推荐力量又十分有限,那么博士生最终在学术圈肯定是找不到教职的。导师想让博士生找不到下家有无数种方法,这样的结果就是导致博士生的生存更加艰难。

之前读书的时候就听一些老师说:“做数学科研就是加入一个又一个的俱乐部”。想要圈子里面的人带着新人玩,除了新人自身的努力之外,更重要的是需要有人的引荐,而这个引荐的人通常来说就是博士生的导师。如果导师并没有将博士生引入到这个圈子里面,那么博士生到最后也只是一个圈外之人,需要花费比想象更多的时间和精力才能够进入圈子。审稿人和编辑的数量其实是有限的,通常来说都是圈子里面的人,对于一些差不多的学术成果,其实就是看圈子里面的关系和面子了。

一个优秀的导师,很乐意将博士生,硕士生的出路贴在实验室或者个人主页上,即使由于某些原因没有贴出来,也总能够在学术圈看到这位老师学生们的身影。例如频繁活跃在各个学术论坛上,不停地有论文发表,与各种各样的学术大佬们都有交集。如果在学术界基本上看不到导师的学生们在活跃,甚至也找不到哪些学生是该导师带出来的,那说明这位导师最多是一位优秀的科学家,在培养学生方面实在是糟糕透顶。

方向比努力更加重要

俗话说,方向不对,努力白费。无论是读书还是工作,最好是能够在一个上升的通道上面,而不是加入一个快要死气沉沉的方向上。例如,在 2010 年学习人工智能,或者在 2015 年前在一线城市买房子,随着行业的进步和城市的发展,只要搭上了这一趟顺风车,以后想不发达都挺难的。当然,如何选择方向是一个非常难的课题,每年或许都有让人财务自由的机会,但是能不能赶上就看运气了。正所谓:一命二运三风水,四积阴德五读书。靠纯读书就想发达的日子应该是一去不复返了,当然,读书读到了一定的境界估计还是可以的。例如某人能够拿到 IMO 之类的奖牌,然后美国牛校博士毕业,一般情况下最终也不会太差。

但是对于绝大多数人而言,方向就显得尤为重要。当年还在读本科的时候,私下聊天的时候有一位老师就说:“男怕入错行”。当时没有理解其深意,后来逐渐理解了,但是总感觉走了弯路。选择了一个正确的方向,在相同的时间和精力投入下,能够拿到的回报明显是更多的。

避免抑郁症

读博士是一件长达四五年的事情,在人的一生中占据着黄金时光,但是在科研的道路上通常没有一帆风顺,更多的是铺满荆棘的道路。这条荆棘的道路不仅来自于困难的科研课题,还有可能来自于同学,师门,学校等诸多环境因素。科研的路上有人陪伴固然是好,如果实在是没有人陪伴,那就只能够一个人奋力向前。在奋力向前的过程中,由于科研经常会给人带来各种困难和挫折,因此对于博士生而言,如何避免抑郁症则是一件非常重要的事情。

回想起当年科研的经历,每天早上醒来想得并不是写多少行公式,敲多少页的论文。想得更多的则是如何面对即将到来的一天的失败。毕竟作为一个有一定科研理想的博士生,实在是不愿意做那种可以随时添加条件的论文。如果是做有一定难度的论文,就一定要学会面对失败,学会如何一次又一次地在失败中站起来奋勇向前。但是人的精力和意志力总是有一定的限度,一旦超过了这个限度,就会容易产生焦虑和抑郁,甚至会觉得生活没有什么意义。

无论是在国内还是国外,除了师门的人之外,还是要多去认识一些其他院系的朋友,工业界的朋友。这种时候不仅能够开拓眼界,在关键的时候还能够找到人出点子,甚至在困难的时候进行倾诉。倾诉的对象最好是跟自身没有利益冲突,也不是身边的人,这样的话也能够有效地保护自己不受伤害。毕竟人与人之间一旦有了利益冲突,很可能之前所维持的关系就不复存在了。

保持自己的节奏

每一个人都有着自己的时区,在不同的时区自然要做着不同的事情。在读博士的阶段,一般情况下本科毕业和硕士毕业的同学说不定早早回家乡娶妻生子。这种时候如果去参加同学会说不定反而会感到不愉快,毕竟别人已经在十八线城市买房安居乐业,博士生还在国外过着颠沛流离的生活。但是,每个人的生活节奏是不一样的,有的人早早结束读书生活踏入社会,有的人却要拿到博士学位才开始第一份工作。每一种选择都是一种人生,实在是没有必要一直互相比较。一般情况下,早几年晚几年其实并不会造成太大的差距。

在读书期间可以多享受生活,无论是各种健身活动,还是各种社团活动,多参加总好过不参加,毕竟天天做科研也不见得有特别突出的结果,把科研融入自己的生活反而有可能做出更好的结果。无论是在办公室,游泳池,餐厅,咖啡馆,还是其他地方,都可以对数学问题进行思考和研究。

不要在一棵树上吊死

当年科研的时候,就有导师不准学生换科研课题,只准学生做一个题目直到毕业为止。美其名曰:“不能够轻易更换课题”。该导师在学生发现该课题难度过高,甚至要求增加一个 Plan B 都果断拒绝。不过该学生还是能力较强,即使在种种阻碍下依然能够完成课题。但是这则故事一旦事后回想起来,就会发现这种没有 Plan B 的做法完全是进行赌徒行为。不过导师和学生毕竟也不是父子关系,坑一个学生对导师来说也没有任何成本。

对于一个人而言,在做事情的时候,一定要留有 Plan B,也就是原来的方案和计划一旦执行不成功,有没有退路可以走。这种退路可以是去工业界,也可以是去做学术圈的其他研究方向。在做科研题目的时候,最好不要只做一个课题,可以在有时间的前提下同时开展多个课题,毕竟多路出击总好过吊死在一棵树上。博士生对导师也不要抱有太高的期望,说不定导师的作用就是给个论文课题。遇到一个好的导师固然是一件好事,但是遇到一个坑的导师也不要把自己的前途放弃了。

读本科的时候笔者不太理解为什么数学系要开设 C++ 的课程,后来回想起来发现,这完全就是给学生安排的退路,一旦数学做不下去,还能够考虑一下编程的工作。在读本科,硕士,博士的时候,除了本专业之外,也可以去了解一下其他专业的课程,这样有利于扩展自身的知识面,遇到某些困境的时候不至于走向绝路。(未完待续)

统计距离(statistical Distance)

统计距离(Statistical Distance)

统计距离的定义

在欧式空间,如果要衡量两个 n 维空间中的点 \bold{x}=(x_{1},\cdots,x_{n})\bold{y} = (y_{1}, \cdots, y_{n})\in\mathbb{R}^{n} 之间的距离,通常可以使用 L^{p}- 范数来进行描述,其数学公式是:

d(\bold{x},\bold{y})=(\sum_{i=1}^{n}|x_{i}-y_{i}|^{p})^{1/p}, 1\leq p <+\infty.

d(\bold{x},\bold{y})=\max_{1\leq i\leq n}|x_{i}-y_{i}|, p=+\infty.

在统计学中,如果需要衡量两个统计对象之间的“距离”,在离散的场景下除了可以使用欧式距离之外,还可以使用其他的统计距离来描述这两个统计对象之间的距离。与之对应的,在连续的场景下,同样可以定义出两个统计对象之间的距离。

首先,我们来回顾一下距离的定义;

距离是定义在集合 X 的函数 d:X\times X \rightarrow [0,+\infty), 并且满足以下条件:

  1. d(x,y)\geq 0 对于所有的 x,y\in X 都成立;
  2. d(x,y) = 0 \iff x=y;
  3. d(x,y) = d(y,x) 对于所有的 x,y\in X 都成立;
  4. d(x,y) + d(y,z) \geq d(x,z) 对于所有的 x,y,z\in X 都成立。

而广义的距离会缺少其中一个或者多个条件,例如时间序列领域中的 DTW 距离就不满足三角不等式。

在微积分中,凸函数(convex 函数)f: \mathbb{D}\rightarrow \mathbb{R} 指的是在其定义域内的任意两个点 x_{1},x_{2}\in\mathbb{D}, 满足
\frac{f(x_{1})+f(x_{2})}{2} \geq f\bigg(\frac{x_{1}+x_{2}}{2}\bigg). 换言之,如果凸函数 f(x) 存在二阶连续导数,那么 f'(x) 是增函数,f''(x)\geq 0.

其次,在统计距离中,通常会基于一个函数 f:\mathbb{R}\rightarrow\mathbb{R} 来定义两个概率分布之间的距离。该函数 f 是一个凸函数(convex function),并且满足 f(1)=0. 对于空间 X 中的两个概率分布 PQ 而言,

D_{f}(P||Q)=\int_{X}f\bigg(\frac{dP}{dQ}\bigg)dQ=\int_{X}f\bigg(\frac{p(x)}{q(x)}\bigg)q(x)dx

定义了概率分布 PQf- 散度(f-divergence),其中 p(x),q(x) 分别对应了 P,Q 的概率密度函数。不同的函数 f(x) 对应了不同的散度,常见的散度包括但不限于:

  • KL – 散度(KL – Divergence):f(x)=x\ln(x);
  • Reverse KL -散度(Reverse KL – Divergence):f(x)=-\ln(x);
  • Hellinger 距离(Hellinger Distance):f(x)=(\sqrt{x}-1)^{2} 或者 f(x)=2(1-\sqrt{x});
  • 变分距离(Total Variation Distance):f(x)=|x-1|/2;
  • Pearson \chi^{2} – 散度(Pearson \chi^{2} – Divergence):f(x)=(x-1)^{2} 或者 f(x)=x^{2}-1 或者 f(x)=x^{2}-x;
  • Reverse Pearson \chi^{2} – 散度(Reverse Pearson \chi^{2} – Divergence):f(x)=\frac{1}{x}-1 或者 f(x)=\frac{1}{x}-x;
  • Jensen-Shannon-Divergence:f(x)=\bigg\{(x+1)\ln\bigg(\frac{2}{x+1}\bigg)+x\ln(x)\bigg\}/2;
  • L1 – 范数(L1 – Norm):f(x)=|x-1|;

在这样的定义下,D_{f} 是非负函数,i.e. D_{f}(P||Q)\geq 0. 事实上,

D_{f}(P||Q)=\int_{X} f\bigg(\frac{dP}{dQ}\bigg)dQ\geq f\bigg(\int_{X}\frac{dP}{dQ}dQdx\bigg)=f(1)=0.

在数学中有如下定理:如果 f 是凸函数,那么 g(x,t)=tf(x/t) 在定义域 \{(x,t)|x/t\in Dom(f),t>0\} 也是凸函数。

根据以上定理,可以得到:对于 \forall 0\leq \lambda\leq 1,

D_{f}(\lambda P_{1}+(1-\lambda)P_{2} ||\lambda Q_{1}+(1-\lambda)Q_{2})\leq \lambda D_{f}(P_{1}||Q_{1}) + (1-\lambda)D_{f}(P_{2}||Q_{2}).

除了 f- 散度之外,直接使用 L^{p}- 范数也可以定义两个概率空间的距离,特别地,当 p=1,2,\infty 时,其距离公式是:

||P-Q||_{1}=\int_{X}|p(x)-q(x)|dx,

||P-Q||_{2}=\sqrt{\int_{X}|p(x)-q(x)|^{2}dx},

||P-Q||_{\infty}=\sup_{x\in X}|p(x)-q(x)|.

统计距离的函数分析

事实上,对于 KL 散度和 Reverse KL 散度而言,令 f_{1}(x)=x\ln(x), f_{2}(x)=-\ln(x),

\text{KL}_{f_{1}}(P||Q)=\int_{X}f_{1}\bigg(\frac{p(x)}{q(x)}\bigg)q(x)dx=\int_{X}p(x)\ln\frac{p(x)}{q(x)}dx

=\int_{X}-p(x)\ln\frac{q(x)}{p(x)}dx=\int_{X}f_{2}\bigg(\frac{q(x)}{p(x)}\bigg)p(x)dx

=\text{Reverse KL}_{f_{2}}(Q||P),

这就是函数 f_{1}, f_{2} 分别对应着 KL-散度和 Reverse KL-散度相应函数的原因。

类似地,对于函数 f_{3}(x)=x^{2}-1, f_{4}(x)=x^{2}-xg_{3}(x)=\frac{1}{x}-x, g_{4}(x)=\frac{1}{x}-1 而言,可以直接证明得到:

\text{Pearson}_{f_{3}}(P||Q)=\int_{X}\bigg(\bigg(\frac{p(x)}{q(x)}\bigg)^{2}-1\bigg)q(x)dx

=\int_{X}\bigg(\frac{p(x)}{q(x)}-\frac{q(x)}{p(x)}\bigg)p(x)dx=\int_{X}g_{3}\bigg(\frac{q(x)}{p(x)}\bigg)p(x)dx

=\text{Reverse Pearson}_{g_{3}}(Q||P),

\text{Pearson}_{f_{4}}(P||Q)=\int_{X}\bigg(\bigg(\frac{p(x)}{q(x)}\bigg)^{2}-\frac{p(x)}{q(x)}\bigg)q(x)dx

=\int_{X}\bigg(\frac{p(x)}{q(x)}-1\bigg)p(x)dx=\int_{X}g_{4}\bigg(\frac{q(x)}{p(x)}\bigg)p(x)dx

=\text{Reverse Pearson}_{g_{4}}(Q||P).

对于 Jensen-Shannon Divergence(简写为 JSD)而言,f(x)=\frac{1}{2}\bigg\{(x+1)\ln\bigg(\frac{2}{x+1}\bigg)+x\ln(x)\bigg\},

\text{JSD}_{f}(P||Q)=\frac{1}{2}\int_{X}f\bigg(\frac{p(x)}{q(x)}\bigg)q(x)dx

=\frac{1}{2}\int_{X}\bigg\{\bigg(\frac{p(x)}{q(x)}+1\bigg)\ln\bigg(\frac{2q(x)}{p(x)+q(x)}\bigg)+\frac{p(x)}{q(x)}\ln\bigg(\frac{p(x)}{q(x)}\bigg)q(x)\bigg\}dx

=\frac{1}{2}\int_{X}\bigg\{p(x)\ln\frac{2p(x)}{p(x)+q(x)}+q(x)\ln\frac{2q(x)}{p(x)+q(x)}\bigg\}dx

=\frac{1}{2}\text{KL}(P||M)+\frac{1}{2}\text{KL}(Q||M),

其中 M=(P+Q)/2, i.e. m(x)=(p(x)+q(x))/2.

对于 Hellinger Distance 而言,f_{1}(x)=(\sqrt{x}-1)^{2}, f_{2}(x)=2(1-\sqrt{x}). 其实这两个函数是等价的,因为

\text{Hellinger Distance}_{f_{1}}(P||Q)=\int_{X}\bigg(\sqrt{\frac{p(x)}{q(x)}}-1\bigg)^{2}q(x)dx

=\int_{X}\bigg(p(x)+q(x)-2\sqrt{p(x)q(x)}\bigg)dx

=2-2\int_{X}\sqrt{p(x)q(x)}dx

=\int_{X}2\bigg(1-\sqrt{\frac{p(x)}{q(x)}}\bigg)q(x)dx

=\text{Hellinger Distance}_{f_{2}}(P||Q).

其中 BC(P,Q)=\int_{X}p(x)q(x)dx 被称为 Bhattacharyya 系数(Bhattacharyya Coefficient),Bhattacharyya 距离则定义为

D_{B}(P||Q)=-\ln(BC(P,Q))=-\ln\bigg(\int_{X}p(x)q(x)dx\bigg).

统计距离的上下界分析

对于以上函数而言,由于凸函数 f(1)=0, 因此当 P=Q 时,D_{f}(P||Q)=0.

KL 散度是没有上界的,但是 Jensen Shannon Divergence 是具有上界的。事实上,如果 M=(P+Q)/2, 则有

KL(P||M)=\int_{X}p(x)\ln\frac{2p(x)}{p(x)+q(x)}dx\leq\int_{X}p(x)\ln 2 dx=\ln2,

同样地,KL(Q||M)\leq \ln2, 所以可以得到 JSD(P||Q)\leq \ln2.

根据 Hellinger 距离的公式,可以得到:\text{Hellinger Distance}(P||Q)=2-\int_{X}\sqrt{p(x)q(x)}dx\leq 2. 同时,Bhattacharyya 距离 D_{B}(P||Q)=-\ln(BC(P||Q)) 是没有上界的,因为 BC(P||Q) 可以取值到零。

考虑 L^{p}- 范数中 p=1,2,\infty 三种情况:

||P-Q||_{1}=\int_{X}|p(x)-q(x)|dx\leq\int_{X}(p(x)+q(x))dx=2, 并且上界 2 是可以取到的。

||P-Q||_{2}=\sqrt{\int_{X}(p(x)-q(x))^{2}}=\sqrt{\int_{X}((p(x))^{2}-2p(x)q(x)+(q(x))^{2})dx}

\leq\sqrt{\int_{X}((p(x))^{2}+(q(x))^{2})dx}

\leq\sqrt{\int_{X}(p(x)+q(x))dx}=\sqrt{2}.

||P-Q||_{\infty}=\sup_{X}|p(x)-q(x)|dx\leq 1.

证明以上不等式使用了性质 0\leq p(x),q(x)\leq 1, \int_{X}p(x)dx=\int_{X}q(x)dx=1.

多重集合

多重集合的定义与性质

在数学中,集合(set)中不能够包含重复的元素,但一个多重集合(multiset)中则可以包含重复的元素,并且计算了元素的重数。例如,

  1. a\neq b 时,\{a,b\} 可以看成集合,也可以看成重数为 1 的多重集合,可以记为 \{a^{1},b^{1}\} 或者 \{1/a,1/b\}.
  2. 在多重集合 \{a,a,b\} 中,a 的重数是 2,b 的重数是 1,可以记为 \{a^{2},b^{1}\} 或者 \{2/a,1/b\}.
  3. 在多重集合 \{a,a,a,b,b,b\} 中,a,b 的重数都是 3。

对于一个有限集合 \{a_{1},\cdots,a_{n}\} 而言,其多重集合可以记为 \{a_{1}^{m(a_{1})},\cdots,a_{n}^{m(a_{n})}\} 或者 \{m(a_{1})/a_{1},\cdots,m(a_{n})/a_{n}), 其中 m(a_{i}) 表示元素 a_{i} 的重数。多重集合的一个典型例子就是质因数分解,例如:100=2^{2}\cdot 5^{2}.

假设多重集合 A,B 的元素都属于集合 U,

  1. 子集:如果对于所有的 x\in Um_{A}(x)\leq m_{B}(x), 则称多重集合 A 是多重集合 B 的子集;
  2. 交集:如果 \forall x\in U,m_{C}(x)=\min(m_{A}(x),m_{B}(x)), 则称多重集合 C 是多重集合 A,B 的交集,记为 C=A\cap B;
  3. 并集:如果 \forall x\in U,m_{C}(x)=\max(m_{A}(x),m_{B}(x)), 则称多重集合 C 是多重集合 A,B 的并集,记为 C=A\cup B;
  4. 求和:如果 \forall x\in U, m_{C}(x)=m_{A}(x)+m_{B}(x), 则称多重集合 C 是多重集合 A,B 的和,记为 C=A\oplus B;
  5. 求差:如果 \forall x\in U, m_{C}(x)=\max(0,m_{A}(x)-m_{B}(x)), 则称多重集合 C 是多重集合 A,B 的差,记为 C=A\ominus B.

假设 A=\{x^{2},y^{1},z^{3}\}, B=\{x^{1},y^{4},w^{3}\}, 那么

A\oplus B=\{x^{3},y^{5},z^{3},w^{3}\},

A\ominus B=\{x^{1},z^{3}\},

A\cap B=\{x^{1},y^{1}\},

A\cup B=\{x^{2},y^{4},z^{3},w^{3}\}.

多重集合的相似度和距离

由于已经定义了多重集合的交集和并集,因此集合相似度中的 Jaccard 相似度,Overlap 相似度都可以应用到多重集合中。

对于多重集合 A=\{a_{1}^{m(a_{1})},\cdots,a_{n}^{m(a_{n})}\} 而言,令 p_{i}=m(a_{i})/\sum_{i=1}^{n}m(a_{i}), 1\leq i\leq n. 因此,多重集合 A 对应了一个离散的概率分布 \{p_{1},\cdots,p_{n}\}. 于是,可以使用以上的统计距离(Statistical Distance)来计算两个多重集合之间的距离。

参考资料

  1. 统计距离:https://en.wikipedia.org/wiki/Statistical_distance
  2. f – divergence:https://en.wikipedia.org/wiki/F-divergence:包括了 KL 散度的其余变形方式。
  3. Bregman distance:https://en.wikipedia.org/wiki/Bregman_divergence
  4. Jensen Shannon Divergence:https://en.wikipedia.org/wiki/Jensen%E2%80%93Shannon_divergence
  5. KL Divergence:https://en.wikipedia.org/wiki/Kullback%E2%80%93Leibler_divergence
  6. Bhattacharyya distance:https://en.wikipedia.org/wiki/Bhattacharyya_distance
  7. Wasserstein metric:https://en.wikipedia.org/wiki/Wasserstein_metric
  8. 多重集合:multiset:https://en.wikipedia.org/wiki/Multiset

随笔(四)— 社交网络平台的时间线

在社交网络上,除了日常可以与朋友聊天沟通之外,还可以发各种内容,包括 QZone 的说说/图片,也包括人人或者 Facebook 的 Timeline,印象深刻的就是人人的“历史上的今天”,还有 Facebook 的“那年今天”。于是,回顾自身社交网络的时候,突然看到历史上的自己在某天发表过某个内容,其实也是一件挺有意思的事情。

2013 年 1 月 30 日

微信公众号 20130130

在 2013 年 1 月 30 日这天,笔者在微信公众号发表了第一个朋友圈,图中展示了在做助教的时候,中途下课期间去 Faculty of Engineering 打饭,然后拿到办公室去吃的场景。NUS 工学院的食堂算是 NUS 比较大的食堂之一,其吃饭的地方也比较多。该食堂历史悠久,从 1983 年到 2018 年。后续已经重建,直到 2020 年才正式对外重新开放。

Faculty of Engineering Canteen

2013 年 11 月 16 日

微信公众号 20131116

Marina Bay Sands 一直是新加坡比较有名的酒店之一,其特点就是在其酒店的屋顶有一个无边的游泳池,入住酒店的旅客可以免费上去游玩。那天一位同学的亲戚来新加坡旅游并且入住 Marina Bay Sands,亲戚走了之后就将第二天可以上去的门票留给了同学,于是朋友就邀请我上去游玩了一次。虽然笔者小时候会游泳,但是也已经多年没有下过水,为了这次游玩还专门去商店买了一套游泳装备。到了可以游玩的当天,就跟着同学一起去了 Marina Bay Sands,从下午开始一直待到晚上 8:00 左右,欣赏了新加坡滨海湾从白天,到傍晚,再到夜晚的风景。整体来看,Marina Bay Sands 的无边游泳池还是非常赞的,非常值得再去一次。

2014 年 2 月 28 日

2014年2月28日

当年作为一个博士生,除了吃喝玩乐之外,最主要的任务自然就是科研了,记得在 2014 年的时候,正好是科研压力比较大的时期,每天晚上都要科研到深夜,自然过年期间也不例外。NUS 的开学期间算是相对较早的,每年的 1 月初就已经开启了新的学期,Chinese New Year(农历新年)正好处于学期中间,因此,作为博士生的话回家就不是那么方便,于是过年期间可能会休息一两天,然后就必须要投入紧张的科研工作中了。在 2014 年 2 月底,笔者也工作到凌晨,但是的科研内容主要是复动力系统相关,日常主要是大量而繁重的计算。计算的时候除了动笔之外,还可以把日常的工作内容用 LaTex 敲写下来,方便未来查看与翻阅。当时的工作地点主要在 PGPR 的宿舍,工作的工具包括一台 2012 年的 MAC AIR,一堆草稿纸,铅笔和橡皮。使用铅笔与橡皮可以让自己出错的时候及时修改,也是为了克服自己内心深处避免错误的恐惧。

2015 年 2 月 13 日

微信公众号 20150213

经过去年一年的努力科研,转眼到了 2015 年。而在 2014 – 2015 这一年内,笔者顺利地完成了科研课题,并且提交了博士论文。在 2014 年的时候,笔者曾经写下 2015 年回家过年的新年愿望。经过了一年的努力,终于达成目标,成功在 2015 年回到贵州遵义欢度新年。虽然当时其实也没有完成毕业答辩,也没有找好工作,甚至都没有想好找什么工作,但是能够顺利提交论文,对笔者来说就是一件值得庆祝的事情。

2015 年 5 月 15 日

微信公众号 20150515

在 2015 年 4 月份完成了博士毕业答辩,并且提交完了最后的材料之后,博士生涯基本上告一段落,此刻再也不需要研究数学课题,也不需要思考数学论文。在人生的一个阶段即将结束的时候,也就是快要离开新加坡的时候了,此刻笔者去了之前一直都没去过的东海岸公园(East Coast Park)徒步,独自一人沿着东海岸公园的海岸线走了很长的一段路,期间见过很多烧烤架,也看到不少的游人在此游玩。其实作为动力系统的博士生,每次见到海滩,就想到 Smale 当年在沙滩上思考动力系统的场景。虽然自身的水平明显不如 Smale,但是能够从事过近似的一个研究方向,也算是一种荣幸吧。

2016 年 7 月 20 日

微信朋友圈 20160720

2016 年去台湾,已经是加入公司一周年的事情了,在这一周内里面发生了太多的事情。一开始需要面对工作上的辛苦,后来需要处理各种各样的事情,直到后续的购房安家装修工作,很多事情都在 2016 年完成。不过,2016 年的台湾之行总是给自己留下了一个还不错的回忆,以至于后面连续三年都去台湾旅游,台北,台中,台南,台东都走了一遍甚至多遍。这次去台湾除了在跟团游方面比较省心之外,还在台湾大学数学系见到了之前的博士同学,共同探讨了一些毕业之后的事情和发展情况,虽然自己已经不再从事数学研究,但是能够认识一些数学界的朋友,也算是人生的一种经历。

2017 年 5 月 28 日

微信朋友圈20170528

近些年去过不少的地方,包括厦门,长沙,武汉,上海,北京,广州等,也包括中国台湾,韩国济州岛,老挝,日本。其中海外旅游还是日本比较好,无论是从旅游设施的便捷程度,还是服务质量等方面来看,都是日本最佳。去日本的话基本上还是赶凌晨的飞机前往,因此需要提前一天从深圳过关去香港,然后再从香港飞往日本。在 2017 年第一次去日本的时候,由于太过疲惫,就在日本的新宿御苑的草坪上睡了一觉,直到下午才见到“一边旅游一边写诗“的博主司北。自从南大毕业之后,在新加坡见过一次司北,时隔多年,在日本东京又再次见到。依稀记得,当时是带了一本很厚的摄影书籍给司北,然后在四谷附近的居酒屋吃了一顿晚饭。

2017 年 9 月 10 日

微信朋友圈20170910

这已经是第二次来台湾旅游了,第二次来的时候,之前在台北做博士后的朋友已经回大陆顺利找到了教职,因此没有在台北见面。这次来台湾旅游主要是在台北,台东,台南旅行。旅行结束之后,自己的工作内容其实也发生了变化,后续就主要从事智能运维(AIOps)方向,一干就是三年时光,直到 2020 年才再一次发生了变化。不过第二次来台湾其实已经没有了第一次的新鲜劲,但是不一样的景点还是给我留下了深刻的印象,也让我意识到其实下一次来台湾就完全可以自由行了。

2018 年 12 月 29 日

微信朋友圈20181229

作为一直在南方生活的人来说,虽然在冬天也能够看到雪,但是南方的雪和北方的雪比起来还是弱了不少。在 2019 年元旦之际,笔者和 RDD 同学选择了去北海道旅游。北海道位于日本的东北部,是著名的旅游景点,无论是春夏秋冬,都有其非常出名的景色。但最吸引人的应该就是北海道的雪景。从札幌开始,走过旭川,登别,洞爷,函馆,小樽,北海道每一个地方的景色都给我们留下了深刻的印象。不过北海道的白天较短,16:00 之后就基本上进入了夜色,对于想要出行的朋友可以趁早出发,然后晚上就可以早点休息。(未完待续)

复杂网络中的节点相似性

在机器学习领域,很多时候需要衡量两个对象的相似性,特别是在信息检索,模式匹配等方向上。一般情况下,相似性与距离是都是为了描述两个对象之间的某种性质。但在实际使用的时候,需要根据具体的情况来选择合适的相似度或者距离函数。

相似性与距离

首先,我们来看一下相似性函数的含义。对于两个对象 x,y \in X, 相似性函数 s:X\times X\rightarrow \mathbb{R} 是将 X\times X 映射到实数域 \mathbb{R} 的有界函数,i.e. 存在上下界使得 s_{min}\leq s\leq s_{max}, 它具有以下两个性质:

  1. 自反性:s(x,x)=s_{max} 对于所有的 x\in X 都成立;
  2. 对称性:s(x,y)=s(y,x) 对于所有的 x,y\in X 都成立;

一般情况下,不要求相似度函数具有三角不等式的性质。相似度越大,表示两个元素越相似;相似度越小,表示两个元素越不相似。

相似度

其次,我们来看一下距离函数的含义。对于两个对象 x,y\in X, 距离函数 d:X\times X\rightarrow \mathbb{R}^{+}\cup\{0\} 是将 X\times X 映射到非负实数域的函数,它只存在下界 0, 并不存在上界,它具有以下三个性质:

  1. 自反性:d(x,x)=0 对于所有的 x\in X 都成立;
  2. 对称性:d(x,y)=d(y,x) 对于所有的 x,y\in X 都成立;
  3. 三角不等式:d(x,y)+d(y,z)\geq d(x,z) 对于所有的 x,y,z\in X 都成立。

距离越小,表示两个元素越近;距离越大,表示两个元素越远。

距离

相似度(Similarity)

对于欧式空间 \mathbb{R}^{n} 中的两个点 A=(a_{1},a_{2},\cdots,a_{n})B=(b_{1},b_{2},\cdots,b_{n}) 而言,可以多种方法来描述它们之间的相似性。

余弦相似度(Cosine Similarity)

\text{Cosine Similarity}(A,B)=\frac{A\cdot B}{||A||_{2}\cdot ||B||_{2}}=\frac{\sum_{i=1}^{n}a_{i}b_{i}}{\sqrt{\sum_{i=1}^{n}a_{i}^{2}}\cdot\sqrt{\sum_{i=1}^{n}b_{i}^{2}}}.

根据 Cauchy 不等式可以得到 Cosine Similarity 的取值范围是 [-1,1].

Pearson 相似度(Pearson Similarity)

\text{Pearson Similarity}(A,B)=\frac{cov(A,B)}{\sigma_{A}\cdot\sigma_{B}}=\frac{\sum_{i=1}(a_{i}-\overline{A})\cdot(b_{i}-\overline{B})}{\sqrt{\sum_{i=1}^{n}(a_{i}-\overline{A})^{2}}\cdot\sqrt{\sum_{i=1}^{n}(b_{i}-\overline{B})^{2}}}.

其中 \overline{A}=\sum_{i=1}^{n}a_{i}/n, \overline{B}=\sum_{i=1}^{n}b_{i}/n. 同样根据 Cauchy 不等式可以得到 Pearson Similarity 的取值范围是 [-1,1].

Pearson 系数

Dice 相似度(Dice Similarity)

\text{Dice Similarity}(A,B)=\frac{2\sum_{i=1}^{n}a_{i}b_{i}}{\sum_{i=1}^{n}(a_{i}^{2}+b_{i}^{2})},

其中 AB 不能同时是零点,并且由均值不等式可以得到 Dice Similarity 的范围也是 [-1,1].

除了欧式空间的点之外,在有的情况下需要对两个集合 AB 来做相似度的判断。特别地,欧式空间 \mathbb{R}^{n} 里面的点可以看成 n 个点所组成的集合。因此,下面的集合相似度判断方法同样适用于欧式空间的两个点。

Jaccard 相似度(Jaccard Similarity)

对于集合 AB 而言,

\text{Jaccard Similarity}=\frac{|A\cap B|}{|A\cup B|} = \frac{|A\cap B|}{|A|+|B|-|A\cap B|},

其中,|\cdot| 表示集合的势,并且 Jaccard 相似度的取值范围是 [0,1]. 越靠近 1 表示两个集合越相似,越靠近 0 表示两个集合越不相似。

两个集合 A 和 B

重叠相似度(Overlap Similarity)

对于集合 AB 而言,

\text{Overlap Similarity}=\frac{|A\cap B|}{\min\{|A|, |B|\}}

= \max\bigg\{\frac{|A\cap B|}{|A|}, \frac{|A\cap B|}{|B|}\bigg\}

= \max\{P(B|A), P(A|B)\},

其中 P(B|A), P(A|B) 指的是条件概率,意思分别是 A 发生的时候 B 同时发生的概率,B 发生的时候 A 同时发生的概率。重叠相似度的另外一个名称是 Hub Promoted(HP),它主要用于计算两个集合的重叠程度。

Overlap Similarity

类似的,可以将重叠相似度中的 min 函数换成 max 函数,那就是所谓的 Hub Degressed(HD),用公式来描述就是

\text{HD}(A,B)=\frac{|A\cap B|}{\max\{|A|,|B|\}},

它可以用于描述两个集合不重叠的程度。

距离(Distance)

欧氏距离(Euclidean Distance)

d_{2}(A,B)=\sqrt{\sum_{i=1}^{n}(a_{i}-b_{i})^{2}}.

另外,如果将 2 进行推广,则可以引导出 L^{p}(1\leq p\leq  +\infty) 距离如下:

d_{p}(A,B)=\bigg(\sum_{i=1}^{n}|a_{i}-b_{i}|^{p}\bigg)^{\frac{1}{p}}, 其中 p\geq 1.

d_{\infty}(A,B)=\max_{1\leq i\leq n}|a_{i}-b_{i}|.

欧氏距离

复杂网络中的节点相似性

在复杂网络 G=(V,E) 中,G 表示顶点集合,E 表示边的集合。为了简单起见,这里暂时是考虑无向图的场景。对于顶点 x \in V 而言,N(x) 表示其邻居的集合。在复杂网络中,同样需要描述两个顶点 x,y\in V 的相似性,于是可以考虑以下指标。

无标度网络

共同邻居相似度(Common Neighbours Similarity)

对于两个顶点 x,y\in V 而言,如果它们的共同邻居数越多,表示它们的相似度越高,反之,相似度越低。

CN(x,y)=|N(x)\cap N(y)|=\sum_{u\in N(x)\cap N(y)}1.

共同邻居

所有邻居相似度(Total Neighbours Similarity)

类似地,将顶点 xy 的邻居求并集,也可以得到一个指标,TN(x,y)=|N(x)\cup N(y)|.

Preferential Attachment

PA(x,y)=|N(x)|\cdot |N(y)|, 它将 xy 的邻居数乘起来,获得一个指标。

Jaccard 相似度(Jaccard Similarity)

如果将两个节点 xy 的邻居分别作为两个集合 N(x), N(y), J(x,y)=CN(x,y)/TN(x,y) 就可以作为顶点 xy 的 Jaccard 相似度指标,其相似度是通过邻居来衡量的。

Sorensen-Dice 相似度(Sorensen-Dice Similarity)

SI(x,y)=\frac{2|N(x)\cap N(y)|}{|N(x)|+|N(y)|},

该相似度与 Jaccard 相似度有恒等变换,J(x,y)=\frac{SI(x,y)}{2-SI(x,y)}SI(x,y)=\frac{2\cdot J(x,y)}{1+J(x,y)}.

Hub Promoted 相似度

该相似度描述了顶点 xy 的重叠程度,

HP(x,y) = \frac{|N(x)\cap N(y)|}{\min\{|N(x)|,|N(y)|\}}.

Hub Depressed 相似度

HD(x,y)=\frac{|N(x)\cap N(y)|}{\max\{|N(x)|,|N(y)|\}}.

复杂网络的社区

好友度量(Friend Measure)

\text{Friend-measure}(x,y)=\sum_{u\in N(x)}\sum_{v\in N(y)}\delta(u,v),

其中 \delta 用于判断 u,v 之间是否有边相连接。如果相连接,则取值为 1, 否则取值为 0.

Adamic Adar 相似度(Adamic Adar Similarity)

A(x,y)=\sum_{u\in N(x)\cap N(y)}\frac{1}{\ln |N(u)|},

因此,0\leq A(x,y)\leq \frac{CN(x,y)}{\ln(2)}. 事实上,当 u\in N(x)\cap N(y) 时,|N(u)|\geq 2. A(x,y) 越大,表示顶点 xy 的相似度就越高;反之,如果 A(x,y) 越小,表示顶点xy 的相似度就越低。Adamic Adar Algorithm 相当于在共同邻居的计算上增加了权重,如果 x,y 的共同邻居 u 拥有较多的邻居,则降低权重,否则增加权重。

Resource Allocation 相似度(Resource Allocation Similarity)

RA(x,y)=\sum_{u\in N(x)\cap N(y)}\frac{1}{|N(u)|},

该相似度函数与 Adamic Adar 相似度类似,只是分母上没有增加对数函数而已。

参考文献:

  1. Silva, Thiago Christiano, and Liang Zhao. Machine learning in complex networks. Vol. 2016. Switzerland: Springer, 2016.
  2. Barabási, Albert-László. Network science. Cambridge university press, 2016.
  3. Wang, Peng, et al. “Link prediction in social networks: the state-of-the-art.” Science China Information Sciences 58.1 (2015): 1-38.

在新加坡的这五年—生活篇(七)

留学在外,衣食住行是所有学生都必须要关注的事情。还未出国之前,笔者总觉得在外留学需要每天自己准备食物,然后刚到新加坡的第一天,就彻底地打消了这个念头。新加坡是一个多元化的国家,它们的饮食亦是如此,除了当年下南洋的华人所创造的诸多美食之外,还有周边国家的人民所传入的食物。除此之外,新加坡人日常工作繁忙,也少有人能够在家长期做饭。虽不能够经常在家做饭,但在新加坡的各个社区和住宅楼附近,都布满了食阁,里面充满了各国的食物,足以满足周边居民的饮食需要。

NUS 的食阁(摘选 NUS 官网)

对于学生而言,如果日常都要去周边食阁吃饭,则还是不太方便,但是在 NUS 的内部的各个学院其实都有相应的食堂。第一次到 NUS 的时候,是从 West Coast Plaza 出发,穿越 Clementi Woods,就走到了 NUS 的工学院(Faculty of Engineering)。在工学院的食堂,其实就有各个国家的食物,不仅有中式的快餐,还有印尼烧烤等诸多食物。在食堂附近,还有着一年到头都开着的麦当劳(Mcdonalds),无论是在日常生活还是除夕期间,都可以去麦当劳购买快餐。每个学院都有自己的食堂其实会相对方便,毕竟每个院系的学生和老师都在相应的院系走动,近距离的食堂确实也能够给大家带来更多的方便。当时在 NUS 当助教的时候,是带 MA1505 和 MA 1506 两门课,而这两门课的开设地点通常都是在工学院(除了在 2014 – 2015 学年改到了 UTown 的 ERC),在工学院讲课自然是在工学院吃饭最为方便。而工学院的食堂则是位于 Central Library 的对面,只要坐校车就可以轻松地到达食堂。

FacultyofEngineeringCanteen_1
Faculty of Engineering 的食堂

NUS 的工学院食堂里面的店面相对丰富,不仅包括中式杂菜饭,还有印尼烧烤等诸多选择,足以满足不少教职工的需要。毕竟新加坡是一个多元化的国家,由不同的民族组成。所谓杂菜饭,就是跟国内的食堂打饭一样的性质,商家会将不同种类的菜分门别类的放好,顾客想吃什么菜只需要告诉商家就行,最后商家会根据顾客的需要将其打包或者装盘。不过 NUS 的 Faculty of Engineering 的打包看上去就是很简单,Science 的鸡肉饭至少会用一个饭盒。

2013年1月30日的朋友圈
人生第一个朋友圈(20130130)

对于理学院的学生而言,其实去 Science 的食堂是最方便的,当年只要从理学院的大门进去,就能够很容易地找到 Science 食堂。在 2010 – 2015 年期间,Science 食堂一直维持原样,直到 2017 年底 Science 食堂才得以重新翻修。后续如果有机会重返新加坡,一定会去新的 Science Canteen 再吃一顿。

FacultyofScience_1
理学院的标志
FacultyofScienceCanteen_1
以前的 Science Canteen

除了在各个学院的食堂之外,NUS 宿舍区的食堂其实也独具特色。对于博士生而言,日常的饮食自然是可以在学院的食堂解决,但是每个学院的食堂周末都是不开门的。事实上,每次到了星期六下午 13:00 之后,各个学院的食堂都会关闭,直到下周一才会重新开始营业。于是每到周末的时候,博士生们除了选择外出吃饭之外,还可以选择在 UTown 或者 Prince George Park 的食堂吃饭。UTown 和 Prince George Park 是研究生和博士生能够选择的宿舍区,其中有很多类型的宿舍可供选择,无论是有空调的屋子,没有空调的屋子,还是家庭式的独立房间都是可以让博士生根据自身的需要进行选择的。

NUS UTown Residence

周末除了能够在宿舍区的食堂吃饭之外,学生们还可以选择去周边的食阁寻找美食。距离 NUS 比较近的住宅区是 Clementi(金文泰),而在金文泰比较有名的小吃则是“黄土地西安小吃”,这家店铺主要是卖羊肉泡馍,肉夹馍,凉皮等食物。而这些美食恰好就是 NUS 的食堂所没有的,因此数学系里面的几位西安籍的博士生都非常喜欢去这家店。从 NUS 的数学系 S17 去 Clementi 其实只需要从 AYE 上乘坐 97,197,198,963 等线路的公交车就可以顺利抵达,不过下车之后自然是需要步行一段时间的。

S17 到 Clementi 的线路

新加坡的各个住宅区都设有食阁,食阁里面的食物自然是可以提供外带服务的。有几次笔者就将凉皮和肉夹馍自行携带回 S17 的办公室享用。

星期日的晚餐(20131006

除了来自中国的面食之外,在新加坡也有不少日本拉面店。在新加坡吃日本拉面的地点也有许多,而笔者常去的地点包括 Vivo City, Buona Vista 和 Holland Village 。笔者吃日本拉面其实是受到了卫同学的影响。自从 Circle Line 开通了之后,从 NUS 的 S17 去 Vivo City 也很方便,只需要在 Kent Ridge MRT Station 乘坐 Circle Line 就可以轻松抵达 Vivo City,在这里有日本拉面店中比较出名的是面屋武藏(Menya Musashi)。同时,新加坡的荷兰村(Holland Village)也是店铺林立,它属于新加坡别有风味的休闲购物区。在荷兰村有不少的酒吧,商店,饭馆等,只要有钱有时间有胃口,在这里就可以享用到各国的美食。在 Holland Village 的拉面店也有许多,包括 Yushimura 日本拉面,三宝亭(Sanpoutei Ramen),翡翠拉面小笼包等,只不过翡翠拉面小笼包中的拉面一般是中式拉面。

面屋武藏(20131113

日常的饮食除了食堂和各个餐馆之外,各种类型的自助餐也是新加坡的特色之一。刚去新加坡的时候第一次吃的自助餐就是四川火锅自助,在 Block 602 附近就有添一点火锅和川江号子。在节假日最常做的一件事情就是在中午的时候吃自助火锅,到了晚上之后就完全不需要吃晚饭了。新加坡的自助餐除了中国的四川火锅之外,还有各种各样的海鲜自助餐。其中去的次数较多的就是维也纳海鲜,虽然说是海鲜自助餐,但是也会提供牛排,鸡翅等食物。整体的质量较高,推荐享用。

维也纳海鲜(20131019

每次到了新加坡春节的时候,包括 NUS 校园内部食堂在内的许多餐厅都会暂停营业。在这种时候,博士生们除了吃麦当劳或者自己做饭之外别无选择。不过在 NUS 的 Faculty of Engineering 就有一个麦当劳,在 Kent Ridge MRT Station 也有一个汉堡王(Burger King),每逢节假日笔者都有可能出现在这里吃汉堡。

正月初二的麦当劳(20140201)

到了 2014 年,基本上是 2010 级的博士生准备毕业的时候,毕竟这是博士生面临着发表论文和撰写毕业论文的关键阶段了。在 2014 年 7 月 12 日,2010 级第一位提交博士论文的博士生何同学离开了新加坡,准备再去美国攻读一个博士学位。在送别了何教授之后,笔者和一些朋友一起去 Geylang 的串烧工坊吃了顿烧烤。不过新加坡的啤酒是真的十分昂贵,一瓶青岛啤酒在餐馆里面可以卖到 8 新币(折合人民币 40 元左右)。

串烧工坊(20140712)

其实在 2014 年上半年,笔者的论文课题已经基本完成,关键的核心步骤已经写好。而到了 2014 年的下半年,笔者的毕业论文基本上已经写好,只需要整理完成即可。那半年的主要工作就是撰写毕业论文和当助教,到了 2015 年的时候,笔者已经顺利地提交了博士论文并且回国过春节。在 2015 年 4 月份答辩结束之后,在回国找工作之前,笔者专门去了一次位于宏茂桥的龙海鲜螃蟹王,这里的螃蟹米粉真的是一绝,螃蟹汤拌米粉真的是非常好吃。2012 年和司北吃螃蟹是在新加坡河边上的珍宝海鲜楼,后来 2017 年在日本东京的时候也与司北在日本居酒屋共进晚餐,只是不知道下次跟司北一起吃饭是在何时何地了。(未完待续)

龙海鲜螃蟹王(20150519)

随机图模型

数学家是一种把咖啡变成定理的机器。
Alfred Renyi

A mathematician is a machine for turning coffee into theorems.
Alfred Renyi

随机图的历史

在 1959 和 1968 年期间,数学家 Paul Erdos 和 Alfred Renyi 发表了关于随机图(Random Graph)的一系列论文,在图论的研究中融入了组合数学和概率论,建立了一个全新的数学领域分支—随机图论。

随机图的案例 p=0.01

随机图的定义

本文只关注无向图的场景。顾名思义,随机图(Random Graph)就是将一堆顶点随机的连接上边。好比在地上撒了一堆豆子,而豆子之间是否用线来相连是根据某个概率值来确定的。通常来说,对于随机图而言有两种定义方式

  1. 【定义一】给定 NM, G_{1}(N,M) 的定义是随机从 N 个顶点和 M 条边所生成的所有图集合中选择一个。其中,这样的图集合的势是 C(N(N-1)/2, M), 因此获得其中某一个图的概率是 1/C(N(N-1)/2, M).
  2. 【定义二】给定 NpG_{2}(N,p) 的定义是有 N 个顶点,并且两个顶点之间以概率 p\in[0,1] 来决定是否连边。

事实上,这两个定义是等价的,N 个顶点的图最多拥有的边数是 N(N-1)/2,G_{1}(N,M) 恰好有 M 条边,并且它们分配的概率是均等的,因此两个顶点之间是否存在边的概率就是 p = M/(N(N-1)/2), 这里的 C 指的是组合数。i.e.

G_{1}(N,M) = G_{2}(N, \frac{M}{N(N-1)/2}).

另一方面,对于 G_{2}(N,p) 而言,顶点两两之间是否存在边的概率是 p,N 个顶点的图最多拥有 N(N-1)/2 条边,于是边数为 pN(N-1)/2. i.e.

G_{2}(N,p)=G_{1}(N,pN(N-1)/2).

进一步地,通过以上两个公式可以得到:

G_{1}(N,M)=G_{2}(N,\frac{M}{N(N-1)/2}) = G_{1}(N,M).

在定义一中,可以直接算出所有顶点的平均度是 \langle k\rangle = 2 M /N. 但如果要计算图的其余指标,用第二种定义 G_{2}(N,p) 反而更加容易,因此后续将会重点关注第二种定义,为方便起见,记号简化为 G(N,p) = G_{2}(N,p).

随机图的度

图的度(degree)指的是对于某个顶点而言,与它相关联的边的条数。对于随机图 G(N,p) 而言,它的边数大约是 pN(N-1)/2, 最多与该节点相连接的顶点数为 N-1, 整个图的顶点平均度是(边数 * 2) / 顶点数,用记号 \langle k\rangle 来表示,意味着顶点平均度是 \langle k\rangle = p(N-1) \sim pN,N 充分大的时候成立。换言之,

p \sim \langle k\rangle / N.

顶点上的值就是该顶点的度

对于随机图 G(N,p) 中的一个顶点 i 而言,我们想计算它恰好有 d 条边的概率值。事实上,对于除了 i 之外的 N-1 个点而言,有 d 个顶点与 i 相连,N-1-d 个顶点与 i 不相连,其概率是 p^{d}(1-p)^{N-1-d}, 同时需要从这 N-1 个点中选择 d 个点,因此,顶点 i 的度恰好是 d 的概率是

p_{d}=C(N-1, d)\cdot p^{d}\cdot (1-p)^{N-1-d}.

特别地,当 d\ll N 时,上述概率近似于泊松分布(Possion Distribution)。事实上,p=\langle k\rangle / (N-1) 并且

C(N-1,d) = (N-1)(N-2)\cdots(N-d+1)/ d! \sim (N-1)^{d} / d!,

(1-p)^{N-1-d} \sim (1-\langle k\rangle /(N-1))^{N-1-d} \sim e^{-\langle k\rangle},

因此,在 d\ll N 时,p_{d} 近似于泊松分布,

p_{d} \sim \langle k\rangle^{d}e^{-\langle k\rangle}/d!.

随机图的连通分支

对于随机图 G(N, p) 而言,它的连通分支个数是与顶点的平均度 \langle k\rangle 息息相关的。特别地,当 \langle k\rangle=0 时,每个顶点都是孤立的,连通分支个数为 N;\langle k\rangle=N-1 时,任意两个顶点都有边相连接,整个图是完全图,连通分支的个数是 1. 顶点的平均度从 0N-1 的过程中,连通分支的个数从 N 演变到 1, 最大连通分支顶点数从 1 演变到 N, 那么在这个变化的过程中,最大连通分支的顶点数究竟是怎样变化的呢?是否存在一些临界点呢?数学家 Erdos 和 Renyi 在 1959 年的论文中给出了答案:

对于随机图 G(N,p) 而言,用 N_{G} 表示最大连通分支的顶点个数,那么对于图的平均度 \langle k\rangle 而言,

  1. \langle k\rangle = Np < 1, 那么 N_{G} = O(\ln(N));
  2. \langle k\rangle = Np = 1, 那么 N_{G} = O(N^{2/3});
  3. \langle k\rangle = Np \in (1, \ln(N)), 那么巨连通分支(Giant Component)存在,同时存在很多小的连通分支,在临界点 1 的附近时, N_{G} \sim (p-p_{c})N, 这里 p_{c}=1/N;
  4. \langle k\rangle = Np \in (\ln(N),+\infty), 那么图 G 是全连通图,i.e. N_{G}=N.

在这个定理中,对于顶点的平均度 \langle k\rangle 而言,存在两个临界点,分别是 1\ln(N).\langle k\rangle < 1 时,巨连通分支不存在,所有连通分支的量级都在 O(\ln(N)) 以下;当 \langle k\rangle = 1 时,巨连通分支开始出现,量级大约是 O(N^{2/3});1<\langle k\rangle <\ln(N) 时,随机图存在一个巨连通分支和很多小的连通分支;当 \langle k\rangle > \ln(N) 时,图是连通图。

图的平均度的临界点

整个定理的证明有点复杂,但本文将会介绍两个临界点的计算。先来考虑第一个临界点 \langle k\rangle = 1 的情况:

N_{G} 来表示随机图 G 中的最大连通分支的顶点个数,u 表示图 G 中不在最大连通分支的顶点比例,i.e.

u=(N-N_{G})/N = 1 - N_{G}/N= 图的顶点不在最大连通分支的概率。

对于不在最大连通分支的顶点 i 而言,其余的 N-1 个顶点分成两种情况,Case(1):要么 i 与之不相连,此时概率是 1-p; Case(2):要么 i 与之相连,但此时的顶点不能在最大连通分支中,那就只能在剩下的 uN 个顶点中,其概率是 pu. 于是,对于所有顶点而言,它不在最大连通分支的概率是 (1-p+pu)^{N-1}. 于是,

u=(1-p+pu)^{N-1}=(1-p(1-u))^{N-1}.

根据 p\sim\langle k\rangle /N\lim_{N\rightarrow +\infty}(1+x/N)^{N}=e^{x} 可以得到当 N 充分大时,有

u = (1-p(1-u))^{N-1} = (1-(1-u)\langle k\rangle /N)^{N-1} \sim e^{-(1-u)\langle k\rangle}.

s= 1-u = N_{G}/N, 它表示最大连通分支的顶点个数在所有顶点个数的占比,从而可以得到近似方程

1-s=e^{-\langle k\rangle s}.

g(s) = 1 - s - e^{-\langle k\rangle s},g(0) = 0, g(1) = -e^{\langle k\rangle}<0. 它的导数是 g'(s) = - 1 + \langle k\rangle e^{-\langle k\rangle s}, 通过计算可以得到:

  1. \langle k\rangle \leq 1 时,g'(s)<0(0,1) 上成立,i.e. g(s) = 0[0,1] 上的唯一解是 s=0, 换言之,N_{G}/N = s \rightarrow 0;
  2. \langle k\rangle > 1 时,g'(s)>0(0,\ln\langle k\rangle/\langle k\rangle) 成立,g'(s)<0(\ln\langle k\rangle /\langle k\rangle,1) 成立。换言之,g(s)=0[0,1] 上除了零之外还有解 s_{0}\in(0,1). 此时会存在巨连通分支,N_{G}/N = s_{0}\in (0,1) 是解。

因此,最大连通分支的顶点数在这个点会出现突变,1 是该方程的第一个临界点,并且是出现巨连通分支的临界点。

再来考虑第二个临界点 \langle k\rangle = \ln(N) 的情况。对于极限状况而言,假设仅有一个顶点不在最大连通分支中,那么 s = N_{G}/N = (N-1)/N, 此刻,

1/N=1-s=e^{-\langle k\rangle s}=e^{-\langle k\rangle (N-1)/N},

两边求对数可以得到 \langle k\rangle = \ln(N), 因此,\ln(N) 也是一个临界点,并且是出现全连通图的临界点。

随机图的六度分离

六度分离又称为小世界现象,它的含义是在地球上任意选择两个人,他们之间最多相隔 6 个相识关系。换言之,来自世界上任何地方的两个人都可以通过不超过 6 个相识关系所连接起来。

The Six Degrees of Larry Stone

图中两个顶点的距离定义为两个顶点之间的最短路径长度,图的直径就是图中任意两点的距离的最大值。对于随机图 G(N,p) 而言,如果 \langle k\rangle \leq 1 则是不连通的,因此通常只需要考虑 \langle k\rangle>1 的情况,甚至只考虑 \langle k\rangle >\ln(N) 的全连通图。任取一个顶点 i,则有

  1. \langle k\rangle 个距离为 1 的顶点;
  2. \langle k\rangle^{2} 个距离为 2 的顶点;
  3. \langle k\rangle^{3} 个距离为 3 的顶点;
  4. \langle k\rangle^{d_{max}} 个距离为 d_{max} 的顶点;

同时,G(N,p) 而言,顶点的个数为 N, 这意味着 \langle k\rangle + \langle k\rangle^{2}+\cdots+\langle k\rangle^{d_{max}}\leq N. 通过等比级数的公式可以得到 \langle k\rangle^{d_{max}} \leq N, 因此,

d_{max} = O(\ln(N)/\ln(\langle k\rangle)).

而随机图的直径的量级是与 d_{max} 成正比的,因此,随机图的直径量级同样是 O(\ln(N)/\ln(\langle k\rangle)). 如果 N = 10^9 并且每个人认识 \langle k\rangle = 200 个人,于是随机图的直径量级是 \ln(6*10^9) / \ln(200) = 4.25 < 6.

参考文献

  1. Erdos Renyi Model:https://en.wikipedia.org/wiki/Erd%C5%91s%E2%80%93R%C3%A9nyi_model
  2. Giant Component:https://en.wikipedia.org/wiki/Giant_component
  3. Erdős P, Rényi A. On the evolution of random graphs[J]. Publ. Math. Inst. Hung. Acad. Sci, 1960, 5(1): 17-60.
  4. Albert R, Barabási A L. Statistical mechanics of complex networks[J]. Reviews of modern physics, 2002, 74(1): 47.
  5. 《巴拉巴西网络科学》,艾伯特-拉斯洛·巴拉巴西(Albert-LászlóBarabási),2020.

2018 年的台湾八日行

2020 年受疫情和诸多因素的影响,注定没有办法进行境外旅游了,笔者只好提笔整理之前拖欠多年的游记,回忆之前每年都外出旅游的日子。

在 2018 年端午小长假来临之际,根据国务院假日的安排,只需要请四天假期就可以得到长达 9 天的假期。端午节假期之长,总不能够留在家里一直待着。于是,笔者在 5 月底的时候就开始考虑着出去旅游。思前想后,虽然日本韩国台湾均已去过,但是台湾省还是值得多去几次,因为之前去台湾的时候都是跟团旅游,也就是传说中的“上车睡觉,下车拍照”,有些想去的地方都没有仔细地游玩。因此,这次旅游地点就再次选择了台湾。不过,要想在短短的七八天时间内把台湾整体玩一遍还是非常困难的,因为在台湾旅游适合慢慢地玩,而不适合走马观花。

台北与台中

在 2016 年和 2017 年,笔者已经跟随公司去过两次台湾,走的是完全不同的两条线路。分别是台北-台中台北-花莲-高雄两条线路,因此对台湾的大致情况也有所了解。这次是带着 RDD 一起前往台湾,于是在出行方面就全部是由笔者来设计和规划了。在出行方面,由于台北机场与香港机场的距离不远,并且从深圳到香港机场也不算特别费事,于是,笔者最终还是选择了从深圳入境香港,再从香港机场飞往台北机场。在请假的时候就把 3 天婚假和 1 天年假加在一起凑了 4 天,就获得了整整 9 天的假期。

台北 101 景色

从深圳过关到香港是相对简单的,只需要材料齐全就可以轻松过关,到达香港之后可以选择坐大巴或者做地铁前往香港机场,通常来说坐大巴会方便一些,在资金方面也可以节省不少钱。其实也可以在皇岗口岸选择坐去机场的商务车,也可以达到省时省力的目的。

在抵达香港机场之后,跟以前的一样办理登机手续和正常登机。从香港出发的时候乘坐的航班是国泰航空的 CX400,2018 年 6 月 16 日 13:10-15:10,只需要两个小时的时间就可以抵达台北桃园机场;而从台中机场返回香港的时候乘坐的是华信航空的 AE1841,2018 年 6 月 23 日 16:55-18:25。因此,从香港去台湾是非常方便和迅速的。

从行程上来安排,笔者简单地安排了以下景点:

  1. 20180616 – 20180620:台北游玩:西门町,诚品书店,宁夏夜市,中正纪念堂,中山纪念堂,士林官邸,国立故宫博物院,九份山城,平溪线,台北 101 大厦,台北松山文创园区,国立台湾师范大学等;
  2. 20180620 – 20180623:台中游玩:东海大学,静宜大学,逢甲大学(夜市),清境农场等。
国立国父纪念馆

至于从台北到台中的交通线路,可以选择在台北车站购买;而台北的交通卡叫做悠游卡,用它可以乘坐公交与地铁,同时这张卡在台北机场也有售卖点。至于手机卡等通讯设备,也完全可以等到了台湾之后再进行购买,不一定需要在国内全部准备好。由于这次的行程相对简单,只安排了台北和台中两个城市,也需要安排台北,台中两地的住宿即可。

清境农场的栈道

西门町是台北市的商业区之一,在这里聚集了无数的年轻人,而西门町距离台北车站仅仅只有 10 分钟的车程。西门町拥有各路美食,也包括各种各样的网红店。同时,西门町的诚品书店西门红楼则是来了西门町的必去之地,在这里不仅能够享受到各种美食,也能够体会到与大陆不一样的生活气息。在台北的这几天(2018 年 6 月 16 日 – 2018 年 6 月 20 日)所住的酒店是 Hotel PaPa Whale,酒店就位于西门町附近,于是无论是出行还是游玩都十分方便。

中正纪念堂是台北比较有名的景点之一,它是为了纪念蒋中正而兴建的建筑。中正纪念堂对于游客则是免费的,游客可以根据自己的时间安排来自由参观它。在大厅里面,每两个小时就会有海军仪仗队的交接仪式,只要时间安排合理游客们都有机会在大厅里面看到这场仪式。在中正纪念堂内部除了可以在四楼观看海军仪仗队的交接仪式之外,还可以在其余楼层观看其他展品。在一楼就摆设了当年蒋先生用过的一些物品,也介绍了历史上的一些故事。在中正纪念堂的外面有一个牌楼,上面写着“自由广场”四个大字。在 GOOGLE 上也可以搜到很多团体会根据日程安排在自由广场举办相应的活动,有兴趣的朋友在旅游之前不妨研究一下。

中正纪念堂

在中正纪念堂参观完了之后,不妨去附近的“金峰卤肉饭”吃一顿网红美食。从中正纪念堂到金峰卤肉饭也就几百米的路程,步行前往倒花不了多少时间,但是在排队等饭的时候却是花了许多功夫。毕竟这家餐厅的人气实在是太旺了,周边的游客都会闻风而来,每到饭点这间店的门口总是会排起长龙。

自由广场

从中正纪念堂前往台北的国立故宫博物院其实是需要花费一个小时的时间,需要从中正纪念堂乘坐捷运到士林站,再从士林站转乘巴士 255 区间车前往国立故宫博物院。不过在士林站附近有士林夜市,在游玩故宫博物院结束之后在返程途中可以前往士林夜市吃晚饭。台北故宫博物院是台湾省最大的博物馆,其著名的展品包括翠玉白菜,红烧肉,毛公鼎,象牙球等诸多文物。除此之外,在一些特殊的时期,故宫博物院也会根据需要来进行一些历史文物,名人字画的展示。这就看各位游客去的时候有没有赶上好时候了。

国立故宫博物院
翠玉白菜
红烧肉

在士林站和国立故宫博物院中间,还有另外一个景点,那就是士林官邸。它是蒋中正在台湾时期的官邸,在参观的过程中可以看到蒋中正先生当年的日常生活情况,屋子里面的装修精致大方,屋外还有一片花园,是一个可供拍照的好去处。成人的票价也十分便宜,100 新台币即可(约合人民币 23 块),游玩时间大约 1 个小时。

士林官邸

松山文创园区是台北信义商圈的一个景点,里面有不少文艺的作品和文艺的小店。诚品书店也在其中有分店。而在信义商圈附近,最著名的应该就是台北 101 大厦了,它位于台北的核心地带,在 101 上的观景台可以将台北的景色一览无余。因此推荐大家在傍晚之前登上观景台,这样的话就可以同时参观白天和晚上的景色了。在 101 附近也有国立国父纪念馆,如果有兴趣的朋友也可以抽空前往,毕竟这几个地点的路程都不算太远。

台北 101 夜景

在台北旅游除了可以参观上述景点之外,对校园生活感兴趣的朋友也可以选择去参观台湾大学台湾师范大学等著名高校。笔者第一次去台湾大学的时候是跟着公司的 2016 年团建,正好有一天属于自由活动的时间,于是约上了 PHD 的朋友在台湾大学数学研究所见面,顺便也参观了一下台湾大学的校园生活。而在台湾大学附近,也有不少文艺的咖啡厅和小店,同样吸引了不少的游客前往游玩。

九份山城

在台北除了可以参观各种著名景点之外,距离台北车站 2 个小时车程的九份山城也是来台北的游客会去参观的地方。九份山城其实已经不属于台北,而是属于新北市的瑞芳区,早期由于金矿而繁华,后期由于金矿挖尽而没落。不过近几十年由于各种各样的原因,九份山城已经被改造成一个旅游景点,吸引着不少大陆,日本和韩国的游客去游玩。在九份山城,除了可以感受到当年挖金矿的人们的日常生活之外,还可以在九份山城享受各种美食,包括芋头,烤肠,各种当季的台湾水果等。

平溪线的小火车

从台北车站去九份的话必定会经过瑞芳车站,而从瑞芳车站走平溪线也别有一番滋味。因为平溪线是区间车,因此游客可以在每个站都下来玩一下,然后到点了就乘车前往下一个车站。沿途的车站包括猴硐猫村,十分车站,平溪车站,菁桐车站等景点。每个景点可以游玩的时间大约是 1 个小时,不过这些车站都不大,一般来说不会游玩那么久的时间。而且这些车站的相似度非常高,如果没有特别的爱好,其实也没有必要每一个车站都下去玩。

平溪线的竹筒
平溪线的车站

由于这次的假期有 9 天,因此只在台北的话就略显得有点单调。于是在安排行程的时候就把台中包含了进来。从台北到台中的车程也就一个小时左右。如果说台北是台湾最繁华的城市,那么台中就显得比台北破旧一些。在台中市区内可以游玩的景点确实不算多,基本上都是在台中的周边地带。包括东海大学,静宜大学,彩虹眷村,甚至更远的清境农场与日月潭。

逢甲夜市

提到台中市的夜生活,就不得不去台中最著名的逢甲夜市。为了能够在台中享受到美食,笔者在订酒店的时候就特定选择了位于逢甲夜市的酒店 KUN Hotel。于是,在台中的这几个晚上,都在逢甲夜市吃的晚餐。逢甲夜市不仅包括各路小吃,也包括各种饮品,甚至还包括各种卖东西的商店,属于一个非常大的商圈。每逢假日,逢甲夜市总是人满为患,道路被挤得水泄不通。因此来台中的游客一定不要错过这个著名的逢甲夜市。

东海大学的路思义教堂

在台中市,除了夜市附近的逢甲大学之外,还可以去参观东海大学静宜大学。东海大学是台湾的一所私立大学,与 1963 年建成的路思义教堂则是东海大学的著名景点之一。除此之外,东海大学还有农业的相关院系,因此东海大学的牧场所出售的牛乳制品也是一绝,其中包括牛乳冰淇淋,牛奶,冰棍等。而静宜大学出名恐怕是由于电视剧《恶作剧之吻》的热播,袁湘琴与江直树在剧中的天台则成为许多游客的打卡地。

静宜大学的天台
静宜大学的音乐台
静宜大学的公告栏

南投县距离台中市区并不远,而清境农场与日月潭也是在行程之内。只是当时的天气不太好,然后就只规划了一个景点,那就是清境农场。只不过乘车抵达清境农场之后同样是下雨,逛农场的时候都只能够撑伞,也没有机会触摸到毛茸茸的绵羊。只是在小商店购买了一些羊奶制品进行享用。不过幸运的是恰好赶上了一场马戏表演,这也算是在清境农场的不错的体验。其实从台中赶到清境农场其实也要花费一定的功夫,如果想省事的话,其实可以报一个当地团前往,不仅可以游览清境农场,还可以顺便游玩一些周边的景点,包括巧克力工坊小瑞士花园等。但是对于钢铁旅游的朋友来说,就可以自行前往,并且在一天之内把日月潭和清境农场游玩一遍。

清境农场的绵羊
清境农场的花
清境农场的风车

在深圳的这几年时间里,笔者去过台湾三次,去过的地方包括台北,九份,花莲,垦丁,高雄,台中,日月潭,清境农场等诸多地方。本想着有机会的话再去慢慢地走一遍台湾的其他景点和城市,但是近些年由于种种原因则无法出行。后续会继续寻找机会再去一次台湾,让忙碌的工作尽量慢下来,慢慢去体验生活所带来的乐趣。

随笔(三)— 深圳的房价

第一次来深圳的时候应该是在 2011 年左右,作为博士生每年都有 21 天的假期,那自然是会回到家乡与家人团聚。从新加坡回大陆的话一般来说都有廉价航空(Tiger),所以为了省钱会制定一条较为折腾的路线。每次从新加坡返回家乡的时候都选择先去香港,再从香港进入深圳,最后从深圳返回贵州。笔者当时对深圳的印象也挺好,无论是从自然气候,空气环境,城市建设等方面,深圳与新加坡都是十分相似的。

在 2011 – 2012 年期间,笔者每年都会回国,会时不时地往返香港与深圳,笔者也经常拿这两座城市做比较。当时在香港居住的地方是钻石山的星河明居,附近拥有荷里活广场(Hollywood Plaza)和一些便利店,因此日常生活用品和做饭材料都可以在荷里活广场买到,整体来说生活也算方便。当时的星河明居有 A,B,C,D,E 这几栋,住的那一个屋子大约 50 平左右,有三个房间,再加上客厅的话总共有四个居住场所,所以日常的租户是 4 人。有一个房间就特别小,测量了一下大约只有 4 平左右。在居住的闲暇之余还去周边的房产中介看了一下,50 平左右的这个房子大约的价位是 550 万港币,总体来看,这些房子的均价大约是 10 万港币 / 平左右。

星河明居

从星河明居到罗湖口岸其实并不花太长的时间,从观塘线转到东铁线,再进入罗湖也就大约 1 个小时。一旦进入了罗湖,总想着也需要比较一下深圳和香港的房价,当年也在深圳的福田和罗湖浏览了一些小区的房价,当时福田不少小区的均价还在 2 万以下,在罗湖也能够找到 1 万多的小区。

星河明居楼下

当时关注的房子基本上都是小户型,毕竟即使是小户型也会远好于在星河明居只有 4 平方的房间。福田或者罗湖的一室一厅的面积都是在 20 – 40 平左右,一般来说不会到 60 平。当时关注的不少小区房价相对于香港还是便宜许多的,两者的距离仅仅相差了一个罗湖口岸。

当年关注过位于八卦岭的鹏益花园这个小区,小户型(一室一厅,小于 40 平方)的价格是有明显变化的。在 2013 年的时候,60 万人民币基本上可以拿下一套小户型,但是从链家的官网来看,房价处于一个高速上升的势头,不管是由于学区房还是其他原因,整体的房价都在提升。据不完全统计和肉眼观察,鹏益花园的房价基本上是:

  1. 2010 年大约是 10 k / 平;
  2. 2014 年大约是 20 k / 平;
  3. 2019 年大约是 50 k / 平;
  4. 2020 年大约是 90 k / 平;

除了鹏益花园之外,还有南山的诺德假日花园,同样呈现了较大的增长势头。从链家的交易记录来看,可以看到小区的交易价格大约是:

  1. 2010 年大约是 20 k / 平;
  2. 2016 年大约是 70 k / 平;
  3. 2020 年大约是 140 k / 平;

无论是鹏益花园,诺德假日花园还是深圳的其余小区。在短短的十年时间,二手房的价格大约涨了 8 – 9 倍。这对于应届生而言,如果是 2010 年来了深圳之后就迅速买房,虽说不一定能够保证财务自由,但是也足以节省一大笔钱,而且房产的资产增值幅度有很大可能已经远超工资上涨的幅度。如果是 2015 年来深圳的应届生,虽然也经历了 2015 年房价迅速增加的一段时光,但是估计也没想到有的小区在短短的 5 年之后还能够继续保持一定的涨幅,并且有些地区的涨幅基本上是翻倍了。

在 2020 年的初期,深圳的房价又一次出现了上涨的势头,整体的价格相对于 2019 年确实涨了不少。即使是从 2020 年的 8 月份算起,深圳的房价也呈现了稳中有升的局面,从价格上来看并没有出现下降的趋势。

10646元!2019年深圳市在岗职工月平均工资(即社平工资)出炉。记者分别从深圳市医疗保障局、深圳市社会保险基金管理局获悉,从7月起我市各项社保缴费基数和待遇偿付基数也随之调整,涉及到2019年全省全口径从业人员月平均工资、2019年深圳市在岗职工月平均工资的,分别按6756元、10646元/月计算。

这十年来的变化,使得深圳的二手房房价已经快追上了香港,2020 年的深圳房价已经不是 2010 年的水平了。但是其工资水平其实并没有发生那么多倍的变化,能够在早期入手购房的人说不定已经财务自由,但是对于刚来深圳的应届生而言,在深圳安家的成本就会变得越来越高,根据深圳市的调查,深圳市最新的社平工资为 10646 元。其链接是:我市最新社平工资为10646元/月 工伤发生人数下降15.28%

从深圳的平均工资和二手房均价来看,如果只是靠个人的薪水想要攒到深圳核心地段的房子首付确实是一件较难的事情,如果家里面能够提供必要的支持确实能够帮助应届生解决问题。此时,有的同事会选择在深圳打工,然后想办法供二线家乡城市的房子。毕竟无论在哪里工作,最终都是为了能够过上更好的生活。(未完待续)

随笔(二)—工作与生活

从小听过不少家长或者老师的“谎言”,读初中的时候,老师们总是说让大家努力学习,只要考上了高中就可以轻松学习了,毕竟从高中考大学是相对容易的;在高中的时候,老师们也总是说让大家继续努力学习,保持学习劲头不放松,等考上了大学就可以开始真正的素质教育了;但是到了大学的时候,才发现所谓的学习生活并不是跟高中老师所说的一样。从某种程度来看,大学教育在某些时候也是一种应试教育,跟高中的模式没有太大的区别,要想获得某门课程的好成绩同样也需要花费很多时间和精力的。

笔者在读博士的时候,在刚入学的第一年总想在很短的时间内做完某件事情,甚至在刚入学的第一个学期都没有在周边进行游玩和娱乐,也没怎么进行休息,一直在尽力地学习各种数学课程,阅读科研论文。等到了博士第二年的时候,心态就出现变化,毕竟博士生做论文并不是花费几个月就能够搞定的,科研与学习是有本质区别的。科研是一种生活状态,无论博士生在办公室,在路上,在家里,甚至在吃饭的时候,都可以思考问题,不断地考虑论文中的突破口,不停地进行各种各样的演算和尝试,在每一次的失败中寻求成功的路径。如果科研是一种生活状态,那就不太可能出现读完,写完某篇论文就不用继续努力付出的情况。对于博士生而言,科研与生活会长期并存,互相交织在一起。

其实无论是在中学,大学,研究生,还是博士阶段,甚至到了工作时期,都不太可能出现度过了某个阶段,下个阶段就无比轻松的情况。在不同的阶段都有着完全不同的任务和目标,都有着截然不同的挑战和困难。在小学,中学,大学的时候,大家还是以学生的身份而存在;到了研究生,博士阶段的时候,大家就要考虑未来的生计问题了;等到了工作期间,大家考虑和谈论的事情基本上就是事业,成家,立业等家庭问题;到了生儿育女的阶段,大家商讨的应该就是学区房,小孩成绩等诸多问题了。因此,无论在人生的哪个阶段,并不会出现丝毫没有任何压力的情况,也很难出现一个阶段过去了下一个阶段就很轻松的事情,说不定下一个阶段比上一个阶段更加的艰难。

在人的一生中,学习,工作,生活三者将会一直共存,进入工作阶段并不意味着学习的停滞,在学习期间也不意味着不需要生活,在工作阶段更不意味着可以永远不休息。生活和工作在每个人的人生中其实是不可严重割裂的两块,对大多数人而言,是很难做到不需要工作而只需要生活的,也很难做到不需要生活而只需要工作。当然,在某个短暂的阶段我们完全可以做到放弃其中的某一样而努力做到另外一件事情,但是以长远的眼光来看,工作与生活其实是长期并存的关系。

在一线城市工作,虽然日常会承受 995 甚至 996 的工作压力,但是总还是可以找到休息的机会。不过据说有的公司是 007 的工作状态,那么估计这些员工是没有生活了。但是 007 的工作状态也不会持续一辈子,毕竟人的体力和精力都是有限的,在某个合适的时刻这种工作状态会被改变的。如果不想拥有高强度的工作压力,就要合理地降低自身的欲望。如果想在职场发展中持续地赚到钱或者维持高收入,就必然要保持自身的竞争力。而竞争力的来源包括工作时长,技术能力,管理能力等诸多方面,其中工作时长是最容易体现竞争力的一个方面,这也许正是 996 的由来。但即使是高强度的工作,也可以尝试在工作间隙进行必要的休息和生活,例如午饭和晚饭的时间。工作人士可以在这两个时间段做一些自己喜欢的事情,体验一下与工作完全不同的生活。

工作在某些时候就跟读博士一样,千万不能够想着读完了博士就怎么怎么样,而是要学会把大任务拆解,安排好每个时间段的工作。只要每天,每周,每月,每年做完一定的任务之后就及时享受生活和体验人生。只有这样才能够保证自身的能量充足,能够长期在工作中保持战斗力。工作是人生的必经阶段,也是日常生活的一部分,为了更好地生活,我们需要努力的工作,但是并不需要为了工作而放弃所有的生活。

在工作的时候,通常任务有日常的常规任务,也有充满挑战的创新性任务。在做常规任务的时候,可以搞一些可以提升效率的工具,减少重复工作的时间。在做创新性项目的时候,就要一往无前地全力以赴,毕竟创新性的工作除了给人带来工资与收益之外,还能够给人带来巨大的成长,为今后的工作做必要的铺垫。只做重复性的工作很容易让人产生疲惫的心理,在互联网这种充满风险和挑战的地方还是要做一些对自己有提升的工作。一旦目前的工作都已经手到擒来,没有任何挑战,那就可以考虑去找一些更有挑战的项目来提升自己了。

工作与生活是不能被分割的两部分,很难放弃其中的一个而只选择另外一个。在日常的工作中,通过项目来精进自身的能力,在工作中获得一定的成就感。在生活中及时地享受人生,在娱乐之余及时地给予自己一定的奖励,只有这样,才能够更好地平衡工作与生活。

随笔(一)— 养娃一月记

对于一线大城市的年轻人而言,读书,就业,买房,恋爱,结婚,生娃都是非常重要的事情。但对于不同的人却有着不一样的顺序,也许结婚的时候并不在当时工作的城市,或者在某个阶段就早已回到家乡重新开始新的生活。不过这些事情对于年轻人以及背后的家庭而言,都是一个又一个的里程碑(Milestone),是一段新生活的开始。

从今年七月份开始,笔者的日常生活基本就是围绕着小朋友而展开,从一开始进医院陪产,出院之后直接进入月子中心,到离开月子中心重新回归家庭,直到最后家里迎来了新的成员。

说到生产的医院,就是在怀孕的初期或者中期就需要确定下来。而在建档的时候父母双方可以在市里的妇幼保健院建档,当场录入父母双方的信息以及基本情况。此时妇幼保健院还会要求父母做一些必要的检查,例如地中海贫血症等,也会查一下父母双方的血型,以便后续有需要的时候会作进一步地检查。

在妇幼保健院建档并不意味着只能够在妇幼保健院生宝宝,也可以在中途更换到其他的医院,此时完全可以考虑根据自身和家庭的情况选择最适合的方案。有的医院床位紧张,可能到时候产妇和家属需要睡在楼道里面;有的医院床位宽松,产妇可以住在病房里面,家属则可以铺一张行军床;当然,如果家庭条件再好一点的话,去条件更好的医院,家属其实也不用铺行军床了。

在建档之后笔者选择的是香港大学深圳医院(在这里没有打广告的意思),当时去医院看了之后发现整体环境还不错,而且港大医院是预约制的,要想在港大医院生产必须预约成功才行。对医院而言,病人数量会相对可控一些,笔者去的时候也暂时没发现有产妇孕妇睡在走廊的情况。在港大医院里面有全家(MyFamily)便利店 24 小时营业,里面除了出售日常的食品和消耗品之外,还出售病人常用的一些装备,甚至还有宝宝所需要的纸尿裤,这样也极大地方便了来医院就诊的患者。港大医院的产科位于住院部 A 栋,分为东区和西区,其中东区是负责产前,西区负责产后。这样也有利于产妇的休息和宝宝的照顾。而产房则是位于门诊医技楼,因此在生产的时候,妈妈们是要用轮椅被护士推送到产房,而爸爸们则只能够在产房的大厅里耐心地等候。

香港大学深圳医院

产妇在医院的时间一般来说不会太长,通常一周左右就会正常出院,而出院了之后去月子中心还是请月嫂照顾,或者全程由家人照顾则是根据每个家庭自身情况来定的。通常来说,月子中心可以提供一系列的关于妈妈和宝宝的解决方案。月嫂的话虽然也能够帮忙和解决问题,但是一个人照顾毕竟人力有限,有的时候会出现人力紧张的情况。而全程由家人照顾的话,则需要家人懂一些育儿的经验和法则,最好家人最好还要与时俱进,不能够拿着三十年前的经验在持续使用。

今年正好处于疫情防控期间,很多医院都只能够让一个陪护人员进入病房照顾病人,基本上在病房里面不会出现一大家人进去的情况。因此对于新手爸妈而言,尤其是对爸爸来说,在医院期间同时照顾妈妈和小孩就是一件非常有挑战的事情,而这件有挑战的事情在疫情期间是没有办法让别人来帮忙的。至于月子中心或者月嫂基本上都是出院了之后才会使用,在医院只能够依赖爸爸来解决问题。

全家的冰淇淋

有的月子中心整体感觉还不错,能够针对妈妈和小孩的情况来制定相应的解决方案。毕竟对于新手爸爸来说,照顾妈妈和小孩的经验是十分缺乏的。同时对于长辈而言,很可能都是过时的经验,而且现在照顾小孩也有很多与时俱进的策略和照顾方案。况且长辈也近三十年没有带过小孩,并且带小孩也是一个体力活,不是所有长辈都能够承受这种劳动强度。这种时候如果有一个靠谱的月子中心或者月嫂,确实能够极大地减缓新手爸爸和其他家庭成员的劳动强度。

在一个靠谱的月子中心,会有很多角色与某个家庭对接,而要解决某个问题只需要找到相应的角色就可以了。通常来说会包括护士,医生,瑜伽老师,生活助理,营养师等角色,而这些角色每天负责的内容是不一样的,护士也是轮班的工作模式,会保证这些工作人员得到必要的休息。而月嫂的工作模式基本上是一个人在工作,一个人会负责妈妈和宝宝的方方面面。这种情况下,在某些时候就难免分身乏术,毕竟同时照顾两个人其实是有一定的难度和挑战的。月嫂毕竟是一个人,每天也是需要一定的时间进行休息的,这与月子中心那种随叫随到的模式是不太一样的。

月子中心

在一线城市工作,其工作节奏还是相对较快,无论是在大公司还是中小型公司,工作人士基本上都是需要加班的。这就表示爸爸即使能够照顾家里面,也仅仅局限于陪产假的期间,其他时间都是较难照顾到家里面。因此无论让长辈过来或者去月子中心,还是请月嫂都是解决问题的方法。一般情况下月子中心在深圳的价格是 26 天 5 万以上,如果需要住更长的时间或者有其他的需求,则需要更高的费用,这种时候一般都会超越 10 万人民币。同时,月子中心也会有其他的项目,包括给宝宝拍照,妈妈的瑜伽恢复和产后恢复等诸多项目,而这些项目一旦超过了前期的套餐费用,都是需要付费的,因此,在月子中心里面多花几千块或者几万块钱都是属于正常的。当然,也有一些人就做完正常的项目就没有继续做额外的项目了。

而宝宝一天的流程除了日常的喂奶,换尿布之外,还会有洗澡,抚触,早教,游泳等诸多项目。妈妈的项目除了喂奶,吃饭,还有产后修复等内容,这些项目在月子中心是由不同的角色完成的,但如果是月嫂的话则是全部由一个人完成。如果月嫂靠谱的话还算比较好,毕竟在价格方面相对月子中心还是便宜许多。其实去一次月子中心的钱其实可以请好几个月嫂了,还是要根据自身家里的情况来决定怎么做,毕竟这个对每一家而言真的是个性化的需求。

不同的家庭的确需要根据自身情况来决定该怎么做,但是有的时候自己或者家人千万不要高估自己的能力,毕竟带婴儿也是一个力气活,而且带婴儿的知识是需要不停地更新的,不学习任何知识就想带好婴儿是不可能的事情。除非一开始就打算随便养一下,那确实也没啥必要学;一旦想要好好带的话,最好还是多学习各种知识,包括母婴的基础知识,常见的育儿百科等等。整个流程还是很长,但其实这只是一个开始,后续还有更长的路需要走。(未完待续)

主动学习(active Learning)

主动学习背景介绍

机器学习的研究领域包括有监督学习(Supervised Learning)无监督学习(Unsupervised Learning)半监督学习(Semi-supervised Learning)强化学习(Reinforcement Learning)等诸多内容。针对有监督学习和半监督学习,都需要一定数量的标注数据,也就是说在训练模型的时候,全部或者部分数据需要带上相应的标签才能进行模型的训练。但是在实际的业务场景或者生产环境中,工作人员获得样本的成本其实是不低的,甚至在某些时候是相对较高的,那么如何通过较少成本来获得较大价值的标注数据,进一步地提升算法的效果就是值得思考的问题了。

机器学习

在工业界的图像标注领域,虽然有 ImageNet 这个学术界和工业界都在使用的图像数据库,但是在很多特殊的业务场景上,从业人员依旧需要想尽办法去获取业务标注数据。在安全风控领域,黑产用户相对于正常用户是偏少的,因此,如何通过极少的黑产用户来建立模型则是值得思考的问题之一。在业务运维领域,服务器,app 的故障时间相对于正常运行的时间也是偏少的,必然会出现样本不均衡的情况。因此,在这些业务领域,要想获得样本和构建模型,就必须要通过人力的参与。那么如何通过一些机器学习算法来降低人工标注的成本就是从业者需要关注的问题了。毕竟需要标注 100 个样本和需要标注成千上万的样本所需要的人力物力是截然不同的。

在学术界,同样有学者在关注这方面的问题,学者们通过一些技术手段或者数学方法来降低人们标注的成本,学者们把这个方向称之为主动学习(Active Learning)。在整个机器学习建模的过程中有人工参与的部分和环节,并且通过机器学习方法筛选出合适的候选集给人工标注的过程。主动学习(Active Learning)的大致思路就是:通过机器学习的方法获取到那些比较“难”分类的样本数据,让人工再次确认和审核,然后将人工标注得到的数据再次使用有监督学习模型或者半监督学习模型进行训练,逐步提升模型的效果,将人工经验融入机器学习的模型中。

在没有使用主动学习(Active Learning)的时候,通常来说系统会从样本中随机选择或者使用一些人工规则的方法来提供待标记的样本供人工进行标记。这样虽然也能够带来一定的效果提升,但是其标注成本总是相对大的。

用一个例子来比喻,一个高中生通过做高考的模拟试题以希望提升自己的考试成绩,那么在做题的过程中就有几种选择。一种是随机地从历年高考和模拟试卷中随机选择一批题目来做,以此来提升考试成绩。但是这样做的话所需要的时间也比较长,针对性也不够强;另一种方法是每个学生建立自己的错题本,用来记录自己容易做错的习题,反复地巩固自己做错的题目,通过多次复习自己做错的题目来巩固自己的易错知识点,逐步提升自己的考试成绩。其主动学习的思路就是选择一批容易被错分的样本数据,让人工进行标注,再让机器学习模型训练的过程。

那么主动学习(Active Learning)的整体思路究竟是怎样的呢?在机器学习的建模过程中,通常包括样本选择,模型训练,模型预测,模型更新这几个步骤。在主动学习这个领域则需要把标注候选集提取和人工标注这两个步骤加入整体流程,也就是:

  1. 机器学习模型:包括机器学习模型的训练和预测两部分;
  2. 待标注的数据候选集提取:依赖主动学习中的查询函数(Query Function);
  3. 人工标注:专家经验或者业务经验的提炼;
  4. 获得候选集的标注数据:获得更有价值的样本数据;
  5. 机器学习模型的更新:通过增量学习或者重新学习的方式更新模型,从而将人工标注的数据融入机器学习模型中,提升模型效果。
主动学习的流程

通过这种循环往复的方法,就可以达到人工调优模型的结果。其应用的领域包括:

  1. 个性化的垃圾邮件,短信,内容分类:包括营销短信,订阅邮件,垃圾短信和邮件等等;
  2. 异常检测:包括但不限于安全数据异常检测,黑产账户识别,时间序列异常检测等等。

主动学习的模型分类包括两种,第一种是流式的主动学习(Sequential Active Learning),第二种是离线批量的主动学习(Pool-based Active Learning)。在不同的场景下,业务人员可以选择不同的方案来执行。

主动学习的三种场景

而查询策略(Query Strategy Frameworks)就是主动学习的核心之处,通常可以选择以下几种查询策略:

  1. 不确定性采样的查询(Uncertainty Sampling);
  2. 基于委员会的查询(Query-By-Committee);
  3. 基于模型变化期望的查询(Expected Model Change);
  4. 基于误差减少的查询(Expected Error Reduction);
  5. 基于方差减少的查询(Variance Reduction);
  6. 基于密度权重的查询(Density-Weighted Methods)。

不确定性采样(Uncertainty Sampling)

顾名思义,不确定性采样的查询方法就是将模型中难以区分的样本数据提取出来,提供给业务专家或者标注人员进行标注,从而达到以较快速度提升算法效果的能力。而不确定性采样方法的关键就是如何描述样本或者数据的不确定性,通常有以下几种思路:

  1. 置信度最低(Least Confident);
  2. 边缘采样(Margin Sampling);
  3. 熵方法(Entropy);

Least Confident

对于二分类或者多分类的模型,通常它们都能够对每一个数据进行打分,判断它究竟更像哪一类。例如,在二分类的场景下,有两个数据分别被某一个分类器预测,其对两个类别的预测概率分别是:(0.9,0.1) 和 (0.51, 0.49)。在此情况下,第一个数据被判定为第一类的概率是 0.9,第二个数据被判定为第一类的概率是 0.51,于是第二个数据明显更“难”被区分,因此更有被继续标注的价值。所谓 Least Confident 方法就是选择那些最大概率最小的样本进行标注,用数学公式描述就是:

x_{LC}^{*}=argmax_{x}(1-P_{\theta}(\hat{y}|x))=argmin_{x}P_{\theta}(\hat{y}|x),

其中 \hat{y}=argmax_{y}P_{\theta}(y|x),这里的 \theta 表示一个已经训练好的机器学习模型参数集合。\hat{y} 对于 x 而言是模型预测概率最大的类别。Least Confident 方法考虑那些模型预测概率最大但是可信度较低的样本数据。

Margin Sampling

边缘采样(margin sampling)指的是选择那些极容易被判定成两类的样本数据,或者说这些数据被判定成两类的概率相差不大。边缘采样就是选择模型预测最大和第二大的概率差值最小的样本,用数学公式来描述就是:

x_{M}^{*}=argmin_{x}(P_{\theta}(\hat{y}_{1}|x)-P_{\theta}(\hat{y}_{2}|x)),

其中 \hat{y}_{1}\hat{y}_{2} 分别表示对于 x 而言,模型预测为最大可能类和第二大可能类。

特别地,如果针对二分类问题,least confident 和 margin sampling 其实是等价的。

Entropy

在数学中,可以使用熵(Entropy)来衡量一个系统的不确定性,熵越大表示系统的不确定性越大,熵越小表示系统的不确定性越小。因此,在二分类或者多分类的场景下,可以选择那些熵比较大的样本数据作为待定标注数据。用数学公式表示就是:

x_{H}^{*}=argmax_{x}-\sum_{i}P_{\theta}(y_{i}|x)\cdot \ln P_{\theta}(y_{i}|x),

相较于 least confident 和 margin sample 而言,entropy 的方法考虑了该模型对某个 x 的所有类别判定结果。而 least confident 只考虑了最大的概率,margin sample 考虑了最大的和次大的两个概率。

不确定性采样的差异性

基于委员会的查询(Query-By-Committee)

除了考虑单个模型的不确定性采样方法之外,还可以考虑多个模型的场景,这就是类似集成学习的方法。通过多个模型投票的模式,来选择出那些较“难”区分的样本数据。在 QBC(Query-By-Committee)的技术方案中,可以假设有 C 个模型,其参数分别是 \{\theta^{(1)},\cdots,\theta^{(C)}\},并且这些模型都是通过数据集 \mathcal{L} 的训练得到的。

如果不需要考虑每个模型的检测效果,其实可以考虑类似不确定性采样中的 least confident 和 margin sampling 方法。可以选择某一个分类器难以区分的样本数据,也可以选择其中两三个分类器难以区分的数据。但是如果要考虑所有模型的分类效果的时候,则还是需要熵(Entropy)或者 KL 散度等指标。因此,QBC 通常也包括两种方法:

  1. 投票熵(Vote Entropy):选择这些模型都无法区分的样本数据;
  2. 平均 KL 散度(Average Kullback-Leibler Divergence):选择 KL 散度较大的样本数据。

投票熵(Vote Entropy)

对于这种多模型 \{\theta^{(1)},\cdots,\theta^{(C)}\} 的场景而言,可以用熵来衡量样本数据被这些分类器区分的难易程度,如果这些分类器都把样本数据划分到某一类,则容易区分;如果分类器把样本数据划分到多类,则表示难以区分,需要重点关注。用数学公式表达就是:

x_{VE}^{*}=argmax_{x}-\sum_{i}\frac{V(y_{i})}{C}\cdot\ln\frac{V(y_{i})}{C},

其中 y_{i} 表示第 i 类,求和符号表示将所有的类别 i 相加,V(y_{i}) 表示投票给 y_{i} 的分类器个数,C 表示分类器的总数,并且 \sum_{i}V(y_{i})=C

平均 KL 散度(Average KL Divergence)

KL 散度可以衡量两个概率之间的“距离”,因此可以用 KL 散度计算出那些偏差较大的数据样本。用数学公式来描述就是:

x_{KL}^{*}=argmax_{x}\frac{1}{C}\sum_{c=1}^{C}D(P_{\theta^{(c)}}||P_{\mathcal{C}}),

其中 P_{\mathcal{C}}(y_{i}|x)=\frac{1}{C}\sum_{c=1}^{C}P_{\theta^{(c)}}(y_{i}|x) 也是概率分布,D(P_{\theta^{(c)}}||P_{\mathcal{C}}) 表示两个概率的 KL 散度。

期望模型变化(Expected Model Change)

模型变化最大其实可以选择那些使得梯度变化最大的样本数据。

期望误差减少(Expected Error Reduction)

可以选择那些通过增加一个样本就使得 loss 函数减少最多的样本数据。

方差减少(Variance Reduction)

选择那些方差减少最多的样本数据。

基于密度权重的选择方法(Density-Weighted Methods)

有的时候,某个数据点可能是异常点或者与大多数数据偏差较大,不太适合做样本选择或者区分,某些时候考虑那些稠密的,难以区分的数据反而价值更大。于是,可以在使用不确定性采样或者 QBC 方法的时候,将样本数据的稠密性考虑进去。用数学公式表示就是:

x_{ID}^{*}=argmax_{x}\phi_{A}(x)\cdot\bigg(\frac{1}{U}\sum_{u=1}^{U}sim(x,x^{(u)})\bigg)^{\beta},

在这里,\phi_{A} 表示某个不确定性采样方法或者 QBC 方法,\beta 表示指数参数,x^{(u)} 表示第 u 类的代表元,U 表示类别的个数。加上权重表示会选择那些与代表元相似度较高的元素作为标注候选集。

B 附近的点信息量会大于 A 附近的点

总结

在主动学习(Active Learning)领域,其关键在于如何选择出合适的标注候选集给人工进行标注,而选择的方法就是所谓的查询策略(Query Stategy)。查询策略基本上可以基于单个机器学习模型,也可以基于多个机器学习模型,在实际使用的时候可以根据情况来决定。整体来看,主动学习都是为了降低标注成本,迅速提升模型效果而存在的。主动学习的应用场景广泛,包括图像识别,自然语言处理,安全风控,时间序列异常检测等诸多领域。后续笔者将会持续关注这一领域的发展并撰写相关文档。

参考资料

  1. Settles, Burr. Active learning literature survey. University of Wisconsin-Madison Department of Computer Sciences, 2009.
  2. Aggarwal, Charu C., et al. “Active learning: A survey.” Data Classification: Algorithms and Applications. CRC Press, 2014. 571-605.

软技能 2:软件开发者职业生涯指南

《软技能 2:软件开发者职业生涯指南》的作者是【美】John Sonmez,他是畅销书《软技能:代码之外的生存指南》的作者,也是 “Simple Programmer” 网站的作者。他为在线培训机构 Plural sight 开发了 50 多门在线课程,涉及 iOS,Android,.NET,Java 和游戏开发等多个主题。他是 “Get Up and Code” 播客的主持人,在这里他讨论 “程序员健身”;他还是 “Entreprogrammers” 播客的主持人,在这里他和其他三位开发者/企业家分享他们构建在线业务的真实故事。

软技能 2

之前笔者也撰写过一篇关于《软技能:代码之外的生存指南》的简单介绍,在第一本书中,作者撰写了职业,自我营销,学习,生产力,理财,健身,精神等七个章节。而在第二本书中,作者的侧重点就放在以下五个方面:

  1. 如何转行成为软件开发者:介绍了入行经验,傍身之技,如何学好一门编程语言等部分;
  2. 找到一份工作:初出茅庐,创新思维,唇枪舌剑等部分;
  3. 关于软件开发你需要知道什么:编程语言概述,开发流程,测试流程,代码维护等部分;
  4. 软件开发者的日常工作:与同事,老板,质量保障人员,生活,团队的共存,协作之道等部分;
  5. 推进你的职业发展:建立声望,广结善缘,与时俱进,笔耕不缀,未雨绸缪,学无止境等部分。

从本书的标题《软技能 2:软件开发者职业生涯指南》就可以看出这本书将会关注程序员的职业生涯发展,与第一本书《软技能:代码之外的生存指南》略有不同。而从章节的安排来说,作者依次介绍了转行,求职,软件开发的日常工作,职业发展路径的部分。

本书的阅读对象主要包括 3 类:

  1. 初学者或者只是对学习软件开发感兴趣的人士;
  2. 中级开发者;
  3. 神经百战的专业人士。

从豆瓣的评分来看,《软技能 2:软件开发者职业生涯指南》的评分高达 9.0,当然这个要经过时间的考验才行。

豆瓣评分

笔者拿到《软技能 2:软件开发者职业生涯指南》这本书没多久,还没来得及读完所有的章节,只好选择部分章节来摘选一下该书中的经典语录:

第四篇:软件开发者的日常工作

你要是想通过获得越来越多的职责来成长和扩展你的领地,就找一些还没有人探索过的沼泽地,没有人想去碰它,你把它拿走,别怕它会弄脏你的手,然后在那里建造出一个主题公园—华特.迪士尼就是那么做的。找出那些没人愿意染指的领域,那些没人愿意触碰的项目,接管它们。然后,让它们变成你的高光时刻。我向你保证,如果你能持续得到晋升,并在任何组织中加大你的职责,最后加薪的事情将不在话下。

你能做的第一件事情就是投资对自己的教育。坦诚地讲,你要买更多的书并阅读它们。只是读书还远远不够,还要聆听在线课程,并且真正完成它们。走出去参加研讨会或者行业会议,以及现场培训课程。

第五篇:推进你的职业发展

只有习惯性地做比被要求更多的事情,才能够带来进步。— 加里.瑞安.布莱尔

如果你真的想要出类拔萃,你真的想要把你的事业提升到一个更高的水平,你就需要学会如何建立起稳固的声望,包括如何推销自己,如何打造个人品牌,这些将为你打开常人难以企及的机会之门。

下面列出的是可以让你出名的渠道或者方法:

1. 写出你的博客;

2. 在其他人的博客发表评论;

3. 写一本书;

4. 为杂志撰写文章;

5. 登录别人的播客;

6. 创建自己的播客;

7. 创建自己的 YouTube 频道;

8. 成为一名活跃的 Twitter 或者其他社交媒体用户;

9. 在当地的用户组和编程训练营上发表演讲;

10. 在大型开发者人员会议上发表演讲;

11. 创建一个广受欢迎的开源项目。

我发现,在编程的世界保持与时俱进的最佳方法之一就是每天清晨花 30 分钟左右的时间阅读编程方面的博客。

你需要持续不断地学习新东西。不管你对当前的技能是多么驾轻就熟,也不管你的教育背景有多么深厚博大,你总是要去学习新东西。定期评估你现在的技能,定期校正你的学习方向,这样就可以明确确定你应该学习哪些新东西,以及你的学习内容的优先级和顺序。不过,要注意一点:不要去学那些你永远都不会用到的东西。

无论你眼下的工作岗位或者工作氛围多有保障,都不要过得太安逸,这点很重要。

行家里手:做专才还是做通才?真正的答案应该是:两者兼而有之。如果在你的领域内没有对综合知识的广泛积累作为基础,那么想成为一名优秀的专家是非常难的。当公司说他们想要一个通才的时候,他们真正说的是:他们想要的是一个适应能力强,学习速度快的人。他们担心的是他们会雇佣一个只能做一件事情的人。宁可错误地选择过于狭小,太过具体的专业方向,也不要选择太宽泛。你要么在自己选定的主攻方向上直接深入地透彻研究,要么就去学习那些放之四海而皆准的永恒经典。不要试图学习一堆你可能永远不会用到的编程语言与框架。

一般来说,你会发现,软件开发者不管选择了那一条特定的职业路径(也许不止一条),最终都会遇到所谓的“玻璃天花板”。这个玻璃天花板实质上就是一个极限,限制了你在职业发展路径上可以前进多远,限制了你作为一个软件开发者可以得到的最高薪酬。无论你决定做什么,最重要的是:你需要做出决策,并且为此做出计划。

结束语

知道要做什么与知道该怎样付诸实践之间,还存在着巨大的鸿沟。

就在今天,就在此刻,立即采取行动!