“诺贝尔”为什么将中国神童拒之门外?(吴树新作)

111

原文链接:http://2538242610.blog.sohu.com/309710379.html

他们都是神仙,本来就是想要那个结果、有另外的目的在,只不过没告诉我,我却不知道,所以就想不通他们为什么那么做。”

——谢彦波

采访时间:2014年5月

采访地点:合肥等地

受访人:谢彦波,中国科学技术大学78级第一期少年班学生。他跳过整个中学阶段,由小学直接进入了少年班。十一岁上科大。十五岁上科学院理论物理所读硕士,跟于录院士。十八岁读博士,跟中科院副院长周光召院士,被看好有希望在二十岁前得博士学位。中国博士没读完,去普林斯顿大学,跟诺贝尔奖获得者安德森做固体物理理论工作。后回国,他以硕士的身份接受了近代物理系教师的工作。

王永:谢彦波同班同学、中科大教授、中科大信息技术学院副院长、博士生导师、教授、安徽省政协委员。

1978年,11岁的谢彦波挂着红领巾、带着一身传说、滚着一只铁环进入中科大。与“第一神童”宁铂齐名,他俩的故事“全国人民都知道”。

传说:小彦波6岁时还不会用第一人称讲话,饿了说:“彦波要吃饭”。渴了说:“彦波要喝水”,妈妈叫他“榆木疙瘩”。后经有见识的人士点拨,说这是阿斯伯格症患者的特征,牛顿、爱因斯坦、贝多芬、比尔?盖茨等超级天才,儿时都曾具有这种症状,特征是沟通能力奇差、但在某些方面拥有超常能力。

果不其然,小彦波小学三年级时学完初中数学,四年级学完高中数、理、化,五年级开始钻研大学的解析几何和微积分,解答了数以千计的习题。当他端坐在小学教室里上课时,几乎所有熟悉他的老师们都认为,“论实际知识水平这孩子该上大学了!”

果不其然,1977年,小学未毕业的谢彦波参加湖南医学院子弟中学高二年级的数学竞赛,获得第二名。参加长沙市高中生数理化竞赛,又获得了好成绩。于是,“神童”之誉不胫而走,引来中科大招生老师的关注与面试。1978年,11岁的谢彦波顺利进入中科大少年班。据受访同学回忆,“他小学毕业没学过高中数学,可每次临考试了还拉着别人打乒乓球,一个不去拽另一个,打了几天球,最后却拿100分!”(照片:少年谢彦波站在凳子上演算)

奇迹仍在继续。16岁读完大三,谢彦波提前一年本科毕业,入读中科院研究生,18岁取得硕士学位,接着又在中科院副院长周光召门下攻读博士学位。半年后,谢彦波改读美国普林斯顿大学,成为诺贝尔物理学奖获得者、曾为美国“神童”的安德森教授的博士生。

由此,谢彦波成为中科大首届少年班中唯一被人们寄望摘取诺贝尔奖的天才学员,就连少年班“第一神童”宁铂也说:“我看遍20多届少年班成员,谢彦波是最聪明的人!”

在人类普适性生态学原理中,有许多中肯不中听的词汇——诸如“日中则昃”、“月盈则亏”、“物极必反”,等等。其中既有两位曾为“神童”者所涉领域的物理法则,更兼备“先知先觉”的神童们普遍兼备“少知少觉”的事理法则。就在“神童”谢彦波满载国人的厚望,向着科学的天空展翅翱翔之时,一场意料不到的逆袭,竟令他折翅铩羽。

赴美10年后的某一天,谢彦波结束了他宿命中的所有神话与童话,被组织上接回了中科大。一颗曾被寄予国人厚望的少年“启明星”,为何去到全球科学大本营美国后未及升空就突然陨落?对此,国人少不了议论纷纷。

一是公开报道的“不睦遣返”说——2005年7月21日,《南方周末》刊文透露:首届少年班辅导员汪惠迪回忆,谢彦波原本跟随中科院副院长周光召读博士,但“他没能处理好和导师的关系,博士拿不下来,于是转去美国继续读博,结果美国导师安德森同样无法容忍谢彦波比他本人还要傲气,不让他过关……”

二是流传更广的“枪击教授”之说——“一个月黑风高的夜晚,谢彦波摸到安德森的住宅,安恰好不在家,安夫人开的门,见谢一只手插在好像藏有枪支的口袋里,神色不对头。老太太吓得魂飞天外,一边稳住谢,一边打电话找来谢的推荐人李政道教授,让李教授把谢带走。”

谢彦波的同班同学、中科大信息技术学院副院长兼博导王永教授向我们详细介绍了另一种似乎更接近真相的版本。

“谢彦波一直视安德森为神,去美国也是冲着安德森去的,但是一开始并没能排上安德森的博士生。一位台湾籍女教授收了他,老太太非常喜欢这个小娃娃,当儿子一样宠,谢彦波也非常适应,读得很好。没想到当他博士论文都基本写好了的时候,安德森的入学通知却来了!按道理,谢彦波本应跟着老太太读完博士再走,但他一心想在安德森门下出师,便迫不及待地离开了老太太,带着论文草稿投奔到安德森教授门下。

“刚开始,他在普林斯顿也读得非常好,据说还刷新了该校某个成绩总分的记录,并很快提交了论文。可偏偏就是那篇论文捅篓子了——安德森看看题目、翻翻前言,把文章一扔!

“物理是一门很悲哀的学科,尤其是谢彦波从事的理论物理研究,发展到一定程度就变得不可验证,比如说黑洞,谁见过黑洞?全都是几辈子科学家没法实证的,像玄学一样!正是因为没有检验标准,空想当道、学派林立、靠嘴皮子干仗就成了理论物理的现实情况。而谢彦波的论文,就踩了这个‘雷’。他引用的观点论据,不巧是跟安德森‘干仗’的对立学派,安德森怎么可能自扇耳光、让论文通过?他不好明说,便托辞‘你英文水平太差,我看不懂!

“谢彦波很愣,又非常崇拜安德森,还真的以为自己英文不过关,竟然花了两年时间在普林斯顿文学院读了个文学硕士,然后改好论文又送给安德森。安德森没辙了,只能委托旁人明确转告谢彦波:‘由于学派问题,你不可能靠这篇论文在我的门下拿到学位’。

“谢彦波没法相信这话,他眼里的安德森是多么伟大的科学家,又那么崇尚真理,怎么会有门户之见?你们都骗我!从那时候起,他就开始常常产生‘别人都在骗我’的幻觉。后来安德森拿他没办法,只好屈尊再让一步,托人转告谢彦波,可以介绍他在另外一个导师名下答辩。偏偏谢彦波到这一步还坚决不相信安德森会抛弃他,仍然执着地追随他死不回头。

“这一‘杠’足足9年,谢彦波与教授的矛盾几乎成为公开的秘密,就他自己感觉不到。在中科大一位副校长访问普林斯顿大学之前,恰巧又发生一起北大赴美留学生杀死教授的惨案,所以其他中国留学生建议到访的科大领导带谢彦波回国。副校长约谢彦波谈话过后,也感觉到有些担心,便直接带他随团回国。因为走得太急,谢彦波在普林斯顿大学宿舍里的所有物品都没来得及带走,都是后来同学帮忙打包邮回来的……”

去中科大之前,我在“贴吧”还读到一篇该校的学生留言:“我们英语老师说谢老师赴美读博时,因为拿枪指着他的教授被取消博士学位,回来得了精神病。学校为了名声以及考虑他的水平,仍然给他教课,但是长期交流,会把学生的心理带进沟里……”

为了弄清真相,我问这位同学怎么找得到谢彦波。他告诉我,谢教授从家里到学校两点一线,很难碰上。但每周三会在某教室上课,这是唯一方便见到他的机会。

5月,我来到中科大,预先“埋伏”在那位同学所说的教室里。看来这里是开放式教学,我旁边还坐着一位不修边幅的中年男人,上身套着一件脏得看不清本色的老式夹克衫,怀里抱着一只鼓鼓囊囊的红色环保袋,酷似街头拾荒者。见我落座,他挪了一下位置,似熟非熟地朝我笑笑。

我朝他点点头。上课铃响了,我盯着门口,等着谢彦波的出现。一会儿,旁坐的“拾荒者”站起来,径直上了讲台。他从环保袋里掏出一沓作业本,拍在第一排课桌上。然后上前擦干净黑板,用粉笔写下:“§4.6局域惯性系条件”。天,这位“拾荒者”模样的人就是谢彦波教授?我满脑子闪现的全是若干年前这间教室里站在木凳上演板的少年谢彦波,很难把两者协调起来。(插图:谢彦波上课4张照片)

他流畅地整板书写着那些复杂的公式,嘴里说着我不懂的中文:“假如用做数学题的方法衡量一个星球的文明……”

站在讲台上的谢老师,与刚才坐在身边的“拾荒者”判若两人,嗓音洪亮自信,思维逻辑缜密。他右手板书时,左手松弛地抄在裤兜里,大方潇洒,偶尔将嘴唇歪成平行四边形,再努力恢复原状,皱着眉头,像是眼睛里进了砂子。每一次擦完黑板后,他必然猛地回头向同学们没来由地挤出个笑脸。

下课后,我在教室门口堵住了他,用“我是您的崇拜者”这种最无聊的借口作为搭讪。他友善地朝我笑笑,似乎对陌生人豪无戒心,很快开始了有问有答的闲聊,甚至还请我在食堂里吃了份快餐。即便后来我提出有些冒昧的问题,他也努力给出答案。采访中,比照旁边匆匆而过的斜视眼神,谢彦波那种纯真和诚恳,不止一次让我心酸。

记者:“您还在上《广义相对论》吗?”

谢彦波:“什么叫‘还在上’?是不是学懂了之后就只用教了?是不是教其他东西就可以再学习?学了没意思,对我来说学了没用啊……现在的物理不是做物理,是在做数学题。真正的物理,我觉得是里面有好多效应的,但是他们好像都不讨论这种效应。”

他的回答让我有些犯晕:“您在做研究啊?”

谢彦波歪着脑袋想了想,一半对我、一半对自己:“我做研究也没有用,别人会反对、不感兴趣。我觉得生活应该遵守物理的基本道理,但是他们有‘特异功能’!做了一些新的假定,又不肯告诉我。所以我就没办法。”

记者:“我记得好像您在哪儿说过,科学也会有很多谬误?”

谢彦波:“我是说很多人在应用方面过头了。比如u盘、手机、隐形飞机,都跟物理对不上。”

记者:“这方面公开发表过论文吗?让大家都知道您的观点或想法。”

谢彦波:“写过,但是我认为有价值、写得好的论文,一篇都不给发表。我认为一般甚至是很烂的论文,却发表了。国外杂志也一样,他们不是看不懂,就是故意不给发,或者是我没有搞明白其中的规则吧。”

记者:“好像这里面的门道挺深?”

谢彦波:“什么意思啊?”

记者:“比如说您是杂志编审的学生或者熟人,论文就容易上。学术界有挺多搞人际关系的。”

谢彦波:“有可能吧……”

记者:“您一周几节课?

谢彦波:“三节课,没事干。”

记者:“你还住在学校里面吗?”

谢彦波:“对,我住北校区,比以前大一些。我就不懂,为什么要住大房子?打扫卫生那么麻烦。想住更大的房子,要搬到郊区,得开车,不是很累吗?住北区走过来吃饭很方便,我一天三餐都在食堂吃。走路正好锻炼身体。”

记者:“您女儿多大了?”

谢彦波:“读高中。”

记者:“您的学生说您很酷,一些您觉得不对的理论上课时就不讲?”

谢彦波:“嗯。比如黑洞、宇宙学我就不讲,我搞不懂,问别人也不懂,我觉得它是有问题的。比如宇宙,以前说是无限大,现在说是有限大。有个广告,说如果宇宙无限大,那么晚上和白天是一样亮的,现在晚上和白天不一样亮,所以宇宙就是有限大的。这个就是乱扯!因为恒星会死亡,而且光会被吸收,吸收了以后又变成新的恒星,是不断演变的。”

好玩儿,他把我当成可以讨论的同事了。

记者:“您不上课的时候在家干嘛?”

谢彦波:“要不就下围棋,要不就算算题目,算量子化学,用数学办法计算分子反应、能量。”

记者:“听说您喜欢用心算或者笔算?”

谢彦波:“我以前用计算机,现在懒得用,没必要,就用笔算。”

记者:“觉得自己的脑袋比计算机转得快?”

谢彦波:“计算机用多了,脑子就变傻了。实在没事干,在网上与人下棋。”

记者:“在少年班的时候您有没有跟宁铂下围棋?”

谢彦波:“那时候下不过他,现在不知道了。以前他是科大最厉害的,可能后来有学生比他更厉害吧。”

记者:“听说有一本被学界广为引用的专业书籍,其中由国际知名实验室做出来的权威光谱数据,被你用手算推翻了?”

谢彦波:“一开始我用心算就怀疑那个光谱数据不对,后来用手算,证明确实不对,是(铬)Cr3+,Cr是4s平方3d4,去掉两个,现在google最新版本的数据和我的计算结果一致。后来觉得也没意思,说人家不对,搞得别人难受……”

我笃信,这样的话语,若是出自别人之口,只能用虚伪去解释,但他真诚得像一个做了错事的孩子。

记者:“从某种角度讲,科学本来就是纠正错误的学问啊!”

谢彦波:“没法搞啊,有好多东西不对。比如特高压,那么高的高压,一下雨或者有雾气,不就把空气击穿了?老是击穿不是就损失很多能量?我算了一下,没占到便宜,而且很危险,所以就没必要去搞特高压啊。但是现在中国人、外国人都搞。现在的学问都变掉了,一些人就像有特异功能的神仙。以前我不相信,现在信了。‘他们’的确是神仙,有这个本事!”

记者:“您经常说的神仙,是不是指那些学术权威?”

谢彦波:“……”

记者:“听说您以前在美国的时候,发现导师的研究也有漏洞?让导师非常生气?”

谢彦波低下头,有点不好意思地朝地面笑笑:“是啊,我算了半天也验证不出他要的结果。没办法。”

记者:“一般来说,导师就算是有错也不会承认,被学生证明自己错,多没面子啊!”

谢彦波睁大眼睛瞪着我:“为什么不认?这个很奇怪啊!我导师并不是靠那个课题得诺贝尔奖的,我证明有错的是他后来的理论。”

记者:“但从形式上看,您毕竟还是挑战了他的权威呀!”

谢彦波似乎无法理解这一点,他絮絮叨叨地说起他的推测,再次陷入自我:“导师可能把这个看得太重。他把我开除了也没什么不对,我也没太怪他,现在回想起来,反正都是有点假,以前我学了半天都白学了。”

记者:“为什么会是白学了呢?”

谢彦波:“因为‘他们’都是神仙,本来就是想要那个结果、有另外的目的在,就是让神仙的力量更加摆脱严密逻辑?如果有个人本事特别大,硬是算出来很多东西都不对,那么神仙们就不能为所欲为了,所以就不高兴了。但他们没告诉我,我却不知道,所以还在那为他求证。”

记者:“所以当时您就找安德森教授理论去?”

谢彦波:“或许。当时不知道,还以为做学问是件很严肃的事情。我告诉他我的学问是对的,他的结论出错了。”

记者:“听说你带了枪去找安德森?他没在,他夫人开的门?”

谢彦波:“啊?这个事情你怎么知道得那么清楚?”

记者:“海外很多留学生嘛,你太出名了!”

谢彦波:“我是去找过教授,但没带枪,我也不会打枪,他们是乱说的。他们住在一个山头上,我和他太太在院子里说了几句,后来他出来了,可能发生过争执。”

记者:“您骂了他?”

谢彦波:“也没有……(喃喃地)反正就是发神经病。我是学的知识越多就越反动(文革时期的流行语),学的知识越多就搞得别人越烦。”

记者:“怎么会那样呢?”

谢彦波:“我要是总发现人家不对,把理论物理乃至整个科学都弄崩溃了,那就是我的不对了。”

我突然意识到,原来世俗理念早已存在于科学圣地,而我们的主人公正因为不谙世俗而付出了惨重的代价。

记者:“安德森在学术界的势力很大,你得罪了他,所以你在美国一直拿不到博士学位?”

谢彦波:“也许……老外和中国人有点不一样,抱团比较厉害些。得罪了安德森,安德森不会去和别人说,‘你们不准发表谁谁谁的论文’,但是别人会自动不给发。”

记者:“这一点您当时不明白吗?”

谢彦波摇摇头:“我是回来以后、想了很久乱猜出来的。其实发论文讨论全球变暖问题又不是帮我什么忙,只是他们本来就是想要让全球变暖,用昂贵的产品把便宜的东西取代掉,他们有另外的目的在,只不过没告诉我,所以我就想不通他们为什么那么做。”

记者:“阴谋论?您觉得‘神仙’们另有目的?”

谢彦波:“全球变暖是二氧化碳增多的原因。现在基因技术这么发达,照理说应该可以培养一种植物,长得比较快,纯粹吸收二氧化碳,如果担心影响粮食产量可以去沙漠上种,还可以保养水土。怎么就没人搞呢?搞不懂。”

记者:“您是说‘神仙’们有自己的利益诉求?”

谢彦波自说自话地:“这里面肯定有规则说,不准这样搞!搞不懂怎么回事?”

记者:“不懂里面潜在的规则或逻辑?”

谢彦波:“理论物理本来是按照数学的框架、逻辑性很强,但是有些规则,可以让神仙们的力量摆脱更加严密的逻辑。如果一个人本事特别大,硬是算出来很多东西都不对了,算得神仙们也不能为所欲为,那么他们就不高兴了。”

可怜的谢彦波,一个只需两分钟就可以得出的结论,他竟然思考了二十年才似懂非懂。此时我更加相信,科学家与凡夫俗子的智商一定被上帝分割在两个绝然不同的山顶上。

记者:“听说后来你还继续跟安德森辩论?”

谢彦波:“后来我没上门跟他讲理,跟他在教室的黑板上讨论学问,他说不过我,突然接了个电话,说老婆找他,就走了。我现在判断是故意的,甚至有个阴谋,他故意出一个错,知道我会发现……”

记者:“然后再找个理由把你给送回来?”

谢彦波:“可能是,也可能不是……”

记者:“你去之前以为安德森是个真神仙?”

谢彦波:“是的。”

记者:“相处一阵子就发现他理论上有漏洞?”

谢彦波点点头:“有些理论像是编故事”。

记者:“科学家编故事?”

谢彦波:“都在编,但没有老老实实按照物理学的东西在编。”

记者:“听说安德森也是‘神童级别’?也出身于少年班?”

谢彦波:“不叫少年班,美国大学生一年级大部分是18岁,他16岁进的大学”。

记者:“那比您晚多了,您11岁上的少年班……”

没想到的是聊到这,谢彦波忽然情绪激动起来:“我本来就不该来这个(少年)班的!”

记者:“您的意思是说如果重新挑选,您宁可按部就班上完中学再读大学?”

谢彦波觉察到自己情绪失控,努力恢复平静:“应该是这样吧。当时我没有怀疑到这些怪事情、没有想到神仙这个事情。如果当年慢慢读上来,可能就懂了。其实学问做得高,人际关系也很重要。即使是搞研究,也是生活在真空中”。

记者:“安德森在这方面比您更成熟?”

谢彦波:“他很成熟,狡猾得很,人际关系好,待人接物比较练达。”

记者:“是啊,这些都是您的弱项。开始去的时候处得还好吗?

谢彦波:“刚开始没什么不好,我是冲着他去的美国。”

记者:“吵了一次架之后他就不理您了?”

谢彦波:“也没有……就是大家做学问没有那么认真,我在科大受的教育、还有以前小学在长沙受的教育,都是说做科学要很认真、一丝不苟的,一是一二是二,事实上学问不是这样的。”

记者:“我们所受的教育也是那样的呀!”

谢彦波失望地摇摇头:“我以前不相信有神仙,现在信了。早知道学问只能神仙搞,我就不会那么认真。现在我如果在美国,在普林斯顿,根本就不会再去学物理,学数学算了,不管那些东西……”

记者:“您也学会编故事了?(笑)如果让您回到当年的少年班,您会编一个什么样的故事呢?”

谢彦波:“可以说天上有很多石头之类的,还有在少年班的时候,宁铂给我编的故事,为什么豹子狮子眼睛长在前面,牛马眼睛长在边上?”

记者:“为什么?”

谢彦波:“因为豹子狮子要去吃牛羊,眼睛必须朝前看。而牛羊眼睛长在太前面就什么都看不见,容易被豹子狮子吃掉”。

我开玩笑问谢彦波,您的眼睛是朝前还是朝两边长?他没回答,却像个孩子似地调整起眼神,一会儿朝前,一会儿向两边……

记者手记:毫无疑问,神童谢彦波一生只能生活在他自己的世界里了。他说,过去自己曾经认为科学是神圣的,但最近几年开始怀疑整个科学体系是“神仙”们编造的,他试图查找漏洞,进而证明科学本身就是一个错误……

采访时,谢彦波的同学与同事异口同声说他的精神出了问题,而他的学生们则一致辩称谢教授是属于另类世界的“牛逼顿”(牛顿)。至于那个他张口闭口念叨的“神仙”究竟是谁?是神童们的命运摆布者还是某种规则、抑或某种逻辑的编程人?我们不得而知,只有他自己清楚。但显而易见的是,尽管“诺贝尔”没向谢彦波敞开大门,但他原本是一个可以与上帝对话的人。

点击率(CTR)融入物品相似度

假设物品A与其余三个物品1,2,3的相似度分别是S_{A1}, S_{A2}, S_{A3}.物品1,2,3的点击率(click through rate)分别是CTR(1), CTR(2), CTR(3). 此刻如果物品3的点击率过低,那么需要把第3个物品与物品A的相似度降低,使得第4个物品与A的相似度S_{A4}>S_{A3},从而使得第4个物品能够取代第3个物品。

定义物品A与物品1,2,3的相似度如下:

S_{Aj}^{'}(x)=\frac{S_{Aj}\cdot(x+CTR(j))}{x+(\sum_{k=1}^{3}S_{Ak}\cdot CTR(k))/(\sum_{k=1}^{3}S_{Ak})} \text{ for all }1\leq j\leq 3.

其中x\geq 0是待定的系数。下面就来研究新的相似度满足的性质。

性质1. 相似度的总和没有变化。i.e. \sum_{j=1}^{3}S_{Aj}^{'}(x)=\sum_{j=1}^{3}S_{Aj}对任何的实数x\geq 0都成立。

性质2. 如果CTR(1)=\max_{1\leq k\leq 3}CTR(k), i.e. 第1个物品的点击率最高,那么

(i) S_{A1}^{'}(x)\geq S_{A1}对于任何x\geq 0都成立。

(ii) S_{A1}^{'}(x)对于x是非增函数,i.e. 导数DS_{A1}^{'}(x)\leq 0.

(iii) \lim_{x\rightarrow \infty}S_{A1}^{'}(x)=S_{A1}.换句话说,随着x的增大,S_{A1}^{'}(x)是递减趋向于原始的相似度S_{A1}.

性质3. 如果第3个物品的点击率最低,i.e. CTR(3)=\min_{1\leq k\leq 3} CTR(k), 那么

(i) S_{A3}^{'}(x)\leq S_{A3}对于任何x\geq 0都成立。

(ii) S_{A3}^{'}(x)对于x是非减函数,i.e. 导数DS_{A3}^{'}(x)\geq 0.

(iii) \lim_{x\rightarrow \infty}S_{A3}^{'}(x)=S_{A3}.换句话说,随着x的增大,S_{A3}^{'}(x)逐渐增大趋向于原始的相似度S_{A3}.

(iv) 特别的,如果CTR(3)=0,那么S_{A3}^{'}(0)=0, 通过选择合适的x_{0}\geq 0, 可以使得S_{A3}^{'}(x_{0})<S_{A4}.在这里的S_{A4}指的是物品A与第4个物品的相似度。

物质扩散模型

引言

在推荐系统中,常常用二部图来表示用户和物品的关系:把用户(Users)看成一类点,把物品(Objects)看成另一类点。如果用户购买了某种物品,那么用户和物品之间就存在一条连线,也就是一条边。如果用户没有购买某种物品,那么用户和物品之间就没有连线。但是用户和用户之间,物品和物品之间是不存在连线的。换句话说就是同一类点之间是不存在连线的。这样的图结构就叫做二部图。电子商务中间的物品推荐,可以看成是二部图的边的挖掘问题。扩散过程可以用来寻找二部图中两个节点的关联强度。经典的扩散过程分成两类:一种叫做物质扩散(Probabilistic Spreading),它满足能量守恒定律;另一种叫做热传导(Heat Spreading),一般由一个或多个热源(物品)驱动,不一定满足能量守恒定律。

物质扩散(Probabilistic Spreading)算法流程

probabilistic spreading

如图所示,用黄色的点来表示用户,用红色的点表示物品。用户有三位,物品有四个。第一个用户和第一个物品有连线表示第一个用户购买了第一个物品,而与第二个物品没有连线表示第一个用户没有购买第二个物品。根据图像(a)所示,第一个物品和第三个物品有能量1,第二个物品和第四个物品有能量0.对于物质扩散过程,第一个物品需要把自己的能量1平均分配给购买过它的用户一和用户二。第三个物品也需要把自己的能量1平均分配给购买过它的用户一和用户三。用户的能量就是所有用物品得到的能量的总和。正如图像(b)所示,第一个用户此时具有能量1,第二个和第三个用户都具有能量1/2.接下来,每个用户再把自身的能量平均分配给所有购买过的物品,物品的能量则是从所有用户得到的能量的总和。所以第一个物品的能量就是第一个用户的能量乘以0.5加上第二个用户的能量乘以1/3,所得的能量则是2/3.其他物品的能量用类似的方法计算。

物质扩散(Probabilistic Spreading)数学模型

假设有m个用户(Users)和n个物品(Objects),可以构造矩阵A_{m\times n}, 如果a_{ij}=1,那么表示用户i购买了物品j;如果a_{ij}=0, 那么表示用户i没有购买物品j。用(c_{1},\cdot\cdot\cdot, c_{n})来表示物品1到物品n的能量。用k(U_{\alpha})=\sum_{j=1}^{n}a_{\alpha j}表示用户\alpha的度,也就是该用户购买的物品数量。用k(O_{j})=\sum_{i=1}^{m}a_{ij}表示物品j的度,也就是该物品被多少个用户购买过。根据物质扩散的算法描述,第一步需要计算出用户从物品那里得到的能量,此时用户i得到的能量用b_{i}表示,那么

b_{i}=\sum_{\ell=1}^{n} a_{i\ell}\cdot c_{\ell}/k(O_{\ell}) \text{ for all } 1\leq i\leq m.

后面需要通过用户的能量来更新物品的能量,假设物品j的新能量用c_{j}^{'}表示,那么

c_{j}^{'}=\sum_{i=1}^{m}a_{ij}\cdot b_{i}/ k(U_{i}) \text{ for all } 1\leq j \leq n.

b_{i}的公式带入上面可以得到对于1\leq j\leq n,我们有

c_{j}^{'}=\sum_{\ell=1}^{n}\left(\frac{1}{k(O_{\ell})}\cdot\sum_{i=1}^{m}\frac{a_{ij}a_{i\ell}}{k(U_{i})}\right)\cdot c_{\ell}=\sum_{\ell=1}^{n}w_{j\ell}^{P}\cdot c_{\ell}.

在这里对于1\leq j\leq n, 1\leq \ell \leq n,

w_{j\ell}^{P}=\frac{1}{k(O_{\ell})}\cdot\sum_{i=1}^{m}\frac{a_{ij}a_{i\ell}}{k(U_{i})}.

假设n\times n矩阵W^{P}=(w_{j\ell}^{P}), 列向量\vec{C}=(c_{1},\cdot\cdot\cdot,c_{n})^{T}\vec{C^{'}}=(c_{1}^{'},\cdot\cdot\cdot,c_{n}^{'})^{T},那么\vec{C^{'}}=W^{P}\vec{C}.

性质1. 矩阵W^{P}每列的和都是1,i.e. \sum_{j=1}^{n}w_{j\ell}^{P}=1对于所有的1\leq \ell \leq n都成立。

证明. \sum_{j=1}^{n}w_{j\ell}^{P}=\sum_{j=1}^{n}\sum_{i=1}^{m}\frac{1}{k(O_{\ell})}\cdot\frac{a_{ij}a_{i\ell}}{k(U_{i})}=\sum_{i=1}^{m}\frac{a_{i\ell}}{k(O_{\ell})}=1.

性质2. \frac{w_{j\ell}^{P}}{k(O_{j})}=\frac{w_{\ell j}^{P}}{k(O_{\ell})}对于所有的1\leq j,\ell\leq n都成立。换言之,矩阵W^{P}不一定是对称矩阵,只有在所有物品的度都完全一致的情况下才是对称矩阵。

证明. 根据w_{j\ell}^{P}w_{\ell j}^{P}的定义可以得到结论。

性质3. 矩阵W^{P}对角线上的元素是该列的最大值。i.e. w_{jj}^{P}\geq w_{\ell j}^{P}对于所有的1\leq j,\ell\leq n都成立。

证明. 根据矩阵A的定义,对于所有的1\leq j,\ell\leq n,可以得到

w_{jj}^{P}=\frac{1}{k(O_{j})}\cdot \sum_{i=1}^{m}\frac{a_{ij}^{2}}{k(U_{i})}\geq\frac{1}{k(O_{j})}\cdot\sum_{i=1}^{m}\frac{a_{ij}a_{i\ell}}{k(U_{i})}=w_{\ell j}^{P}.

性质4. 能量守恒定律:\sum_{j=1}^{n}c_{j}^{'}=\sum_{\ell=1}^{n}c_{\ell}.

证明. 根据前面的性质,已经知道W^{P}矩阵每一列的和都是1,i.e. \sum_{j=1}^{n}w_{j\ell}^{P}=1. 可以直接计算得到:\sum_{j=1}^{n}c_{j}^{'}=\sum_{j=1}^{n}\sum_{\ell=1}^{m}w_{j\ell}^{P}c_{\ell}=\sum_{\ell=1}^{n}c_{\ell}\cdot\sum_{j=1}^{n}w_{j\ell}^{P}=\sum_{\ell=1}^{m}c_{\ell}.

性质5. 如果物品O_{j}的用户都是物品O_{\ell}的用户,换句话说,如果a_{ij}=1, 则有a_{i\ell}=1.那么w_{jj}^{P}=w_{\ell j}^{P}对于所有的1\leq \ell \leq n都成立。反之,如果w_{jj}^{P}=w_{\ell j}^{P},那么物品O_{j}的用户都是物品O_{\ell}的用户。

证明. 根据w_{j\ell}^{P}的定义,可以得到

w_{jj}^{P}=\frac{1}{k(O_{j})}\cdot \sum_{i=1}^{m}\frac{a_{ij}^{2}}{k(U_{i})}=\frac{1}{k(O_{j})}\cdot \sum_{\{1\leq i\leq m, a_{ij}=1\}}\frac{1}{k(U_{i})},

w_{\ell j}^{P}=\frac{1}{k(O_{j})}\cdot \sum_{i=1}^{m}\frac{a_{i\ell}a_{ij}}{k(U_{i})}=\frac{1}{k(O_{j})}\cdot \sum_{1\leq i\leq m, a_{ij}=1}\frac{a_{i\ell}}{k(U_{i})}.

根据条件,如果a_{ij}=1,则有a_{i\ell}=1,那么上面两个式子相等。i.e. w_{jj}^{P}=w_{\ell j}^{P}对于所有的1\leq \ell \leq n都成立。

根据上面性质,可以定义变量

I_{j}=\sum_{\ell=1}^{n}(w_{\ell j}^{P}/w_{jj}^{P})^{2},

其中w_{\ell j}^{P}/w_{jj}^{P}可以看成物品O_{j}与物品O_{j}的独立程度。如果w_{\ell j}^{P}/w_{jj}^{P}=1,那么说明物品O_{j}的用户都是物品O_{\ell}的用户。如果w_{\ell j}^{P}/w_{jj}^{P}=0,那么说明物品O_{j}的用户与物品O_{\ell}的用户则没有交集。换言之,物品O_{j}与物品O_{\ell}则相对独立。根据这个性质,如果I_{j}越小,那么物品O_{j}与其他物品就相对独立。

性质6. 1\leq I_{j}\leq n对于所有的1\leq j\leq n都是成立的。

证明. 根据以上性质可以得到w_{\ell j}^{P}\leq w_{jj}^{P}对于1\leq \ell \leq n都成立,并且I_{j}\geq (w_{jj}^{P}/w_{jj}^{P})^{2}=1,所以上面性质成立。

基于物质扩散算法的用户相似度

回顾一下基于用户的协同过滤算法:用户U_{\alpha}, U_{\beta}的相似度是

S_{\alpha \beta}=(\sum_{j=1}^{n}a_{\alpha j}\cdot a_{\beta j})/\min\{k(U_{\alpha}),k(U_{\beta})\}

或者使用余弦表达式

S_{\alpha \beta}=(\sum_{j=1}^{n}a_{\alpha j}\cdot a_{\beta j})/\sqrt{k(U_{\alpha})\cdot k(U_{\beta})}.

如果用户U_{i}并没有选择物品O_{j},那么预测分数则是

v_{ij}=(\sum_{1\leq \ell \leq m, \ell\neq i} S_{i\ell}\cdot a_{j\ell}) / \sum_{1\leq \ell \leq m, \ell\neq i} S_{i\ell}.

这里的求和指的把除了用户i的其他用户做相似度的加权,看用户U_{\ell}是否购买了物品O_{j}.然后对于任意的用户和物品组成的对(i,j), 只要a_{ij}=0(意思是用户U_{i}并没有购买过物品O_{j}),根据预测分数v_{ij}从大到小对1\leq j\leq n排序,推荐v_{ij}值大的物品给用户U_{i}即可。以上就是基于用户的协同过滤算法。

下面来介绍基于物质扩散方法的算法。与上面的方法类似,第一步就是定义用户相似度S_{\alpha \beta}^{P}如下:

S_{\alpha \beta}^{P}=\frac{1}{k(U_{\beta})}\cdot \sum_{j=1}^{n}\frac{a_{\alpha j}\cdot a_{\beta j}}{k(O_{j})}.

上面定义表示物品O_{j}购买的人越多,用户的相似度S_{\alpha \beta}^{P}就会减少。原因就是比方说像新华字典这种购买的人非常多的物品,并不能说明大多数人都是相似的,反而是购买数学分析这种物品的人相似性比较大。也就是说物品的热门程度k(O_{j})对计算用户相似度的时候有抑制作用。此时的评分系统则是:如果用户U_{\alpha}之前没有购买物品O_{i},那么其预测分数则是

v_{\alpha i}=(\sum_{1\leq \beta\leq m, \beta\neq\alpha}S_{\alpha \beta}^{P}\cdot a_{\beta i})/\sum_{1\leq \beta\leq m, \beta\neq\alpha}S_{\alpha \beta}^{P}

对于物质扩散的算法,可以用以下简单方法进行推广。增加参数d>0,定义用户U_{\alpha}和用户U_{\beta}的相似度S_{\alpha \beta}^{P}(d)如下:

S_{\alpha \beta}^{P}(d)=\frac{1}{k(U_{\beta})}\cdot \sum_{j=1}^{n}\frac{a_{\alpha j}\cdot a_{\beta j}}{(k(O_{j}))^{d}}.

d>1时,减弱了热门物品对用户相似度的影响;当d\in (0,1)时,增加了热门物品对用户相似度的影响。某篇论文显示基于某些数据,d=1.9是最佳的参数。

时间序列模型之相空间重构模型

一般的时间序列主要是在时间域中进行模型的研究,而对于混沌时间序列,无论是混沌不变量的计算,混沌模型的建立和预测都是在所谓的相空间中进行,因此相空间重构就是混沌时间序列处理中非常重要的一个步骤。所谓混沌序列,可以看作是考察混沌系统所得到的一组随着时间而变化的观察值。假设时间序列是\{ x(i): i=1,\cdot \cdot \cdot, n\}, 那么吸引子的结构特性就包含在这个时间序列之中。为了从时间序列中提取出更多有用的信息,1980年Packard等人提出了时间序列重构相空间的两种方法:导数重构法和坐标延迟重构法。而后者的本质则是通过一维的时间序列\{x(i)\}的不同延迟时间\tau来构建d维的相空间矢量

y(i)=(x(i),...,x(i+(d-1)\tau)), 1\leq i\leq n-(d-1)\tau.

1981年Takens提出嵌入定理:对于无限长,无噪声的d^{'}维混沌吸引子的一维标量时间序列\{x(i): 1\leq i \leq n\}都可以在拓扑不变的意义下找到一个d维的嵌入相空间,只要维数d\geq 2d^{'}+1. 根据Takens嵌入定理,我们可以从一维混沌时间序列中重构一个与原动力系统在拓扑意义下一样的相空间,混沌时间序列的判定,分析和预测都是在这个重构的相空间中进行的,因此相空间的重构就是混沌时间序列研究的关键。

1. 相空间重构

相空间重构技术有两个关键的参数:嵌入的维数d和延迟时间\tau. 在Takens嵌入定理中,嵌入维数和延迟时间都只是理论上证明了其存在性,并没有给出具体的表达式,而且实际应用中时间序列都是有噪声的有限序列,嵌入维数和时间延迟必须要根据实际的情况来选取合适的值。

关于嵌入维数d和延迟时间\tau的取值,通常有两种观点:第一种观点认为d\tau是互不相关的,先求出延迟时间之后再根据它求出合适的嵌入维数。求出延迟时间\tau比较常用的方法主要有自相关法,平均位移法,复自相关法和互信息法等,关键的地方就是使得原时间序列经过时间延迟之后可以作为独立的坐标来使用。同时寻找嵌入维数的方法主要是几何不变量方法,虚假最临近法(False Nearest Neighbors)和它改进之后的Cao方法等。第二种观点则是认为延迟时间和嵌入维数是相关的。1996年Kugiumtzis提出的时间窗长度则是综合考虑两者的重要参数。1999年,Kim等人提出了C-C方法,该方法使用关联积分同时估计出延迟时间和时间窗。

(1) 延迟时间\tau的确定:

如果延迟时间\tau太小,则相空间向量

y(i)=(x(i),\cdot\cdot\cdot, x(i+(d-1)\tau), 1\leq i\leq n-(d-1)\tau

中的两个坐标分量x(i+j\tau)x(i+(j+1)\tau)在数值上非常接近,以至于无法相互区分,从而无法提供两个独立的坐标分量;但是如果延迟时间\tau太大的话,则两个坐标分量又会出现一种完全独立的情况,混沌吸引子的轨迹在两个方向上的投影就毫无相关性可言。因此需要合适的方法来确定一个合适的延迟时间\tau, 从而在独立和相关两者之间达到一种平衡。

(1.1) 自相关系数法:

自相关函数是求延迟时间\tau比较简单的一种方法,它的主要理念就是提取序列之间的线性相关性。对于混沌序列x(1), x(2),\cdot \cdot \cdot, x(n), 可以写出其自相关函数如下:

R(\tau)=\frac{1}{n}\sum_{i=1}^{n-\tau}x(i)x(i+\tau).

此时就可以使用已知的数据x(1),\cdot \cdot\cdot x(n)来做出自相关函数R(\tau)随着延迟时间\tau变化的图像,当自相关函数下降到初始值R(0)1-e^{-1}时,i.e. R(\tau)=(1-e^{-1})R(0), 所得到的时间\tau也就是重构相空间的延迟时间。虽然自相关函数法是一种简便有效的计算延迟时间的方法,但是它仅仅能够提取时间序列的线性相关性。根据自相关函数法可以让x(i), x(i+\tau)以及x(i+\tau), x(i+2\tau)之间不相关,但是x(i), x(i+2\tau)之间的相关性可能会很强。这一点意味着这种方法并不能够有效的推广到高维的研究。而且选择下降系数1-e^{-1}时,这一点可能有点主观性,需要根据具体的情况做适当的调整。因此再总结了自相关法的不足之后,下面介绍一种判断系统非线性关系性的一种方法:交互信息法。

(1.2) 交互信息法:

在考虑了以上方法的局限性之后,Fraser和Swinney提出了交互信息法(Mutual Information Method)。假设两个离散信息系统\{ s_{1},\cdot \cdot \cdot, s_{m}\}, \{q_{1},\cdot\cdot\cdot, q_{n}\}所构成的系统SQ。通过信息论和遍历论的知识,从两个系统中获得的信息熵分别是:

H(S)=-\sum_{i=1}^{m}P_{S}(s_{i})log_{2}P_{S}(s_{i}),

H(Q)=-\sum_{j=1}^{n}P_{Q}(q_{j})log_{2}P_{Q}(q_{j}).

其中P_{S}(s_{i}), P_{Q}(q_{i})分别是SQ中事件s_{i}q_{i}的概率。交互信息的计算公式是:

I(S,Q)=H(S)+H(Q)-H(S,Q),

其中H(S,Q)=-\sum_{i=1}^{m}\sum_{j=1}^{n}P_{S,Q}(s_{i},q_{j})log_{2}P_{S,Q}(s_{i},q_{j}).

这里的P_{S,Q}(s_{i},q_{j})称为事件s_{i}和事件q_{j}的联合分布概率。交互信息标准化就是

I(S,Q)=I(S,Q)/\sqrt{H(S)\times H(Q)}.

现在,我们通过信息论的方法来计算延迟时间\tau. 定义(S,Q)=(x(i), x(i+\tau)), 1\leq i\leq n-\tau, 也就是S代表时间x(i), Q代表时间x(i+\tau). 那么I(S,Q)则是关于延迟时间\tau的函数,可以写成I(\tau). I(\tau)的大小表示在已知系统S,也就是x(i)的情况下,系统Q也就是x(i+\tau)的确定性的大小。I(\tau)=0表示x(i)x(i+\tau)是完全不可预测的,也就是说两者完全不相关。而I(\tau)的第一个极小值,则表示了x(i)x(i+\tau)是最大可能的不相关,重构时使用I(\tau)的第一个极小值最为最优的延迟时间\tau.

交互信息法的关键在于怎么计算联合概率分布P_{S,Q}(s_{i},q_{j})以及SQ系统的概率分布P_{S}(s_{i})P_{Q}(q_{j}). 这里采取的方法是等间距格子法,其方法简要概述如下。

(S,Q)=(x(i), x(i+\tau)), 1\leq i \leq n-\tau,(S,Q)平面用一个矩形包含上面所有的点。将矩形S方向上等分成M_{1}份,Q方向等分成M_{2}份(注:M_{1}, M_{2}取值100~200之间即可)。那么在S方向上格子的长度就是\epsilon_{1}, Q方向上格子的长度就是\epsilon_{2}. 假设(a,b)(S,Q)平面矩形左下角的顶点坐标。

如果(i-1)\epsilon_{1}\leq s-a <i\epsilon_{1}, 那么s在第i个格子中,对Row[i]做一次记录;

如果(j-1)\epsilon_{2}\leq s-b <j\epsilon_{2}, 那么q在第j个格子中,对Col[j]做一次记录。x(i)x(i+\tau)序列的总数都是n-\tau, 那么

P_{S}(i)=Row[i]/(n-\tau), 1\leq i\leq M_{1},

P_{Q}(j)=Col[j]/(n-\tau), 1\leq j\leq M_{2}.

如果(i-1)\epsilon_{1}\leq s-a<i\epsilon_{1}(j-1)\epsilon_{2}\leq q-b < j\epsilon_{2},(s,q)在标号为(i,j)的格子中,对Together[i][j]做一次记录。那么

P_{S,Q}(i,j)=Together[i][j]/(n-\tau)^{2}, 1\leq i\leq M_{1}, 1\leq j\leq M_{2}.

根据以上信息论的公式,可以得到:

H(S)=-\sum_{i=1}^{M_{1}}P_{S}(i)log_{2}P_{S}(i),

H(Q)=-\sum_{j=1}^{M_{2}}P_{Q}(j)log_{2}P_{Q}(j),

H(S,Q)=-\sum_{i=1}^{M_{1}}\sum_{j=1}^{M_{2}}P_{S,Q}(i,j)log_{2}P_{S,Q}(i,j).

I(S,Q)=H(S)+H(Q)-H(S,Q),

I(S,Q)=I(S,Q)/\sqrt{H(S)\times H(Q)}.

交互信息曲线I(\tau)=I(S,Q)第一次下降到极小值所对应的延迟时间\tau则是最佳延时时间。

(2) 嵌入维数d的确定:

(2.1) 几何不变量法:

为了确定嵌入维数d, 实际应用中通常的方法是计算吸引子的某些几何不变量(如关联维数,Lyapunov指数等)。选择好延迟时间\tau之后逐渐增加维数d, 直到他们停止变化为止。从Takens嵌入定理分析可知,这些几何不变量具有吸引子的几何性质,当维数d大于最小嵌入维数的时候,几何结构已经被完全打开,此时这些几何不变量与嵌入的维数无关。基于此理论,可以选择吸引子的几何不变量停止变化时的嵌入维数d作为重构的相空间维数。

(2.2) 虚假最临近点法:

从几何的观点来看,混沌时间序列是高维相空间混沌运动的轨迹在一维空间的投影,在这个投影的过程中,混沌运动的轨迹就会被扭曲。高维相空间并不相邻的两个点投影到一维空间上有的时候就会成为相邻的两点,也就是虚假邻点。重构相空间,实际上就是从混沌时间序列中恢复混沌运动的轨迹,随着嵌入维数的增大,混沌运动的轨道就会被打开,虚假邻点就会被逐渐剔除,从而整个混沌运动的轨迹得到恢复,这个思想就是虚假最临近点法的关键。

d维相空间中,每一个矢量

y_{i}(d)=(x(i),\cdot \cdot \cdot, x(i+(d-1)\tau), 1\leq i\leq n-(d-1)\tau

都有一个欧几里德距离的最邻近点y_{n(i,d)}(d), (n(i,d)\neq i, 1\leq n(i,d)\leq n-(d-1)\tau) 其距离是

R_{i}(d)=||y_{i}(d)-y_{n(i,d)}(d)||_{2}.

当相空间的维数从d变成d+1时,这两个点的距离就会发生变化,新的距离是R_{i}(d+1), 并且

(R_{i}(d+1))^{2}=(R_{i}(d))^{2}+||x(i+d\tau)-x(n(i,d)+d\tau)||_{2}^{2}.

如果R_{i}(d+1)R_{i}(d)大很多,那么就可以认为这是由于高维混沌吸引子中两个不相邻得点投影到低维坐标上变成相邻的两点造成的,这样的临近点是虚假的,令

a_{1}(i,d)=||x(i+d\tau)-x(n(i,d)+d\tau)||_{2}/R_{d}(i).

如果a_{1}(i,d)>R_{\tau} \in [10,50], 那么y_{n(i,d)}(d)就是y_{i}(d)的虚假最临近点。这里的R_{\tau}是阀值。

对于实际的混沌时间序列,从嵌入维数的最小值2开始,计算虚假最临近点的比例,然后逐渐增加维数d, 直到虚假最临近点的比例小于5%或者虚假最临近点的不再随着d的增加而减少时,可以认为混沌吸引子已经完全打开,此时的d就是嵌入维数。在相空间重构方面,虚假最临近点法(FNN)被认为是计算嵌入维数很有效的方法之一。

(2.3) 虚假最临近点法的改进-Cao方法:

虚假最临近点法对数据的噪声比较敏感,而且实际操作中需要选择阀值R_{\tau}, 具有很强的主观性。此时Cao Liangyue教授提出了改进的FNN方法,此方法计算时只需要延迟时间\tau一个参数,用较小的数据量就可以求的嵌入维数d.

假设我们有时间序列x(1),\cdot\cdot\cdot, x(n). 那么基于延迟时间\tau所构造的向量空间就是:y_{i}(d)=(x(i),\cdot\cdot\cdot x(i+(d-1)\tau)), i=1,2, \cdot\cdot\cdot, n-(d-1)\tau, 这里的d是作为嵌入维数,\tau是作为嵌入时间。y_{i}(d)则表示第id维重构向量。与虚假最临近点法类似,定义变量

a(i,d)=||y_{i}(d+1)-y_{n(i,d)}(d+1)||_{\infty}/||y_{i}(d)-y_{n(i,d)}(d)||_{\infty}, i=1,2,\cdot\cdot\cdot n-d\tau,

这里的||\cdot ||_{\infty}是最大模范数。其中y_{i}(d+1)是第id+1维的重构向量,i.e. y_{i}(d+1)=(x(i),\cdot\cdot\cdot, x(i+d\tau)). n(i,d) \in \{1,\cdot\cdot\cdot, n-d\tau\}是使得y_{n(i,d)}(d)d维相空间里面,在最大模范数下与y_{i}(d)最近的向量,并且n(i,d)\neq i,显然n(i,d)id所决定。

定义

E(d)=(n-d\tau)^{-1}\cdot\sum_{i=1}^{n-d\tau} a(i,d).

E(d)与延迟时间\tau和嵌入维数d有关。为了发现从dd+1,该函数变化了多少,可以考虑E1(d)=E(d+1)/E(d).d大于某个值d_{0}时,E1(d)不再变化,那么d_{0}+1则是我们所寻找的最小嵌入维数。除了E1(d), 还可以定义一个变量E2(d)如下。令

E^{*}(d)=(n-d\tau)^{-1}\cdot \sum_{i=1}^{n-d\tau}|x(i+d\tau)-x(n(i,d)+d\tau)|,

这里的n(i,d)和上面的定义一样,也就是使得y_{n(i,d)}(d)y_{i}(d)最近的整数,并且n(i,d)\neq i. 定义E2(d)=E^{*}(d+1)/E^{*}(d). 对于随机序列,数据之间没有相关性,E2(d)\equiv 1. 对于确定性的序列,数据点之间的关系依赖于嵌入维数d的变化,总存在一些值使得E2(d)\neq 1.

2. 相空间的预测

通过前面的相空间重构过程,一个混沌时间序列x(1),\cdot \cdot \cdot, x(n)可以确定其延迟时间\tau和嵌入维数d, 形成n-(d-1)\taud维向量:

\vec{y}_{1}=y_{1}(d)=(x(1),\cdot\cdot\cdot, x(1+(d-1)\tau)),

\vec{y}_{2}=y_{2}(d)=(x(2),\cdot\cdot\cdot, x(2+(d-1)\tau)),

\cdot \cdot \cdot

\vec{y}_{i}=y_{i}(d)=(x(i),\cdot\cdot\cdot, x(i+(d-1)\tau)),

\cdot \cdot \cdot

\vec{y}_{n-(d-1)\tau}=y_{n-(d-1)\tau}(d)=(x(n-(d-1)\tau),\cdot\cdot\cdot, x(n)).

这样我们就可以在d维欧式空间\mathbb{R}^{d}建立一个动力系统的模型如下:

\vec{y}_{i+1}=F(\vec{y}_{i}), 其中F是一个连续函数。

(1) 局部预测法:

假设N=n-(d-1)\tau, 根据连续函数的性质可以知道:如果\vec{y}_{N}\vec{y}_{j}非常接近,那么\vec{y}_{N+1}\vec{y}_{j+1}也是非常接近的,可以用x(j+1+(d-1)\tau)作为x(N+1+(d-1)\tau)=x(n+1)的近似值。

(1.1) 局部平均预测法:

考虑向量\vec{y}_{N}k个最临近向量\vec{y}_{t_{1}},\cdot\cdot\cdot, \vec{y}_{t_{k}}. i.e. 也就是从其他的N-1个向量中选取前k个与\vec{y}_{N}最临近的向量,此处用欧几里德范数||\cdot ||_{2}或者最大模范数||\cdot ||_{\infty}. 根据局部预测法的观点,可以得到x(n+1)的近似值:

x(n+1)\approx k^{-1}\cdot \sum_{j=1}^{k}x(t_{j}+1+(d-1)\tau) .

也可以引入权重的概念来计算近似值:

x(n+1)\approx \sum_{j=1}^{k}x(t_{j}+1+(d-1)\tau)\cdot \omega(\vec{y}_{t_{j}},\vec{y}_{N}).

其中\omega(\vec{y}_{t_{j}}, \vec{y}_{N})=K_{h}(||\vec{y}_{t_{j}}-\vec{y}_{N}||) / \sum_{j=1}^{k} K_{h}(||\vec{y}_{t_{j}}-\vec{y}_{N}||), 1\leq j \leq k,

K(x)=exp(-x^{2}/2),

K_{h}(x)=h^{-1}K(h^{-1}x)=h^{-1}exp(-x^{2}/(2*h^{2})).

(1.2) 局部线性预测法:

假设N=n-(d-1)\tau, 则有y_{N}(d)=(x(N),\cdot\cdot\cdot, x(n)).

局部线性预测模型为

\hat{x}(n+1)=c_{0}x(N)+c_{1}x(N+\tau)+\cdot\cdot\cdot+c_{d-1}x(N+(d-1)\tau)+c_{d},

其中c_{i}, 0\leq i\leq d是待定系数。假设向量\vec{y}_{N}k个最临近向量是\vec{y}_{t_{1}},\cdot\cdot\cdot,\vec{y}_{t_{k}}. 此处可以用欧几里德范数||\cdot ||_{2}或者最大模范数||\cdot ||_{\infty}. 这里使用最小二乘法来求出c_{i}, 0\leq i\leq d的值。也就是求c_{i}使得

||Ab-Y||_{2}^{2}=\sum_{j=1}^{k}(\hat{x}(t_{j}+1+(d-1)\tau)-x(t_{j}+1+(d-1)\tau))^{2}

=\sum_{j=1}^{k}(c_{0}x(t_{j})+c_{1}x(t_{j}+\tau)+\cdot\cdot\cdot+c_{d-1}x(t_{j}+(d-1)\tau)+c_{d}-x(t_{j}+1+(d-1)\tau))^{2}

取得最小值,其中Y=(x(t_{1}+1+(d-1)\tau), x(t_{2}+1+(d-1)\tau),\cdot\cdot\cdot x(t_{k}+1+(d-1)\tau))^{T}, b=(c_{0},c_{1},\cdot\cdot\cdot, c_{d})^{T}, 矩阵A的第j行是d+1维向量(x(t_{j}),\cdot\cdot\cdot, x(t_{j}+(d-1)\tau), 1), 1\leq j\leq k. 根据最小二乘法可以得到待定系数向量b=(A^{T}A)^{-1}A^{T}Y是最小二乘解。

(1.3) 局部多项式预测法:

(2) 全局预测法:

(2.1) 神经网络
(2.2) 小波网络
(2.3) 遗传算法

3. 实验数据

这里使用Lorenz模型来作为测试数据,

dx/dt=\sigma(y-x),

dy/dt=x(\rho-z)-y,

dz/dt=xy-\beta z,

其中x, y, z是系统的三个坐标,\sigma, \rho, \beta是三个系数。在这里,我们取\rho=28, \sigma=10, \beta=8/3.在解这个常微分方程的时候,使用了经典的Runge-Kutta数值方法。

测试数据1:

使用1300个点,预测未来100个点,绿色曲线表示Lorenz模型在z坐标上的实际数据,红线右侧表示开始预测,蓝色曲线表示使用相空间重构模型所预测的数据。根据统计学分析可以得到:在红色线条的右侧,蓝色曲线的点和绿色曲线的点的Normalized Root Mean Square Error<8%, Mean Absolute Percentage Error<5.3%, 相关系数>97%.

n=1300 1

把红线附近的图像放大可以看的更加清楚:

n=1300 2

测试数据2:

使用1800个点,预测未来100个点,绿色曲线表示Lorenz模型在x坐标上的实际数据,红线右侧表示开始预测,蓝色曲线表示使用相空间重构模型所预测的数据。根据统计学分析可以得到:在红色线条的右侧,蓝色曲线的点和绿色曲线的点的Normalized Root Mean Square Error<1%, Mean Absolute Percentage Error<2%, 相关系数>99%.

n=1800

把红线附近的图像放大:

n=1800 2

使用同样的数据量,也就是n=1800,预测未来100个点,绿色曲线表示Lorenz模型在z坐标上的实际数据,红线右侧表示开始预测,蓝色曲线表示使用相空间重构模型所预测的数据。根据统计学分析可以得到:在红色线条的右侧,蓝色曲线的点和绿色曲线的点的Normalized Root Mean Square Error<1%, Mean Absolute Percentage Error<1%, 相关系数>99%.

n=1800 y

把红线附近的图像放大:

n=1800 y2

参考文献:

  1. https://en.wikipedia.org/wiki/Lorenz_system
  2. https://en.wikipedia.org/wiki/Root-mean-square_deviation
  3. https://en.wikipedia.org/wiki/Mean_absolute_percentage_error
  4. Practical method for determining the minimum embedding dimension of a scalar time series
  5. 基于混沌理论的往复式压缩机故障诊断
  6. determining embedding dimension for phase-space reconstruction using a geometric construction
  7. Time Series Prediction by Chaotic Modeling of Nonlinear Dynamical Systems
  8. nonlinear dynamics delay times and embedding windows

时间序列模型之灰度模型

灰度预测法是一种对含有不确定因素的系统的预测方法,灰色系统是位于白色系统和黑色系统之间的一种系统。

白色系统指的是一个系统内部的特征是完全已知的,使用者不仅知道系统的输入-输出关系,还知道实现输入-输出的具体方式,譬如函数表达式,微分方程的变化公式,或者物理学的基本定律。比方说牛顿第二定律F=ma, 使用者只需要知道物体的质量和加速度,就可以通过牛顿第二定律求出所使用的力F的具体值。或者说当物体的质量固定之后,已知不同的加速度,就可以求出不同的力的值,力和加速度之间有明确的关系表达式。这种系统就称为白色系统。

黑色系统和白色系统就有鲜明的对比,使用者完全不清楚黑色系统的内部特征,只是知道一些输入和相应的输出。使用者需要通过这一系列的输入和输出的对应关系来判断这个黑色系统的内部特征,对于没有办法打开的黑箱,使用者需要通过输入和输出来建立模型来了解这个黑箱。比方说:高校在进行招生的时候,其实对考生是几乎不了解的,这个时候就需要通过高考或者自主招生考试来判断学生的知识掌握程度和运用知识解决问题的能力。通过测试的结果来判断学生的综合能力的大小,进而判断是不是符合高校的专业需求。

灰度系统恰好位于白色系统和黑色系统之间,灰度系统内部一部分是已知的,但是另一部分却是未知的。比方说:经济学中的模型,通过数学或者统计学的方法,可以判断某些因素之间确实有关系,但是却不能够完全的判断整个系统的情况,对于很多未知的情况,这些模型就有一定的局限性。于是,灰度系统就需要通过判断系统各个因素之间的发展规律,进行相应的关联分析。通过原始的数列来生成规律性更强的数列,通过生成的数列来建立相应的微分方程模型,从而预测数列的未来发展趋势。灰度模型使用等时间距观测到的数据值来构造灰色预测模型,从而达到能够预测未来某一时刻的数值的目的。

尽管灰度系统的现象不够清楚,内部的结构并不为人所知,数据是杂乱的,但是却是互相关联的,有整体功效的,因而可以对它的变化过程进行预测。其中灰度模型是灰度系统理论的重要组成部分,将杂乱的原始数据整理成规律性较强的数据,然后再利用离散的灰度方程建立连续的微分模型,从而对系统的发展做出全面的观察分析,并做出长期预测。

下面来介绍下灰度模型的几种分类:

已知序列 x^{(0)}(1),...,x^{(0)}(n),其中n是数组的长度。通过分析这组序列的内在结构,从而建立相应的微分方程模型,达到预测未来序列x^{(0)}(n+1), x^{(0)}(n+2),...的目的。

(1) 灰度模型GM(1,1)

第一步需要通过累加形成新序列 x^{(1)}(1),..., x^{(1)}(n),其中

x^{(1)}(1)=x^{(0)}(1),

x^{(1)}(2)=x^{(0)}(1)+x^{(0)}(2), \cdot \cdot \cdot

x^{(1)}(n)=x^{(0)}(1)+\cdot\cdot\cdot+x^{(0)}(n).

对上面的累加序列取均值,就可以得到序列

z^{(1)}(1)=x^{(1)}(1),

z^{(1)}(2)=(x^{(1)}(1)+x^{(1)}(2))/2, \cdot \cdot \cdot

z^{(1)}(n)=(x^{(1)}(n-1)+x^{(1)}(n))/2.

那么GM(1,1)灰度模型相应的微分方程就是\frac{dx^{(1)}}{dt}+a x^{(1)}(t)=b, 它的离散方程是x^{(0)}(k)+az^{(1)}(k)=b, 这里2\leq k\leq n. 其中a成为发展系数,b称为控制系数。通过最小二乘法的推导,可以得到 (a,b)^{T}=(B^{T}B)^{-1}B^{T}Y. 其中B和Y都是矩阵,定义如下:

B=\begin{pmatrix} -z^{(1)}(2) & 1 \\ -z^{(1)}(3) & 1 \\ . & . \\ -z^{(1)}(n) & 1 \end{pmatrix},

Y= (x^{(0)}(2),\cdot \cdot \cdot, x^{(0)}(n))^{T}.

通过常微分方程的求解,可以得到预测模型的解析表达式。这里分两种情况:

第一种情况:a\neq 0

x^{(1)}_{p}(k)=(x^{(0)}(1)-\frac{b}{a})e^{-a(k-1)}+\frac{b}{a}, k \geq 1, 从而得到序列的预测值:

x^{(0)}_{p}(k)=x^{(1)}(k)-x^{(1)}(k-1)=(x^{(0)}(1)-\frac{b}{a})\cdot e^{-a(k-1)}\cdot (1-e^{a}), k\geq 2, x^{(0)}_{p}(1)=x^{(0)}(1).

第二种情况:a=0

x^{(1)}_{p}(k)=bk+x^{(0)}(1)-b, k\geq 1, 从而得到的序列的预测值:

x^{(0)}_{p}(k)=x^{(0)}(1).

(2) 灰度Verhulst模型

灰度Verhulst模型和前面的灰度模型GM(1,1)相似,也是计算累加生成数列,然后计算中值数列。不过Verhulst模型是建立非线性的常微分方程,所以相应的矩阵B和Y就需要做更改。微分方程是\frac{dx^{1}(t)}{dt}+ax^{(1)}(t)=b(x^{(1)}(t))^{2}. 离散方程则是x^{(0)}(k)+az^{(1)}(k)=b(z^{(1)}(k))^{2} \text{ for } 2\leq k\leq n. 通过最小二乘法的推导,可以得到 (a,b)^{T}=(B^{T}B)^{-1}B^{T}Y. 其中B和Y都是矩阵,定义如下:

B=\begin{pmatrix} -z^{(1)}(2) & (z^{(1)}(2))^{2} \\ -z^{(1)}(3) & (z^{(1)}(3))^{2} \\ . & . \\ -z^{(1)}(n) & (z^{(1)}(n))^{2} \end{pmatrix},

Y= (x^{(0)}(2),\cdot \cdot \cdot, x^{(0)}(n))^{T}.

通过微分方程的求解,可以得到

x_{p}^{(1)}(k)=\frac{ax^{(0)}(1)}{bx^{(0)}(1)+(a-bx^{(0)}(1))e^{a(k-1)}} \text{ for } k\geq 1.从而可以得到预测的序列x_{p}^{(0)}(k)=x_{p}^{(1)}(k)-x_{p}^{(1)}(k-1) \text{ for }k\geq 2, x_{p}^{(0)}(1)=x^{(0)}(1).

注:如果a<0, 那么\lim_{k\rightarrow \infty}x_{p}^{(1)}(k)=a/b, \lim_{k\rightarrow \infty}x_{p}^{(0)}(k)=0.

(3) 灰度模型DGM(2,1)

这个DGM(2,1)灰度模型并不需要累加生成序列,直接使用原序列就可以进行操作。微分方程是\frac{d^{2}x^{(1)}}{dt^{2}}+a\frac{dx^{(1)}}{dt}=b, 通过最小二乘法的推导,可以得到 (a,b)^{T}=(B^{T}B)^{-1}B^{T}Y. 其中B和Y都是矩阵,定义如下:

B=\begin{pmatrix} -x^{(0)}(2) & 1 \\ -x^{(0)}(3) & 1 \\ . & . \\ -x^{(0)}(n) & 1 \end{pmatrix},

Y= (x^{(0)}(2)-x^{(0)}(1),\cdot \cdot \cdot, x^{(0)}(n)-x^{(0)}(n-1))^{T}.

通过微分方程的求解,可以得到:x^{(1)}_{p}(k)=(\frac{b}{a^{2}}-\frac{x^{(0)}(1)}{a})e^{-a(k-1)}+\frac{b}{a}k+(x^{(0)}(1)-\frac{b}{a})\frac{1+a}{a} \text{ for } k\geq 1.

求解原序列的预测值就是:x^{(0)}_{p}(k)=(\frac{b}{a^{2}}-\frac{x^{(0)}(1)}{a})(1-e^{a})e^{-a(k-1)}+\frac{b}{a} \text{ for } k\geq 2, x^{(0)}_{p}(1)=x^{(0)}(1).

案例1:灰度模型在电力行业的应用。

某市1984~1990年用电量数据如下:

年份                  1984             1985           1986           1987            1988             1989            1990

用电量/GWh    2783.20  3028.26  3290.55  3477.77 3685.02      3935.09    4210.29

这里用n=4,也就是前四个点建立模型,然后后面三个点用来测试模型的正确性。注:这里使用了一些根据上面模型进行改进的灰度模型,进行了模型的融合。x^{(0)}(1)=2783.20, x^{(0)}(2)=3028.26, x^{(0)}(3)=3290.55, x^{(0)}(4)=3477.77. 通过计算累积生成序列,可以进一步求的系数a和b的值,从而根据上面的模型进行模拟。通过模型可以算出

x^{(0)}_{p}(1)=2783.20, x^{(0)}_{p}(2)=3042.19, x^{(0)}_{p}(3)=3258.00, x^{(0)}_{p}(4)=3489.12, x^{(0)}_{p}(5)=3736.64, x^{(0)}_{p}(6)=4001.72, x^{(0)}_{p}(7)=4285.60.

通过平均绝对百分比误差(Mean Absolute Percentage Error)的定义得到:前四项的MAPE<0.005, 所有七项的MAPE<0.01. 通过标准均方根误差(Normalized root mean square error)的定义可以求出前四项的NRMSE<0.027, 所有七项的NRMSE<0.031.

作图如下:

eletric energy

其中绿色线条表示实际的用电量数据,蓝色线条表示用灰度模型模拟的用电量数据。红线左侧表示用来测试的前四项,红线右侧表示预测的未来三年的走势。

案例2:某油藏原始数据

年份              1972             1973           1974           1975             1976             1977            1978              1979

综合含水     31.8              39.1            43.2             48.6              49.8                   53.3               58.6               61.7

这里用n=5,也就是前五个点建立模型,然后后面三个点用来测试模型的正确性。

x^{(0)}(1)=31.8, x^{(0)}(2)=39.1, x^{(0)}(3)=43.2, x^{(0)}(4)=48.6, x^{(0)}(5)=49.8. 通过计算累积生成序列,可以进一步求的系数a和b的值,从而根据上面的模型进行模拟。通过模型可以算出

x^{(0)}_{p}(1)=31.8, x^{(0)}_{p}(2)=39.72, x^{(0)}_{p}(3)=43.10, x^{(0)}_{p}(4)=46.78, x^{(0)}_{p}(5)=50.77, x^{(0)}_{p}(6)=55.10, x^{(0)}_{p}(7)=59.80, x^{(0)}_{p}(8)=64.89.

通过平均绝对百分比误差(Mean Absolute Percentage Error)的定义得到:前五项的MAPE<0.015, 所有八项的MAPE<0.023. 通过标准均方根误差(Normalized root mean square error)的定义可以求出前五项的NRMSE<0.054, 所有八项的NRMSE<0.052.

作图如下:

raw data of reservior

其中绿色线条表示实际的综合含水数据,蓝色线条表示用灰度模型模拟的综合含水数据。红线左侧表示用来测试的前五项,红线右侧表示预测的未来三年的走势。

参考文献:

  1. https://en.wikipedia.org/wiki/Root-mean-square_deviation
  2. https://en.wikipedia.org/wiki/Mean_absolute_percentage_error

在新加坡的这五年---第一年

2010年7月19日 星期一, 南京-新加坡,东方航空公司,MU771,09:50-16:00. 这是自己第一次买到新加坡的机票,也是自己的第一次出国。当时选择从南京出发,是因为自己在南京已经呆了整整五年。2005年9月2日从贵阳飞南京,在南京大学数学系读了四年,加上一年的休整。在南京的四年,得到了很多老师,同学和亲戚朋友的帮助,在南京的这几年应该是自己比较快乐的时光。在来新加坡之前,通过数学系的校友群,得知2003级的学长姜开封在07年已经过来,于是请求他帮忙在NUS附近找房子。当时的NUS不像现在,PGP宿舍是只提供给本科生住,是不给研究生住的,UTown宿舍也没有修好,Kent Ridge地铁站也没有修好。在种种不利的情况下,研究生就只能够在外面租房子住。当时多亏姜开封师兄的帮忙,在距离学校不远的地方找了一个屋子,离West Coast Plaza很近,Block 602,#11-28。要是没有师兄的帮忙,估计当时真的只能够露宿街头了。说起来师兄也够给力,不仅帮我找到了住的地方,还专门跑到机场去接机,让人十分感动。这样也就罢了,连租房子交的押金都是师兄先垫着了,说以后发工资了你再还给我,因为刚来的PHD一般资金都比较紧张。以至于后来只要有南大的来新加坡,我如果知道的话,一般也会去机场接机,买张公交卡和电话卡,然后带到宿舍,简单的介绍一下NUS的生活情况,算是给后来人一点点微小的帮助吧。

来了新加坡之后,当然一开始就要去办理银行账户。当时和同学去Clementi的POSB银行办理银行账户,由于刚来的时候是NUS开学季,排队的人格外多,人山人海,排了两个小时,终于搞定了一个账户,这个账户就伴随着自己在新加坡的这几年。奖学金的发放,学校住宿费的扣除,都要靠这个账户。搞定了银行之后,然后就去学校办理各种各样的手续,首先就去NUS的UHC体检,然后参加英语的等级考试。说起这个英语考试(DET),自己也真的是好运,在花了两三天准备英语作文之后,居然拿到了Band 3,也就是不需要在NUS修任何的英语课程。通常情况下,都要求中国来的研究生学习ES5001和ES5002。之后需要的就是去NUS的MPSH办理签证的各种事情,然后办理注册的手续。然而这一切都非常的顺利,以至于让人根本想不到后面在NUS读PHD这几年会那么的艰辛。

2010年8月的第一周,是NUS传统的Orientation Week,新生都要参加,由各个学院的领导来介绍NUS的基本情况,然后研究生和博士生的一些基本要求之类的。当时自己的英语也不行,有的东西也听不懂,稀里糊涂的过了一周。碰巧那一周赶上新加坡的45周年,2010年8月9日,于是和同学去City Hall附近转了一圈,人山人海,当时的手机还是Nokia,定位系统都没有。新加坡这边的公交又不报站,Kent Ridge地铁站还没有修好,只能到Buona Vista或者Clementi转公交,因此出门之后就必须要记住路。当时8月9日在外面瞎跑了一天,晚餐吃的也是快餐,总算体验了一下新加坡热闹的国庆。

Orientation Week过了之后,就开始了正式的PHD生涯。当然第一年主要是修课。NUS数学系的要求是在系里面修八门课,然后达到学校要求的英语就可以了。当时自己选择了四门课,Graduate Analysis,Graduate Algebra,Topology,PDE。分析课作业实在太多,每周要花一整天才能够写完作业。代数课的课程难度太大,讲到最后都是非常抽象的范畴论。拓扑课也比较抽象,算了算去也就PDE比较容易混。这个学期还读了一些论文,总之课程的压力十分大。当时NUS数学系由于刚从S14搬过来,座位十分的紧张,自己也算倒霉,抽签的时候只有我一个人抽不到座位。没办公室座位也要学习啊,这个时候就只能够去图书馆写作业看书,和那些本科生抢位置。这个时候终于知道了什么叫做传说中的小组学习(Group Study),一帮人坐在图书馆的桌子上讨论问题。于是当时每天都去图书馆看书写作业,从8月份到10月份,几乎都是在图书馆-食堂-宿舍三点一线度过。到了10月底的时候,突然惊奇的发现NUS一个学期非常的短,总共也就13周,很快就要面临期末考试了,于是就开始紧张的准备期末考。特别辛苦的准备了一个月,终于考完了四门课。

一开始拿到NUS的Offer的时候,就被告知要给本科生讲课改作业监考之类的。然后第一个学期就被指派了这些任务,其中有一个任务是给本科生改作业。改作业的时候如果遇到错误,不仅要指出来,还要指明为什么学生错了,还要把正确的答案写给学生,总共改五次作业,每次可能70份左右吧,具体的已经记不清了,每周还要花半天来处理作业。除此之外,还被系里面要求给本科生讲Maple这个软件,一共五周,每周两节课,于是备课讲课也占用了不少的时间。于是第一个学期就被四门课和TA的任务占据了,科研的事情几乎没什么进展。

到了2010年12月份,假期开始了。对别人来说,假期开始就是娱乐的开始,但是对于自己来说恰恰相反。由于2011年1月份要参加数学系的博士资格考试,考分析和代数两门课,整个假期都要用来准备考试。在那个时候,在S17仍然没有自己的Office,要准备考试,只能够继续去图书馆干活。假期的图书馆和平时不一样,平时是从8:00am -10:00pm,假期则是8:00am-7:00pm。到了傍晚,图书馆准时关门,自己又没办公室,只能够在图书馆门口的桌子上继续看书。12月份那个时候,公共假日又比较多,在公共假日,图书馆整天都不开门,食堂也不开门,那几天为了看书就只能够到处找桌子看书,当时住的地方离Central Library比较近,于是经常去那里的长凳桌子上面复习课程。复习了一个月之后,在2011年1月份的资格考试中轻松通过两门。当然之后入学的研究生每个人都拥有了自己的办公室,然后仍然有人考QE死活不过,也许不是能力的问题,而只是一个态度的问题。

过了QE之后,在2011年2月份顺利的分到了自己的办公室,一打听,原来是有一个PHD退学了,决定拿master走人,所以位置就空出来了。自己终于拥有了自己的办公室。这个学期就没有选择那么多的课程了,随便选了三门课,Manifold,Probability,Topics。由于少了一门课,于是自己终于有时间来处理自己的科研了。拿到论文之后一看,90页,感觉比多上一门课来说难度不降反增。不过也没办法,哪个让自己来读这个PHD呢,只能坚持一点一点的读。只不过这次的工作地点从图书馆换到了自己的办公室。助教的任务这个学期也不重,教课的任务仍然没有,就剩下改作业了,这个学期的作业非常简单,随便改改任务就算完成了。除了系里面的专业课,自己还修了一门CELC的英语口语课,总算修了一门英语课,虽然这门英语课不属于自己应该修的范畴内,但是总算体验了一把NUS的英语教学。

2011年是自己第一次不在国内过年,不过这边也没啥过年的气氛,都是自己过自己的,无非就是PHD自己做点饭来吃吃。而且过年也只有两天的假期,何况系里面不让PHD在这段时间用自己的假日回家过年,理由是有助教的任务。于是没办法,只能够在新加坡过年。过年的时候,几乎所有的店铺都关门,超市也关门,只能够自己提前买好吃的,储备好自己的食物,免得没饭吃。这个学期和上一个学期有很大不同,上个学期几乎不出门玩,几乎都在学校度过,但是这个学期在新加坡反而去了不少的地方。动物园,植物园,中华园,圣淘沙等,该吃的东西也吃了不少,回去之后总算可以给亲戚朋友说一下新加坡的一些基本情况。

说到2010-2011年这一学年的NUS,PGP宿舍不让研究生入住,Utown宿舍还没有修好,研究生住宿好像在Boonlay和Commonwealth那边,每天有校车来回Kent Ridge和宿舍区。Kent Ridge地铁站没有修好,黄线也没有通车,每次出门都要坐95路到Buona Vista或者96路到Clementi地铁站。至于数学系则是从S14刚搬到S17,当年的General Office还在七楼,六楼还没有完全装修好,至于四五楼则是一点都没有装修,研究生的座位都十分紧张。数学系的课程当时安排在S16,一直到S17四楼装修好了之后才搬到这边来上课。理学院图书馆(Science Library)门口的山头正在一点一点的被移走,每天在图书馆都能够看到吊车拖车之类的从门口经过。当时据说是要修一栋楼,直到2015年,这栋楼才竣工。由于当时住在西海岸,每天都要往返数学系,图书馆和宿舍,Clementi Woods便成了自己每天的必经之路,每天早上起来穿过Clementi Woods,到了C车的起点Kent Vale,就坐校车C从起点到终点理学院(Science)。回去则是全程走路返回宿舍,必定穿过Clementi Woods。有时间的话就去盛松超市买点零食,或者去West Coast Plaza里面购买寿司。

除了普通的学校生活,在新加坡吃吃喝喝就成为了第一年的主要任务。当年West Coast Plaza的川江号子和清香馆,盛松附近的添一点自助火锅,Clementi的福苑家传菜,Jumbo海鲜楼,Novena地铁站的维也纳海鲜。

到了5月份,NUS第二个学期结束,于是S17开始了巨大的装修工程。每天白天没有装修,晚上开始装修,搞得在S17都没有办法安心学习,于是就开始在youtube上面浏览各种视频,七七八八的也看了不少,于是在6月份回国,在新加坡读博士的第一年这个时候也结束了。

NUS 数学系 PHD 论文提交-2015年

2015年,终于在新加坡国立大学(National University of Singapore)数学系把博士论文交上了,于是写一个大致的流程供大家参考。

在第四年快要结束的时候,学生要和老板商量好什么时候交论文,在不同的时候交论文,所要收取的学费是不一样的。如果是每个学期开学的前两周交论文,那么这个学期的学费就不用交。如果是学期中间(有一个期限)的时候交论文,虽然一开始会将这个学期的学费扣掉,但是学期结束的时候会把一半的学费返还给学生。如果过了学期中间的时刻再交论文的话,就要交上这个学期的全部学费。2010年入学的时候,当年的学费是13300.00SGD一年。到了2015年入学的时候,学费意见是26000.00SGD一年了。学费涨的比较快,PHD们只能够尽最大的努力早日毕业了。

在和老板商量好什么时候交论文了之后,就要着手开始处理交论文的事情了。首先就要预计一个交论文的时间,尽量精确到某一周。这个时候,需要在NUS的MYISIS系统上面提交自己预计交论文的时刻,同时General Office和自己的导师就会收到邮件,他们在系统上面认可学生的信息并且提交了才行。导师在这个时候一般都需要确定请哪位教授来审自己学生的博士论文,一般情况下,需要有一位来自外校的教授来审稿,审稿人不能够全部是本校的教授。

到了交论文的时候,需要先去General Office要一堆表格,逐项填好。然后去YIH或者去Queenstown的打印店打印自己的论文,包括封面,侧边和论文的正文。一般情况下,打印四份即可。打印的费用倒是不便宜,四份差不多就可以花掉50.00SGD(如果是150页的论文)。论文的中间有一份声明(Declaration),这一份需要签上自己的名字和交论文的日期。除此之外,还需要找一个光盘,找一个能够刻盘的电脑,把自己的论文刻到光盘里面,光盘的封面签上自己的名字。这个时候,就可以把自己从General Office拿到的表格,以及打印的论文和刻好的光盘一起交到General Office。然后需要等General Office给的反馈,需要自己的导师,系主任和管理人员签字。再拿着这一份签好的表格去YIH的Student Service Centre,这个时候数学PHD交论文需要提交535.00SGD。交了钱之后,YIH的工作人员会给学生一份表格,表示收到了学生的光盘,论文,以及填写好的表格。

之后就是漫长的等待期间,一般来说,从PHD交了论文到答辩时间,需要三个月的时间。这个期间一般来说是没有什么特别的事情的。只不过如果运气实在是不好的话,会被审稿人不停的发邮件要求改论文。不过审稿人也不能够直接发邮件给学生,需要先给学校发邮件,然后转到系里面,再由系里面转给学生。学生回复邮件的时候,也不能够发给审稿人,需要从院系到学校,再从学校到审稿人。算了一下,在2015年2,3月份春节期间,自己被审稿人拉着改论文就有五六次,连休息的时间都没有。一般从交了论文到第七周或者第八周的时候,所有审稿人的评审意见就会寄到学校,由学校的工作人员安排学生的答辩时间。答辩的时候是需要有审稿人到场参与的,所以这个时候需要学生,院系和审稿人三方的沟通,共同选择一个合适的时间。在选择好时间之后,就可以开始准备写答辩的PPT了,一般答辩的时间是由两部分组成,40分钟的学生陈述,20分钟的老师和观众问答。根据学生的表现情况,答辩评审委员会要给出一个结果。一般情况下都会让学生通过答辩,从而进一步拿到学位。另一种情况就是学生的表现没有那么理想,然后评审委员会就要求学生花一段时间(一个月至几个月不等)来修改论文,直到他们满意为止。

答辩结束之后,会收到NUS官方发来的邮件,上面有需要填写的表格。表格里面需要让学生填写版权,是否对外部开放这一类信息。表格的一部分需要导师和系主任签字,这个时候需要把表格提交到General Office,然后他们弄好了之后,学生就可以去取这一堆表格,此刻交到YIH就可以了。这就是交到YIH的最后一份表格。过了几天,就会收到学校发来的邮件,要求学生在一周之内把修改好的论文按照要求上传学校数据库。当学生上传了之后,学生在NUS的论文提交过程就算是结束了。

提交了论文之后,等一个月左右就可以收到NUS邮件寄来的确认函,表示学生已经可以从NUS拿到学位证,学生此刻可以凭借这一份确认函去工业界或者学术界找下一份工作。如果有需要的话,可以报名参加即将到来的毕业典礼。个人觉得毕业典礼还是很有必要去参加一下,去感受一下毕业的氛围,毕竟对于一般人来说,博士学位一生可能只有一个了。

科研这条路

本来是打算交了博士论文之后才开始写这篇文章,但是之前读过网上别的博士写的一些书籍和资料,自己也一直不停的在写blog,所以感觉这篇文章已经基本成熟,再加上最近科研毫无进展,故写一篇文章来纪念一下自己的博士生涯。

1. 专业选择。

可能很多选择本科读数学的人都有这种经历,在高中的时候就有一种所谓的偏科,会把大量的时间花在数学物理上面,而且参加各种竞赛也能够顺利拿奖,对于语文英语就是得过且过。拿竞赛奖状之后,要么就开始保送各个高校的数学系,要么就开始准备高考。高考完了之后面临着选专业的问题,对于一个高中生来说,怎么可能知道大学里面的专业是学什么,几乎就是瞎选,高中擅长学什么就开始选择什么。

2. 本科生涯。

刚进入大学的时候,身边的人要么是竞赛保送的,要么就是高考高分考进来的。在第一年的时候,基本上就开始分成两类人在走。一种是天天努力学习的,一种是几乎不学习的,就靠考试前突击过日子。也不知道是不是高中生活的延续,在第一年的时候非常认真,在数学分析和高等代数上面花费了大量的时间,也做了不少的数学习题。在C++之类的重要课程上面继续不花时间,继续着自己高中的偏科日子。这件事说来也巧,正好在大一的数学分析习题课上认识了张老师。有一次碰巧遇到张老师,他给我说打算下个学期办一个讨论班,讲一下他最近关注的一些书籍和论文,并且说这些书籍只需要大一上学期的内容就可以了。当时听上去很有吸引力,就满口答应下学期开始着手这件事情。到了第二个学期,讨论班果然开始了,再加上廖老师,当时也凑了几个努力学习的同学,就开始读张老师想读的那本书 “One Dimensional Dynamics”。第二个学期的时候,基本上都是张老师在讲,坚持了一个学期,终于把那本书的第一章差不多讲完了。其实当时自己也就是在下面听,但是什么都没听懂,听来听去就感觉在用Lagrange中值定理,确实只用了大一数学分析的内容。说实话,坚持读一本书是非常困难的,尤其是一边还要写论文,还要教学。到了本科第二年的时候,张老师就问我们几个学生,有没有兴趣自己试着讲,当时可能也是想挑战自己一下,就自告奋勇上去讲了一次,虽然自己也只有大一的知识储备量,但是读那本书,一行一行看其实只要花时间还是没问题的。在下面自己花了很多时间,准备了一次,因为都是涉及一些基本的计算,最多涉及到级数求和,所以第一次试讲就非常成功。这样就在无形中极大的激励了自己,坚持这个讨论班坚持了两年。后来到了第三年结束的时候,正好有一个研究生的暑期学校,在尤老师的大力帮助下,推荐我跟着那些研究生一起学习,听一些讲座。就在当时的暑期学校上面认识了现在的老板。

3. PHD生涯。

NUS的第一个学期就收到一篇90页的论文,不过论文里面有个巨大的漏洞,希望自己能够找出来并且把它补上。第一个学期选择了太多的课程,分析,代数,拓扑,PDE,导致自己也没啥时间弄这篇论文。第一个学期的唯一收获就是把博士生资格考试顺利通过了。到了第二个学期,开始读论文了,虽然自己之前也读过论文和相应的书籍,但是给PHD的课题怎么可能那么容易就完成。如果那个漏洞那么容易就补上了,怎么可能十几年没人做那个问题。查一下网上的资料,2006年有人做出了类似的一个问题,不仅顺利发了Annals of Mathematics,还给了国际数学家大会45分钟的报告。相比之下,可想而知自己的这个博士课题有多难。在这个时候自己也没多想,也没想过换一个容易一点的问题,总想着自己一定能够做出来,然后当时办公室位置紧张,没分到办公室座位,于是自己天天都去图书馆呆着,就带着自己的这篇论文,在图书馆里面一页一页的看。

后来到了第三个学期,就要开始博士资格考试的口试了,需要做一个关于自己的研究方向的一个报告,然后系里面会让一些老师来给博士生打分,不行的话就要重新再来一次。在阅读一开始的那篇90页的论文的时候发现需要另外一篇文章作为基础,于是博士资格考试的内容就以另一篇文章作为主要的框架。这个时候我又再次查一下这篇新的文章,同样是发在Annals of Mathematics上面,而且自从1996年之后,关于这个课题也是几乎没有新的结果出现。这个时候开始觉得压力很大了,就去找老板,老板说:课题不能轻易换,你要坚持做。不过这次的资格考试还算顺利,口试一次通过。但是过了之后并不是轻松的开始,反而带来了更大的问题。如果博士资格考试不通过的话还可以拿一个硕士学位走人,但是通过了考试就没有选择了,只能争取博士毕业。苦海无涯,回头已经看不到岸了,只能够竭尽全力地游到对岸。游到对岸就意味着自己需要把论文的课题搞定,需要把一个非常难的问题攻克。于是这个时候就产生了巨大的心理压力,非常痛苦的过了一年。

2013年4月份的时候,一件事情直接把自己从痛苦中敲醒,那就是年过半百的张益唐在孪生素数领域做出了巨大的贡献,并且向Annals of Mathematics投稿,三周后被编辑确认无误并且接收。他的生平经历对年轻人来说是一个非常大的鼓励,至今记得他在youtube上面接受采访的时候与记者的对话。“唐诗宋词?我就说两句,不想说它的出处。庾信平生最萧瑟,暮年诗赋动江关“。看过他的生平事迹都清楚他为什么喜欢这两句诗,因为这两句诗正是他一生的写照。做数学研究的人都知道,过了45岁几乎就不太可能有什么特别大的突破了,45岁以后的体力和精力和20多岁的时候相比都严重下降,很少有人在接近60岁的时候能够完成华丽的逆转,但是张益唐做到了,用自己的实际行动完成了质的飞越。回到自己,在PHD的期间确实走了不少的弯路,领略了很多艰辛和苦涩。正是张益唐成功的事迹激励了自己,只要努力就能够让自己顺利毕业。

再次回到自己的科研上。痛定思痛,决定努力一下重新攻克之前的问题,此时已经是PHD的第三年都快结束了,自己还没有任何结果,办公室的哥们都已经三四篇文章了,师门的师兄们也已经有了自己的paper,而且老板明确表态,毕业的标准就是把自己的论文发表在Ergodic Theory and Dynamical Systems这个杂志上。对于当时没有任何结果的自己,压力山大。于是,为了让自己能够顺利毕业,就逐渐开始奋发图强,再次从那篇错误的文章入手,重新从别的角度来审视那篇文章,看看能够从哪些地方寻求突破。在那篇文章里面,作者着重于研究一个叫做Fibonacci的多项式,在和老板的交流中,发觉可以把Fibonacci多项式做出推广,以寻求新的结果。终于,在PGP宿舍独立工作一个月之后,搞出了自己毕业论文的第一步,也就是Real Bound Theorem。当时总算感觉放松了一下,可是告诉了老板这个结果之后,悲剧再次发生。被老板告知有两个人已经差不多写好了一个的结果(后来我知道他们发表在了Nonlinearity这个杂志上),这就意味着自己不可能凭借这个结果拿到博士学位,需要把原来的问题攻克才能毕业。这个时候PHD的第三年已经结束。

到了第四年,需要轮到自己真正攻克问题了,这个时候必须要做出来才能毕业,没有任何选择的余地,正所谓“置之死地而后生”。导师给的论文课题是关于实系数多项式

f(z)=z^{\ell}+c

的迭代,这里c是实数,\ell是偶数。在这个问题下,没有任何额外的条件,这和那些每次科研遇到障碍就开始加条件的方向截然不同。做科研好比一支部队在打仗,不同的人就有不同的风格。有的人就喜欢在一个鬼都打不到的地方乱放枪,把别人的论文改改条件就变成自己的文章,甚至连自己的条件是不是相互矛盾都不知道。但是有的人立志就是要做难题,这个时候就好比这支部队接到的任务是攻下山头,首先就必须打掉山头上面的碉堡,就需要集中所有的人力和火力来攻取,就必须集中自己的注意力,排除其他所有障碍物。当时为了集中注意力,在第四年的时候自己每天晚上都在系大楼的四楼教室里面呆着,因为安静并且没有人来打扰,特别适合思考问题。除了每天晚上到四楼独立思考问题,每周还要和老板讨论问题,不停的看看有没有新的办法来做原来的问题。单调的生活就这样持续了PHD的第四年。到了PHD的第四年快结束的时候,终于找到方法来突破原来的问题,至少看起来成功的希望非常大。不过悲剧再次发生,用这个方法来研究问题有一定的局限性,是不够完美的,心情再次从大喜到大悲,感觉离毕业又再次远了一步。不过这个时候要是放弃了就前功尽弃了,必须努力向前,作为一个第四年的PHD已经没有时间用来彷徨了。经过两周的不懈努力,终于做出来了,这个时候感觉离学位再次进了一大步。

4. 经验总结。

漫长的故事讲完了,这个时候希望那些觉得自己在数学方面很有天分或者觉得对数学很有兴趣的本科生们长一个心眼,学数学考高分离真正的科研还差得远。一个崭新的科研题目在所有的PHD面前都是人人平等的,都是未知的领域,需要PHD花很多的时间去研究和探索。下面列举的是一个博士生做数学科研需要注意的一些基本事项,当然我也只能够在自己的领域里面说说,别的专业的博士其实和数学还是差挺多的,可以作为参考。

(i) 极强的心理素质:之前高中,本科遇到的练习题,努力一下,和同学讨论一下,说不定都能够搞出来,花上几个小时,几天,甚至几周,基本上就能够搞定。但是对于一个博士生来说,没有任何课题是在几天,几周,甚至几个月之内就能够搞定的。以前在高中和本科的时候都能够不停地做出数学难题,于是就能够给人带来快感,让人越来越有动力,越来越想研究数学。但是在读博士的过程中,这种感觉肯定会烟消云散。取而代之的是长期做不出来问题,读论文带来的痛苦,思考问题带来的绝望。无论一个学生的本科成绩多么的优秀,在有科研经验的老师面前,真的是不算什么。被老板bs很正常,科研成功一次就可以毕业了,甚至就能够功成名就了(参见张益唐)。在这个非常漫长的四年,五年,甚至六七年的岁月里,一个学生要是没有这点心理素质就不要混下去了。正如图片所示:读博士之前一直以为读博士努力下去就会一帆风顺,按时到达。结果实际的情况确是第二种,道路崎岖不平,各种意想不到的艰难困苦,只有克服了这些困难,才能够在PHD这条路上走下去。IMG_3780

(ii) 从开始PHD的那一刻开始,就必须忘记之前自己取得的所有成绩,一切从零开始。以前很轻松的写一下本科毕业论文就可以获得优秀,能够讲讨论班,甚至足够在所谓的SCI杂志上发表,这些只能够说明在本科生当中属于佼佼者。但是开始读博士之后,这些就变得不算什么了。好比你一开始住在五层小楼里面,身边都是平房,自然显得很强。但是后来随着自己的成长,坐标系也就悄悄的发生了变化,身边的人也跟着变化,对手已经不是本科生,而是从本科生中间选出来的优秀者,难度显而易见的增加了许多。

(iii) 对于一个普通的博士生来说,自己想独立搞科研几乎是不可能的,想脱离老板而独立搞科研完全是自寻死路。一开始读博士的时候由于本科的习惯,总自以为自己的想法很牛逼,很可能做出大东西,后来发现这是根本不可能的。作为老板,在科研领域已经打拼了十几年,在经验和能力上面通常都在博士生之上。通常一个博士生自己提出一个东西,要么是别人做过了,要么是根本没有什么意思,没有人在乎。如果让博士生自己选择论文课题,要么选择得太难,根本不可能完成,要么就是别人已经做过了,根本没有继续研究的必要。对普通的博士生来说,奉劝大家,基础不够就老老实实从底层做起,从老板推荐的论文和书籍一点一点的慢慢开始,千万不要想自己去选择一些论文课题来做。往往一个领域有着自己非常难的问题,通常这些问题是不能够直接留给博士生来做的。这个时候不能够从正面去攻取这些题目,需要有一定程度的迂回,而这些迂回往往依赖于导师在本领域摸爬滚打多年的经验。此时导师给学生推荐的书和论文会从侧面帮助学生理解问题,研究问题甚至解决问题提供非常大的帮助。在这个过程中,导师很可能根据学生的科研进度提出阶段性的题目,以降低学生科研的难度。通常来讲,老板提出的问题和想法,博士生有的时候哪怕只是取得了部分的结果和进展,都会远远高过自己独立选择的题目。

(iv) 在博士的生涯中,曾经见过有的老板会帮助学生写论文,甚至送论文给学生,但是并不是所有的老板都会做这些事情。博士生自己做不出来问题,很多老板通常是不会给予非常直接的帮助的,这个时候就需要博士生自己想办法来解决问题,克服障碍。在学校里面,通常的观点是:写不出论文是学生的问题,不是老板的问题。对于一个数学系的博士生来说,即使你的论文想法已经非常成熟,细节全部都能够过去,要把它写成一篇能够发表的论文也是一条非常艰难的路,而且这条路也很不好走。之前本科的时候,一般的关注点都是学生学了多少东西,懂得多少东西。到了博士阶段,已经没有人在乎学过多少东西,在乎的是做出了什么结果,能够发表什么样的文章。要发好的杂志,就需要一个好题目,这个问题通常都是难题。在这些问题前面,每个人都是平等的,都是一个一个独立的灵魂在奋斗。此时此刻就需要博士生自己克服很大的心理障碍,想毕业就要一直坚持做自己的课题,坚持下去才能够知道自己能不能够成功,才能够知道自己究竟能够走多远。在这个过程中,根本不敢去想能够走到哪一步,只能够咬紧牙关坚持走下去。科研这种只有一个人在走的路十分考验一个人的忍耐力和承受力。跟别的事情不一样,比方考试什么的,都是大家一起混,怎么混一般都不至于混到最后。但是科研这种事情,就和一个人到海里面游泳一样。游着游着,猛一回头,尼玛就只有自己一个人在游泳,而且已经看不到岸了,只能够一个人努力往前游。做科研难题的时候,只有自己能够帮助自己,只能够一个人竭尽全力地往前走。

(v) 对于数学系的人来说,由于不需要像别的专业一样做实验,所以时间非常自由,除了干一些教学工作,剩下的时间都是自由安排。这种自由职业者如果时间安排不当,很容易产生拖延症,陷入PHD的时间陷阱而不能自拔。对于搞纯数学的PHD来说,一个PHD的课题绝对不是在几个月之内就可以完成的,一定会有一段时间没有任何的进展和突破。这个时候由于要克服自己的心理压力,很容易在自己的科研课题上面产生拖延症,好比牛顿第一定理,在没有外力的催动下,自己的课题一定会停滞不前,能毕业日期也就离自己越来越遥远。如果出现这种问题,需要及时克服自己的心理障碍,战胜拖延,免得造成更大的困扰。

phd030801s

最后一条,如果一个人在本科或者硕士毕业的时候在工作和读博之间摇摆不定的话,这个时候选择工作基本上是正确的。如果本科或者硕士论文都写得要死要活的学生,是非常不适合继续读下去的。哪怕博士生涯刚刚开始,这个时候立刻逃离也是非常明智的决定。做科研的时候需要把它当成一份事业,而不是当成一份工作。世界上有很多的工作可以做,为什么选择一条那么艰难的路来走呢。其实,要做一番事业,无论是任何领域的,都需要一个人不计回报的付出,不能够像干工作的时候那样计较加班费和休息时间。只要一个人在做的是自己的事业而不只是工作,无论这份事业本身能够带来多少的收入,无论在别人的眼光里面这怎么也算不上一个成功者的案例,在坚持做这个事业的过程中,就已经成功了。看着张益唐的视频,想想也觉得“庾信平生最萧瑟,暮年诗赋动江关”是一件非常幸福的事情。

参考资料:

重生的数学家张益唐

Ergodic Properties

One Dimensional Dynamics

— Welington De Melo, Sebastian van Strien

Chapter 5. Ergodic Properties and Invariant Measures.

1. Ergodicity, Attractors and Bowen-Ruelle-Sinai Measures.

A distortion result for unimodal maps with recurrence

Given a unimodal map f, we say that an interval U is symmetric if \tau(U)=U where \tau:[-1,1]\rightarrow [-1,1] is so that f(\tau(x))=f(x) and \tau(x)\neq x if x\neq c. Furthermore, for each symmetric interval U let

D_{U}=\{x: \text{ there exists } k>0 \text{ with } f^{k}(x)\in U\};

for x\in D_{U} let k(x,U) be the minimal positive integer with f^{k}(x)\in U and let

R_{U}(x)=f^{k(x,U)}(x).

We call R_{U}: D_{U}\rightarrow U the Poincare map or transfer map to U and k(x,U) the transfer time of x to U. The distortion result states that one can fined a sequence of symmetric neighbourhoods of the turning point such that the Poincare maps to these intervals have a distortion which is universally bounded:

Theorem 1.1.  Let f:[-1,1]\rightarrow [-1,1] be a unimodal map with one non-flat critical point with negative Schwarzian derivative and without attracting periodic points. Then there exists \rho>0 and a sequence os symmetric intervals U_{n}\subseteq V_{n} around the turning point which shrink to c such that V_{n} contains a \rho-scaled neighbourhood of U_{n} and such that the following properties hold.

1. The transfer time on each component of D_{U_{n}} is constant.

2. Let I_{n} be a component of the domain D_{U_{n}} of the transfer map to U_{n} which does not intersect U_{n}. Then there exists an interval T_{n}\supseteq I_{n} such that f^{k}|T_{n} is monotone, f^{k}(T_{n})\supseteq V_{n} and f^{k}(I_{n})=U_{n}. Here k is the transfer time on I_{n}, i.e., R_{U_{n}}|I_{n}=f^{k}.

Corollary. There exists K<\infty such that

1. for each component I_{n} of D_{U_{n}} not intersecting U_{n}, the transfer map R_{U_{n}} to U_{n} sends I_{n} diffeomorphically onto U_{n} and the distortion of R_{U_{n}} on I_{n} is bounded from above by K.

2. on each component I_{n} of D_{U_{n}} which is contained in U_{n}, the map R_{U_{n}}:I_{n}\rightarrow U_{n} can be written as (f^{k(n)-1}|f(I_{n}))\circ f|I_{n} where the distortion of f^{k(n)}|f(I_{n}) is universally bounded by K.

As before, we say that f is ergodic with respect to the Lebesgue measure if each completely invariant set X (Here X is called completely invariant if f^{-1}(X)=X) has either zero or full Lebesgue measure. An alternative way to define this notation of ergodicity goes as follows: f is ergodic if for each two forward invariant sets X and Y such that X\cap Y has Lebesgue measure zero, at most one of these sets has positive Lebesgue measure. (Here X is called forward invariant if f(X)\subseteq X.)

Theorem 1.2 (Blokh and Lyubich). Let f:[-1,1]\rightarrow [-1,1] be a unimodal map with a non-flat critical point with negative Schwarzian derivative and without an attracting periodic points. Then f is ergodic with respect to the Lebesgue measure.

Theorem 1.3.  Let f:[-1,1]\rightarrow [-1,1] be a unimodal map with a non-flat critical point with negative Schwarzian derivative. Then f has a unique attractor A, \omega(x)=A for almost all x and A either consists of intervals or has Lebesgue measure zero. Furthermore, one has the following:

1. if f has an attracting periodic orbit then A is this periodic orbit;

2. if f is infinitely often renormalizable then A is the attracting Cantor set \omega(c) (in which case it is called a solenoidal attractor);

3. f is only finitely often renormalizable then either

(a) A coincides with the union of the transitive intervals, or,

(b) A is a Cantor set and equal to \omega(c).

If \omega(c) is not a minimal set then f is as in case 3.a and each closed forward invariant set either contains intervals or has Lebesgue measure zero. Moreover, if \omega(c) does not contain intervals, then \omega(c) has Lebesgue measure zero.

Remark. Here a forward invariant set X is said to be minimal if the closure of the forward orbit of a point in X is always equal to X. The attractors in case 3.b is called a non-renormalizable attracting Cantor set, or absorbing Cantor attractor or wild Cantor attractor. Such an attractor really exists which is proven in [BKNS], and one has the following strange phenomenon: there exist many orbits which are dense in some finite union of intervals and yet almost all points tend to a minimal Cantor set of Lebesgue measure zero (this Cantor set is \omega(c)). The Fibonacci map is non-renormalizable and for which \omega(c) is a Cantor set. It was shown by Lyubich and Milnor that the quadratic map with this dynamics has no absorbing Cantor attractors. More generally, Jakobson and Swiatek proved that maps with negative Schwarzian derivative and which are close to the map f(x)=4x(1-x) do not have such Cantor attractors. Moreover, Lyubich has shown that these absorbing Cantor attractors can not exist if the critical point is quadratic. However, Bruin, Keller, Nowicki and Van Strien showed that the absorbing Cantor attractors exist for Fibonacci maps when the critical order \ell is sufficiently large enough.

Theorem (Lyubich). If f:[-1,1]\rightarrow [-1,1] is C^{3} unimodal, has a quadratic critical point, has negative Schwarzian derivative and has no periodic attractors, then each closed forward invariant set K which has positive Lebesgue measure contains an interval.

The next result, which is due to Martens (1990), shows that if these absorbing Cantor attractors do not exist then one has a lot of ‘expansion’. Let x not be in the pre orbit of c and define T_{n}(x) to be the maximal interval on which f^{n}|T_{n}(x) is monotone. Let R_{n}(x) and L_{n}(x) be the components of T_{n}\setminus x and define r_{n}(x) be the minimum of the length of f^{n}(R_{n}(x)) and f^{n}(L_{n}(x)).

Theorem 1.4 (Martens). Let f be a C^{3} unimodal map with negative Schwarian derivative whose critical point is non-flat. Then the following three properties are equivalent.

1. f has no absorbing Cantor attractor;

2. \limsup_{n\rightarrow \infty} r_{n}(x)>0 for almost all x;

3. there exist neighbourhoods U\subseteq V of c with cl(U)\subseteq int(V) such that for almost every x there exists a positive integer m and an interval neighbourhood T of x such that f^{m}|T is monotone, f^{m}(T)\supseteq V and f^{m}(x)\in U.

神户牛肉

神户牛肉,根据神户肉流通推进协议会的定义,是出产于日本兵库县的但马牛肉。但马牛是和牛的一种,饲养方式独特,其肉则为日本料理中的珍馐,特性表現为美味、肥嫩以及外表所呈現出的大理石纹理。神户牛肉可以做牛排、寿喜烧、日式火锅、铁板烧或刺身。

不仅在日本国内,神户牛肉在海外知名度也相当高,是世界最高级牛肉的代名词。2009年美国媒体侨报网选出「世界最贵9种食物」﹐其中神户牛肉与金箔、白松露、鱼子醬、金钱猛鱼、藏红花、麝貓咖啡 、香草 、鹅肝醬一同列入,以每磅超过150美元的价格排行第六。

历史:

神户牛肉的传说1:

1868年, 开国当时还是港口城市的神户。在食肉文化还没有扎根的当时,人们是如何发现“神户牛肉”的美味的呢?

(i) 国际性的港口城市神户1868年作为国际港对海外开放门户的神户。在许多外国人移居的这个国际性的城市,日本传统和外国文化出现了交集。 在食肉文化还没有扎根的当时,第一次在神户品尝但马牛的据说是一位英国人。他品尝了农夫们农业作业用的但马牛后一定认为这味道简直是天赐的美味。据说在这之后进入神户港的外国船也开始要求购买这里的牛,并且不知不觉地人们就开始管它叫“神户Beef”了。

(ii) 时任当权者喜爱的美味神户港开港同年,伊藤博文出任兵库县首代知事。作为从英国留学归来的国际派而扬名的伊藤作为出力整备神户的外国人居住地的人物也非常有名。就是这样一个人,据说也留下了喜欢吃神户牛肉的逸闻。

神户牛肉的传说2:

其美味被铭刻在美食历史上已有1个多世纪之久。全世界的名人到访日本享受的乐趣之一,品尝神户牛肉在100年前和现在都相同。

(i) “去日本一定要享用神户牛肉”美国总统奥巴马在2009年来日本时点名要在日本品尝神户牛肉已成为了一段有名的佳话。除奥巴马总统外,欧美的政治家,王室成员,好莱坞明星等世界名流来日本时想品尝神户牛肉的层出不穷。最近希望去牧场一游的请求据说也不少。

(ii) 名字竟取自对神户牛肉的回忆?美国职业篮球界首屈一指的知名选手科比布莱恩特的名字,实际上“KOBE”的发音是美语化的。据说是他的父亲来日本时吃到神户牛肉的牛排并为之感动,所以给他取了这个名字。即使时光流逝,但神户牛肉的味道仍鲜活地留在人们的记忆中。想必那美味今后也还会继续迷倒全世界的舌头。

美味的特点:

细腻,极为上乘的,口感甘香的红肉,将脂肪的味道和香味浑然融合在一起的风味。 神户牛肉美味的秘诀就在其含有人类肌肤的温度都可使之立即融化的低熔点雪花状脂肪密集地分布在肌肉中,也就是所谓的“霜降”。另外也经科学分析证实其富含决定美味因素的肌甙酸和油酸。

[霜降]
熔点低的雪花状脂肪密集地分布在肌肉中。

[红肉]
肉质极为细腻,口感上乘甘甜。

[美味成分]
富含决定脂肪味道关键因素的油酸和美味成分的肌甙酸。

Screen Shot 2014-12-03 at 12.14.20 pmScreen Shot 2014-12-03 at 12.14.53 pmScreen Shot 2014-12-03 at 12.15.08 pmfeature-03

名门纯种牛的血统:

(i) 风土
但马牛的故乡是在面向日本海,平原少的兵库县北部山地名为但马的地方。该地起源悠久,早在平安时代初期的“系列日本纪”中就能找到有关对但马牛的记述。但马牛体型小但强壮,由于行动灵活,主要被用于在狭小的梯田从事农业作业和搬运货物的工作。昼夜温差大,夜间降露水,这个地方生长的柔软鲜嫩的牧草和富含矿物质的山泉水形使但马牛形成了特有的肉质。
(ii) 得天独厚的资质
拥有薄而富有弹性的皮肤和像羽毛一样轻软的毛,结实肌肉的但马牛。肉质的美味自不用说,由于骨头细小皮下脂肪少的缘故,其可食用的部位多,简直是拥有天赐的用来食用资质的最棒的品种。从这种血统代代诞生的性情温顺,体型和性格良好的牛逐渐也在但马地区以外的兵库县内各地被饲育。
(iii) 卓越的遗传力
但马牛有很强的遗传力,被用作全国的和牛品种改良的纯种牛。改良系统中固定的最优秀资质的系统被称为“蔓延系统”。从该系统诞生出的牛被称为“蔓牛”。但马牛中现存的有“ATSUTA 蔓”,“FUKI蔓”和“YOSHI 蔓”这3大蔓牛。作为代代继承了优秀基因的牛占据着主导地位。
(iv) 纯正血统的传承
作为纯种牛被视作珍宝,现在在日本各地的名品牛身上都有来自但马牛的基因。但其中兵库县产的但马牛至今还保持着避免和其他府县的和牛交配,以保持使其血统完全纯正的做法。全力保护珍贵遗产“但马牛”和“神户Beef”的农家们所倾注的爱和他们的自豪感使这种得以夸耀世界的品质延续传承。

严格的认定标准:

即使在“但马牛”种,也只有符合一定品质标准的牛才能得到“神户牛”的称号。

(i) 子牛的繁殖

在兵库县内的繁殖农户处(指定生产者)出生的但马牛血统的子牛首先需要在牛的户籍簿上登记注册,并在耳朵上安装一个10位数的“个体识别码”。判断什么样的血统可以诞育子牛、更加清楚地鉴定良种交配、将子牛健康地培育到9个月的月龄就是繁殖农户的任务。

(ii) 育肥

育肥农户(指定生产者)在子牛家畜市场买进出售的子牛,并在没有压力健康的环境中对其倾注爱心,时间和精力进行培育。子牛所食的是经过严格筛选的稻草,玉米和小麦等饲料,所饮的是清澄的水,最低月龄在28个月以上,平均为32个月的时候最接近理想的肉质。
(iii) 出栏 
在兵库县内的肉食中心进行屠宰。各種、進行检查,合格的牛将在骨腿肉市场被作为“兵库县产但马牛”出售。
(iv) 等级划分

只有那些从最高等级的但马牛中挑选的,必须是未产过子的牛和阉割牛,骨腿肉等级符合以下条件的牛才能被称为“神户牛”。●表示霜降程度的「BMS」在6级以上
●红肉比率(成品率等级)是A_B等级
●骨腿肉重量在470kg以下
●肉质细腻,细致紧凑程度卓越

关于出口牛肉:

2012年之前,神户牛肉从未出口。2012年,神户牛肉业界组织鉴于神户牛肉在本地销售不理想,加上农作物关税废除等跨太平洋伙伴协议(TPP)的推动,決定首度向海外出口神户牛肉。2012年2月2日首批神户牛肉出口到澳门。2012年7月输出神户牛肉到香港。2012年11月29日首次出口到美国。现在也出口到新加坡和泰国。

神户牛肉出口记录

备注:

1. 维基百科-神户牛

2. 神户肉流通推进协会

[转载]昔日“奥数天才”不逼女儿学奥数 大量时间研究数学

他被誉为天才少年,李修福的得意弟子

他是国际奥林匹克数学竞赛满分金牌得主

他麻省理工学院博士毕业后,如今是浙大数学讲师

对于别人说他是否成功,他有自己的态度

东北网5月10日讯 7日,《“奥数教父”李修福的反思》刊发后,李修福的纠结、个体反思,引发了家长、老师及社会各界的群体性反思。你的孩子在为奥数纠结吗?奥数到底学不学,怎么学?当教育变成应试,成材的标准又是什么?连续两届国际奥林匹克数学竞赛满分金牌得主、李修福的得意弟子罗炜,当年的天才少年,他认为自己成材了吗?昨天,记者带着诸多问题,连线罗炜。

 现在大量时间在做数学研究

罗炜话少,冷静得像在分析他的数学问题。

从哈师大附中毕业后,罗炜被保送到北京大学数学系,大学毕业之后到麻省理工学院读博士。他说:“要进行学术研究的话,都要申请读博士。”

回国后,罗炜到浙江大学数学中心当了一名老师,今年38岁了。

“现在是教授了吧?”记者问。

“没有,讲师。”罗炜淡淡地回答。

他简单地介绍了一下自己的研究领域,那是关于数学、物理有关圆的问题,还有应用的一些问题。不是只做一个领域,和组合、计算机图形有关的。

对于记者在内的圈外人来说,这个实在太专业了。至于在学术成果上,他说自己发表论文的刊物比较普通,没有TOP(顶尖)的。

记者试问:“你是不是太谦虚了?”

“不是,可以查得出来的。”和李修福老师一样,他在用1+1=2的数学思维,说着自己的话。

作为大学老师,罗炜有自己的学生,一般来说,一星期有五六节课。剩下的大量时间,他都用来做研究了。浙大的数学中心,也是一个研究所。

对于为什么没回到母校北大工作,罗炜称没有机会,另外,回北大也不一定很好。一个好学校,在某种程度上能给学生很大的自信心,在文化方面的培养可能也有好处。而对于工作的话,要考虑工作的自由程度,另一个是待遇。

辉煌已成过去 现在很低调

提到哈尔滨人仍关注着他,他还是很多人的偶像,罗炜好像很意外:“大家很关心吗?”仿佛说的不是他自己。

他说自己不太在意这个,在意了是会有压力的,所以反而喜欢低调,没人注意。

当然,他承认自己人生最辉煌的是得金牌的那段日子。只不过大学以后开始低调了,是刻意的低调。比如说,不爱说话,不主动发表意见。

至于周围人对他的看法,是否觉得他傲气,他称自己不知道,没人跟他说,他也不太在意别人的看法。即使别人有那样的错觉也是临时的。如果是自己认为有意思的问题,他愿意真诚交流。

他说,自己现在接触的人很多都是喜欢数学的。这些人不在意人对人的态度,这是他们这个圈子里人的特点。

不强求女儿学习奥数

为了升学,目前很多家长逼着孩子学奥数。

对此,罗炜直言,奥数还是比较难,如果没什么兴趣,碰到难题的话,对自信心、学习兴趣的影响都很大。可能就比较讨厌了。连带着可能其他的学科也学不好。因此,学奥数如果孩子很喜欢,就好,如果不喜欢就没什么意思。

当然,很多孩子学奥数是为了考试。因为学校也希望找到比较聪明的学生,学数学确实能看到这方面的领悟力。如果要上好学校,就要证明自己。

“你的孩子学奥数吗?”记者问。

罗炜说,女儿很小,才一岁。但她长大后,他会尽量引导她的兴趣。但不会强逼着她学,她有她的自由,不学坏就行。

我不在意别人怎么看我

兴趣,是孩子成材最重要的。罗炜执此观点。

“我觉得一个小孩不喜欢的话,不可能成材。大部分还是看他是不是把时间都充分地利用起来,去做喜欢的事情。老师讲得好也是次要的。老师只是告诉你有一个好的东西,需要你去探索、去学习。而靠老师手把手地教,不会有出色的学生。”

罗炜说,成材本身就是一个社会标准,到底是别人觉得你的孩子很好,还是自己很开心、很满足,每个人的看法不一样。

曾经的金牌,曾经的第一,罗炜又是怎样看待现在的自己?他说:“其实自己不在意别人的评价,成材不成材是自己对自己是否满意的事情,别人的标准都可以忽略。我的思维方式可能和别人不一样。”

正因为这样,所以罗炜对自己的现在很满意,觉得挺好的。比较重要的是,自己现在比较自由,有自己的时间做喜欢的数学研究。

记者随后在他的QQ空间看到,他的空间也叫做“数学的无限空间”,在那里,你会发现有几百篇的专业数学证明题,也有很多对此有兴趣的网友参与其中。

“包括恩师李修福在内,人们对你的期望值很高。”记者又扔出了一枚“砖块”。

罗炜犹豫了一下:“是吧。我没考虑过这个问题,我觉得不需要完成任何人对我的期望,因为这是我自己的事情。”

“李修福老师说了,捡破烂儿也得捡第一呀。”记者用李修福老师的话反问罗炜。

“这个价值每个人看法不同,争第一是一种,提高自己也是,不争也可以。”罗炜这样看。

前两年曾回过哈尔滨

对于故乡哈尔滨,罗炜很少回来,因为父母都在北京。父亲是电机学教授。上高二时,父亲工作调动到北京,一家人迁居北京。罗炜在清华附中借读。

在北京定居的父母,也经常来杭州看儿子,现在还要看的是一岁多的小孙女——可爱的歆艺。罗炜说现在在家都不太上网了,女儿淘气,不时过来捣乱。

回哈尔滨,只是前两年有一次,是师大附中找他讲课。当然还是讲奥数的事。据他讲,现场的效果挺好,同学们注意力很集中,还是愿意听他讲。

30多岁,正是忙事业、忙家庭的时候,罗炜也不能例外,如今只有一个初中同学一直联系,其他的都没联系了。由于高二下半学期转到清华附中借读,和哈尔滨的高中同学在一起时间都不长。他的高中校友也有一个学数学的,只记得好像在北京大学数学系。

罗炜的时间大部分是属于数学的,他告诉记者马上要去搞科研了,匆匆道别。记者截稿时,罗炜肯定还在自己的研究室里忘我地工作。

不管他将来是不是华罗庚、陈景润,他在做自己喜欢的事,在自己的领域里创造价值。沙子里的金子是极少的,更多的还是普通的沙子,这样才有浪漫美丽的海滩吧。

超前学习 不如打好基础

奥赛冠军怎么学数学?罗炜介绍,他基本上就是看书、做题。那时候有几本奥数习题书,拿来尽量看、做,不会的,就看答案,分析人家是怎么解答的。

因为自己有兴趣,所以花了很多时间在数学上,也影响了一些其他学科的学习,有点偏科。语文在初中一般80多分,高中70多分(按满分100)。其他的理科也都能打90多分,所以整体上没影响升学。

对于现在很多初中生超前学习,罗炜很不赞成。他称,虽然是出于中考的需要,但这不算是很好的学习方法。学数学要按顺序一步一步来,逻辑关系、难易程度、思维方式,都是有台阶的。假如基础打不好,后面很吃力,越学越难。学数学总要做题的,学太快理解得不够深。

很多学生到高中跟不上。是初中的学习方法没让他适应高中的学习,还有很多高中考得好,大学也学不好的。

“把你看过的要弄懂,要能用来做题,这是基本方法。”罗炜说,做题,不是题海战术,是要把你学的概念能应用。

他的一个有用的方法是:做题后要总结自己的方法,或者看到的方法,做题中比较关键的步骤是什么,这样才会对今后的学习有帮助。而不是一种题型做好多遍。

“一种题型会做了,知道怎么做了,也知道结果怎样,实际上就没必要再做同样的了。”他说,我知道怎么做的,就跳过了,做更难的题。

如果初中没打好基础,到了高中发现不会了,别人学新的东西,你还要补旧的,你就得再不停地补。

原文链接:

http://heilongjiang.dbw.cn/system/2013/05/10/054758366.shtml?from=singlemessage&isappinstalled=0

[转载]关于如何写正式英文email的总结

这里说的是比较正式的email,如:写邮件联系国外教授要资料,或者商业email….

感觉自己还有些地方不是很懂..尤其是一些礼貌,句子语气之类的.

说来有些惭愧,学了这样多年英语居然不会用英语跟人交流.只会看看英文电影,读写纸面英语…教育的悲哀?

查资料的过程中发现国外的老师是会辅导大一的学生跟授课的老师(professor)之类的如何联系的…

其实国外的人比我们规矩多……小总结下,希望对某些人有用.如有谬误欢迎鸡蛋.

一:常识:

1.要用教育网邮箱,避免被过滤掉。地址格式直接用wi@cqu.edu.cn>避免其他格式某些系统不支持。

2.地址栏只有一个地址,不要同时发给几个人,尤其是不要让一个接收者知道。就是避免在接收者收到的邮件里面看到正文前面一串邮箱地址:(1)不安全,把某些人的邮箱传给了不认识的人。(有时候居然发现有些人写满自己个人信息群发邮件。。)(2)一个问题发给两个人,两个人如果都觉得对方会回答,你的问题就没人回答了。

3.写完,发之前要通读几遍,找错误,最好找别人读一下,看会不会被误解。尤其是要核对后面“句型和句子的注意事项”中的问题,确保在邮件中你显得比较专业,比较认真。。尤其是在找人帮忙或问问题的时候。

4.如果问问题或索要资料,要交代清楚背景,避免收件人不知所问。

二:整体格式框架注意事项:

1 . 称呼和正文之间,段落之间,正文和信尾客套话之间一般空一行,开头无须空格。有多个要点时,分项列举或分行以便于阅读。(参考最后的例子);

2. 介绍自己。

联系关系比较淡,或陌生人时要在开头简单介绍下自己的主要信息,姓名,职业,等。

3. 不要把某个词全部大写,这样常会被认为是在吼叫或骂人(很不礼貌)。如果要强调某些词语或句子用底线,斜字,粗体就可以了. 如:MUST change to OS immediately. 外国人就觉得不礼貌和喝令人一样. 要强调的话。

4. 不要用简写和笑脸等符号 J,不要用长词和不常用的词语。简单的单词便于理解。

( 其实估计我们也只会常用的词语)。。。

5. 整个email不要太长,每个段落不要太长,每个句子不要太长,不要用结构复杂的句子。

大家不喜欢读长的,太长可能人家就不读了。整个email不要超过一个屏幕.即:不需要scroll就可以看完。一个段落大概只由一到三个句子组成。 一个句子不超过15-20个词。

三:标题:

1. 要写一个 meaningful 标题。不要太宽泛,不要含糊不清,不要太长,一般不要超过35个字母,只需要将位于句首的单词和专有名词的首字母大写.

比较下面几个:

“Product A information “ is good than “product information”.

“News about the meeting” vs “Tomorrow’s meeting canceled”.

professional trainees from sister company should abide by rule of local company(太长)
可以写出自己的主要目的

“Could I please get the assignment for next Wednesday?”

2. 视信的内容是否重要,还可以开头加上URGENT或者FYI(For Your Information,供参考),如:URGENT:Submit your report today!
但别乱用,否则就成了喊狼来了的小孩子了.

四:email头称呼:

Dear Professor Sneedlewood  即:Dear Professor +lastname, 千万不要用first name称呼。千万不要写错名字,头衔(会很让人反感),有的人有荣誉学位就不喜欢用一般头衔.

Dear Committee Member:  注意:冒号是可以用的.

不要用词给人鲁莽感觉的词语.(老实说还真不知道英文里面那些词鲁莽除了fuck,shit,bullshit).如果文中要用he ,she,madam,……要查收件人性别,确保无失误。

五:段落:

1. 段落开头写重要的和要强调的事情.同样重要的事情要写在句子首.

(1)Because he was unable to attend the meeting personally, he forwarded his congratulations on cassette tape.
(2)He forwarded his congratulations on cassette tape because he was unable to attend the meeting personally. 两者强调的事情就有分别了.

2. 轻重有分, 同等重要的用and来连接,较轻放在次要的句子里.

六:句型和句子的注意事项.(结合了一些商业email和联系教授email的混杂例子)

1. 用主动句型而不是被动。

“We will process your order today” is more personal than “your order will be processed today”. 后者用太多,sounds unnecessarily formal.

2. 那么I和you呢?好烦好烦.一般来说,收信人的利益比较重要,名义上都要这样想.给人尊重的语气就一般不会错了. 多用you有时会有隔阂的感觉.
You will be pleased to learn that you have been selected to serve on our advisory board. Your prompt response will be appreciated. (好像欠你一样)
I am pleased that our board has selected you as the best qualified candidate to serve on our advisory board. I hope you’ll agree to serve. (这就友善多了)
Your book was well written and comprehensive. (不用你来判断我呀~~)
I thoroughly enjoyed your book and found an answer to every one of my questions about performance appraisals. (客气一点,人家受落)
总之,语气和宾词的运用得当能决定你的礼貌程度.

3. 亲切,口语化是比较受欢迎! 用宾词和主动的词,让人家受落.
例如: (1)This information will be sincerely appreciated.”
(2) We sincerely appreciate your information. 明显地,我们会喜欢第2句.

4. 要求人做事要有客气Ask politely.

“Could you please email me the page numbers for the next reading? Thanks!” sits better than “I need the assignment. Please send it.” It’s a Golden Rule kind of thing, right?

尽量减少词数,如:on a regular basis =====regularly.

5. 不可主客不分或模糊.

Deciding to rescind the earlier estimate, our report was updated to include $40,000 for new equipment.”  应改为:Deciding to rescind our earlier estimate, we have updated our report to include $40,000 for new equipment. (We决定呀, 不是report.)

6. 结构对称,令人容易理解. The owner questioned the occupant’s lease intentions and the fact that the contract had been altered with ink markings.
应改为: The owner questioned the occupant’s lease intentions and ink alterations of the contract.

7. 单数复数问题:
例如: An authorized person must show that they have security clearance.

8. 动词主词要呼应. 想想这两个分别:
1)This is one of the public-relations functions that is underbudgeted.
2)This is one of the public-relations functions, which are underbudgeted.

9. 时态和语气不要转变太多.看商务英语已经是苦事,不要浪费人家的精力啊.

10. 标点要准确.
例如: He did not make repairs, however, he continued to monitor the equipment.
改为: He did not make repairs; however, he continued to monitor the equipment.  (没想到老外也用分号啊 !!);

11. 选词正确. 好像affect和effect, operative和operational等等就要弄清楚才好用啦.

12. 拼字正确. 有电脑拼字检查功能后,就更加不能偷懒.

13. 意思转接词要留神. 例如: but (相反), therefore (结论), also (增添), for example (阐明). 分不清furthermore和moreover就不要用啦.

14. 修饰词的位置要小心,
例如: He could only reimburse the cost after July 15.
应为 He could reimburse the cost only after July 15.

15. 用语要肯定准确.切忌含糊.
例如:The figures show a significant increase.” 怎样significant,
改为: The figures show an increase of 19%.

16. 立场观点一致. 少用被动语.
例如: Partial data should be submitted by April.
改为: You should submit partial data by April.就很好了.

17. 求人做事,最后写:thanks 即可.

七:结尾

要写自己全名,比较详细的东西。。。

1. 格式问题,

Ken Green

Vice president, Unicom China.

下面这个不如上面的

Ken Green

Vice President of Unicom China (其实就多个”of”,但没办法要专业…要专业.)

2. 书信的结尾致意要留意,弄清大家的关系才选择用词,例子:
(1) Very Formal非常正规的(例如给政府官员的)
Respectfully yours, Yours respectfully,
(2) Formal正规的(例如客户公司之间啦)
Very truly yours, Yours very truly, Yours truly,
(3) Less Formal不太正规的(例如客户)
Sincerely yours, Yours sincerely, Sincerely, Cordially yours, Yours cordially, Cordially,
(4)Informal非正规的(例如朋友,同事之类)
Regards, Warm regards, With kindest regards, With my best regards, My best, Give my best to Mary, Fondly, Thanks, See you next week!

八: 获得别人回复要再回复:Thanks .

九: 如果没有回复,一周后可以再发个提醒一下。

例子:

To: Carmine Prioli <prioli@social.chass.ncsu.edu>

Subject: Will be absent next Wednesday. Could I get the assignment?

_______________________________________________________________

Hi, Dr. Prioli-

I will be playing my cello for a friend’s conference performance in San Antonio, TX next Wednesday, Thursday, and Friday (November 16, 17, & 18).

I am afraid my Wednesday flight leaves before your Colonial Literature class. Could I please get the assignments for that day so I can prepare for Monday?

Thanks!

Susanna Branyon
Colonial Lit, MW 1-3pm

一个外国老师说的如何写英文邮件联系教授——老外的规矩比我们多多了 。

How to write clear emails to your professor (or, why I currently think my undergrad students are rockstars)

we talk about how to address faculty and staff (a hint: call them “Dr” or “Professor” as a default, and they may tell you to call them something else if you’re lucky).

Together we came up with the following guidelines:

Write a clear subject line that actually summarizes what the question is and what it might be connected to in the course.

Address me in the email, and remember to call me “Dr.” or “Prof.”

Give me some context for the question, situating it in the particular assignment or activity you’re working on.

Punctuate. Capitalize appropriately. Use complete words and sentences; this is not texting. Check your spelling.

Be specific and detailed about what the difficulty or challenge is regarding.

Ask an actual question, rather than leaving it up to me to infer what you don’t understand.

Be nice and thank me for answering.

Sign your full name and give what ever institutional markings might be helpful for me to keep this in context.

例子:

Dear Dr. Pawley,
Our lab group was working on the class project for ENGR 126 and we didn’t understand one of the requirements (#4). Can you please clarify for us what you mean by “what the experts say”?
Thanks
Astu Dent, Team 4

一个微软的人写的seek  job 电子邮件写法,抱怨了一大堆不过感觉很有道理;

Sounds simple but so many people screw it up. Seth talks about writing a personal email. But I see these mistakes in the emails I get from job seekers and people trying to get my attention for some other professional reason. Listen up staffing tools vendors, agency recruiters and the people that want me to introduce them to some nameless person within Microsoft that they can contact about their business idea/product concept, etc. Yeah, let me get right on that. I have a ton of extra time and absolutely no priorities. And I definitely would not rather be spending my time doing something else. Ooh, snarky.

I think the worst offenders are the folks that contact me through LinkedIn looking for a job. I can’t even tell you how many of these rules have been broken. But let’s just say that cut and paste isn’t always your friend. If you don’t take the time to craft an email that, say, addresses me by name and/or references my company, then can you really expect that I will take the time to review your resume and forward it along to the recruiters here? Really?

I get a lot of mail from people that don’t really know what they want to do at Microsoft. Oh yes, I actually do. If they don’t know, how the hell am I supposed to know? I always send them to our career site to find some positions that they could be interested in. I would like to believe that they are just experiencing a momentary lapse of reason and are not expecting me to wade through all of our open positions in order to find the ones that would be a fit for their background and that they would personally enjoy. You know, because I know them personally.

The thing is that I actually want to help people. But not if it’s a waste of my time. And helping people that don’t have the good sense to not spam a bunch of staffing folks or do a little research so they know who they are asking for help is definitely wasting time. So here are some of my rules for sending a job search email:

1) Address me personally. If you don’t, I know….KNOW that you are cutting and pasting. And if that is the case, I know that you think that your job search is a numbers game. Knock on enough doors, etc. That makes me think that you are not a sought after prospect. Or, it makes me think you are lazy. Either way… not good.

2) When and if you do address me by name, make sure it’s my name. We all know what mail merge is. Refer to #1 above. And on the same note, that whole “Sir/Madam” thing? Come on! Even if you are not from the US, you have access to the same interwebs I do and can identify “Heather” as a female name. Nobody has ever called me “madam” to my face…ever! Or “sir” for that matter.

3) You don’t have to send me a long email with a narrative of your professional life. It’s best to tell me where you work and what you do plus a little about any previous work that is relevant to the position that you are looking for (“I am currently working as an account manager at XYZ and previously worked at ABC in tech support.”), plus any experience with specific markets (“My experience is primarily in the healthcare and biomedical industries.”) and what you are looking to do (“I would like to get back into a role where I can utilize both my account management and technical expertise. I noticed a position open at Microsoft for a Technical Account Manager, focused in healthcare and feel I would be a good fit.”). The goal is to get the recruiters to view your resume, not to restate the resume. The email is, at most, a teaser.

4) If you are open to relocation, state it up front. It’s one of the first questions we will ask you.

5) If you reference specific positions or groups, include a job code from our career site. You should spend time on our career site looking regardless. Including job codes helps me get your resume to the right person. It also shows me that you are serious.

6) Don’t tell me you are willing to “do anything.” Wow, that is a red flag! OK, well first, nobody is qualified to do any/every job. So it’s not smart. And it sounds desperate. I know that it’s hard if you are out of work; that is probably an understatement. But despite this fact, you want to make employers feel that they would be fortunate to get you. Because you got skillz.

7) Don’t tell me about your personal life. There is some stuff that I am more comfortable not knowing. If you are sending an email to inquire about open positions, include only information that is relevant to the position. I know that people ask for advice and include a little personal info, and that is fine. But if you are reaching out to me about a position, I don’t need to know that the reason you want to relocate is that your mother-in-law is living with you and you’d like to leave her behind because she chews loudly. Just sayin’.

8) Attach your resume from the beginning. I’ll look at it and forward it along to any appropriate recruiters. It’s how I roll. So withholding it and asking me to tell you more about the position is just going to result in extra emails.

9) You can ask me to spend some time talking to you about a position or group, but it’s not going to happen. Of course we all want that. It might be reasonable if you are reaching out to a recruiter and you have all of the requirements of an open position (be honest with yourself about that too), but consider whether the person you are reaching out to is the recruiter for the open positions or even a recruiter at all. And to that end…

10) When you are reaching out to someone at a company, especially when you are asking for something, take a little time to research them. Just search on their name (might I recommend that you Bing them?).  It might inform how you engage that person. For example, if someone did a search on my name, they would find that I am not currently a recruiter but I do work in Staffing, that I am female (picture frequently accompanying my contact info), that I am a blogger, that I am open to forwarding resumes and that I provided a list of how to write an effective job inquiry email.

I don’t mean to be overly critical. Any one of these things is not a deal-breaker but most of it seems like common sense. You obviously want to make a good impression and get your resume in the right place ASAP. So yeah, consider this a little email tough love.

 

原文链接如下:

http://www.cqumzh.cn/uchome/space.php?uid=102519&do=blog&id=278386

[转载]写英文 Email 要特别留心这些点,一些原则私信也适用

今天的笔记主要是日常的 Email 写作,只适用于理工科范围内,对于商业、法律、艺术等等领域可能均不适用。

Email 要以收信人为主题

写 Email 的一个原则,应该是以收信人为主题。信件的内容,应该是跟收信人相关的,或者至少,不能让收信人觉得这是一封群发邮件。

我在知乎收到过很多私信,绝大多数我都不想回,也没法回,知道为什么吗?这些私信篇幅都很长,有的长达好几百字,内容全部是关于写信人自己,几乎从来没有出现过收信人的信息。“我是什么什么学校的学生……我要转专业……”、“我是什么什么情况……我该考研还是工作……”、“我在哪里哪里工作了几年,我要不要转行……”

事实上,这些信换一个收信人的名字就可以原封不动的再发给别人,就像春节的时候大家讨厌的那些群发短信一样。而且很多时候,他们问的很多问题我都有过类似的回答,哪怕他们花三分钟的时间点开我的主页,就能找到相关的信息。

你说我该怎么回复呢?请问他们写的这些信跟我有关系吗?请问我说过我可以提供免费的教育就业咨询吗?当然,我很乐意帮助别人,但是前提是,你得让我知道我能怎么帮。

比如说,你是一位教授,收到一位学生的套磁邮件,打开一看,满篇都是“我特别特别优秀,我 985 大学专业第一……”、“我 GRE 多少多少分”、“我怎么怎么牛逼……”。看到这样的信,你会怎么想?可能绝大多数情况,你会觉得,跟我有什么关系呢,这信换个收信人的名字一样能用。

反过来,如果信件里提到的都是你的研究内容、写信人对你的研究内容的看法、写信人自己的经历跟你的这些研究的相关程度,至少,如果我是这个收信的教授,我不会把这封信拖进垃圾箱。

同样的道理,你看一下好的广告,侧重点并不是“我的手机跑分超级高”、“我的车跑的特别快”……而是“你用我的手机可以享受便捷生活”、“你开我的车可以享受驾乘体验”…… 同样,必须是 YOU-oriented,而不是通篇的“我怎么怎么样”。

最最简单的判断方法,数一数你的 Email 里面,是 you/your 出现的次数多,还是 I/my 出现的次数多。如果通篇都是 ”I……“、”My……“,那么问一下自己,我写的这些东西跟收信人有关吗?收信人会对我的这些信息感兴趣吗?

Email 要简洁明了

既然是以收信人为主题,那就不要说那么多废话。对收信人最大的尊重,不是说“感谢你抽时间看我的信”,而是信写得简洁明了,一点不浪费收信人的时间。

除了极其正式的信件,一般来说,第一句话就应该直入主题。这封信是问问题、交作业、约时间、反映情况、提建议、提交简历,收信人读到第一句话就应该知道。

即使是比较正式的信件,比如求职信、套磁信,第一句话也应该说明主题,比如 “I’m very interested in the XX position currently open in your company.” 或者 “I have a very strong interest in the XX position that you have advertised on your website.” 不要以 “My name is ……” 或者 “I am s student of ……” 开头,一定要让收信人最快时间知道你想干嘛。

一般来说,没有必要在正文里介绍你的名字、地址、联系方式之类的,这些东西应该在信件的专门位置,如果收信人感兴趣,想要回信或者以其它方式联系你,自然会去找。如果是求职信或者套磁信,可以在第一句说明目的之后,紧接着突出重点的介绍自己,比如 “I am currently a PhD/master’s student in XX at XX University with a focus on XXXX. I expect to graduate in XX/XXXX.”

Email 要避免套话空话

既然要简洁明了,一个有效的办法就是避免套话空话。什么叫套话空话呢?就是没有任何意义的话。如果删去这些句子或者这些表达,一点都不影响信件的意思,那这样的句子就是套话空话,写这样的句子就是浪费收信人的时间。

应该尽量避免什么样的套话空话呢?

过于客气的表达。Please do not hesitate to contact me at your earliest convenience 或者 Very truly yours 。假想一下收信人就坐在你的面前,你直接跟收信人面对面谈话,你还会用这些表达吗?你不觉得别扭吗?信件无非就是用书面的形式传递这些谈话,怎么说,就怎么写。过多的使用这些 cliche 或者 canned speech 会让你的信显得不真诚,给人一种油嘴滑舌的感觉。

最最常见的几个过分客气的表达包括:

  • at your earliest convenience (直接说 when you can 或者 soon)
  • please find enclosed 或者 I have forwarded (直接说 I have sent you)
  • please do not hesitate (不需要说,直接删掉)
  • 过于书面的表达。比如 herewith、aforementioned、hereby、herein 这样的词语,或者非常老派的表达方式,让人感觉你是从一本出版于 60 年代的语法书上抄来的。
  • 过于口语化的表达。这个对于非英语母语的人来说,写出过于口语化的英语来其实是不太可能的。比如说,用 Let’s touch bases next week 代替 Let‘s talk next week,用 bottom line、team player、square one 等等类似的口语化词汇, 这些都属于所谓的 slang 或者 buzzword。这样的表达会让人觉得你不太职业,给人不信任的感觉。其实,现在的中文里有大量这样的例子,“碉堡”“么么嗒”“蛮拼的”之类的最好不要用在除了非常私人的信件以外的任何 Email 里。

Email 要注意性别指代

在英文语境里,这其实是非常重要的。在写 Email 之前,你应该尽量弄清楚收信人的性别,然后用正确的前缀。现在有 Google、LinkedIn、Facebook 等等,很容易就能确定收信人的性别。

在信件的内容里,也要注意避免性别指代的用法。其实不只是信件,这也适用于绝大多数英语写作。

  • 不要说 Each employee must show his identification,请用 Employees must show their identification.
  • 不要说 By the age of three, a child should be able to feed and dress himself,请用 By the age of three, a child should be able to eat and get dressed without help.
  • 不要说 Although a nurse often comes to the job without computer experience, she can easily be trained to use the hospital software,请用 Although a nurse often comes to the job without computer experience, this person can easily be trained to use the hospital software.
  • 不要说 actress,请用 actor。(可以注意好莱坞的采访或者发言,大多数女演员会说 as an actor… 医生都是 doctor,没有 doctress,所以演员都是 actor,越来越少的人用 actress 这个词)
  • 不要说 businessman,请用 businessperson。
  • 不要说 fireman,请用 firefighter。
  • 不要说 maid,请用 housekeeper。
  • 不要说 policeman,请用 police officer。
  • 不要说 mailman,请用 mail carrier。
  • 不要说 salesman,请用 sales representative 或者 sales agent。
  • 不要说 waiter 或者 waitress,请用 server。
  • 不要说 mankind,请用 humankind。

Email 的格式和字体

Email 的段落应该尽量短小,尽量避免一整段的长篇大论,尤其是第一段更应该紧抓重点。段落首行不需要缩进,单倍行距,段落之间空一行。

注意选用合适的字号和字体。字号不要过大或者过小,字体不要用太花哨的艺术字体,不要用花花绿绿的颜色,尽量避免太多的粗体和斜体。

原文链接如下:

http://mp.weixin.qq.com/s?__biz=MjM5MTAxNjMwMA==&mid=201786861&idx=1&sn=3a5116e49dc0d64c2a3fadbd6163fdd4&key=a96d0bed9b36e45d0559ce641e0b01de38e4dc9cadf68761b9d95ccb2dca0fca9a18ec70ed08b12f9dd7cc639eda0a72&ascene=14&uin=NDIzMzY5MzIw&devicetype=iPhone+OS8.0&version=16000114&pass_ticket=jY2IBlEpeIJYJ0DwooHqYpGrm9RmG1kAr0U4%2Bm5EO9Y1xcWLKHDTishNUjl2DR%2F9

[转载]英文Email

这样写英文Email,老外会感觉你很有礼貌、很有风度,很想帮助你

作者: 白羽轩❤Queenie

 

需要写的英文邮件多了,就觉得很吃力,尤其是当需要经常写给同一个人时。希望邮件的开头、结尾、一些客套的话能有不同的表达~~

 

邮件的开头:感谢读者是邮件开场白的好办法。感谢您的读者能让对方感到高兴,特别是之后你有事相求的情况下会很有帮助。

 

Thank you for contacting us.如果有人写信来询问公司的服务,就可以使用这句句子开头。向他们对公司的兴趣表示感谢。

Thank you for your prompt reply.当一个客户或是同事很快就回复了你的邮件,一定记得要感谢他们。如果回复并不及时,只要将“prompt”除去即可,你还可以说,“Thank you for getting back to me.”

Thank you for providing the requested information.如果你询问某人一些信息,他们花了点时间才发送给你,那就用这句句子表示你仍然对他们的付出表示感激。

Thank you for all your assistance.如果有人给了你特别的帮助,那一定要感谢他们!如果你想对他们表示特别的感激,就用这个句子,“I truly appreciate … your help in resolving the problem.”Thank you raising your concerns.

就算某个客户或是经理写邮件给你对你的工作提出了一定的质疑,你还是要感谢他们。这样你能表现出你对他们的认真态度表示尊重及感激。同时,你也可以使用,“Thank you for your feedback.”

 

在邮件的结尾:在邮件开头表示感谢一般是表示对对方过去付出的感谢,而在邮件结尾处表示感谢是对将来的帮助表示感谢。事先表示感谢,能让对方在行动时更主动更乐意。

 

Thank you for your kind cooperation.如果你需要读者帮助你做某事,那就先得表示感谢。

Thank you for your attention to this matter.与以上的类似,本句包含了你对对方将来可能的帮助表示感谢。

Thank you for your understanding.如果你写到任何会对读者产生负面影响的内容那就使用这句句子吧。

Thank you for your consideration.如果您是在寻求机会或是福利,例如你在求职的话,就用这封邮件结尾。

Thank you again for everything you’ve done.这句句子可以用在结尾,和以上有所不同。如果你在邮件开头已经谢过了读者,你就可以使用这句话,但是因为他们的帮助,你可以着重再次感谢你们的付出。

 

十种场合的表达

 

1. Greeting message 祝福

Hope you have a good trip back. 祝旅途愉快。

How are you? 你好吗?

How is the project going? 项目进行顺利吗?

 

2. Initiate a meeting 发起会议

I suggest we have a call tonight at 9:30pm (China Time) with you and Brown. Please let me know if the time is okay for you and Ben.

我建议我们今晚九点半和Brown小聚一下,你和Ben有没有空?

I would like to hold a meeting in the afternoon about our development planning for the project A.

今天下午我建议我们就A项目的发展计划开会讨论一下。

We’d like to have the meeting on Thu Oct 30. Same time.

十月三十号(周四),老时间,开会。

Let’s make a meeting next Monday at 5:30 PM SLC time.

下周一盐湖城时区下午五点半开会。

I want to talk to you over the phone regarding issues about report development and the XXX project.

我想跟你电话讨论下报告进展和XXX项目的情况。

 

3. Seeking for more information/feedbacks/suggestions 咨询信息/反馈/建议

Should you have any problem accessing the folders, please let me know.

如果存取文件有任何问题请和我联系。

Thank you and look forward to having your opinion on the estimation and schedule.

谢谢你,希望能听到更多你对评估和日程计划的建议。

Look forward to your feedbacks and suggestions soon.

期待您的反馈建议!

What is your opinion on the schedule and next steps we proposed?

你对计划方面有什么想法?下一步我们应该怎么做?

What do you think about this?

这个你怎么想?

Feel free to give your comments.

请随意提出您的建议。

Any question, please don’t hesitate to let me know.

有任何问题,欢迎和我们联系。

Any question, please let me know.

有任何问题,欢迎和我们联系。

Please contact me if you have any questions.

有任何问题,欢迎和我们联系。

Please let me know if you have any question on this.

有任何问题,欢迎和我联系。

Your comments and suggestions are welcome!

欢迎您的评论和建议!

Please let me know what you think?

欢迎您的评论和建议!

Do you have any idea about this?

对于这个您有什么建议吗?

It would be nice if you could provide a bit more information on the user’s behavior.

您若是能够就用户行为方面提供更多的信息就太感激了!

At your convenience, I would really appreciate you looking into this matter/issue.

如果可以,我希望你能负责这件事情。

4. Give feedback 意见反馈

Please see comments below.

请看下面的评论。

My answers are in blue below.

我的回答已标蓝。

5. Attachment 附件

I enclose the evaluation report for your reference.

我附加了评估报告供您阅读。

Attached please find today’s meeting notes.

今天的会议记录在附件里。

Attach is the design document, please review it.

设计文档在附件里,请评阅。

For other known issues related to individual features, please see attached release notes.

其他个人特征方面的信息请见附件。

6. Point listing 列表

Today we would like to finish following tasks by the end of today:1…….2…….

今天我们要完成的任务:1…….2…….

Some known issues in this release:1…….2…….

声明中涉及的一些问题:1…….2…….

Our team here reviewed the newest SCM policy and has following concerns:1…….2…….

我们阅读了最新的供应链管理政策,做出如下考虑:1…….2…….

Here are some more questions/issues for your team:1…….2…….

以下是对你们团队的一些问题:1…….2…….

The current status is as following: 1……2……

目前数据如下: 1……2……

Some items need your attention:1…….2…….

以下方面需提请注意:1…….2…….

7. Raise question 提出问题

I have some questions about the report XX-XXX

我对XX-XXX报告有一些疑问。

For the assignment ABC, I have the following questions:…

就ABC协议,我有以下几个问题:……

8. Proposal 提议

For the next step of platform implementation, I am proposing…

关于平台启动的下一步计划,我有一个提议……

I suggest we can have a weekly project meeting over the phone call in the near future.

我建议我们就一周项目开一个电话会议。

Achievo team suggest to adopt option A to solve outstanding issue……

Achievo团队建议应对突出问题采用A办法。

9. Thanks note 感谢信

Thank you so much for the cooperation感谢你的合作!

Thanks for the information

谢谢您提供的信息!

I really appreciate the effort you all made for this sudden and tight project.

对如此紧急的项目您做出的努力我表示十分感谢。

Thank you for your attention!

Thanks to your attention!

谢谢关心!

Your kind assistance on this are very much appreciated.

我们对您的协助表示感谢。

Really appreciate your help!

非常感谢您的帮助!

10. Apology 道歉

I sincerely apologize for this misunderstanding!

对造成的误解我真诚道歉!

I apologize for the late asking but we want to make sure the correctness of our implementation ASAP.

很抱歉现在才进行询问,但是我们需要尽快核实执行信息。

Fractals – A Very Short Introduction

Excerpt From: Falconer, Kenneth. “Fractals: A Very Short Introduction (Very Short Introductions).” iBooks.

Chapter 7
A little history

Geometry, with its highly visual and practical nature, is one of the oldest branches of mathematics. Its development through the ages has paralleled its increasingly sophisticated applications. Construction, crafts, and astronomy practised by ancient civilizations led to the need to record and analyse the shapes, sizes, and positions of objects. Notions of angles, areas, and volumes developed with the need for surveying and building. Two shapes were especially important: the straight line and the circle, which occurred naturally in many settings but also underlay the design of many artefacts. As well as fulfilling practical needs, philosophers were motivated by aesthetic aspects of geometry and sought simplicity in geometric structures and their applications. This reached its peak with the Greek School, notably with Plato (c 428–348 BC) and Euclid (c 325–265 BC), for whom constructions using a straight edge and compass, corresponding to line and circle, were the essence of geometric perfection.

As time progressed, ways were found to express and solve geometrical problems using algebra. A major advance was the introduction by René Descartes (1596–1650) of the Cartesian coordinate system which enabled shapes to be expressed concisely in terms of equations. This was a necessary precursor to the calculus, developed independently by Isaac Newton (1642–1727) and Gottfried Leibniz (1646–1714) in the late 17th century. The calculus provided a mathematical procedure for finding tangent lines that touched smooth curves as well as a method for computing areas and volumes of an enormous variety of geometrical objects. Alongside this, more sophisticated geometric figures were being observed in nature and explained mathematically. For example, using Tycho Brahe’s observations, Johannes Kepler proposed that planets moved around ellipses, and this was substantiated as a mathematical consequence of Newton’s laws of motion and gravitation.

The tools and methods were now available for tremendous advances in mathematics and the sciences. All manner of geometrical shapes could be analysed. Using the laws of motion together with the calculus, one could calculate the trajectories of projectiles, the motion of celestial bodies, and, using differential equations which developed from the calculus, more complex motions such as fluid flows. Although the calculus underlay Graph of a Brownian process8I to think of all these applications, its foundations remained intuitive rather than rigorous until the 19th century when a number of leading mathematicians including Augustin Cauchy (1789–1857), Bernhard Riemann (1826–66), and Karl Weierstrass (1815–97) formalized the notions of continuity and limits. In particular, they developed a precise definition for a curve to be ‘differentiable’, that is for there to be a tangent line touching the curve at a point. Many mathematicians worked on the assumption that all curves worthy of attention were nice and smooth so had tangents at all their points, enabling application of the calculus and its many consequences. It was a surprise when, in 1872, Karl Weierstrass constructed a ‘curve’ that was so irregular that at no point at all was it possible to draw a tangent line. The Weierstrass graph might be regarded as the first formally defined fractal, and indeed it has been shown to have fractal dimension greater than 1.

In 1883, the German Georg Cantor (1845–1918) wrote a paper introducing the middle-third Cantor set, obtained by repeatedly removing the middle thirds of intervals (see Figure 44). The Cantor set is perhaps the most basic self-similar fractal, made up of 2 scale copies of itself, although of more immediate interest to Cantor were its topological and set theoretic properties, such as it being totally disconnected, rather than its geometry. (Several other mathematicians studied sets of a similar form around the same time, including the Oxford mathematician Henry Smith (1826–83) in an article in 1874.) In 1904, Helge von Koch introduced his curve, as a simpler construction than Weierstrass’s example of a curve without any tangents. Then, in 1915, the Polish mathematician Wacław Sierpiński (1882–1969) introduced his triangle and, in 1916, the Sierpiński carpet. His main interest in the carpet was that it was a ‘universal’ set, in that it contains continuously deformed copies of all sets of ‘topological dimension’ 1. Although such objects have in recent years become the best-known fractals, at the time properties such as self-similarity were almost irrelevant, their main use being to provide specific examples or counter-examples in topology and calculus.

It was in 1918 that Felix Hausdorff proposed a natural way of ‘measuring’ the middle-third Cantor set and related sets, utilizing a general approach due to Constantin Carathéodory (1873–1950). Hausdorff showed that the middle-third Cantor set had dimension of log2/log3 = 0.631, and also found the dimensions of other self-similar sets. This was the first occurrence of an explicit notion of fractional dimension. Now termed ‘Hausdorff dimension’, his definition of dimension is the one most commonly used by mathematicians today. (Hausdorff, who did foundational work in several other areas of mathematics and philosophy, was a German Jew who tragically committed suicide in 1942 to avoid being sent to a concentration camp.) Box-dimension, which in many ways is rather simpler than Hausdorff dimension, appeared in a 1928 paper by Georges Bouligand (1889–1979), though the idea underlying an equivalent definition had been mentioned rather earlier by Hermann Minkowski (1864–1909), a Polish mathematician known especially for his work on relativity.

For many years, few mathematicians were very interested in fractional dimensions, with highly irregular sets continuing to be regarded as pathological curiosities. One notable exception was Abram Besicovitch (1891–1970), a Russian mathematician who held a professorship in Cambridge for many years. He, along with a few pupils, investigated the dimension of a range of fractals as well as investigating some of their geometric properties.

Excerpt From: Falconer, Kenneth. “Fractals: A Very Short Introduction (Very Short Introductions).” iBooks.

 

Excerpts from the Grothendieck-Serre Correspondence

Matt Baker's avatarMatt Baker's Math Blog

Like many fellow mathematicians, I was very sad to hear the news that Alexander Grothendieckpassed away yesterday.  grothendieckThe word “genius” is overused; or rather, does not possess sufficiently fine gradations.  I know quite a few mathematical geniuses, but Grothendieck was a singularity.  His ideas were so original, so profound, and so revolutionary – and he had so many of them! – that I will not even attempt to summarize his contributions to mathematics here.  Rather, I thought that I would share some of my favorite passages from the fascinating Grothendieck-Serre Correspondence, published in a bilingual edition by the AMS and SMF.   They illuminate in brief flashes what made Grothendieck so extraordinary — but also human.  They also illustrate how influential Serre was on Grothendieck’s mathematical development.  Before I begin, here is a quote from another wonderful book, Alexander Grothendieck: A Mathematical Portrait, edited by Leila Schneps:

…the…

View original post 2,863 more words

254A announcement: Analytic prime number theory

Terence Tao's avatarWhat's new

In the winter quarter (starting January 5) I will be teaching a graduate topics course entitled “An introduction to analytic prime number theory“. As the name suggests, this is a course covering many of the analytic number theory techniques used to study the distribution of the prime numbers $latex {{mathcal P} = {2,3,5,7,11,dots}}&fg=000000$. I will list the topics I intend to cover in this course below the fold. As with my previous courses, I will place lecture notes online on my blog in advance of the physical lectures.

The type of results about primes that one aspires to prove here is well captured by Landau’s classical list of problems:

  1. Even Goldbach conjecture: every even number $latex {N}&fg=000000$ greater than two is expressible as the sum of two primes.
  2. Twin prime conjecture: there are infinitely many pairs $latex {n,n+2}&fg=000000$ which are simultaneously prime.
  3. Legendre’s conjecture:…

View original post 3,947 more words

zr9558's Blog