All posts by zr9558

描述统计学

描述统计学(descriptive statistics)又称为叙述统计,是统计学中用于描述和总结所观察到对象的基本统计信息的一门学科。描述统计的结果是对当前已知的数据进行更精确的描述和刻画,分析已知数据的集中性和离散型。描述统计学通过一些数理统计方法来反映数据的特点,并通过图表形式对所收集的数据进行必要的可视化,进一步综合概括和分析得出数据的客观规律。

与之相对应的是推断统计学(statistical inference),又称为推断统计,是统计学中研究如何用样本数据来推断总体特征的一门学科。推断统计学是在对样本数据描述的基础上,对总体的未知数据做出以概率形式来描述的推断。推断统计的结果通常是为了得到下一步的行动策略。

本篇文章将会集中讲解描述统计学中的一些常见变量及其含义。

数据类型:

总体population),又称为全体或者整体,是指由多个具有某种共同性质的事物的集合。

样本sample),是指全体中随机抽取的个体。通过对样本的调查,可以大概的了解总体的情况。从总体抽样的时候,需要抽取一定数量的样本,如果样本太少,则不足以反映总体的情况。

population_and_sample
总体和样本

案例 1:一亿张图片所组成的图片集可以称之为一个总体,我们希望分析在这个图片集中包含汽车的图片有多少张。一种方法是一亿张图片每一张都看一遍,从而可以获得包含汽车的图片数量,这样就可以得到一个精确的数字。但是这样的工作量可能相对较大。另外一种方法是从一亿张图片中随机选择十万张或者一百万张,也就是获得了一个样本集。在这个样本集中,把每一张都看一遍,获得这个样本集中包含汽车的图片数量,进一步估算出总体中包含汽车的图片数量。这样的话,工作量相对较少,但是得到的则是一个估算数字。

ImageNet
ImageNet

案例 2:我们想知道某个国家居民的平均身高和体重,一种方法是将所有的居民都测量一遍,但是这样做的效果就是耗费的人力成本巨大。而另外一种办法就是随机抽样,抽取一定数量的居民进行身高和体重的测量。即可估算出这个国家居民的平均身高和体重。

特征类型

在机器学习领域,特征是被观测对象的某种特性和度量。一般情况下,事物的特征很多,但是提取的特征应该尽量要服从于我们的目的,如果提取了很多无效的特征,那么在机器学习实战中的价值也不会很大。通常来说,特征包括两类,第一种是离散型特征,第二种是连续型特征

discrete_and_continuous
连续与离散

离散型特征指的是该特征的数据类型是离散的(discrete)。例如人的性别,有男女两个选择,可以用 0 或者 1,或者其他记号来表示。例如某个城市是否属于某个省份,如果是的话该特征就是 1,如果否的话该特征就是 0。例如某只股票近期属于上涨还是下跌,上涨用 1 表示,下降用 0 表示。某个人当前处于婴儿,少年,青年,成年,老年的哪个阶段,分别用记号 0,1,2,3,4,5 表示,这种也是离散型特征。离散型特征的数值之间的大小关系(实数域比较)有的时候是没有意义的。例如人的性别,男(0)女(1)两个值,在实数域中 0 < 1,但是却没有意义。

连续性特征指的是该特征的数据类型是连续的(continuous)。例如某个国家一年的天气温度,温度是可以连续变化的,可以从 30 摄氏度连续地下降到 20 摄氏度,也可以连续地上升到 35 摄氏度。某个人的身高,可以从 170 cm 逐渐长高到 175 cm,这也属于连续的特征。连续特征的数值之间有大小关系(实数域比较),比如通过气温特征的值,是可以反映这个地区的温度情况。通过某个人的身高则可以反映出这个人距离上一次测量有没有变化。

特征统计量

集中趋势的度量(measure of central tendency)

集中趋势(central tendency)指的是某种平均的指标,通过这种指标可以反映一组数据的整体分布情况。在这里,这组数据并不需要有先后关系,只要是一个集合即可。对于 n 个数据所组成的集合,可以表示为 X=\{x_{1},x_{2},\cdots,x_{n}\}.

算术平均数(Arithmetic Mean)

数据的总和除以数据的个数,也就是

A_{n}=\mu=\sum_{i=1}^{n}x_{i}/n.

几何平均数(Geometric Mean)

如果该集合里面的数字都是非负数,那么可以定义其几何平均数为

G_{n}=\sqrt[n]{x_{1}\cdots x_{n}}.

从高中的数学知识可以得到几何平均数不大于算术平均数。

调和平均数(Harmonic Mean)

如果该集合里面的数字都是正数,那么可以定义其调和平均数为

H_{n}=n/(x_{1}^{-1}+\cdots+x_{n}^{-1}).

平方平均数(Quadratic Mean)

平方平均数指的是

Q_{n}=\sqrt{\frac{\sum_{i=1}^{n}x_{i}^{2}}{n}}.

Theorem. 如果 x_{1},\cdots, x_{n} 都是正数,那么 H_{n}\leq G_{n}\leq A_{n}\leq Q_{n}. 也就是说,调和平均数\leq几何平均数\leq算术平均数\leq平方平均数。

proof. n=2 的情形证明如下图。其余可以用数学归纳法等多种方法证明。

二维均值不等式的几何证明
二维均值不等式的几何证明

方差(Variance),标准差(Standard Deviation)

方差和标准差反映了数据的波动情况,方差指的是 \sigma^{2}=\sum_{i=1}^{n}(x_{i}-\mu)^{2}/n. 而标准差则有两种情况,第一种是总体的样本差(population standard deviation),总体的标准差定义为方差正的平方根,记为 SD,

SD = \sigma = \sqrt{\frac{1}{n}(x_{i}-\overline{x})^{2}},

其中 \overline{x}=\sum_{i=1}^{n}x_{i}/n.

第二种是样本的标准差(sample standard deviation),此时集合 \{x_{1},\cdots,x_{n}\} 是从一个更大的总体抽样出来的部分数据。样本的标准差记为 s, s 的定义为

s = \sqrt{\frac{1}{n-1}\sum_{i=1}^{n}(x_{i}-\overline{x})^{2}},

其中 \overline{x}=\sum_{i=1}^{n}x_{i}/n.

众数(Mode)

众数指的是这个集合 \{x_{1},\cdots,x_{n}\} 中出现得最多的数字。

k 阶矩(k Moment),k 阶中心矩(k Central Moment)

k 阶矩指的是

m_{k} = \sum_{i=1}^{n}x_{i}^{k}/n,

它称为样本的 k 阶矩,它反映了样本总体的信息。显然,m_{1} 就是算术平均数。

k 阶中心矩指的是

\mu_{k} = \sum_{i=1}^{n}(x_{i}-\overline{x})^{k}/n,

它称为样本的 k 阶中心矩,它反映了样本距离均值的情况。显然,\mu_{2} 就是样本方差。

偏度(Skewness)

偏度定义为

\sum_{i=1}^{n}\frac{1}{n}\cdot\frac{(x_{i}-\overline{x})^{3}}{\sigma^{3}}=\frac{\mu_{3}}{\sigma^{3}}.

n 个样本的样本偏度(sample skewness)定义为 \mu_{3}/s^{3}, 其中 s 是样本的标准差,i.e s = \sqrt{\frac{1}{n-1}\sum_{i=1}^{n}(x_{i}-\overline{x})^{2}}.

而另外常见的一种样本偏度定义为 \frac{n^{2}}{(n-1)(n-2)}\cdot \frac{\mu_{3}}{s^{3}}. 而偏度的结果可以是正数,负数,或者零。分别被称为 Positive Skew(右侧的尾巴更长),  Negative Skew(左侧的尾巴更长) 和 Zero Skew。当均值等于中位数等于众数的时候,该概率分布是对称的。Median(中位数)相对于 Mean(均值)是更加接近 Mode(众数)的数字,因此根据 Median 和 Mean 的大小关系也能够大致判断 Skew(偏度)的趋势。

skewness_1
偏度的两种类型
skewness_2
中位数,众数,平均数,偏度

峰度(Kurtosis)

n 个样本的样本峰度(sample kurtosis)可以定义为:\frac{\mu_{4}}{\mu_{2}^{2}} - 3, 其中 \mu_{4} = \sum_{i=1}^{n}(x_{i}-\overline{x})^{4}/n, \mu_{2}=\sum_{i=1}^{n}(x_{i}-\overline{x})^{2}/n. 减去 3 的目的是为了让正态分布的峰度为零。

Theorem. 正态分布 4 阶距的值是 3。

Proof. 需要计算 \frac{1}{\sqrt{2\pi}}\int_{-\infty}^{+\infty}x^{4}e^{-\frac{x^{2}}{2}}dx 的值。可以使用极坐标的方法来解决,首先通过坐标变换可以得到原式子等于 \frac{4}{\sqrt{\pi}}\int_{-\infty}^{+\infty}x^{4}e^{-x^{2}}dx. 其次,令 A=\int_{-\infty}^{+\infty}x^{4}e^{-x^{2}}dx, 可以得到

A^{2}=\int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty}x^{4}y^{4}e^{-x^{2}-y^{2}}dxdy

= \int_{0}^{2\pi}\cos^{4}(\theta)\sin^{4}(\theta)d\theta \cdot \int_{0}^{+\infty}r^{9}e^{-r^{2}}dr

= \frac{3\pi}{64}\cdot 12=\frac{9}{16}\pi.

进一步得到 A=\frac{3}{4}\sqrt{\pi}. 从而原式子等于 3。i.e. 正态分布 4 阶距的值是 3。

中位数(Median)

中位数指的是将集合中的数字从小到大排序之后得到的有序数列,中间的那个数字。如果的数列的长度是偶数,则取中间两个数的平均值。

median
中位数的计算案例

带权重的算术平均数(Weighted Arithmetic Mean)

对于一组数据 \{x_{1},x_{2},\cdots,x_{n}\}, 可以设置其一组正数权重 \{w_{1},\cdots,w_{n}\}, 然后得到其带权重的算术平均数为

\sum_{i=1}^{n}w_{i}x_{i}/\sum_{i=1}^{n}w_{i}.

截断平均数(Truncated Mean)

截断平均数是舍弃掉样本中最高和最低的一些样本之后再计算得到的平均值,并且最高和最低两端舍弃的样本数量一致。舍弃的样本数量可以是整体资料数量的占比,也可以是一个固定的数量。

发散度量(measure of dispersion)

四分位距(interquartile range,IQR)

四分位距(IQR),也被称为 midspread,middle 50%,H-spread,它等于 75th 百分位数与 25th 百分位数的差值,也就是

IQR = Q_{3}-Q_{1}.

其中,对于长度为 2n 或者 2n+1 的数列而言,Q_{1} 就是 n 个最小数的中位数,也就是 Q_{1} 在有序数列从小到大排序的 25% 位置。Q_{3} 就是 n 个最大数的中位数,也就是 Q_{3} 在有序数列从小到大排序的 75% 的位置。IQR 反映了数据的集中程度,IQR 越小,表示数据越集中于 median 附近;IQR 越大,表示数据越发散于两端。

IQR_1
正态分布的箱形图

用箱形图(boxplot)作异常检测的时候,上下界分别定义为 Q_{3}+1.5 \cdot IQR, Q_{1}-1.5 \cdot IQR.

IQR_2
四分位距的案例

在上述案例中,Q_{1} = 31, Q_{2}=87, Q_{3} = 119, 从而四分位距 IQR = Q_{3}-Q_{1}=88. 异常检测的上下界分别是 Q_{3}+1.5\cdot IQR = 251, Q_{1}-1.5\cdot IQR = -101.

四分位发散系数(quartile coefficient of dispersion)

四分位发散系数也是用于衡量数据集中程度的,对于不同的序列而言,IQR 并没有在一个尺度下进行衡量,无法通过直接对比两个序列的 IQR 来判断它们之间的发散程度(需要先对两个序列进行归一化才行)。于是,有学者提出了另外一种衡量方法,就是四分位发散系数,它的定义就是

(Q_{3}-Q_{1})/(Q_{3}+Q_{1}).

例如:X=\{2, 4, 6, 8, 10, 12, 14\}Y=\{1.8, 2, 2.1, 2.4, 2.6, 2.9, 3\} 两个集合。对于 X 而言,Q_{1}=4,Q_{2}=8,Q_{3}=12, 它的 IQR=Q_{3}-Q_{1}=8, 四分位发散系数为 (Q_{3}-Q_{1})/(Q_{3}+Q_{1})=0.5; 对于 Y 而言,Q_{1}=2,Q_{2}=2.4,Q_{3}=2.9, 它的 IQR=Q_{3}-Q_{1}=0.9,四分位发散系数为 (Q_{3}-Q_{1})/(Q_{3}+Q_{1})=0.1837. 因此集合 X 的四分位发散系数比 Y 的四分位发散系数要大,XY 更加发散。

范围(range)

在统计学中,对于集合 \{x_{1},\cdots,x_{n}\} 而言,它的最大值减去最小值的差值就是范围。i.e.

range = \max_{1\leq i\leq n}\{x_{1},\cdots,x_{n}\}-\min_{1\leq i\leq n}\{x_{1},\cdots,x_{n}\}.

该值越大,表示集合的最大值与最小值的差异越大,数据更加发散;该值越小,表示集合的最大值与最小值的差异越小,数据就更加集中。

平均绝对偏差(Mean Absolute Difference)

对于集合 X=\{x_{1},\cdots,x_{n}\} 而言,平均绝对偏差(Mean Absolute Difference)定义为:

MD(X)=\frac{\sum_{i=1}^{n}\sum_{j=1}^{n}|x_{i}-x_{j}|}{n(n-1)}.

相对平均绝对偏差(Relative Mean Absolute Difference)则定义为:

RMD(X) = \frac{\sum_{i=1}^{n}\sum_{j=1}^{n}|x_{i}-x_{j}|}{(n-1)\sum_{i=1}^{n}x_{i}}.

通过相对平均绝对偏差可以对比两个集合之间的偏差程度。

中位数绝对偏差(median absolute deviation)

中位数绝对偏差定义为 MAD=median(\{|x_{i}-\tilde{x}|,1\leq i\leq n\}), 其中 \tilde{x}=median(\{x_{1},\cdots,x_{n}\}), 可以看出数据的偏移程度。

变异系数(coefficient of variation)

变异系数指的是标准差除以均值,i.e.

cv=\frac{\sigma}{\mu},

它表示了集合数据相对于均值的波动程度。

例如:X=\{10,10,10\}, Y=\{9,10,11\}, Z=\{1, 5, 6, 8, 10, 40, 65, 88\}, 通过定义可以计算出它们的变异系数 cv(X)=0, cv(Y)=0.1, cv(Z)=32.9/27.9=1.18. 变异系数越大,表示集合的数据波动程度越大。变异系数越小,表示集合的数据波动程度越小。

参考资料

  1. 集中趋势:https://en.wikipedia.org/wiki/Central_tendency
  2. 离散程度:https://en.wikipedia.org/wiki/Statistical_dispersion
  3. 描述统计学:https://zh.wikipedia.org/wiki/%E6%8F%8F%E8%BF%B0%E7%BB%9F%E8%AE%A1%E5%AD%A6
  4. 数据分析的基础—统计学之描述性统计(一):https://zhuanlan.zhihu.com/p/33544707
  5. 数据分析的基础—统计学之描述性统计(二):https://zhuanlan.zhihu.com/p/34073898

 

在新加坡的这五年—学术篇(二)

本文写于毕业答辩五周年之际。对于每个博士生而言,毕业答辩都是一件非常重要的事情,这不仅关系着博士生能否顺利拿到学位,也会影响未来的职业生涯。

在博士答辩的时候,学生不仅需要向答辩委员会展示这几年在学校的研究成果,还需要得到答辩委员会的一致认可才能够拿到博士学位。每个学校对于博士生的毕业要求不一样,不同的学校有着不太一样的制度,但是整体流程却是大同小异的。下图是 NUS 数学系对于 Graduate Programme 的学生的一些基本要求。包括在 24 个月之内通过 Qualify Exam,学习 MA5198 这门课,完成英语课程的学习,CAP 达到 3.5 以上,最后就是写完博士毕业论文。

NUS_PHD_requirement
博士生的毕业要求

毕业论文作为 Step 6 就代表着这是博士生从学校毕业的最后一步了。当时为了记录自己搞科研写论文的时候,专门使用了 Google Calendar,然后把自己的工作时长记录下来。每周搞数学科研的时长平均是 20 个小时左右,毕竟进行创新性工作是比体力劳动累很多的。一天看书八小时没啥问题,但是一天思考数学难题八个小时就是因人而异了。

工作时长
2014 年的每周工作时长

从 NUS 提交论文的流程来看,其实博士生想提交一篇论文并不是一件非常容易的事情。先不说撰写毕业论文的路程之艰辛,就说说这提交论文的流程就足以花费很长时间。根据 NUS 的学术日历,博士生们需要在一些特定的时候提交论文才会比较“划算”。为什么用“划算”这个词语呢?因为 NUS 的博士生在前四年是不需要交学费的,但是在博士第五年开始延期的时候就需要缴纳一定的学费,而学费的多少完全取决于在博士生什么时候提交论文。如果在每个学期的前两周提交论文,那么这个学期是不需要交学费的。如果在 Recess Week 之前提交论文,那么这个学期只需要缴纳一半的学费。如果提交论文的时间过了 Recess Week,那么博士生就要缴纳本学期全部的学费。所以,对于想要交论文的博士生,通常都会在 Vacation 的期间尽量把论文全部写好,然后赶在开学的前两周提交论文,这样的话一来有充足的时间撰写论文,二来不用缴纳下一个学期的学费。

NUS学校日历
NUS 的学术日历

NUS 的博士生在前四年是免学费的,但是到了第五年的时候就要开始交学费了。而学费的涨幅也是十分惊人的,记得在 2010 年的时候一年的学费大约是 13000 SGD,而到了 2020 年的时候一年的学费已经涨到了 40000 SGD。虽然学费涨幅惊人,但是只要博士生能够按时毕业,就可以避免缴纳高额的学费。这可能也是督促博士生按时毕业的一个好方法。

NUS学费
NUS 的学费

言归正传,在进行答辩之前需要在学校和院系提交博士生的毕业论文。第一次提交论文初稿的时候需要提交四份打印稿,并且装订成册。方便答辩委员会的成员阅读和翻阅。当时打印论文的时候,是由大峰哥带路去 Queenstown 打印,价格比学校的 YIH 稍微便宜一点,时间也会相对快很多。

对于博士生的答辩,除了导师会在现场之外,也需要从院系里面选择一两位教授,还需要从外校选择一位比较精通该领域的学者,共同组成该学生的答辩委员会。答辩委员会不仅要在学生答辩的时候出席,还要对学生提交的博士论文进行审核,查看该学生的学术成果是否能够达到毕业的要求。如果答辩委员会在审核期间对学生的论文有所疑问的话,也可以通过邮件的方式来向院系的秘书和学生发邮件,要求学生提供更加详细的资料和证明方法。不过发邮件提问的时候答辩委员会的教授都是匿名的,学生不能知道是哪位审稿人所提出的问题。一般审稿的期限为 3 个月左右,一旦达到了这个期限,并且审稿没有问题的话,就可以让院系安排博士生的毕业答辩了。

毕业答辩的邮件通知_full
答辩邮件

2015 年 4 月 24 日,是笔者在新加坡国立大学(National University of Singapore) 的答辩日子。每次有博士生答辩的时候,数学系的行政人员们就会提前发送一封邮件给大家,通知大家系里面有人去答辩了,请感兴趣的老师和同学自行前往。一般情况下,答辩的时长是一个小时左右。除此本校的教授无需专程移动之外,答辩委员会的成员也需要从各个国家飞往当地进行毕业答辩。在答辩的时候,学生需要准备一份 PPT 来讲解之前几年在学校做的科研工作,还需要提前准备一些可能面临的挑战点以应对大家的提问。听讲座的人背景不一样,所提出的问题也有可能是五花八门的,所以做好充足的准备是非常有必要的。在答辩的前两天,有的导师也会将答辩委员会的教授们介绍给博士生认识,毕竟学术圈也是一个圈子,混个脸熟还是十分有必要的。不过学术圈的人通知消息的方式都比较特殊,记得当时导师通知开会和吃饭都是通过邮件的方式,和现在通过微信和电话的方式有明显差异。

毕业聚餐的地点
聚餐地点

在博士生进行答辩陈述结束之后,答辩委员会的成员会让博士生暂时离开教室一段时间,然后他们在教室里面填写必要的资料,决定博士生是否能够通过这次答辩。如果顺利通过的话,教授们会走出来通知学生已经通过了答辩。如果不幸没有通过的话,就只能让学生持续修改论文和再接再厉了。除了参加博士生的答辩之外,学术圈的教授们聚集到一个学校,总会开设一两个讲座或者进行必要的聚餐。这次自然也不例外,笔者还有幸在答辩的当天下午听了一个教授的讲座。到了吃饭时间,下午 5:00 左右,导师就把学生和教授喊在一起,去外面聚餐吃饭。不过当时吃饭的地点就是在学校附近的食阁,大家会点上不少下酒菜,然后点上很多啤酒(PS:新加坡的酒真的是贵),在食阁那里谈天说地。当时留在师门的人也不多了,大师兄和二师兄已经顺利毕业离开了新加坡,还剩下三师兄和我在一起搞科研和答辩。不过在我答辩完了之后,三师兄也顺利提交了论文,在 2015 年的后半年也顺利通过了博士答辩。

大师兄的毕业证
大师兄的毕业证

记得在 2015 年 4 月 13 日的时候,大清早起来帮大师兄去拿 University Hall 拿学位证。NUS 有固定的发放学位的时间,及时大师兄是 2014 年交的论文,拿到学位证和成绩单也需要等到次年的 4 月份。因此,算好交论文的时间也是一门有趣的事情。不过导师从国内过来的时候,也是把三位师兄带到新加坡,因此三位师兄的年纪略比我大一些。师兄们也是经历了国内的硕士教育和国外的博士教育最终拿到学位,可见拿到博士学位之路真的不好走。

NUS_YIH
NUS 的 YIH

答辩完了之后其实还需要向学校提交一些材料和流程,提交材料的地点就是 NUS 的 YIH。记得当时提交论文不仅需要在网站上提交论文的 PDF 文件,并且把论文刻在一个光盘内才行(PS:这年头用光盘的时候真的是不多了)。当年在南京买的电脑 Y530 还带着光驱,但是从来没有使用过,在 2008 年买的时候绝对没有想到这台电脑刻的唯一一张光盘就是自己的博士毕业论文。(未完待续)

一封来自南大化院的信

见信如晤!南大化院致用人单位和校友的一封信

尊敬的用人单位,亲爱的校友:

你们好!

首先,诚挚感谢各用人单位一直以来对我院就业工作的热心关注与大力支持,帮助我院学子在理想的工作岗位上服务社会,建设国家。感谢各位校友对母院发展的支持和对学弟学妹们的帮助和指导,你们的成就为他们规划自己的职业生涯树立了典范。
自1920年南京高等师范学校建立设置化学系以来,南京大学化学学科已走过百年历程。秉承“诚朴雄伟,励学敦行”的校训,以及“严谨、求实、创新、奉献”的优良传统,由化学学科发展而来的南京大学化学化工学院,已经成为蜚声海内外的人才培养和科学研究基地。2017年,我院化学、化学工程与技术两个学科双双入选国家“双一流”建设学科。百年砥砺,薪火相传,我院培养的一代代化院人在科学研究和技术服务业、教育、制造业、信息传输、软件和信息技术服务业、金融业等各行各业都做出了突出贡献,在中华民族复兴之路上留下了浓墨重彩的篇章!今天,学院师生正在配位化学、化学生物学、能源化学、先进光电材料、合成化学、材料化学、生命分析和分子成像、绿色化学以及计算化学等多个领域开展研究,以化学人独特的思维和方式认知、创造并改变着我们的世界。
当前,全国上下仍处在全力防控新型冠状肺炎疫情的关键时期,受疫情影响,今年本就因全国高校毕业生人数增长40万而紧张的就业形势更加严峻。因此,帮助我院129名本科毕业生,133名硕士毕业生和143名博士毕业生走上满意的工作岗位,是我们一直以来努力达成的目标。
为促进社会需求与人才供给精准对接,值此用人单位招聘与毕业生求职就业的关键时期,我院诚挚邀请各用人单位,为我院学子提供更多宝贵的就业岗位和发展平台若您有招贤纳士的计划,请您与我们联系,我们将第一时间将招聘信息传达给毕业生,根据需求帮助毕业生与贵单位搭建好线上选聘平台,并择优定向推荐,积极配合您完成好招聘工作。众人拾柴火焰高,希望各位校友伸出援手,充分发挥您的社会影响力,帮我们牵线搭桥,提供宝贵的就业信息。同时也欢迎各位校友为即将毕业的学弟学妹分享求职经验,提供线上指导,帮助他们树立求职信心,掌握求职技巧。
再次感谢各用人单位和校友的理解与支持,在这个特殊的春天,让我们凝心聚力,共同努力打赢疫情防控和求职就业的双战役!
附:南京大学化学化工学院2020届毕业生就业工作联络人
负责班级
联络人
办公电话
电子邮箱
本科
朱老师
025-89680289
chemjobnju@163.com
硕士研究生
王老师
025-89682319
博士研究生
闫老师
025-89682319

今天看到南京大学(Nanjing University)的官方公众号于近日发表了一封信,来自南大化院。其主要内容是让各位校友尽量提供各种资源,帮助目前的在校毕业生找到合适的就业岗位。在疫情严重和就业环境不甚理想的情况下,通过这封信,我们能够感受到母校对于学生们的关心,能够体会到母校对应届本科生,硕士生,博士生的负责与关怀。

NJU_Chem_1
NJU 化学化工学院
NJU_Chem_2
百年化院

当年笔者在南京大学就读的时候,就曾听闻 NJU 的化学系,物理系,地科系,天文系都是 NJU 的王牌院系,自然也有不少优秀的高中生选择这些方向进行攻读。笔者在校期间除了拿到学位,也得到了许多南大老师的帮助和教诲,在此表示感谢。在 2006 年,闵乃本院士课题组获得了国家自然科学一等奖,也是国家对 NJU 在自然科学领域的认可。

NJU_Award_1
国家自然科学一等奖

近日南大化院通过官媒所发出的信,一则是因为疫情影响,今年的就业压力确实大;二来某些专业确实不那么容易找工作。某些专业的学生如果只掌握本专业的技能,就会面临着毕业就失业的风险。要想走向满意的工作岗位,除了自己的努力之外,自然也是需要学校的大力支持的。

在国外留学的时候,就感受到一些院校更加强调学以致用。即使是化学,生物,物理等基础学科,在本科期间也会积极安排实习的机会给学生,让学生们有一定的就业实践,获得必要的社会经历。在新加坡国立大学(National University of Singapore),化学系的本科学生是有机会获得一些实习机会的。

NUS_FYI
2020 NUS E-Open House:最后一年的实习

除此之外,最后的毕业项目(Final Year Project)也是需要有一定的实践的。例如,可以与近些年比较火的机器学习(machine learning)和数据分析(data analytics)相结合,将学生培养成具备一定的化学数据分析经验方向的人才。

NUS_FYP
2020 NUS E-Open House:最后一年的项目

学生们在校期间肯定可以接触科研的内容,但是如果只接触科研的内容对学生而言是不公平的。最理想的情况是在校期间校方多让学生接触各行各业的职业,多接触到工业界的就业情况。无论是公司,研究所,还是其他行业的校友以及各行各业的人才都可以把已知的行业消息告诉学生,让学生们多了解,及早做职业规划,这也是对学生负责的一种方法。

不过,南大化学这个专业怎么出现了【博士生的人数 > 硕士生的人数 > 本科生的人数】的情况啊?笔者记得当年数学系本科生大约 160+,硕士生 30+,博士生可能也就 10+;在数学系不至于成为倒过来的情形啊。在外留学的时候,每个院系博士生的数量都是有限制的,数学系也就是 10+,一般不会超过 20。不知道是不是当时招生的时候过度招生了?

如果有机会的话,其实学校,研究所,工业界帮学生牵线搭桥是非常有必要的,毕竟 NJU 的生源质量整体来看还是非常不错的,有的学生真的只是缺少一个机会而已。在这种时候,如果事先在读书之前,就提前给学生和家长做好一定的职业辅导,是不是也是一种方法呢?下面几幅图来自 NUS 的 2020 E-Open House,化学系的老师在网络上给大家介绍了化学系学生的一些发展方向​,其实这样的内容对学生和家长而言可能更有价值和意义。​

NUS_Chem_Level_UP_1
职业发展:Chief Analytical Chemist
NUS_Chem_Level_UP_2
职业发展:Medicinal Chemist
NUS_Chem_Level_UP_3
职业发展:Energy Chemist

无论是 NJU 还是 NUS 的学生都是相对优秀的,有的时候给一个转行的机会就能够紧紧地把握住。如果实在是找不到本专业的就业机会,那就只能够找个机会努力转行了。其实,大学最重要的是培养正确的价值观,引导学生们做想做的事情,做喜欢做的事,而不是为了某个目的而把学生的其他路封死。如果一个人真心想做科研,那么他就不会被其他事情所干扰;如果一个人不是真心想做科研,那么他迟早也是要离开的,无论学校是否告诉他一条转行的道路。

Picture_of_Chem_2
离开的时刻

前几年写过一篇关于转行的文章,希望有所帮助吧。《转行数据挖掘和机器学习(六)》 。不过还是期待业界大佬能够提供就业岗位和发展平台,提供更多的机会给应届生。

2020 年的口罩

谁都没有想到 2020 年的开局竟然是这样,随着新型冠状病毒(COVID-19) 在各个国家的爆发,医疗防护用品成为了 2020 年的畅销品。对于各个国家而言,呼吸机,防护服,护目镜,医用口罩就是必备的物品;对于每个家庭甚至个人而言,口罩就成为了居家必备的防护用品。

早在 2020 年除夕前几天,国内就已经出现了武汉地区爆发疫情的消息,深圳有的药房已经排起了长龙,很多民众都在购买口罩。甚至有的药房已经把口罩卖空,直接在门口挂牌“暂无口罩”,说明当时整体已经出现了口罩短缺的情况。既然线下买不到,那就只能够转到线上去购买。笔者当时还想着买 N95 或者医用外科口罩,但是网上的货源也是远远不够的。最后实在没办法了,就想着买点其他口罩聊胜于无吧。于是直接在某电商平台下单了 50 个一次性医用口罩,下单后第三天货就到位。虽然 50 个口罩不足以保障一家人每天都能够外出,但是足以应对出门拿外卖和日常用品,也正是这 50 个口罩,保证了一家人在疫情期间的日常生活不受影响。

2020年初买的医用口罩
2020 年 1 月中旬买的口罩

国内疫情严重导致口罩短缺,国家开始呼吁大家尽量待在家里,避免出去进一步导致疫情的传播。正好笔者也是属于死宅类型,日常能不出去就不出去,能尽量待在家就尽量待在家。而且此时正值新春佳节之际,如果没有走亲访友的安排,待在家其实是最好的选择,毕竟辛辛苦苦地工作一年也会觉得疲惫,正好找个机会修整一下,以备来年的再次努力奋斗。

过年期间每家每户都在屯口罩,过完年之后就面临着复工的问题。虽然国家已经将春节假期延长,但是总有需要复工的一天。为了复工,想必各个企业也在积极地准备着这些必要的医护用品,否则复工之路将受影响。有的企业渠道比较广,能够弄到一些医护用品发放给员工。为了自身和身边同事的安全,大家在疫情期间上班就只能够戴口罩,虽然刚开始的时候也不太能够适应,但是工作了几天之后竟然也觉得能够接受。话说,普通上班族戴的也就是普通的医疗口罩,奋战在一线的医生和护士不仅需要戴口罩,还需要身着厚重的防护服,全身上下都被严严实实地包裹起来,甚至还要面临着被感染的风险。在这次疫情中,国内的医护人员真的做出了非常大的贡献。

众志成城我们必胜
战疫情

时至今日,国内的疫情已经基本稳定,每个省都在走向全面复工的道路,普通的医用口罩其实也不再短缺,无论是网上商店还是线下药店都能够买到口罩。但让人万万没想到的是国外疫情出现了井喷式的增长,从 Google 的疫情统计来看,不少国家的累计确诊人数已经远远超过中国,美国至今已经高达 50 万的确诊病例,甚至还有持续上涨的趋势。疫情刚开始的时候,国外的不少人还说戴口罩没有用,呼吁大家不用戴口罩。虽然笔者也没有直接证据证明戴口罩能够有效地防护,但是为了保险起见,如果买得到口罩,并且能够承受这个经济压力的话,戴口罩其实对个人也没有什么大碍。虽然刚开始的时候不适应,但是戴多了其实也就那么回事。不过戴着口罩思考问题,写代码确实挺累的,但是为了保障身体健康也只能够戴着,别无选择。

Google疫情统计_1
全球疫情统计
Google疫情统计_2
确诊人数排序

从这张表格来看,其实香港的情况还好,看上去也属于能够控制的范围。由于笔者当年在新加坡生活五年,有不少朋友在新加坡工作和学习,因此也比较关心新加坡的疫情。新加坡的疫情被稳定地控制了很久,但是近几周也出现了感染人数增长的趋势,确诊人数已经多达 2000+,并且存在社区传播的可能性。

Google疫情统计_3
新加坡疫情地图

于是,新加坡政府在 2020 年 4 月份正式宣布了 Stay at home(居家隔离)政策,呼吁民众尽量待在家里,避免外出。从 2020 年 4 月 7 日开始至 2020 年 5 月 4 日,民众都要遵守居家隔离政策,非特殊情况,尽量不要外出;如果一定要外出,则需要戴口罩(mask);食物全部需要打包带走,不能堂食;在排队的时候要保持一定的安全距离。

新加坡疫情防护_1
Stay at home
新加坡疫情防护_2
居家隔离的细节

其实在疫情刚刚爆发的时候(2020 年 1 月底),新加坡根据实际情况呼吁大家暂时无需戴口罩,因为口罩毕竟是医疗用品,需要优先保障一线的医务人员使用。如果很多民众都戴口罩,那么口罩就会出现不够的情况,并且当时疫情在新加坡属于可以控制的范围。在当时做出这个呼吁也属于合理的范围。

新加坡疫情防护_3

新加坡疫情防护_4
联合早报的报道

但是,随着疫情的发展,已经超出了很多人的预期。中国花了很多成本控制住了疫情,但是疫情却在国外爆发了,无论是意大利,西班牙,法国,到现在的美国,都出现了病人井喷的状况。很多国家均已不能独善其身,只能够加入全面抗疫的战斗中。新加坡政府也推出了居家隔离的政策,虽然不一定比中国更加严格,但也确实能够起到一定的效果。

旅游业是新加坡的支柱产业之一,在疫情期间,沙滩全面封闭,不准居民游玩。虽然影响了收入,但实属无奈之举,毕竟控制疫情才是近期最重要的事情。

新加坡疫情防护_5
封闭沙滩

新加坡很多人都不在家做饭,社区周边的食阁就是主要的吃饭场所。在此特殊期间,居民不能够在食阁里面吃饭,必须进行外带,而且餐饮场所的员工必须要戴口罩才能够营业。违者将罚款高达 5000 新币,或吊销餐饮执照。

新加坡疫情防护_6

新加坡疫情防护_7
食阁的规定

除了餐饮行业,人们在日常出行的时候也被要求戴口罩,例如乘坐公交车的乘客就必须戴口罩。

新加坡疫情防护_8
乘客需戴口罩

从新加坡的政策也可以看出,时至 2020 年的 4 月份,新加坡的疫情防控也到了必须要控制的程度。为什么前后的政策会出现如此明显的变化呢?我们可以来看一下新加坡这几个月的疫情发展状况。

在 2020 年的 1 月份,新加坡只有零星的几个案例,即使到了 3 月中期,每天的案例数量也不会超过 50 个,而且绝大多数都可以追踪。但是到了 4 月份,有几天的案例数都超过了 150,总数也超过了 2200 +,而且有一些案例还不太容易进行流行病学的追踪。

新加坡疫情统计_1新加坡疫情统计_2新加坡疫情统计_3

新加坡疫情统计_4
新加坡的疫情变化:2020 年 1 月 – 2020 年 4 月

从联合早报的感染人群来看,除了有外来的输入案例之外,近期还有不少在新加坡的客工宿舍爆发了疫情。

新加坡疫情防护_9

新加坡疫情防护_10
客工宿舍的疫情

新加坡政府控制疫情虽然暂时还没有那么严格,但是也算是下了决心。有一句来自其他地方的笑话,Singapore is a fine city。fine 除了大家都知道的意思之外,另外一层含义就是罚金或者罚款。那为了控制疫情,新加坡政府会给违反规定的民众开出相应的罚单也属于合理的范围。刚开始的时候愿意给警告信,但从 4 月 12 日起就直接开罚单了,每次 300 新币(约人民币 1500 元)。

新加坡疫情防护_11

新加坡疫情防护_12
新加坡的罚单

在防控疫情的不同阶段,不同的国家确实有着完全不同的应对策略,无论是国内的封城,还是其他国家的防控疫情手段,都是为了尽快消灭疫情。而消灭疫情虽然有很多办法,但每个人进行合理范围内的自我保护则是一个非常有效的措施。从 2020 年的 1 月份到 4 月份,所有人都见证了国内疫情爆发,控制,逐渐消失的阶段。从新加坡这几个月的政策也可以看出,从一开始的呼吁民众不需要戴口罩到现在的强制民众戴口罩,说明口罩在疫情防控方面还是具有一点防护和隔离作用的,至少也能够有效地阻止飞沫的传播。因此,能够戴口罩还是戴上为佳,保护自己也保护了别人。最后,还是希望全球的疫情能够早早过去,让大家都过上正常健康的生活。

参考资料:

  1. 新加坡疫情网站:https://co.vid19.sg/singapore/#
  2. 联合早报:https://www.zaobao.com/
  3. 新加坡政府官网:https://www.gov.sg/

在新加坡的这五年—学术篇

每次提到数学这个词,大家能够想到的就是初等代数,平面几何,组合运算,微积分,线性代数,概率论等方向。但在整个数学领域(Earth of Math)上,还有很多更有意思的领域和研究方向,包括数论,几何,拓扑,分形几何,分析,概率统计,博弈论,代数等诸多方向,每一个方向都有很多优秀的数学家在从事相关研究。

EarthofMath
Earth of Mathematics

当年在数学系的时候,所研究的方向是分形几何(Fractal Geometry)和复动力系统(Complex Dynamics),位于 Earth of Math 的左侧,称之为分形湖泊(Fractal Lakes)。所谓分形,其实是一个粗糙或者零碎的集合形状,可以分成多个部分,且每个部分放大之后与整体有某种相似性,即具有自相似性的性质。而动力系统则是基于某种固定的规则,描述一个空间内的所有点随时间的变化情况,例如钟摆的晃动,水的流动,湖泊里面鱼类的数量。备注:动力系统并不是指汽车的动力系统和发动机引擎,这两者毫无关系。

而复动力系统则是动力系统中的一个分支,研究的是有理函数的迭代性质。所谓函数的迭代,指的是针对有理函数 f(z),考察其定义域的点 z\in \hat{\mathbb{C}}n 次复合,得到 f^{(n)}(z)=f\circ\cdots\circ f(z),进一步可以研究 \lim_{n\rightarrow +\infty}f^{(n)}(z) 的极限。

针对不同的定义域,函数的迭代有着完全不同的研究方法。当时的研究方向是复动力系统(Complex Dynamical Systems)。复动力系统理论的研究始于 1920 年,当时是由数学家 Fatou 和 Julia 研究的,因此复动力系统中的两个重要的集合就是以 Fatou 和 Julia 来命名的,分别称之为 Fatou set 和 Julia Set。随着计算机技术的演进,在上世纪八十年代这些集合可以通过计算机进行可视化,分形几何和复动力系统理论开始蓬勃发展起来。在与双曲几何、分形几何、现代分析学和混沌学等学科发展相互促进的同时,围绕双曲猜想以及 Mandelbrot 集合的研究工作,成为当今复动力系统的研究热点。

举个例子,函数 f(z) = z^{2}+0.7885 e^{ia}a\in[0,2\pi])的 Julia 集合的动图如下:

JuliaSet_1
Julia 集合

当然,科研的时候可不是做一点可视化就算完成任务了,还是需要按部就班的学习各种数学知识和技能。

之前在学校研究动力系统的时候,收集过一些书籍,在此列举给大家,希望对初学者有一定的帮助。One Dimensional Real and Complex Dynamics实与复动力系统)需要学习的资料如下:

基础书籍:

复分析基础:本科生课程。学习数学知识自然需要循序渐进,除了必要的数学分析,高等代数之外,分析学则是动力系统所必备的知识之一。既然是复动力系统,那肯定就要集中于研究复分析,因此本科的复分析则是复动力系统的必修课之一。

(1) Complex Analysis, 3rd Edition, Lars V. Ahlfors

(2) Complex Analysis, Elias M. Stein

进阶复分析:研究生课程

到了研究生阶段,其实也不足以直接上手搞科研,需要进一步地学习黎曼曲面,拟共形映射等专业书籍,才能够为复动力系统的学习打下基础。

(1) Lectures on Riemann Surfaces (GTM 81), Otto Forster

(2) Lectures on Quasiconformal Mappings, Lars V. Ahlfors

实分析基础:本科生课程

研究动力系统,实分析也是其基础知识之一,无论是通过学习 Stein 还是 Rudin 的教材,都是为了进一步地了解基础知识。

(1) Real Analysis and Complex Analysis, Rudin

(2) Real Analysis, Elias M. Stein

专业书籍:

实动力系统:

(1) One Dimensional Dynamics, Welington de Melo & Sebastian VanStrien

这本书难度较大,上手的时候不建议直接看这本书。

OneDimensionalDynamics
One-Dimensional Dynamics

(2) Mathematical Tools for One-Dimensional Dynamics (Cambridge Studies in

Advanced Mathematics), Edson de Faria / Welington de Melo

MathematicalToolsforOneDimensionalDynamics
Mathematical Tools for One-Dimensional Dynamics

复动力系统:

(3) Dynamics in One Complex Variable, John Milnor;Milnor 的教材总是写的清晰明确,容易上手,推荐初学者可以读这本书。

DynamicsinOneComplexVariable
Dynamics in One Complex Variable

(4) Complex Dynamics, Lennart Carleson;Carleson 的教材偏向于分析学,读起来其实也有点难度,还是读 Milnor 的教材相对容易。

ComplexDynamics
Complex Dynamics

(5) Complex Dynamics and Renormalization, Curtis T. McMullen;McMullen 的书适合当做查阅,也不太适合从头到尾读下去。

ComplexDynamicsandRenormalization
Complex Dynamics and Renormalization

(6) Renormalization and 3-Manifolds Which Fiber over the Circle, Curtis T. McMullen

Renormalizationand3Manifolds
Renormalization and 3-Manifolds Which Fiber over the Circle

(7) Iteration of rational functions (GTM 132), Alan F. Beardon

遍历论:

(8) An Introduction to Ergodic Theory (GTM 79), Walters Peter

学术会议

除了日常的科研之外,博士生时不时地可以去参加一下学术会议,不仅可以去参加本方向的学术会议,也可以去参加其它方向的学术会议,只要有一份邀请函即可。

如果是在 NUS 的 IMS(Institute for Mathematical Sciences)举办的学术会议,一般来说只要是在校的研究生都是可以参加的。记得当时参加的第一个学术会议是关于 PDE 的,标题叫做 Hyperbolic Conservation Laws and Kinetic Equations:Theory, Computation, and Applications(1 November – 19 December 2010)。笔者去听这个系列讲座是因为在 2010 年选择了一门 PDE 的研究生课程,而这个讲座则是作为课程的一部分。

IMSWorkshopGroupPhoto2012_6
IMS 的偏微分方程学术会议

笔者参与的另外一个学术会议则是关于动力系统的,标题叫做 Workshop on Non-uniformly Hyperbolic and Neural One-dimensional Dynamics(23 – 27 April 2012),主要是关于非一致双曲动力系统方向的研讨会。笔者记得当时所修的课程应该只有概率论(Probability II)一门课,因此上课的任务不算很重。参会的时间恰好是学期快结束的时候,科研的任务也不算特别繁重。因此,积极参与各种学术会议也算是科研的其中一部分,一来通过参会可以了解当前的学术研究情况,二来可以认识学术界的各种人士,也算是扩大学术交流圈子的好机会。

IMSWorkshopGroupPhoto2012_2
IMS 的动力系统学术会议

既然是学术会议,那自然就有各种各样的 Presentations,学术会议的第一天通常是需要有 IMS 的领导来致辞的,表示学术会议正式开始。每天的学术会议都需要有个 chair 来组织,一天的学术会议基本上是从早到晚,大约从早上 9:30 开始,到下午 4:40 结束。而每个学者汇报时间大约是 50 mins 左右。

IMSWorkshopGroupPhoto2012_3
第一天的研讨会安排

这次的学术会议是关于动力系统方向的,那师兄们自然是需要上台做报告的。当时上场的师兄包括大师兄和二师兄,至于三师兄和我则暂时没有成果可以汇报。两位师兄在 IMS 的报告厅里面做了十分精彩的成果展示,会议之后也有不少同行来与师兄们讨论问题。

IMSWorkshopGroupPhoto2012_4
同门汇报工作

一般来说,每次研讨会的开始和结束都需要有一个仪式,除了 IMS 的领导致辞表示会议开始之外,在茶歇时间(Coffee Break)期间是可以四处走动的,并且在第一次茶歇的时候,全体参会人员都会在 IMS 附近拍照留念,预祝本次研讨会成功举办。

IMSWorkshopGroupPhoto2012_5
Group Photo

论文

读到博士自然需要研究一下相应的课题,例如下面这种就是数学系博士生所研究的课题。​

Question. 是否存在 \ell\geq 4 的偶数和复数 c\in\mathbb{C} 使得 f(z)=z^{\ell}+c 的 Julia 集合 J(f) 是正测度?

针对这个课题,数学系的博士生需要翻阅历史上的相关书籍和论文,阅读其相关论文才能够得到前沿技术和进展。当年花时间阅读的论文主要是几篇 Annals 上面的文章,参考资料也是这几篇文章,不过每一篇文章至少都是 40 页左右,基本上看一篇文章需要花几个月的时间。

1. Combinatorics, geometry and attractors of quasi-quadratic maps,Pages 345-404 from Volume 140 (1994), Issue 2 by Mikhail Lyubich

Paper_1

2. Wild Cantor attractors exist,Pages 97-130 from Volume 143 (1996), Issue 1 by Hendrik Bruin, Gerhard Keller, Tomasz Nowicki, Sebastian van Strien

Paper_2

3. Quadratic Julia sets with positive area,Pages 673-746 from Volume 176 (2012), Issue 2 by Xavier Buff, Arnaud Chéritat

Paper_3

4. Polynomial maps with a Julia set of positive measure,Nowicki, Tomasz, and Sebastian van Strien,arXiv preprint math/9402215(1994).

Paper_4

备注:第 4 篇文章 Polynomial maps with a Julia set of positive measure 里面有错误,通过其证明是无法得到最终结论的,因此是否存在正测度的 Julia 集合一直是未知的。直到 2012 年的第 3 篇文章出来,才算证明了二次多项式存在正测度的 Julia 集合。但是对于高次多项式,是否存在正测度的 Julia 集合则是完全未知的。

在拿到论文和课题之后,那就开始需要研究了。草稿纸也算了一张又一张,论文也打印了一份又一份,科研之路哪有一帆风顺的,基本上都是历经曲折,才能够达到毕业的彼岸。毕业的时候写了一篇文章《科研这条路》,以此来纪念读博五年的生涯。

PlanandReality
理想与现实

参考资料:

  1. 科研这条路
  2. 维基百科:Julia 集合

 

一个数学家的辩白

《一个数学家的辩白》是数学大师 Godfrey Harold Hardy 在 1940 年左右的作品,可以称之为 Hardy 本人的自传和内心独白。Hardy 通过自己多年从事数学科研的经验,对数学,文学,哲学,美学等诸多学科的理解,将其写成了一本小册子。给其余的数学工作者,数学爱好者,以及不了解数学的人一个了解数学家内心的机会。

Hardy的照片
G.H.Hardy 的照片

G.H.Hardy(1877 年 2 月 7 日 – 1947 年 12 月 1 日)是一代数论大师,英国数学家,先后在牛津大学(Oxford)和剑桥大学(Cambridge)担任数学教授,与另一位英国数学家 Littlewood 共同研究数学,其研究领域包括解析数论,三角级数,不等式等诸多方向。对数论领域和分析学领域的贡献巨大,是二十世纪英国分析学派的代表人物之一。

Hardy的数学家族谱
G.H.Hardy 的数学家族谱

在卢昌海《黎曼猜想漫谈》这本书里面,提到了 G.H.Hardy 的一则小故事。当年,Hardy 在一次从丹麦回英国的途中,碰巧遇到暴风肆虐。他很担心小船会沉没,于是在上船前给朋友寄了一张明信片,上面写道:“我证明了黎曼猜想。” 如果哈代不幸遇难,因死无对证,后世将无法否认(当然也没法确认)他真的证明了黎曼猜想。然而,上帝不想让他有这样大的荣耀,所以没有让这条船沉没。

在《一个数学家的辩白》这本书中,Hardy 基于个人经历,向大家展示了一位数学家对数学这门学科的一些看法和观点。下面将会摘录其中的一些语句。

假如真的能把我的雕像塑在伦敦纪念碑上的话,我是希望这座碑高耸入云,以至人们见不到雕像呢,还是希望纪念碑矮得可以使人们对雕像一目了然呢?我会选择前一种,而斯诺博士可能会选择后一种。

如果一个数学家发现自己在写关于数学的东西,他会感到很忧伤的。因为数学家的工作是做实事,比如证明新定理,使数学有所发展,而不是谈论自己或别的数学家干了些什么。政治家蔑视时事评论家;画家蔑视艺术评论家;生理学家、物理学家或数学家一般都有类似的感觉。做事者对评论者的蔑视是最深刻的,总的来看也是最合理的。解释、评论、鉴赏是次等工作。

认为“谦卑”的人做不出优秀的工作。比方说,在任何一个学科里,教授的首要职责之一就是对自己这一学科的重要性以及自己本人在这一学科的重要性进行一点夸大。假如一个人总在问自己:“我所做的事是值得做的吗?”以及“我做这个合适吗?”这都会使自己永远无能而且也让别人泄气。这种人该把眼睛闭上一会儿,更多地考虑自己的学科和自己本人的情况,而不是更多地考虑学科与自己所应得的报酬。这不太困难,因为更加困难的是依靠紧闭眼睛来使自己的学科与自己本人不受他人所嘲笑。

我之所以做我的事,因为这事是,而且是惟一的一件我完全可以做好的事。我是个律师,或者是一个股票经纪人,或者是一个职业板球手,这都是因为我对这一特别的工作有些真正的才能。我做律师,是因为我伶牙俐齿,而且对法律之微妙感兴趣;我做股票经纪人,是因为我对股市行情的判断迅速而准确;我做职业板球手,是因为我挥拍非同一般地好。有人说,我做个诗人或数学家也许更好,但不幸的是,我并没有才能做这样的工作。

我并不认为大多数人能够做出上述那样的辩解,因为多数人什么工作也做不好。可是只要这种辩解说得振振有词,它就很难反驳,事实上只有少数人能进行这样的辩解:也许只有 5% 或 10% 的人可做得不错。而只有极少数人可做得真正好。而能做好两件事的人只有寥寥无几的了。假如一个人有真正的才能,他就应该乐于牺牲几乎所有的一切,以充分发挥自己的才能。

我会设想我是在为那些现在和过去都满怀雄心壮志的人写这本书的。一个人的首要任务,进一步说,一个年轻人的首要任务是能显示雄心壮志。雄心是一种可以合情合理地以许多形式表现出的一种宏大高尚的志向。阿提拉(Attila)和拿破仑的野心中就有某种高尚的志向,但最高尚的雄心壮志是在自己身后留下某种永存的价值。

  在这平坦的沙滩上,
  海洋与大地间,
  我该建起或写些什么,
  来阻止夜幕的降临?
  告诉我神秘的字符,
  去喝退那汹涌的波涛,
  告诉我时间的城堡,
  去规划那更久的白昼。

有很多高尚的动机驱使人们进行某项研究。在这些动机中,最为重要的有三种。 首先(舍此必一事无成)是理智的好奇心,也就是对了解真理的渴望。其次是对自己专业工作的自豪感,只有工作才能使自己得以满足的那种渴望。任何自尊的数学家,当他的工作与其才能不相称时,耻辱感会压倒一切。最后一个就是雄心壮志,期望得到名声、地位甚至随之而来的权力和金钱。

假如理智的好奇心、对专业工作的自豪感和雄心壮志是在研究工作中占支配地位的动机的话,那么,毫无疑问,没有哪个人比一个数学家有更好的机会来满足这些条件了。数学家的研究学科是所有学科中最令人好奇的。没有哪门学科中的真理会像数学那样奇异。数学是最精细与最富有魅力的技艺,而且数学研究提供了展示真正的专业技能的机会。最后我还要说的是,正如历史所充分证明的那样,不论数学内在的本质价值何在,其成就是一切成就中最持久的。

数学家,就像画家、诗人一样,都是模式的创制者。要说数学家的模式比画家、诗人的模式更长久,那是因为数学家的模式由思想组成,而画家以形状和色彩创制模式,诗人则以言语和文字造型。一幅画或许蕴含着某种”意境”,但通常是平凡而无关紧要的;比较之下,诗意要重要得多,不过,像豪斯曼坚持认为的那样,人们习以为常地夸大了诗意的重要性。他说:“我难以确信存在诗意之类的东西⋯⋯诗歌并不在于表述了什么,而在于怎样表述。”

 倾江海之水,洗不净帝王身上的膏香御气。

一个有意义的数学概念,一条严肃的数学定理从下述意义上被认为是“普遍的”。数学概念应该是许多数学构造的要素,应能应用于许多不同种定理的证明。

一个有意义的定理必须具备的第二个特性就是“深刻性”。其概念也不易定义,它与“难度”有关,深刻的思想往往难以掌握,但二者也并不完全一样。毕氏定理及推广所蕴含的概念有一定的深度,但现代数学家绝不会认为它难懂。相反,一个定理可能极为肤浅,但却难以证明–如丢番图(Diophantus)的有关求方程整数解的定理。

纯数学和应用数学的这些差异对它们本身很重要,但与我们关于数学“实用性”的讨论毫无关系。我曾谈到过费马和其他一些伟大的数学家的“真正的”数学,具有永恒美学价值的数学,如最好的希腊数学。它们之所以永恒,是因为其中的精华就像文学中的精英部分,在几千年后还能引起千万人强烈的满足感。

对于我的一生,或者说任何一个与我类似的数学家的情况是:我所做的工作扩充了知识,并且帮助他人在这座知识的大厦上添砖加瓦;而这些添加部分与伟大的数学家们的创新,或任何其他大大小小艺术家们的作品的价值的不同仅仅在于程度而不在于种类。这些数学家和艺术家都在死后留下了某种纪念物。

伽罗瓦 21 岁去世,阿贝尔 27 岁去世,拉曼纽扬 33 岁去世,黎曼 40 岁去世。也有些人确实是在较晚时取得伟大成就的,高斯就是在 55 岁时才发表了他的微分几何学的重要论文(但在此十年前他就已经形成了他的基本思想)。我还不知道有哪一个重要的数学进展是由一个年过半百的人创始的。假如一个年长的人对数学不感兴趣而放弃了它,这种损失不论对数学本身还是他本人来说,都不十分严重。

阅读《一个数学家的辩白》这本书,可以通过字里行间看到作为一个数学家的 Hardy 对数学的热爱,对自己正值花甲之年而无法做出更好的科研而流露出一种淡淡的忧伤。

其实,二十世纪三十年代末以后,Hardy 的学术活动就开始逐渐减少。1939 年第二次世界大战爆发,让 Hardy 感到更加苦闷。四十年代以后,Hardy 很少参与学术活动。1947 年 12 月 1 日,Hardy 在剑桥去世,享年 70 岁。留给大家的除了数学上的各种定理,书籍之外,还留下了这一本小册子,《一个数学家的自白》。

参考书籍:

  1. 《一个数学家的辩白》;
  2. 《黎曼猜想漫谈》。

一代数学大师 Rota 的经验与忠告

意大利裔的美籍数学家 Gian-Carlo Rota(1932 年 4 月 27 日 – 1999 年 4 月 18 日)是一位杰出的组合学家。他曾是研究泛函分析(Functional Analysis)出身,后来由于个人兴趣的转移,成为了一位研究组合数学(Combinatorial Mathematics)的学者。Rota 的职业生涯大部分都在麻省理工学院(MIT)度过,曾担任 MIT 的数学教授与哲学教授。

Rota's Photo 1970
1970 年的 Rota

从数学家族谱(Mathematics Genealogy Project)上面可以看到:Gian-Carlo Rota 的导师是 Jacob T. Schwartz,Rota 于 1956 年在耶鲁大学获得数学博士学位,其博士论文的题目是 Extension Theory of Differential Operators。

Rota的数学家族谱_1
Rota 的数学族谱

在 1997 年,Rota 发表了两篇关于人生经验和忠告的文章,分别是 “Ten Lessons I wish I Had Been Taught” 和 “Ten Lessons for the Survival of a Mathematics Department“。下面就来逐一分享这两篇文章中的一些观点。

Ten Lessons I wish I Had Been Taught

Springer Link Ten Lessons I wish I Had Been Taught
Ten Lessons I wish I Had Been Taught

讲座(Lecturing)

每次讲座或者分享的时候都有几个需要注意的事情。

(a)每次讲座都应该只有一个重点。(Every lecture should make only one main point.)

Every lecture should state one main point and repeat it over and over, like a theme with variations. An audience is like a herd of cows, moving slowly in the direction they are being driven towards. If we make one point, we have a good chance that the audience will take the right direction; if we make several points, then the cows will scatter all over the field. The audience will lose interest and everyone will go back to the thoughts they interrupted in order to come to our lecture.

(b)不要超时。(Never run overtime.)

Running overtime is the one unforgivable error a lecturer can make. After fifty minutes (one micro-century as von Neumann used to say) everybody’s attention will turn elsewhere even if we are trying to prove the Riemann hypothesis. One minute overtime can destroy the best of lectures.

(c)提及听众的成果。(Relate to your audience.)

As you enter the lecture hall, try to spot someone in the audience with whose work you have some familiarity. Quickly rearrange your presentation so as to manage to mention some of that person’s work. In this way, you will guarantee that at least one person will follow with rapt attention, and you will make a friend to boot.

Everyone in the audience has come to listen to your lecture with the secret hope of hearing their work mentioned.

(d)给听众一些值得回忆的东西。(Give them something to take home.)

Most of the time they admit that they have forgotten the subject of the course and all the mathematics I thought I had taught them. However, they will gladly recall some joke, some anecdote, some quirk, some side remark, or some mistake I made.

板书技巧(Blackboard Technique)

(a)开讲前保持黑板干净(Make sure the blackboard is spotless.)

By starting with a spotless blackboard you will subtly convey the impression that the lecture they are about to hear is equally spotless.

(b)从黑板的左上角开始书写(Start writing on the top left-hand corner.

What we write on the blackboard should correspond to what we want an attentive listener to take down in his notebook. It is preferable to write slowly and in a large handwriting, with no abbreviations.

When slides are used instead of the blackboard, the speaker should spend some time explaining each slide, preferably by adding sentences that are inessential, repetitive, or superfluous, so as to allow any member of the audience time to copy our slide. We all fall prey to the illusion that a listener will find the time to read the copy of the slides we hand them after the lecture. This is wishful thinking.

多次公布同样的结果(Publish the Same Result Several Times)

The mathematical community is split into small groups, each one with its own customs, notation, and terminology. It may soon be indispensable to present the same result in several versions, each one accessible to a specific group; the price one might have to pay otherwise is to have our work rediscovered by someone who uses a different language and notation and who will rightly claim it as his own.

说明性的工作反而更有可能被记得(You Are More Likely to Be Remembered by Your Expository Work)

When we think of Hilbert, we think of a few of his great theorems, like his basis theorem. But Hilbert’s name is more often remembered for his work in number theory, his Zahlbericht, his book Foundations of Geometry, and for his text on integral equations.

每个数学家只有少数的招数(Every Mathematician Has Only a Few Tricks)

You admire Erdös’s contributions to mathematics as much as I do, and I felt annoyed when the older mathematician flatly and definitively stated that all of Erdös’s work could be “reduced” to a few tricks which Erdös repeatedly relied on in his proofs. What the number theorist did not realize is that other mathematicians, even the very best, also rely on a few tricks which they use over and over. But on reading the proofs of Hilbert’s striking and deep theorems in invariant theory, it was surprising to verify that Hilbert’s proofs relied on the same few tricks. Even Hilbert had only a few tricks!

别害怕犯错(Do Not Worry about Your Mistakes)

There are two kinds of mistakes. There are fatal mistakes that destroy a theory, but there are also contingent ones, which are useful in testing the stability of a theory.

使用费曼的方法(Use the Feynman Method)

You have to keep a dozen of your favorite problems constantly present in your mind, although by and large they will lay in a dormant state. Every time you hear or read a new trick or a new result, test it against each of your twelve problems to see whether it helps. Every once in a while there will be a hit, and people will say, “How did he do it? He must be a genius!”

不要吝啬你的赞美(Give Lavish Acknowledgments)

I have always felt miffed after reading a paper in which I felt I was not being given proper credit, and it is safe to conjecture that the same happens to everyone else.

写好摘要(Write Informative Introductions)

If we wish our paper to be read, we had better provide our prospective readers with strong motivation to do so. A lengthy introduction, summarizing the history of the subject, giving everybody his due, and perhaps enticingly outlining the content of the paper in a discursive manner, will go some of the way towards getting us a couple of readers.

为老年做好心理准备(Be Prepared for Old Age)

You must realize that after reaching a certain age you are no longer viewed as a person. You become an institution, and you are treated the way institutions are treated. You are expected to behave like a piece of period furniture, an architectural landmark, or an incunabulum.

 

Ten Lessons for the Survival of a Mathematics Department

Springer Link Ten Lessons for the Survival of a Mathematics Department
Ten Lessons for the Survival of a Mathematics Department

不要在其他系讲自己系同事的坏话(Never wash your dirty linen in public)

Departments of a university are like sovereign states: there is no such thing as charity towards one another.

别越级打报告(Never go above the head of your department)

Your letter will be viewed as evidence of disunity in the rank and file of mathematicians. Human nature being what it is, such a dean or provost is likely to remember an unsolicited letter at budget time, and not very kindly at that.

不要进行领域评价(Never Compare Fields)

You are not alone in believing that your own field is better and more promising than those of your colleagues. We all believe the same about our own fields. But our beliefs cancel each other out. Better keep your mouth shut rather than make yourself obnoxious. And remember, when talking to outsiders, have nothing but praise for your colleagues in all fields, even for those in combinatorics. All public shows of disunity are ultimately harmful to the well-being of mathematics.

别看不起别人使用的数学(Remember that the grocery bill is a piece of mathematics too)

The grocery bill, a computer program, and class field theory are three instances of mathematics. Your opinion that some instances may be better than others is most effectively verbalized when you are asked to vote on a tenure decision. At other times, a careless statement of relative values is more likely to turn potential friends of mathematics into enemies of our field. Believe me, we are going to need all the friends we can get.

善待擅长教学的老师(Do not look down on good teachers)

Mathematics is the greatest undertaking of mankind. All mathematicians know this. Yet many people do not share this view. Consequently, mathematics is not as self-supporting a profession in our society as the exercise of poetry was in medieval Ireland. Most of our income will have to come from teaching, and the more students we teach, the more of our friends we can appoint to our department. Those few colleagues who are successful at teaching undergraduate courses should earn our thanks as well as our respect. It is counterproductive to turn up our noses at those who bring home the dough.

学会推销自己的数学成果(Write expository papers)

When I was in graduate school, one of my teachers told me, “When you write a research paper, you are afraid that your result might already be known; but when you write an expository paper, you discover that nothing is known.”

It is not enough for you (or anyone) to have a good product to sell; you must package it right and advertise it properly. Otherwise you will go out of business.

When an engineer knocks at your door with a mathematical question, you should not try to get rid of him or her as quickly as possible.

不要把提问者拒之门外(Do not show your questioners to the door)

What the engineer wants is to be treated with respect and consideration, like the human being he is, and most of all to be listened to with rapt attention. If you do this, he will be likely to hit upon a clever new idea as he explains the problem to you, and you will get some of the credit.

Listening to engineers and other scientists is our duty. You may even learn some interesting new mathematics while doing so.

联合阵线(View the mathematical community as a United Front)

Grade school teachers, high school teachers, administrators and lobbyists are as much mathematicians as you or Hilbert. It is not up to us to make invidious distinctions. They contribute to the well-being of mathematics as much as or more than you or other mathematicians. They are right in feeling left out by snobbish research mathematicians who do not know on which side their bread is buttered. It is our best interest, as well as the interest of justice, to treat all who deal with mathematics in whatever way as equals. By being united we will increase the probability of our survival.

把科学从不可靠中拯救出来(Attack Flakiness)

Flakiness is nowadays creeping into the sciences like a virus through a computer, and it may be the present threat to our civilization. Mathematics can save the world from the invasion of the flakes by unmasking them and by contributing some hard thinking. You and I know that mathematics is not and will never be flaky, by definition.

This is the biggest chance we have had in a long while to make a lasting contribution to the well-being of Science. Let us not botch it as we did with the few other chances we have had in the past.

善待所有人(Learn when to withdraw)

Let me confess to you something I have told very few others (after all, this message will not get around much): I have written some of the papers I like the most while hiding in a closet. When the going gets rough, we have recourse to a way of salvation that is not available to ordinary mortals: we have that Mighty Fortress that is our Mathematics. This is what makes us mathematicians into very special people. The danger is envy from the rest of the world.

When you meet someone who does not know how to differentiate and integrate, be kind, gentle, understanding. Remember, there are lots of people like that out there, and if we are not careful, they will do away with us, as has happened many times before in history to other Very Special People.

参考资料:

  1. Rota, Gian-Carlo. “Ten lessons I wish I had been taught.” Indiscrete thoughts. Birkhäuser, Boston, MA, 1997. 195-203.
  2. Rota, Gian-Carlo. “Ten Lessons for the Survival of a Mathematics Department.” Indiscrete Thoughts. Birkhäuser, Boston, MA, 1997. 204-208.