Category Archives: One Dimensional Dynamical System

如何用通俗易懂的语言来解释一维动力系统

我们用科普的角度来聊聊“一维动力系统”(One-Dimensional Dynamics)。

想象一下,你有一个非常简单的规则,这个规则告诉你:根据一个点当前的位置,如何确定它下一刻的位置。然后你不断地、一遍又一遍地应用这个规则。研究这个点在“时间”(可以理解为迭代次数)推进下如何运动、最终会去哪里、系统整体会表现出什么性质的学问,就是动力系统理论
当这个点只能在一条线上移动时(比如一条无限长的数轴,或者一个首尾相接的圆圈),我们研究的系统就叫做一维动力系统

为什么研究“一维”?

  1. 简单但深刻: 一维是维度最低的情况,规则相对简单,更容易分析和理解。但别小看它,即使是最简单的一维规则,也能产生极其复杂和令人惊讶的行为(比如混沌)。
  2. 基础性: 理解了一维系统的行为,是理解更高维(二维、三维甚至无穷维)更复杂系统的基础。很多高维系统中的核心思想和现象(如混沌、分形、吸引子)都能在一维模型中找到原型或被深刻理解。
  3. 应用广泛: 虽然模型简单,但一维动力系统可以用来描述很多实际现象的简化模型,比如:
    (1)种群增长: 今年昆虫的数量决定了明年的大致数量(考虑环境承载力的限制)。
    (2)简单物理过程: 单摆的近似运动(在小角度时)。
    (3)经济模型: 简单的市场供需关系演化。
    (4)信号处理: 某些反馈机制。

一维动力系统的核心要素:

  1. “舞台”: 点运动的空间。主要分两类:
  • 区间: 比如一条线段 [0, 1]。点不能跑出这个范围。
  • 圆周: 像一个环 。点跑出“右边界”会从“左边界”回来(反之亦然)。想象一个圆盘边缘的点。

2. “规则”: 一个函数 f(x)。它定义了如何根据当前点 x 的位置,计算出下一个点 x_{n+1} = f(x_n)。这个函数通常是连续的,有时甚至是光滑的(可导的)。

3. “演员”: 一个初始点 x₀

4. “剧情”: 点运动的轨迹 x₀, x₁ = f(x₀), x₂ = f(x₁) = f(f(x₀)), x₃ = f(f(f(x₀))), ...。这个序列 {x₀, x₁, x₂, ...} 称为轨道

研究什么?关键问题:

  1. 不动点: 有没有点 x* 满足 f(x*) = x*?这个点就像“黑洞”,一旦到达就永远停在那里。它是系统最简单的稳定状态。
  2. 周期点: 有没有点 x_p 满足 f(f(...f(x_p)...)) = x_p(应用 k 次后回到自身)?这样的点会产生一个循环往复的轨道 (x_p, f(x_p), f²(x_p), ..., f^{k-1}(x_p), x_p, ...),称为周期 k 轨道。这代表了系统的周期性行为。
  3. 吸引子: 大多数初始点的轨道最终会趋向于什么样的状态?是一个不动点?一个周期轨道?还是一个更复杂的、永不重复但被限制在某个区域的集合(混沌吸引子)?吸引子代表了系统长期行为的模式。
  4. 对初始条件的敏感性(蝴蝶效应): 这是混沌的核心特征。两个非常非常接近的初始点 x₀ 和 y₀,经过多次迭代后,它们的轨道 {x_n} 和 {y_n} 会分道扬镳,变得毫无关系吗?如果系统具有这种性质,那么长期预测就变得极其困难。
  5. 拓扑共轭: 两个看起来不同的规则 f(x) 和 g(x),是否本质上描述了相同的动力学行为?就像一个故事用中文和英文讲述,情节一样,只是语言不同。找到这种“等价关系”有助于对系统分类。
  6. 分岔: 当规则 f(x) 依赖于某个参数 a(比如 f_a(x) = a * x * (1 - x))时,随着 a 的变化,系统的长期行为(吸引子的类型、数量、稳定性)会发生突然的、戏剧性的变化。这就像调节一个旋钮,系统性质突然“跃变”了。

一个著名的例子:Logistic Map(逻辑斯蒂映射)


规则极其简单:f(x) = r * x * (1 - x)。其中 x 在 [0, 1] 区间内(比如可以代表种群数量占环境最大承载量的比例),r 是一个参数(比如代表繁殖率)。

  • 当 r 比较小(比如 r=2)时:几乎所有初始点的轨道都趋向于一个稳定的不动点。种群数量最终稳定在一个固定值。
  • 当 r 增大一些(比如 r=3.2)时:不动点失稳,出现一个稳定的周期2轨道。种群数量开始呈现“大小年”交替振荡。
  • 当 r 继续增大(比如 r=3.5)时:周期2失稳,出现稳定的周期4轨道。振荡模式变得更复杂。
  • 当 r 增大到某个临界值(约 r≈3.57)以上:系统进入混沌区!轨道看起来是随机的(虽然由完全确定的规则产生),永不重复,对初始条件极其敏感。种群数量变化变得不可长期预测。在这个区域里,还能发现一些“窗口”,其中又会出现稳定的周期轨道(比如周期3)。
  • 当 r=4 时:混沌行为充满整个区间 [0, 1],并且轨道点会稠密地分布在整个区间。

这个简单的二次函数,仅仅通过改变一个参数 r,就展现了从稳定、周期振荡到混沌的几乎所有一维动力系统的典型行为!它是一维动力系统研究的“明星模型”。

一维动力系统研究的是点在一条线(直线段或圆圈)上,按照一个确定的规则 f(x) 一步步移动的长期行为。它关注点最终会去哪里(吸引子)、是否会周期性重复、是否对起点极其敏感(混沌),以及当规则参数变化时行为如何突变(分岔)。虽然空间结构简单,但它能产生极其丰富和复杂的动力学现象,是理解更复杂系统的基础,并且在简化模型中描述了许多自然和社会现象。Logistic Map 是展示一维动力系统魅力最经典的例子。

在新加坡的这五年—学术篇(八)

在2010年12月的新加坡,没有冬天,只有雨天。每天差不多下午四点,天色微暗,图书馆的窗外就会下起一场雷阵雨,雷声轰鸣却不让人害怕,反而像是某种自然的节奏。而且下雨的时间非常准时,不多不少,正好是每天下午的四点左右。当年由于办公位紧张,再加上我的运气一般,导致我没有抽到办公位,所以我每天就喜欢坐在新加坡国立大学的理学院图书馆(Science)靠窗的位置,桌上摊着一篇数学论文,题目看起来很有难度:《Polynomial maps with a Julia set of positive Lebesgue measure: Fibonacci maps》。这是导师布置的任务,要我找出这篇论文中的一个“gap”,而且这个gap是Xavier Buff在1997年就已经指出,但是又没有明确指出哪一段有问题。我当时还很年轻,对动力系统入门并不算久,也没有阅读论文的经历,面对那些抽象的定理和公式,一度感到焦头烂额。

这篇论文声称,对于足够大的偶数 \ell,总存在实数c,使得映射 z \mapsto z^\ell + c 的Julia集具有正的Lebesgue测度。这是一个重要的结论,也是一道未解的难题。可惜的是,1997年时法国数学家Xavier Buff指出论文中存在严重缺陷,但具体问题所在一直无人给出明确分析。导师要我做的,就是从这篇纸面看似无懈可击的证明中,找出那个致命的漏洞。那段时间,我每天在图书馆待到闭馆,翻来覆去地研究每一个lemma、每一页的推导,一边听着窗外准时的雨声,一边陷在公式构筑的迷宫里。

Xavier Buff是一位法国数学家,虽然他写了一篇论文来解释原始论文中的“gap”,但他并没有用英文,而是选择了法语来表达。而且,这篇论文只是在布尔巴基的Seminar会议或者期刊上发表。毕竟,当着大佬们的面指出他们论文中的漏洞,压力是很大的,最好还是含蓄一些。毕竟,学术界的江湖并不是简单的打打杀杀,更多的是讲究人情世故。如果这些大佬的论文即便有瑕疵,最好不要随便去补漏洞,免得得罪人都不知道是怎么回事。那时我还年轻,依旧保持着一股浓烈的数学研究热情,尽管是法语论文,也没有难倒我。

我打开翻译软件,将Xavier Buff的论文一字一句地翻译。那时的科技远没有现在那么发达,翻译软件的功能也很有限。我只能一段一段地翻译,然后将翻译内容用LaTeX排版成英语文章。整整花了一个多月的时间,我终于把这篇论文翻译完成,并且整理成了英语版本,发给了导师。但我也感觉到,Xavier Buff在论文里其实并没有明确指出,原论文的哪一章节、哪一个定理、甚至哪一句话是错的。当时我就体会到了,果然,老外也是很讲究人情世故的。

不过,Xavier Buff针对Fibonacci Maps还是撰写了一篇英文的文章《FIXED POINTS OF RENORMALIZATION》。他将经典多项式映射的重正化理论拓展至更广泛的映射类型(称为L-映射),特别针对具有特定临界轨道组合结构的斐波那契映射(非经典重正化对象),构建了一个封闭的自洽重正化算子。证明实对称斐波那契映射的迭代重正化序列会收敛到一个二阶周期循环(即两个映射交替互为重正化结果)。这两个映射在临界点邻域内表现相同,而在另一特定区域内则呈现符号相反的对称关系。通过重正化不动点导出关键函数方程(Cvitanović-Feigenbaum方程),并证明其解具有独特的几何性质:解的解析域是由拟圆边界界定的拟盘。由此构造的多项式类映射,其动力系统的Julia集具有拟共形等价性(如等价于某类多项式的朱利亚集或拟圆)。这篇论文虽然提供了一个不错的想法,但是对指出原始论文的Gap帮助有限。

做科研比较痛苦的事情就是思考问题,而且要克服的事情就是每天起床之后要面对一天的失败,毕竟365天起码有300天没有结果。经过我个人的不懈努力,一页一页磨,总算在博士第三年把论文推进到Chapter10。虽然推进的速度相对其他方向慢了许多,但是我在阅读论文的过程中还是把周边的论文都读了个遍,包括但不限于Fibonacci Interval Map、Fibonacci Circle Map、Renormalization Theory、Martingale Theory 等方向的书籍与论文资料,当时给我的感觉就是除了这篇文章没搞定,其他论文都搞定了。而且这篇原始的论文我差不多也花费了快三年的时间,可能是我个人的天分不太够吧。在2021年左右,我在师弟的一篇报道中看到下面这一段话,引用在这里以激励大家努力工作从而做出杰出成果:

接近一年的时间就为了去搞懂一篇论文,这在有的人看来是很不划算的,沈老师却有不同的观点:“ 做数学要能静心来,年轻人花十年时间不去计较得失钻研数学不是件吃亏的事情”,这句话让我内心深受震撼。确实数学研究一直是困难重重,做出好的结果更加不易,大多数时候的付出往往没有收获,计较一时的得失只会犹豫不前。只有不忘初心,才不会愧对自己的人生。 “十年不亏”也成为了我后来学习生活的指路明灯,我相信那句话: “念念不忘,必有回响”。

最近到了2025年,回想起当时的种种,也觉得颇有一番道理。如果只是为了做一个普通的结果,那就最好不要去做了。还是要以核心的论文和课题为目标,只有树立远大的目标,最终才会有一个好的结果。比如说,在研究动力系统的过程中,如果以发表《Annals of Mathematics》为目标,那么说不定最终能发表一篇《Communications in Mathematical Physics》;如果以发表《Communications in Mathematical Physics》为目标,或许可以发表一篇《Ergodic Theory and Dynamical Systems》;如果以发表《Ergodic Theory and Dynamical Systems》为目标,最终可能只会发表一篇《Discrete and Continuous Dynamical Systems》;而如果以《Discrete and Continuous Dynamical Systems》为目标,那么估计最后只能发表国内期刊了。当时我还在读博士的时候,我们私下认为,要想在动力系统领域做下去,博士期间至少得发一篇《Ergodic Theory and Dynamical Systems》这个档次的论文,毕竟这算是动力系统领域的敲门砖,发表了之后就算是正式进入这个领域了。

转眼已经是2025年,我再次想起那篇让我头疼了好几年的论文。这一次,我有了一个全新的“助手”——人工智能。我将整篇论文输入到AI中,要求它分析出最有可能出错的关键lemma或theorem。为了避免它被先前的结果干扰,我每次分析前都清空对话历史。第一次,它指向了第10章;第二次,依然是第10章;第三次,依旧如此。这个结果让我震惊,因为十几年前,我也正是凭借自己的直觉和一堆手写演算,将焦点锁定在了那个章节。那一刻,我突然感受到一种跨越时间的验证——仿佛过去那个在热带雨中冥思苦想的我,终于得到了回应。

于是,我再次深入提问,追问第10章可能存在的潜在问题。这次,AI指出了引理10.3和定理10.3的渐进表达式可能存在问题,这与我当时认真分析和严格计算得到的初步结果已经非常相似。我意识到,AI并没有直接为我解答问题,它只是以另一种方式验证了我的直觉和判断。那时我可能还在用尺规构建数学的“积木”,而现在,AI则帮我拿起了扫描仪。它不是替代者,而是另一个视角,一个冷静、系统、高效的数学“侦探”。它无法凭空理解抽象背后的意义,但它能以惊人的效率指向结构中的松动之处,让我们这些人类研究者能够更加聚焦地重新思考。

而在2010年我翻译的那一篇法语论文在AI的协助下,翻译变得极为容易,只需要短短几句话,我就可以得到完整的段落翻译,甚至还可以获得论文指出的“Gap”。从论文指出的内容来看,确实也算指出了原始论文存在不可逾越的缺陷。

这次经历让我对之前的科研进行了反思,也对AI的使用有了更深层次的体会。AI可以是导师,是助手,是共谋者,但它永远无法取代我们对于美、逻辑和意义的追求。我记得在新加坡的前三年时间里,我对着这篇论文感到迷茫和无力;而现在,我借助AI,让迷雾稍稍散去了一点。这不仅仅是一次问题的回溯,更像是一次人与技术共舞的实验。最终,我并没有解决那个难题,但我知道,解决的路径已经比过去清晰了许多。

未来的科研,将是人与AI的合奏。我们用直觉和经验提出问题,AI用速度和模式捕捉给出方向。而最终的证明与理解,仍然属于我们。那些新加坡每天准点落下的雷雨,就像是大自然给出的节奏,而AI,是帮我们听懂这段旋律的新耳朵。

斯蒂芬·斯梅尔:在里约海滩上改变数学的人

斯蒂芬·斯梅尔(Stephen Smale)是20世纪和21世纪最具影响力的数学家之一。他的学术生涯横跨拓扑学、动力系统、数学经济学以及计算理论等多个领域,留下了一系列深刻而广泛的贡献。1930年7月15日出生于美国密歇根州的弗林特市,前几天便是他的 95 岁大寿。斯梅尔在密歇根大学完成了他的本科与博士教育,他的博士论文题为《黎曼流形上的正则曲线》,导师是著名数学家劳尔·博特(Raoul Bott)。然而,这位年轻数学家的真正声名鹊起,源于他1961年完成的一项震惊世界的突破:高维庞加莱猜想的证明。

庞加莱猜想被认为是20世纪最重要的数学难题之一,其本意是探究在高维空间中,若一个光滑流形与球面具有相同的基本拓扑性质(即同伦等价),它是否必定就是球面本身(在同胚意义下)。斯梅尔巧妙地结合莫尔斯理论和他开创的h-配边定理(h-cobordism theorem),成功证明了当维度大于等于5时,这一猜想成立。这项工作不仅解决了一个长久未解的拓扑难题,更为后来维度较低情况下(尤其是三维庞加莱猜想)的问题奠定了理论框架和方法论基础。凭借这一成果,斯梅尔获得了1966年菲尔兹奖——这是数学界的最高荣誉之一。

然而,斯梅尔的视野远不止于拓扑学。他在动力系统理论中的工作同样具有革命性意义。最为人所津津乐道的是“斯梅尔马蹄映射”的提出。这个模型起源于他在巴西里约热内卢海滩度假时的灵感,被他戏称为“我最好的数学不是在办公室里完成的,而是在海滩上诞生的”。马蹄映射的几何图像非常直观:它将一个正方形区域拉伸、折叠,形成马蹄形状,再将其重新放回原始空间。这个简单的变换却产生了惊人的后果——在迭代中,它展示出对初始条件的极度敏感,导致轨道呈指数级分离,这正是“混沌”现象的核心特征。

通过对马蹄映射的严格数学分析,斯梅尔首次为“混沌”这一广义概念赋予了明晰而严密的定义。他证明该映射在一个康托集(Cantor set)上存在一个双曲不变子集,其动力学行为等价于伯努利移位这类符号动力系统。这意味着,即便一个系统在每一步的演化规则完全确定,其长期行为也可能表现出无法预测的复杂性。斯梅尔由此揭示出一个深刻的真理:在完全确定性的世界中,也潜藏着无限复杂与不确定性。

在进一步研究中,斯梅尔发展出莫尔斯-斯梅尔系统(Morse-Smale systems),这是一类结构稳定的动力系统,具有明确的吸引子与排斥子结构。他将莫尔斯理论与动力系统结合起来,构建了一套分析系统稳定性与拓扑结构之间联系的工具体系。在这些系统中,轨道的行为可以通过有限个稳定和不稳定的周期点来描述,从而使得对其长期演化的分析成为可能。这些理论成果不仅对数学内部产生了巨大影响,也为物理学中的湍流、气象学中的气候模型、工程中的非线性控制系统等提供了核心框架。

斯梅尔的视角一向超越数学的分科壁垒。他认为数学的真正魅力在于其结构性的思维方式可以应用到其他复杂系统中。1990年代以来,他开始关注经济学和计算理论,并与Shub、Blum合作提出了Blum–Shub–Smale模型(BSS模型)。这一模型旨在将传统图灵机的离散计算框架推广到实数域,建立一个能够处理连续变量问题的复杂性理论基础。这个模型尤其在研究数值计算复杂度、优化问题的可解性等方面,提供了重要的理论支持。

他还将拓扑工具引入经济学研究,试图用几何与动力系统的方法理解市场均衡的存在性与稳定性。例如,在研究一般均衡理论时,他探讨了价格调整过程是否能够收敛到均衡点,从而为新古典经济学中的“看不见的手”提供了数学分析的可能性。这种跨学科的工作风格,使斯梅尔在多个学科领域都留下了不可忽视的印记。

在斯梅尔看来,数学的发展不仅依赖于过去问题的解决,也需要对未来的大胆构想。1998年,他仿效大数学家希尔伯特的传统,发布了21世纪数学问题清单,总共列出18个未解的重要问题。这些问题涵盖数论、代数几何、计算理论、偏微分方程与动力系统等多个前沿方向。其中包括著名的黎曼猜想、P vs NP问题、纳维–斯托克斯方程的解的存在性与光滑性等,这些问题后来也被选为千禧年七大数学难题的一部分。斯梅尔的问题清单不仅展示了他对数学整体脉络的深刻理解,也对21世纪的数学研究方向产生了重要影响。

作为一位导师,斯梅尔同样具有极强的影响力。他培养的48位博士生中,有许多成为动力系统和混沌理论的领军人物,其中包括与他合著《微分方程、动力系统与混沌导论》的莫里斯·赫希(Morris Hirsch)和著名的科普作家、混沌研究者罗伯特·德瓦尼(Robert L. Devaney)。他们共同撰写的这本教材,已被引用超过12,000次,成为全球无数数学系与工程系课程的标准读物。

斯梅尔的学术成果受到世界广泛认可,除菲尔兹奖外,他还获得了美国国家科学奖章(1996)、沃尔夫数学奖(2007)、奥斯瓦尔德·维布伦几何奖(1966)和肖维内奖(1988)等诸多荣誉。他的影响甚至延伸至天文学界,一颗小行星被命名为“斯梅尔行星”(Smale Planet),以纪念他对科学的贡献。

斯梅尔一生坚持以非传统的方式思考问题,他喜欢说:“我的最佳数学灵感,往往不是在办公室里获得的。”这一观点在他创造马蹄映射的经历中得到了最好的诠释。他的经历证明了自由的思维环境与非线性的灵感源泉,往往比传统学术模式更能激发创造力。

斯梅尔的动力系统理论阐释了一个核心思想:简单规则可以孕育无限复杂。从高维拓扑到混沌动力系统,从实数计算理论到经济系统的动态建模,他持续推动数学扩展其疆域,直指自然与人类社会中深层的秩序与混乱。他让我们看到,在最基础的规则中,藏着宇宙运行的密码,而数学,正是我们用以破译这密码的语言。

在新加坡的这五年—学术篇(七)

之前,我写过不少关于自己学术经历的文章,但今天我想换个角度,重新审视自己的博士历程。如果让我重新再来一次攻读博士学位,我会在哪些方面做出改进和优化?这正是这十年职场生涯中,我逐渐学到的一个重要技能——复盘。正如常言所说,赢了要清楚为什么赢,输了也要弄明白为什么输了。

在攻读博士期间,心态的转变至关重要。为什么这么说呢?因为读博士和本科、硕士有着明显的区别,博士生必须要产出论文。没有产出,就等于没有成绩。无论你在考试中排第几,最终能否在学术界占有一席之地,还是要看你做出了什么样的数学成果。在数学界,没人太在乎你学过多少数学知识,更关心的是你取得了哪些数学成就。因此,博士期间的心态转变显得尤为重要。你需要尽可能多地将时间投入到科研中,而不是陷入书本知识的海洋,反复阅读数学书籍,或者忙于参加各种各样的考试。

对于博士生而言,导师是获取资源的重要渠道之一。就像工作中,领导往往拥有各种资源,若不主动寻求,开展工作总是困难重重。博士生亦是如此,优秀的导师、教授、杰青、长江学者,甚至院士,背后都有丰富的资源。如果不主动争取,显然是在浪费这些宝贵资源。因此,在读博期间,千万不要忽视导师的作用。只要导师是相对靠谱的,即使面临严厉的批评,也要积极向导师寻求资源。这里的资源不仅仅包括经费支持、学术合作机会,还有可能是学术联系、合作项目、甚至就业推荐。想当初在2014年8月份在韩国首尔举办国际数学家大会的时候,如果我主动争取的话,说不定能够去现场参加的机会,也能够拿到院系的补助。所以说能向导师争取的资源就一定要去主动争取,否则资源就消失不见了。

然而,对于很多博士生来说,尤其是那些在本科和硕士阶段表现突出的学生,他们通常习惯了成为被表扬的对象。但在博士阶段,这种状态可能会发生反转。无论你做得多好,总有人比你做得更好,而表扬和正反馈也不像之前那么频繁。因此,接受这一点,对博士生来说是一个重要的心态调整。

决定攻读博士的学生很多,但能够在博士阶段取得重大突破的却寥寥无几。每个决定投身科研的人,心中都怀揣着一个梦想,那就是解决一些科研上的难题。然而,科研中的难题往往并非轻易可解,它们需要天时、地利、人和的完美结合,缺一不可。这也导致科研过程中充满了大量的负反馈。在这样的环境下,如何保持前行,如何有效消除负反馈的影响,成为了一个关键问题。负反馈过多,容易让博士生陷入拖延、焦虑、抑郁等负面情绪中。当我阅读《战胜拖拉》这本书时,我意识到有一种方法可以帮助自己克服这些困境。具体做法是,每天开始科研工作前,先规划好当天的任务,并从一个简单的开局开始,哪怕只是创建一个文件夹、打开一个latex文档,或者整理一个论文标题。接下来,我使用番茄工作法,通过30分钟的集中高效工作逐步展开,逐渐增加工作时间,力求每天在科研上投入3-4小时。这样,虽然时间看似匆匆过去,但每天都有一定的科研产出,长时间坚持下来,成果也会逐步显现。如果我能够在博士生的第二年就使用这个方法,恐怕早就解决科研上的不少问题了。

除了番茄工作法,合理的任务分解也是提高工作效率的关键。科研任务往往复杂且庞大,难以在短时间内完成,容易让人感到焦虑和沮丧。此时将任务分解成若干小块,逐一攻破,不仅能够减轻心理负担,还能提高工作积极性。在我的科研过程中,我发现将一个大问题拆分成若干个小问题,并给自己设定明确的阶段性目标,往往能带来意想不到的效果。

除此之外,在科研的道路上,最大的挑战之一就是如何面对持续的困难和不确定性。尤其是当研究没有显著进展时,负反馈的声音往往会变得愈发响亮。科研本身就充满了不确定性,很多时候博士生所做的工作可能并不会立即见到成果,这也是科研与其他领域不同之处。每一个新的发现背后,往往是无数次的失败和挫折积累而成的。面对这种反复的挑战,博士生必须学会接受失败,并在失败中寻找前进的动力。毕竟,失败本身并不意味着能力的不足,而是科学探索的一部分。在这种情况下,心态的调整显得尤为重要。正如《战胜拖拉》这本书所强调的,面对拖延和自我怀疑时,最关键的是保持一种积极的心态,学会为自己的每一个小进展庆祝,而不是一味地关注自己还未解决的问题。

在博士第四年科研的时候,当我渐渐适应了这种节奏,科研的压力也变得更加可控。虽然困难依旧存在,但每一次在论文上的小突破都让我感受到成长的力量。而这种成就感,正是驱动我继续前行的动力,也促使我最终完成了课题。

在新加坡的这五年—学术篇(六)

刚入学新加坡国立大学(NUS)时,作为一名数学博士,我为自己设定了一个明确的目标:在四大数学期刊上发表论文,即《Annals of Mathematics》、《Inventiones Mathematicae》、《Journal of the American Mathematical Society》和《Acta Mathematica》。这个目标是我科研生涯早期最重要的方向,也是我不断努力的动力源泉。

然而,博士第二年下学期,我的科研进入了困境。思路受阻,进展缓慢,那段时间我常常感到迷茫和焦虑,陷入了低效的恶性循环。进入博士第三年上学期,我重新振作,奋发图强,努力推进研究工作,取得了一些进展。但到了下学期,我再次陷入了科研瓶颈。那段时间,我深刻感受到拖延和自我怀疑所带来的负面影响。

幸运的是,在博士第三年下学期临近结束时,我读到了《战胜拖拉》这本书。这本书对我的影响深远,它帮助我认识到自己在时间管理和心理抗阻上的问题,也让我明白了持续努力的重要性。在调整了心态与习惯后,我的研究终于取得独立突破,完成了Real Bound Theorem的结果。这一阶段的成功,我由衷地感谢《战胜拖拉》。博士第四年,我保持了相对稳定且高效的节奏。几乎每周七天都在工作,平均每天有三小时左右的高质量研究时间。虽然听起来不多,但这三小时的专注深度和效率,为我带来了持续的产出与成长。

大约是在2014年的时候,也就是我博士第四年的时候,可能记忆有偏差。有一次师门几人在Dover聚餐,其中包括导师、大师兄、三师兄还有我。导师问我们几人:“你们几个最近每天花在科研上的时间有多少,是一个小时还是两个小时?”大家顿时沉默不言。当时我阅读了《战胜拖拉》且颇有心得,我确实也按照书中所说治疗本人的拖延症,每天至少也有三个小时投入写论文中。我就如实告知导师。导师立刻说:“三个小时是肯定不够的,你最后的结果不会太差”。回头看上去,最后的结果也不算太差,能够正常搞完论文,当然出路也不算太好,要凭借自己的实力留在学术圈要也比较困难。

我毕业之后,师门几个人也逐渐从国外回国了。后来到了2021~2022年的时候,看到另外一位师弟在四大(Inventiones Mathematicae)上发表了一篇文章,所在学校专门报道了这件事情,我认真阅读了一下里面的内容,其中有几句话印象颇深。

导师一般会布置三个层次的课题,分别是:第一个课题锻炼学生独立思考的能力,第二个课题培养学生独立解决问题的能力,第三个课题让学生独立找到一个有意思的问题并独立解决。

看到这里,回想起来自己大概只完成了第一个课题,也就是Wild Cantor Attractors在Fibonacci-like区间映射上的存在性。要是严格说起来,也没有锻炼出太多独立思考的能力,但是绝对培养了我坚韧不拔的能力和抗压能力,让我以后面对工作难题的时候总能够迎难而上。

为什么我只能完成第一个课题?这可能与博士前三年投入的时间和精力有关。博士第一年大部分时间都花在了应对各种研究生考试和博士生资格考试上。在这一年内,我完成了七门数学课程的学习,并一次性通过了两门博士资格考试。第二年第一学期,我顺利通过了博士资格考试的口试部分和开题报告。问题出现在第二年第二学期,科研进展和状态陷入了恶性循环。论文进展缓慢,思路难以展开,每当看到论文就头大,整个人也不知道自己在做什么,反正浑浑噩噩地度过了这一年。直到第三年第一学期,我才努力奋起直追,开始有了些论文阅读的进展,但很快在第三年第二学期又陷入了恶性循环。直到第三年第二学期接近结束时,我才成功完成了Real Bound Theorem的研究成果。第四年的两个学期,我都在努力追赶进度,终于在第四年结束时,完成了论文的框架和细节整理。博士第五年第一学期,我将论文整理完毕并提交,第二学期顺利完成答辩。

问题的根源在于,博士第二年和第三年我陷入了迷茫,浪费了许多时间,导致我没有足够的时间投入到第二个课题和第三个课题上。然而,尽管如此,我还是从导师那里得到了第二个课题。在博士第四年,当我基本搞定第一个课题,并有把握将其写成毕业论文时,导师立刻给了我第二个课题。这个课题的描述是这样的:

Conjecture. 是否可以找到一个光滑的区间映射,使得通过迭代构造的类Cantor集合具有正的勒贝格测度?

大家都知道,假设我们选择一个合适的函数 f,其形式类似于构造Cantor三分集合的过程。也就是说,Cantor三分集合可以表示为:\cap_{n=1}^{\infty}f^{-n}([0,1]) ,通过直接计算可以得出,Cantor三分集合的勒贝格测度为零。然而,问题在于是否能够找到一个新的区间映射f,通过迭代的方式构造出一个类Cantor集合,且该集合具有正的勒贝格测度?

当然,这个问题的难度非常大。当初我拿到这个问题时,导师对我说:“这个问题我不做了,你自己去做吧。”于是,我努力了一个多月,尽管没有找到明显的进展,但我发现这个区间映射的Real Bound Theorem与我之前做的有很大差异。毕业后,我没有继续研究这个问题。十年后,我再次搜索相关文献,依然没有找到明确的结论。与此同时,第二个课题也让我陷入了困境,以至于当时我已没有精力去独立寻找第三个课题了。

认真对比我与师弟的科研状态,其实有一些相似之处,也有明显的差异。相似的是,在前期我们都花了大量时间阅读难度极高的论文。师弟花了一年时间“啃”完一篇50页的四大顶刊论文,我当年也差不多,前期几乎花了半年到一年的时间才能真正读懂核心文献。但在工作状态和心态上,我们的差异就比较明显了。师弟在报告中提到,他坚持每天晚上11点睡觉、早上7点起床,中午午休半小时,保持全天的高效工作。而我当年明显做不到这一点,我平均每天在论文上的高质量工作时间大约只有3小时,其余时间基本没有投入到科研中。在心态方面,师弟似乎很早就认识到,做基础研究必须接受失败是常态,要学会保持积极的心态。而我直到博士第三年结束时,才真正意识到这一点的重要性。师弟还会每天自问:“今天有没有什么想学的知识、想看的文章?”他相信长期积累终会带来突破。而我当时基本上不会主动提出问题或设定目标,通常是导师给我什么论文,我就读什么论文,同时在毕业之前导师给的任务我一定都会完成。

应该是在2024年初,我和大师兄、二师兄一起吃饭时,大师兄突然提到一句话:“你只是在一个不太合适的时候,‘不想搞数学’的心态战胜了自己‘搞数学’的心态,导致你离开了数学。而这个时期,恰好是毕业的时刻,是你人生的一个拐点。”

那一刻,我不禁陷入了沉思。确实,那个时刻我并没有完全做好准备去继续面对数学研究的挑战,也许是因为心态的不稳定,才让自己在毕业的时候做出了放弃的决定。这句话让我意识到,心态在决定人生轨迹中的重要性,有时候一个小小的心态转变,就可能改变未来的方向。就像动力系统一样,初始值的一个微小变化都有可能导致未来轨迹的巨大变化。或许,这也是一个反思的契机,提醒我无论面对怎样的挑战,都不应该轻易被自己的情绪和心态所左右,而是要保持坚定和清晰的目标。人生的每一个转折点,都是自我成长的一部分,重要的是从中吸取教训,继续前行。

《Chaos:混沌》

少了一钉子,失了一铁蹄;
少了一铁蹄,失了一战马;
少了一战马,失了一骑士;
少了一骑士,失了一胜仗;
少了一胜仗,失了一王国。

在数学中,一连串的时间变化会从一个起点开始,并且随着时间的增加,非常小的变化也会引起巨大的差异。这意味着就像蝴蝶效应一样,南美洲的蝴蝶轻轻地拍一下翅膀,就有可能会引起太平洋上的一场飓风。这种看似微不足道的变化,正是混沌理论的核心所在。我们常常认为,生活中的种种细节是偶然的、无关紧要的,但正是这些微小的变化,可能在不经意间推动着更大、更复杂的系统变化。这不仅仅是数学上的规律,同样也影响着社会、经济,甚至是我们的个人生活。

有时,我们并不会意识到,生活中的一些微不足道的小事,可能在无意中改变了我们的一生。也许是一场偶然的相遇,一次不经意的选择,甚至是一个小小的决定,似乎并不重要,却悄悄地推动了命运的车轮。正如混沌理论所揭示的那样,微小的变化可能在未来掀起巨大的波澜。当初还在南京大学读大一的时候,一次去食堂的路上偶然碰到了张老师,随口问起来要不要一起参加一个关于“One Dimensional Dynamics”的讨论班。当时笔者对这个课题也没有任何概念,但还是一口答应下来。没想到从答应参加讨论班的那时起,未来十年自己的科研工作将围绕着这个方向进行展开,直到博士毕业。

或许,那天你做了某个不经意的决定,或者在某个瞬间决定改变了人生的轨迹,原本不起眼的一件事,竟成了后来故事的转折点。它像一颗小石子投入湖中,激起的涟漪,最终扩展成了无法预见的大海。这种看似偶然的变化,正是我们所说的“蝴蝶效应”。生活中,很多改变我们命运的瞬间,往往都藏在那些我们未曾重视的细节里。

在《Chaos:混沌》一书中,作者詹姆斯格雷克深入探讨了这种现象,展示了在自然界、科学研究和人类历史中的无数例子。混沌并不是完全的无序,而是一种看似随机但又具有潜在规律的复杂状态。它让我们重新思考“秩序”与“混乱”之间的界限,挑战着我们对世界的传统理解。每一次的微小波动,都有可能引发不可预见的连锁反应。数学中的蝴蝶效应,正是通过对这些微小变化的观察与分析,揭示了背后深藏的复杂性。

如果你对数学中的这种神秘现象感兴趣,《Chaos:混沌》将是一本不可多得的好书。它不仅向你展示了混沌理论的基础,还通过一个个生动的例子,带领你走进一个充满不确定性却又极具魅力的世界。在这个世界里,任何微小的改变都可能引发不可预测的未来,而正是这种不可预测性,赋予了生活和科学以无限的可能性。

Koch 雪花的几何奇观:从无限周长到有限面积

引言

在数学的世界中,有一种特殊的几何形态——分形。分形不仅仅是由简单规则生成的复杂图形,还由于它们呈现出自相似性(self-similarity),在更细微的尺度上微观显示出相似甚至相同的结构。除了 Cantor 三分集之外,Koch 曲线Koch 雪花同样是数学界最著名的分形图形之一。

Koch 曲线,最早由瑞士数学家海里格·冯·科赫 (Niels Fabian Helge von Koch)在 1904 年提出,其撰写论文是《Sur une courbe continue sans tangente, obtenue par une construction géométrique élémentaire》,翻译成中文就是《关于一条连续而无切线,可由初等几何构作的曲线》。确实 Koch 曲线是一种由递归定义的分形曲线,就和 Cantor 三分集一样,通过简单的几何操作,即可创造出美妙的图形。在构造的过程中,Koch 曲线展现出了如何在有限的范围内呈现出长度是无穷的曲线。

而当我们在 Koch 曲线的基础上进行进一步的扩展,在一个三角形的基础上用一样的方式来构造,便得到了著名的 Koch 雪花。Koch 雪花是一种由多个相同的自相似三角形组成的分形图案,因其形状类似雪花而得名。它的构造过程是基于 Koch 曲线的迭代扩展,但在每个迭代步骤中加入了更多的三角形,使得雪花的外形更加复杂与精细。

在本文中,我们将深入探讨 Koch 曲线和 Koch 雪花的构造原理和数学特征。

Koch 曲线的构造过程

Koch 曲线的经典构造方法

现在,让我们来看一下 Koch 曲线的构造步骤究竟是什么样的?值得注意的是,这一过程在某种程度上与Cantor三分集的构造方式有着异曲同工之妙。Koch 曲线构造的详细步骤如下:

  1. 从一条线段开始:假设初始线段的长度是 L
  2. 将这条线段三等分:于是每段的长度都是 L/3
  3. 构造三角形:在中间的线段上,构造一个等边三角形,其底边与中间的线段重合。也就是说,这个等边三角形的边长是 L/3
  4. 移除线段:移除原有线段中间的部分,即去掉与三角形底边相重合的那一段
  5. 重复步骤 2 至 4:将每个新的小线段重复以上步骤。对每个新的小线段,按相同的方法进行分段、添加三角形并移除原中间部分。每次迭代后,曲线将变得更加复杂。
  6. 无穷迭代:理论上,我们可以无限次地重复这个过程。而最终得到的曲线就是 Koch 曲线。

在构建等边三角形的时候,我们可以得到其角度是 60^{\circ},如图所示。

然后随着迭代次数的增加,Koch 曲线上的“小三角形”将会变得越来越多。

L 系统

除此之外,Koch 曲线还可以使用 L-system 来进行构造;所谓的 L 系统(L-system)指的是 Lindenmayer 系统,它是由荷兰乌特勒支大学的生物学和植物学家,匈牙利裔的阿里斯蒂德·林登麦伊尔(Aristid Lindenmayer)于 1968 年提出的有关生长发展中的细胞交互作用的数学模型,尤其被广泛应用于植物生长过程的研究。 L-system 是一系列不同形式的正规语法规则,多被用于植物生长过程建模,但是也被用于模拟各种生物体的形态。L-system 也能用于生成自相似的分形,例如迭代函数系统。

而 Koch 曲线中的 L 系统指的是满足以下规则的构造方式,即可构造出 Koch 曲线。它的规则是:F -> F−F++F−F,其中,F 表示向前,- 表示左转 60^{\circ}+ 表示右转 60^{\circ}。通过这样的方式,我们可以得到与经典构造方法一样的 Koch 曲线。

Koch 曲线的长度

从 Koch 曲线的构造过程不难看出,假设初始状态下线段的原始长度是 L,那么迭代了一次之后,长度变成了 \frac{4}{3}L。也就是说,每一次的迭代,都会使得总的长度变成原来的 \frac{4}{3} 倍。由于

\lim_{n\rightarrow +\infty}\bigg(\frac{4}{3}\bigg)^{n}=+\infty

所以 Koch 曲线的长度是无穷大

Koch 曲线的 Hausdorff 维度

在传统的欧几里得几何中,维度通常是一个直观且确定的整数,例如线段是一维,平面是二维,立体是三维。然而,在分形几何中,许多复杂的图形无法用整数维度来精确描述。这时,引入一种更广义的维度概念Hausdorff 维度,使得我们能够量化这些图形的复杂性。Hausdorff 维度通过研究几何物体的自相似性和递归结构,将维度扩展为一个可能是分数的数值。它描述了一个物体在放大或缩小过程中点分布的稠密程度,尤其适用于分形图形。

首先,我们给出 Hausdorff 维度的定义。考察一个特殊的几何物体,这个物体由 n 个大小一致且互不重叠的小物体组成,这些小物体的形状和这个物体本身相同。若这些小物体和大物体的大小比例为 1:m,也就是说小物体放大 m 倍之后与大物体完全重合,那么这个几何物体的 Hausdorff 维度(豪斯多夫维数)就定义为

d=\log_{m}n=\frac{\ln(n)}{\ln(m)}

换言之,m^{d}=n

其次,我们说明这样的维度定义与传统意义上的整数维度是不矛盾的。

  • 线段(一维):一条长度为 1 的线段可以被分成 2 段(n=2),每段的长度与原来线段的大小比例是 1:2m=2),因此 Hausdorff 维度是 \log_{2}2=1
  • 正方形(二维):一个边长为 1 的正方形可以被分成 4 个边长是 \frac{1}{2} 的小正方形,每一个小正方形与原来正方形的大小比例是 1:2m=2),因此 Hausdorff 维度是 \log_{2}4=2
  • 正方体(三维):一个边长为 1 的正方体可以被分成 8 个边长是 \frac{1}{2} 的小正方体,每一个小正方体与原来正方体的大小比例是 1:2m=2),因此 Hausdorff 维度是 \log_{2}8=3

再次,我们来看一下 Koch 曲线的 Hausdorff 维度。从 Koch 曲线的构造过程不难看出,Koch 曲线是由 4 条小曲线构成的,而这 4 条小曲线是互相全等的,并且小曲线放大 3 倍就与原来的 Koch 曲线重合。所以,Koch 曲线的 Hausdorff 维度就是

\log_{3}{4}\approx 1.2619

于是,我们已经看到了一条 Hausdorff 维度并不是整数的曲线,它的 Hausdorff 维度介于 12 之间。

Koch 雪花的构造过程

Koch 雪花的经典构造方法

当我们将 Koch 曲线的构造从单条线段扩展到整个几何图形的时候,一个令人惊叹的分形图案便随之诞生——这就是 Koch 雪花。它从一个简单的等边三角形出发,通过对每条边不断应用 Koch 曲线的迭代规则,逐步生成出精美复杂的图案。相比于单条 Koch 曲线,Koch 雪花展现了更为对称和完整的分形之美。接下来,让我们一起来了解 Koch 雪花的构造过程。

从一个等边三角形开始,我们可以对等边三角形的每一条边都进行 Koch 曲线的变形,然后一直无穷地迭代下去,就可以得到一个 Koch 雪花。

第一步:先画一个等边三角形,这里对应的是迭代次数 0

第二步:等边三角形的每一条边都用 Koch 曲线的演变规则,于是变成下图所示,这里对应的是迭代次数 1

第三步:上述图形的每一条边都进行一模一样的 Koch 曲线演变,我们逐步获得以下的三幅图,分别对应着迭代次数 2, 3, 4

至此为止,我们已经可以看到一个基于正三角形而形成了雪花状的图形,当迭代次数趋向于无穷的时候,我们就得到了最终的 Koch 雪花(Koch Snowflake)。

Koch 雪花的周长与面积

Koch 雪花作为一种经典的分形图形,展示了一个令人惊奇的现象:通过之前的分析我们已经知道 Koch 曲线的长度是无穷大,那么由 Koch 曲线构造出来的 Koch 雪花,它的周长自然就是无穷大。尽管其周长是无穷大的,但其面积却是有限的。通过逐步迭代 Koch 曲线,我们构建出了这个美丽的雪花图案。在每一步迭代中,虽然新的小三角形不断增加,使得周长变得越来越大,但由于每个小三角形的面积逐渐变小,它们对整体面积的贡献变得微不足道。接下来,我们将详细计算 Koch 雪花的面积,揭示这种看似矛盾的现象背后的数学原理。

假设 A_{0} 是初始三角形的面积,A_{n} 表示第 $n$ 次迭代的三角形面积,其中 n\geq 1

第一次迭代:初始三角形的边有 3 条,在第一次迭代的时候会生成三个小三角形,每一个小三角形的面积是初始的 1/9,同时从 3 条边变成了 3\times 4 条边。也就是说:

A_{1}=A_{0}+3\times\frac{1}{9}A_{0}

第二次迭代:边有 3\times 4 条,可以生成 3\times 4 个更小的三角形,每一个更小的三角形的面积是初始三角形面积的 1/9^2,同时从 3\times 4 条边变成了 3\times 4^2 条边。也就是说:

A_{2}=A_{1}+3\times 4 \times \frac{1}{9^2}A_{0}

以此类推,我们可以得到递推公式如下,当 n\geq 1 时,

A_{n}=A_{n-1}+\frac{3\times 4^{n-1}}{9^{n}}A_{0}

成立。将递推公式求和之后我们可以得到

A_{n}=A_{0}+3\times\bigg(\frac{1}{9}+\frac{4}{9^2}+\cdots+\frac{4^{n-1}}{9^{n}}\bigg)A_{0}=\frac{8}{5}A_{0}-\frac{27}{20}\bigg(\frac{4}{9}\bigg)^{n+1}A_{0}.

n 趋向于无穷的时候,\lim_{n\rightarrow +\infty}A_{n}=\frac{8}{5}A_{0}

因此,Koch 雪花是一个周长无穷大,但是面积却是有限的图形。

结束语

通过对 Koch 曲线、Koch 雪花的深入探讨,我们不仅领略了它们的美丽与复杂,还理解了如何通过数学语言描述自然界中的自相似结构。从 Koch 曲线的无限延伸到 Koch 雪花的有限面积,从 Hausdorff 维度对不规则形状的精准量化到 L 系统在分形生成中的应用,这些概念和工具为我们提供了新的视角去探索复杂的几何现象和数学性质。

在新加坡的这五年—学术篇(五)

在南京大学读本科的时候,笔者就参加过不少讨论班,自我感觉有的讨论班搞得还算不错。但是有的讨论班我就完全上听不懂,在课上基本就是摸鱼。在讨论班上的感受就是,每个同学或者老师会轮番上去讲解一些内容,然后在讲解的过程中,其他老师或者同学都会参与讨论和做笔记。讨论班的整体感觉还是比较好的,一般也不会对讲解的学生或者老师刁难太多,毕竟讲讨论班的人也是花了时间准备这门课的。

后来到了新加坡,本以为讲讨论班跟之前本科的时候差不多,但实际体验了之后却有很大区别。当时我刚到新加坡的时候,参加讨论班的有五个人,其中有导师,再加上三位师兄,最后就是我。在参加的时候,我是先听了三位师兄的发言和讲解,但是总感觉师兄们在讲解的时候准备不够充分。因为三位师兄在讲解数学的过程中,总是被导师提出问题,经常被打断然后挂在黑板上。而且他们当时讲的内容并不是学术论文,而是一本动力系统方面的教材。当时由于我粗浅的认知,觉得他们挂在黑板上只是因为准备不够充分。直到我本人亲自讲的时候,才体会到原来挂黑板是一件正常的事情。

第一次讲讨论班

当时由我主讲的第一个讨论班课题是由自己选择的,当时选择了一个调和分析的内容来讲。在讲解的过程中,大家貌似对这个方法并不是很熟悉,所以也会在讨论的时候经常提问和打断。印象比较深刻的点有两个:

(1)关于一个积分公式的改写,本质上是 Riemann 积分和 Lebesgue 积分的求面积公式。为了计算曲线下方的面积,通过 Riemann 积分的方法计算和通过 Lebesgue 积分的方式计算都是合理的。当时被导师问到:“如何才能够直观地发现这个公式?”遇到这个问题的时候,笔者就愣了一会,毕竟之前学习数学的时候,是按照书本的模式来学习的。而书本上的流程基本上就是定义,性质,例题,习题,只要按照这个流程来学习,很多数学课都能够完成。但是在学习的过程中,我确实没有想过“为什么可以发现这个东西?”,“有没有更简单的方法”诸如此类的问题。

(2)当讲解到一个定理的时候,我对定理的陈述并没有描述得太清楚。当初只是抱着学习的态度去看数学,对数学本身的理解其实也不够深刻。在这种前提下,导师就针对这个陈述性的东西进行挑战,导致当时在黑板上也挂了许久。

通过第一次讨论班的实际讲解,我终于知道挂在黑板上并不是师兄们准备得不够充分,而是这个挑战的模式是非常容易让一个讲讨论班的人挂在黑板上的。

第一年的讨论班

在讲完第一次讨论班之后,后面我选择的课题都是跟动力系统相关的了,貌似选择过一些复动力系统的东西,也讲过 McMullen 的一本书。有一次我讲讨论班,自我感觉准备充分,但是讲的时候总是被打断和提问。导师回头就说:“讲讨论班的时候,不要让台上的人觉得很舒服,一定要让他觉得很难受”。还有一次我讲论文,刚说了两句话。导师说:“作为一个搞过多年数学的人,一听你这几句话,就知道你没有懂”。有一次我说我貌似得到一个新的结果,刚讲解了几句,导师就发现了问题,立刻说:“目前你都是一个研究生了,怎么还能写出这样一个数学公式”?

到了第一年的下学期,貌似导师就没再组织过讨论班了。而我本人忙于课程和考试,在讨论班上花的时间也不多,每次都只是听师兄们在上面讲,但是个人在下面也只是听得一知半解。不管怎么样,第一年我还是把重心放在了搞课程上面,第一个学期也就把 Qualify Exam 轻松通过了。貌似在第一年结束的时候也读完了下面这篇论文:

Bruin, Henk, et al. “Wild Cantor attractors exist.” Annals of mathematics (1996): 97-130.

但是,我当时对这篇论文的理解并不够深刻,对一个微小的推广并没有意识到可以简单证明出来。

第二年的讨论班

到了第二年,我个人需要准备 Qualify Exam 的 Oral 部分,也就是口试。当年的口试只需要准备一份开题报告就可以了。我当时还是在阅读下面这篇论文:

Nowicki, Tomasz, and S. van Strien. “Polynomial maps with a Julia set of positive Lebesgue measure: Fibonacci maps.” preprint (1994).

这篇论文足足有 90 页,同时存在一个过不去的 Gap,该方向的学者对这篇论文的 Gap 貌似都说得不清不楚,可能大家也觉得读一篇 90 页的论文没啥意义吧。原因大概有以下两点:

1. 补充别人论文里面的 Gap,容易得罪人。江湖不是打打杀杀,而是人情世故

2. 就算补上了这个 Gap,其他数学工作者也会说这是一个修修补补的工作,不足以成大事。

所以,个人至今也没有明白为什么要读这篇论文。但是,毕竟是博士生,和导师没有讨价还价的权利。博士生从导师那里拿到了任务,即使心里百般不愿意,也要完成这个工作。

在第二年的时候,我个人的工作重心已经从学习转向了科研,而阅读这篇 90 页的论文却给我带来了无尽的痛苦,每学习一步都觉得十分艰难。毕竟这个系列的有确定性结果的论文全部发表在数学四大期刊上,阅读起来也十分困难。但是为了准备 Oral,我还是坚持读下来了。不过到了 Oral 的时候,我应该还没有完全读完,只读到了 Part 9 附近就已经觉得很困难了。但是,根据我个人的感觉,前 9 部分应该都是没有问题的,有问题的应该是在 Part 10。

到了 Oral 的时候,我也就是陈述了这个论文的大致情况,以及动力系统的发展,未来要做的内容。不过,当初的 Oral 考试不难,基本上大家都能够轻松通过这次考试。

通过了 Oral Exam 之后,我还想找导师探讨一下这篇论文,继续搞搞讨论班。但是,导师和师兄们却没有这个兴趣搞,也有可能是不想花时间在这个题目上。于是,我就踏上了独自奋斗的道路。

到了第二年的下学期,可能是科研实在是太难,容易让人产生厌倦的情绪,毕竟我也不是神仙,能够坚韧不拔地做任何事情。为了获得一些成就感,我居然开启了一条编程的道路,买了一些 C++ 的书籍,例如 C++ Primer,重新把 C++ 这门课学了一遍,然后发现 C++ 这门课比科研简单太多了。

后来到了 2012 年的四月份,也就是第二年第二学期快结束的时候,我的科研进展其实并不大,这一个学期基本上处于停滞的状态。不过我的 C++ 编程能力倒是有很大的提升。不过,当时低维动力系统的很多数学家都来到了新加坡,准备参加由 NUS 的 IMS 举办的研讨会。

不过,当时参加这个研讨会个人感觉价值并不大。原因有以下两个:

1. 参加的时候,我也只是听了一下研讨会,日常跟其他数学家的交流基本上等于零。例如,这一周的晚上,老外数学家都喜欢去酒吧喝酒聊天,但是我并不在被邀请的行列中,不知道其他师兄最后去了没有,反正我并没有去过。可能也没有认识其他数学家的机会。

2. 个人的实力不太行,听讲座会觉得有较大的压力,然后日常就是记笔记,但是最后回顾起来,这些笔记对我来说并没有什么作用。甚至不如自己学的那些 C++ 代码和算法导论知识。

不管怎么样,第二年的学术生涯也就结束了。

第三年的讨论班

到了第三年,我确实也感受到了毕业带来的压力,总算把自己的科研论文捡了回来,重新翻阅了一下。在日常跟导师的汇报中,我把那篇有 Gap 的论文读完了,也知道是 Part 10 的一个定理证明错误了。但是,我个人并没有什么方法来解决这个问题。第三年的第一个学期的主要精力就放在了这篇论文上,当时我对这几篇论文只能说大致有一个理解,但是并没有太深刻的认识。

随着第三年第一个学期的结束,毕业压力瞬间就变得很大了。因为 NUS 的毕业年限是四年,第五年就要开始交学费了。如果四年无法毕业的话,对学生来说就会有很大的经济压力了。

即使是这样,到了第三年第二学期,我的科研依旧没有任何进展。留下的问题我依然无法解决,我也没有其他思路去重新考虑这个问题。不过,我作为一个还算有点上进心的人,也没有沉迷游戏,而是把很多时间用在了学习 C++ 和数据结构上,UVA 上面的题目倒是刷了几百个。

到了第三年第二学期快结束的时候,我依旧是没有任何结果。当时我偶然得到了一本书,叫做《战胜拖拉》,至今我都十分感谢这本书,我觉得我个人能够毕业是由两件事情推动的:

1. 获得了《战胜拖拉》这本书,从而使我掌握了一个相对正确的科研方法和整活态度。只有勇敢地面对科研带来的困难,每天进步一点点,才有希望解决最终的问题;

2. 张益唐于 2013 年 4 月 17 日在《数学年刊》(Annals of Mathematics)发表《素数间的有界间隔》,首次证明了存在无穷多对素数对(p, q),其中每一对素数之差,即 p 和 q 的距离,不超过 7000 万。 这为世纪难题“孪生素数猜想”的解决做出了突破性工作,他从一位默默无闻的大学讲师跻身世界重量级数学家的行列。这一故事让我知道了“庾信平生最萧瑟,暮年诗赋动江关”这首诗,人只要坚持不懈地做一件事情,是有可能达成最终目标的。

于是,我从 2013 年 4 月份开始奋发图强,在 Prince George Park 的自习室里面学习,平时也不再去办公室,就天天窝在自习室和自己的宿舍。每天就带着一堆草稿纸和论文,围绕着一个方程思考,草稿纸算了一堆有一堆。但是随着我的坚持,没想到两周之后我居然有了一个突破,证明了 Real Bound Theorem。

后来等我快毕业的时候,导师说:“每个 PHD 刚来学校的时候,其实我前三年都没怎么管,是因为想看一下学生独立发展能够发展成什么样,了解一下学生的数学能力极限在哪里。”于是,师兄们的毕业年限纷纷变成了 6 年,7 年, 8 年。前三年导师也没有跟我交流过太多论文技术,博士第四年才给我些许帮助,可能也是想看看本人的极限在哪里。后来我独立证明了一个 Real Bound Theorem 也就知道自身的极限大概是哪里了。

当我把这个 Real Bound Theorem 告诉导师之后,导师却说国内有人已经证明出来了,让我继续努力。

第四年的讨论班

由于在第三年结束的时候(2013 年 4 月份),自己在没有任何帮助的情况下,独自成功的证明了Real Bound Theorem,总算挽回了一些做科研的信心。

在学术界,如果有人已经得到了相同的结论,一般情况下都会去 ARXIV 上搜索一下预印稿,看看其结论和方法是否与自己的完全一致。作为一个读了三年博士的人,这个基本的操作技巧我还是掌握的。我在 ARXIV 上盯了很长时间,也没看到任何预印稿,直到我快忘记的时候,2014 年这个结论却直接发表在学术期刊上。

不过科研这种事情总是充满了不确定性,不逼一下自己永远也不知道自己能够做到什么程度。在第四年的毕业压力之下,通过个人的努力和坚持不懈,总算在 Real Bound Theorem 的基础上跟上一层楼。在 2014 年 4 月底的时候几乎已经认为可以做出论文了。甚至有一天我已经认为自己做出来课题,导师问我多久能够写出论文,我直接开口说三天即可,因为当时总算是看到了毕业的曙光。不过这种感觉转瞬即逝,等我回去仔细思考之后,发现该方案并不能够解决问题,心情直接就像过山车一样的从天空落到了谷底。不过这个只是一个小问题,之前再大的困难都被克服了,怎么能够在最后关头倒下。于是重新审视了问题所在,发现原来的方法处理不了这个问题,但是恰好能解决其他的问题,于是赶紧把该方法运用到类似的问题上,这才算做完了自己的毕业论文,后续的工作只是把论文的步骤整理好即可。

当时,我意识到这个课题已经做完了之后,毕业的压力瞬间就是消失了,无论我做什么都不会再有毕业的压力了。可以尽情的享受生活,enjoy my life。2014 年 6 月份有段时间我还去过 NUS 的 Central Library,在那里回顾了一下自己这四年的科研旅途,毕竟第一年我没有 Office 的时候,可是整天泡在 Science Library 和 Central Library 的。

做完了课题之后,顿时觉得新加坡的天空十分晴朗,正好此时巴西世界杯也在 2014 年的 6 月份开战,于是自己白天在办公室整理自己的论文,或者去 Vivo City 的 Golden Village 去看电影,晚上就回宿舍看世界杯。此刻也感受了球迷 Zhoufeng 的热情,每天都去买零食和可乐,分给大家喝,于是我在不知不觉中又变胖了。此刻在 NUS 的第四年生涯也算是结束了。

第五年的讨论班

由于 2014 年一整年的努力奋斗,攻克了难题之后,在科研上已经没有任何东西能够阻挡自己了。此时需要做的事情就是整理自己的论文。不知不觉两个月就要过去了。在 2014 年 9 月 30 日的时候,师门的大师兄返回新加坡参加了毕业答辩,顺利地结束了硕博八年的数学生涯。在大师兄的毕业答辩上,有一个国内的教授问我:“你打算什么时候毕业,是不是明年?”我当时恰好把论文写得差不多了,立刻回答:“我打算今年就交论文毕业”。回想起师兄们的 6 年,7 年,8 年,当时觉得自己真的是毕业神速。

对自己而言,除了论文之外,主要任务依然是助教,一周有五节课,其中星期一有四节课,星期五只有一节课。不过这段时间倒是把 MA1505 的讲义完整地整理在自己的 Blog 上。作为助教,监考也是另外一个必要的任务。在 2014 年 11 月 29 日 2:00-4:00pm 的 MPSH4 参加了在 NUS 的最后一次监考。

一转眼就到了 2015 年 1 月份,到了最终交论文的时刻。根据 NUS 的规定,PHD交论文之前都需要交 535SGD 到 YIH,作为审稿的费用。由于 NUS 内部的打印室的队伍实在是太长,只好还专门跑到 Queenstown 地铁站去寻找打印店。这个打印店也是系内的杰出 Tutor ZHOU Feng 告诉我的。到了 2015 年 2,3 月份的时候就是农历的新年,此时自己已经回国过年,不幸的是在除夕的时候还被审稿人拉着提供毕业论文的细节。这些琐碎的事情一直持续了三个月,直到毕业答辩的前一天才结束。而此时自己的下一站则是没有任何的着落,连续四个月没有任何收入,并且还要在新加坡支付着自己的生活费,压力颇大。历经千辛万苦,终于在 2015 年 4 月 24 日顺利地通过了博士生毕业答辩,当时答辩的时候也有很多的同学过来支持,在此再次感谢大家。答辩之后,一周内交了材料和上传论文,博士生的生涯算是告一个段落了。

答辩完了之后其实还需要向学校提交一些材料和流程,提交材料的地点就是 NUS 的 YIH。记得当时提交论文不仅需要在网站上提交论文的 PDF 文件,并且把论文刻在一个光盘内才行(PS:这年头用光盘的时候真的是不多了)。当年在南京买的电脑 Y530 还带着光驱,但是从来没有使用过,在 2008 年买的时候绝对没有想到这台电脑刻的唯一一张光盘就是自己的博士毕业论文

2015 年 5,6 月份的时候回国寻找工作,有时间去做自己想做的事情,因为此时再也没有人拉着我修改论文了。找工作的时候也经历了不少的困难,不过也得到了很多人的帮忙,再次感谢大家。后续的职场发展中,第一份工作确实给了我很大的帮助,也为我以后的个人发展铺平了道路。虽然在工作中也会遇到各种各样的事情,也会有很多阻碍,但是再大的阻碍可能都没有那篇论文给我带来的阻碍大。

《博士生涯的回忆》

我曾经在书海里迷茫
寻找着知识的光芒
我曾经在学术里挣扎
追求着真理的方向

我不怕困难和磨难
我不畏艰辛和挫折
我只有一个目标和信念
那就是完成我的博士学位

终于有一天,我站在了舞台上
手握着毕业证和学位证
我感到了无比的欣喜和自豪
我感谢所有支持我的人

我知道这不是终点,而是起点
我知道这不是结束,而是开始
我会继续我的学习和探索
我会继续我的奋斗和创造

在新加坡的这五年—学术篇(四)

笔者离开数学界已经八年时间,近期在 Arxiv 上翻阅资料的时候无意之中看到一篇关于复动力系统 Julia 集合正测度的文章。这篇文章是由 Avila 和 Lyubich 合写的,最终发表在 Annals of Mathematics(数学年刊)上,可以算是 Julia 集合正测度的最新进展。

[1] Avila, Artur, and Mikhail Lyubich. “Lebesgue measure of Feigenbaum Julia sets.” Annals of Mathematics 195.1 (2022): 1-88.

Julia 集合是由法国数学家 Gaston Julia 和 Pierre Fatou 在 20 世纪初提出的。Julia 集合通常用于研究复平面上的二次多项式迭代,即:f(z) = z^2 + c,其中 z 和 c 都是复数。

Julia 集合具有以下性质:

  1. 分形结构:Julia 集合具有自相似的分形结构,即在任意放大的比例下,其局部结构与整体结构具有相似性。
  2. 边界敏感:Julia 集合的边界对初始值非常敏感。在边界上的点,即使初始值有微小的改变,迭代结果也可能发生巨大变化。
  3. 全分支:Julia 集合可以分为两类,一类是全分支的(connected),另一类是非全分支的(disconnected)。全分支的 Julia 集合(也称为 Fatou 集合)中的任意两点都可以通过一条路径连接;而非全分支的 Julia 集合则由许多分散的点组成。
  4. 稳定集和逃逸集:Julia 集合可以划分为稳定集和逃逸集。稳定集中的点在迭代过程中保持有限,而逃逸集中的点在迭代过程中趋向于无穷大。
  5. 复杂性:Julia 集合具有丰富的结构和高度复杂性。它们的形状取决于参数 c 的值,c 的不同取值会产生各种各样的 Julia 集合形状。
  6. 与 Mandelbrot 集合的关系:Julia 集合和 Mandelbrot 集合之间存在密切的关系。对于给定的参数 c,如果 c 属于 Mandelbrot 集合,则相应的 Julia 集合是全分支的;否则,Julia 集合是非全分支的。

总之,Julia 集合在复动力系统中是一种独特且具有丰富性质的分形结构。

当年刚进入 NUS 的时候,从导师那里拿到的课题就是关于 Julia 集合正测度的,但是研究的对象并不是 2 次多项式(z -> z^2 + c),而是满足某种组合形式的高次多项式(z -> z^{\ell} +c)。

[2] Nowicki, Tomasz, and S. van Strien. “Polynomial maps with a Julia set of positive Lebesgue measure: Fibonacci maps.” preprint (1994).

这篇文章 [2] 有 90 页,但是里面有一个错误,Chapter 10 的一个定理证明出现了错误,导致这篇论文最终只挂在了 Arxiv 上,并没有正式发表。刚从导师那里拿到论文的时候,看到这篇文章足足有 90 页也觉得十分震惊,不过心想自己可能也能够坚持读下来。但是没想到彻底读完的时候,已经到了博士第三年上学期。相当于当时自己花费了差不多一两年时间在这篇论文上。数学家 Buff Xavier 也针对这篇文章写过一个法语的论文,指出了这篇论文的缺陷。但是我感觉这篇法语的文章并没有指出来哪一个章节证明错误了。

当年笔者为了阅读这篇文章,自然也读了周边的一系列文章,下面这篇文章同样是发表在 Annals of Mathematics(数学年刊)上。但是这是一篇关于实动力系统的文章,证明了 wild Cantor attractor 的存在性,其方法有希望应用到复动力系统领域,来最终证明 Fibonacci 多项式的 Julia 集合具有正测度。

[3] Bruin, Henk, et al. “Wild Cantor attractors exist.” Annals of mathematics (1996): 97-130.

可惜,遗憾的是,虽然这个方法在实动力系统上是成立了,论文也发表在 Annals of Mathematics 上,但是上述方法并不能够直接应用到复动力系统上,导致 Julia 集合的正测度一直是 Open Question。

但是,针对 2 次多项式的 Julia 集合的正测度研究,却一直有着不错的进展,而且每一篇文章都发表在数学的四大期刊上。

[4] Lyubich, Mikhail, and John Milnor. “The Fibonacci unimodal map.” Journal of the American Mathematical Society 6.2 (1993): 425-457.

这篇文章证明了 The quadratic unimodal map with Fibonacci combinatorial type has no wild Cantor attractor,发表在 JAMS 上。

[5] Lyubich, Mikhail. “Combinatorics, geometry and attractors of quasi-quadratic maps.” Annals of Mathematics 140.2 (1994): 347-404.

这篇文章证明了 Assume f is unimodal and has a quadratic critical point. If there exists a set X of positive Lebesgue measure so that for all x ∈ X, ω(x) is equal to a Cantor set C, then C is a solenoidal attractor and C = ω(c) for the critical point c. i.e. f has no wild Cantor attractor. 同样发表在 Annals of Mathematics 上。

[6] Buff, Xavier, and Arnaud Chéritat. “Quadratic Julia sets with positive area.” Annals of Mathematics (2012): 673-746.

后来到了 2012 年,有两位数学家证明了存在 2 次多项式使得它的 Julia 集合是正测度。到了 2022 年,数学家 Avila 和 Lyubich 又找到一类 2 次多项式,它们的 Julia 集合同样是正测度。这两篇论文都发表在 Annals of Mathematics 上。

如果没有记错的话,当年答辩的日子是 2015 年 4 月 24 日早上 10:00 – 11:00。在读博期间,笔者的博士课题从一开始就直接敲定,读书期间这个课题也没有进行过更换,那就是复动力系统里面的核心问题之一:

Open Question: Is the measure of Julia set of Fibonacci Polynomial positive or not?

事后回想起来,这个问题可能还是比较难,至少对我本人来说是太难了,可能已经超越了我能够把控的范围。阅读一篇有 Gap 的论文从某种层面打击到了自己的信心,导致后续我对这个问题根本不感兴趣,但是手上又没有其他课题可以做。有一次向导师提出了需要更换课题,但是被导师一口否决了,也只好沿着这个方向一直做下去。在一个没有讨价还价的读博环境下,无论导师提出什么样的学术要求,为了毕业我都会完成,但是坏处就是我对动力系统这个方向就完全失去了兴趣。

在答辩结束的那一天,虽然我不清楚以后可以做什么,但是我很明确地知道不要做什么。

近期,我也听到一些关于博士生和导师的说法:

  1. 如果导师给博士生的题目是有答案的,那么导师对这个题目是不会感兴趣的;如果导师对这位博士生还有所期待,那么这个题目一定是暂时没有答案的;
  2. 长期在某个方向工作的专家会有某种思维惯性,遇到问题的时候就不会朝着某个方向去思考。但是新人却有可能朝着某个方向做问题,反而解决了该领域的未知问题,同时给这个方向带来新的活力,因此 push 学生有助于将新人的潜力激发出来。如果没有在博士期间激发学生最大的潜力,那么确实是会留下遗憾的,并且也没有做到最好的自己;
  3. 在读博期间,导师跟学生的关系并不是朋友的关系,而且导师布置的学术任务是要求学生一定要完成的,没有任何讨价还价的余地。

在导师靠谱的前提下,按照上述 3 点培养出来的学生,只有两种可能性:

  • 科研做得很好,博士毕业之后完全具备独立科研能力,能够独立发表论文,成为科研新星;
  • 直接离开学术界,毕竟上述博士科研经历基本上可以摧毁学生对科研的信心,毕竟课题有可能太难,导致学生无法完成这项任务。中等水平的学生也会知难而退,只有最优秀的学生有信心留在学术界。

虽然给博士生布置尚未解决的问题可以激发学生的创新能力和解决问题的能力,但过于困难的课题可能会导致学生在研究过程中消耗大量时间和精力,甚至可能会陷入困境。此外,并非所有导师都能充分了解学生的兴趣和能力,这可能导致题目设置与学生的实际需求脱节,从而降低研究效率。

虽然新人可能在解决问题时带来新思路和活力,但是新人可能由于知识储备和经验不足,在解决问题时更容易出现错误和偏差。

在读博期间,导师与学生之间的关系确实应该以学术任务为主,但将两者关系定义得过于严格可能会限制双方之间的沟通与交流。就相当于学生和导师只会交流学术,除此之外并没有任何可以沟通的其他内容,学生也不愿意和导师分享除了科研以外的任何事情。一个良好的导师-学生关系应当基于互相尊重、理解和支持的基础上,允许双方在学术任务以外的方面展开交流和合作。这种关系不仅有利于学术研究的开展,还有助于培养学生全面发展的能力。

后来工作了之后,我也会遇到一些困难,但是总能够有各种各样的方法来解决这个问题,与读博的时候死磕一个问题形成了鲜明的对比。在工作和生活中适时的妥协和退让,才会看到一个截然不同的风景,感受广阔无垠的天空。

在新加坡的这五年—学术篇

每次提到数学这个词,大家能够想到的就是初等代数,平面几何,组合运算,微积分,线性代数,概率论等方向。但在整个数学领域(Earth of Math)上,还有很多更有意思的领域和研究方向,包括数论,几何,拓扑,分形几何,分析,概率统计,博弈论,代数等诸多方向,每一个方向都有很多优秀的数学家在从事相关研究。

EarthofMath
Earth of Mathematics

当年在数学系的时候,所研究的方向是分形几何(Fractal Geometry)和复动力系统(Complex Dynamics),位于 Earth of Math 的左侧,称之为分形湖泊(Fractal Lakes)。所谓分形,其实是一个粗糙或者零碎的集合形状,可以分成多个部分,且每个部分放大之后与整体有某种相似性,即具有自相似性的性质。而动力系统则是基于某种固定的规则,描述一个空间内的所有点随时间的变化情况,例如钟摆的晃动,水的流动,湖泊里面鱼类的数量。备注:动力系统并不是指汽车的动力系统和发动机引擎,这两者毫无关系。

而复动力系统则是动力系统中的一个分支,研究的是有理函数的迭代性质。所谓函数的迭代,指的是针对有理函数 f(z),考察其定义域的点 z\in \hat{\mathbb{C}}n 次复合,得到 f^{(n)}(z)=f\circ\cdots\circ f(z),进一步可以研究 \lim_{n\rightarrow +\infty}f^{(n)}(z) 的极限。

针对不同的定义域,函数的迭代有着完全不同的研究方法。当时的研究方向是复动力系统(Complex Dynamical Systems)。复动力系统理论的研究始于 1920 年,当时是由数学家 Fatou 和 Julia 研究的,因此复动力系统中的两个重要的集合就是以 Fatou 和 Julia 来命名的,分别称之为 Fatou set 和 Julia Set。随着计算机技术的演进,在上世纪八十年代这些集合可以通过计算机进行可视化,分形几何和复动力系统理论开始蓬勃发展起来。在与双曲几何、分形几何、现代分析学和混沌学等学科发展相互促进的同时,围绕双曲猜想以及 Mandelbrot 集合的研究工作,成为当今复动力系统的研究热点。

举个例子,函数 f(z) = z^{2}+0.7885 e^{ia}a\in[0,2\pi])的 Julia 集合的动图如下:

JuliaSet_1
Julia 集合

当然,科研的时候可不是做一点可视化就算完成任务了,还是需要按部就班的学习各种数学知识和技能。

之前在学校研究动力系统的时候,收集过一些书籍,在此列举给大家,希望对初学者有一定的帮助。One Dimensional Real and Complex Dynamics实与复动力系统)需要学习的资料如下:

基础书籍:

复分析基础:本科生课程。学习数学知识自然需要循序渐进,除了必要的数学分析,高等代数之外,分析学则是动力系统所必备的知识之一。既然是复动力系统,那肯定就要集中于研究复分析,因此本科的复分析则是复动力系统的必修课之一。

(1) Complex Analysis, 3rd Edition, Lars V. Ahlfors

(2) Complex Analysis, Elias M. Stein

进阶复分析:研究生课程

到了研究生阶段,其实也不足以直接上手搞科研,需要进一步地学习黎曼曲面,拟共形映射等专业书籍,才能够为复动力系统的学习打下基础。

(1) Lectures on Riemann Surfaces (GTM 81), Otto Forster

(2) Lectures on Quasiconformal Mappings, Lars V. Ahlfors

实分析基础:本科生课程

研究动力系统,实分析也是其基础知识之一,无论是通过学习 Stein 还是 Rudin 的教材,都是为了进一步地了解基础知识。

(1) Real Analysis and Complex Analysis, Rudin

(2) Real Analysis, Elias M. Stein

专业书籍:

实动力系统:

(1) One Dimensional Dynamics, Welington de Melo & Sebastian VanStrien

这本书难度较大,上手的时候不建议直接看这本书。

OneDimensionalDynamics
One-Dimensional Dynamics

(2) Mathematical Tools for One-Dimensional Dynamics (Cambridge Studies in

Advanced Mathematics), Edson de Faria / Welington de Melo

MathematicalToolsforOneDimensionalDynamics
Mathematical Tools for One-Dimensional Dynamics

复动力系统:

(3) Dynamics in One Complex Variable, John Milnor;Milnor 的教材总是写的清晰明确,容易上手,推荐初学者可以读这本书。

DynamicsinOneComplexVariable
Dynamics in One Complex Variable

(4) Complex Dynamics, Lennart Carleson;Carleson 的教材偏向于分析学,读起来其实也有点难度,还是读 Milnor 的教材相对容易。

ComplexDynamics
Complex Dynamics

(5) Complex Dynamics and Renormalization, Curtis T. McMullen;McMullen 的书适合当做查阅,也不太适合从头到尾读下去。

ComplexDynamicsandRenormalization
Complex Dynamics and Renormalization

(6) Renormalization and 3-Manifolds Which Fiber over the Circle, Curtis T. McMullen

Renormalizationand3Manifolds
Renormalization and 3-Manifolds Which Fiber over the Circle

(7) Iteration of rational functions (GTM 132), Alan F. Beardon

遍历论:

(8) An Introduction to Ergodic Theory (GTM 79), Walters Peter

学术会议

除了日常的科研之外,博士生时不时地可以去参加一下学术会议,不仅可以去参加本方向的学术会议,也可以去参加其它方向的学术会议,只要有一份邀请函即可。

如果是在 NUS 的 IMS(Institute for Mathematical Sciences)举办的学术会议,一般来说只要是在校的研究生都是可以参加的。记得当时参加的第一个学术会议是关于 PDE 的,标题叫做 Hyperbolic Conservation Laws and Kinetic Equations:Theory, Computation, and Applications(1 November – 19 December 2010)。笔者去听这个系列讲座是因为在 2010 年选择了一门 PDE 的研究生课程,而这个讲座则是作为课程的一部分。

IMSWorkshopGroupPhoto2012_6
IMS 的偏微分方程学术会议

笔者参与的另外一个学术会议则是关于动力系统的,标题叫做 Workshop on Non-uniformly Hyperbolic and Neural One-dimensional Dynamics(23 – 27 April 2012),主要是关于非一致双曲动力系统方向的研讨会。笔者记得当时所修的课程应该只有概率论(Probability II)一门课,因此上课的任务不算很重。参会的时间恰好是学期快结束的时候,科研的任务也不算特别繁重。因此,积极参与各种学术会议也算是科研的其中一部分,一来通过参会可以了解当前的学术研究情况,二来可以认识学术界的各种人士,也算是扩大学术交流圈子的好机会。

IMSWorkshopGroupPhoto2012_2
IMS 的动力系统学术会议

既然是学术会议,那自然就有各种各样的 Presentations,学术会议的第一天通常是需要有 IMS 的领导来致辞的,表示学术会议正式开始。每天的学术会议都需要有个 chair 来组织,一天的学术会议基本上是从早到晚,大约从早上 9:30 开始,到下午 4:40 结束。而每个学者汇报时间大约是 50 mins 左右。

IMSWorkshopGroupPhoto2012_3
第一天的研讨会安排

这次的学术会议是关于动力系统方向的,那师兄们自然是需要上台做报告的。当时上场的师兄包括大师兄和二师兄,至于三师兄和我则暂时没有成果可以汇报。两位师兄在 IMS 的报告厅里面做了十分精彩的成果展示,会议之后也有不少同行来与师兄们讨论问题。

IMSWorkshopGroupPhoto2012_4
同门汇报工作

一般来说,每次研讨会的开始和结束都需要有一个仪式,除了 IMS 的领导致辞表示会议开始之外,在茶歇时间(Coffee Break)期间是可以四处走动的,并且在第一次茶歇的时候,全体参会人员都会在 IMS 附近拍照留念,预祝本次研讨会成功举办。

IMSWorkshopGroupPhoto2012_5
Group Photo

论文

读到博士自然需要研究一下相应的课题,例如下面这种就是数学系博士生所研究的课题。​

Question. 是否存在 \ell\geq 4 的偶数和复数 c\in\mathbb{C} 使得 f(z)=z^{\ell}+c 的 Julia 集合 J(f) 是正测度?

针对这个课题,数学系的博士生需要翻阅历史上的相关书籍和论文,阅读其相关论文才能够得到前沿技术和进展。当年花时间阅读的论文主要是几篇 Annals 上面的文章,参考资料也是这几篇文章,不过每一篇文章至少都是 40 页左右,基本上看一篇文章需要花几个月的时间。

1. Combinatorics, geometry and attractors of quasi-quadratic maps,Pages 345-404 from Volume 140 (1994), Issue 2 by Mikhail Lyubich

Paper_1

2. Wild Cantor attractors exist,Pages 97-130 from Volume 143 (1996), Issue 1 by Hendrik Bruin, Gerhard Keller, Tomasz Nowicki, Sebastian van Strien

Paper_2

3. Quadratic Julia sets with positive area,Pages 673-746 from Volume 176 (2012), Issue 2 by Xavier Buff, Arnaud Chéritat

Paper_3

4. Polynomial maps with a Julia set of positive measure,Nowicki, Tomasz, and Sebastian van Strien,arXiv preprint math/9402215(1994).

Paper_4

备注:第 4 篇文章 Polynomial maps with a Julia set of positive measure 里面有错误,通过其证明是无法得到最终结论的,因此是否存在正测度的 Julia 集合一直是未知的。直到 2012 年的第 3 篇文章出来,才算证明了二次多项式存在正测度的 Julia 集合。但是对于高次多项式,是否存在正测度的 Julia 集合则是完全未知的。

在拿到论文和课题之后,那就开始需要研究了。草稿纸也算了一张又一张,论文也打印了一份又一份,科研之路哪有一帆风顺的,基本上都是历经曲折,才能够达到毕业的彼岸。毕业的时候写了一篇文章《科研这条路》,以此来纪念读博五年的生涯。

PlanandReality
理想与现实

参考资料:

  1. 科研这条路
  2. 维基百科:Julia 集合

 

Hausdorff dimension of the graphs of the classical Weierstrass functions

In this paper, we obtain the explicit value of the Hausdorff dimension of the graphs of the classical Weierstrass functions, by proving absolute continuity of the SRB measures of the associated solenoidal attractors.

1. Introduction

In Real Analysis, the classical Weierstrass function is

\displaystyle W_{\lambda,b}(x) = \sum\limits_{n=0}^{\infty} \lambda^n \cos(2\pi b^n x)

with {1/b < \lambda < 1}.

Note that the Weierstrass functions have the form

\displaystyle f^{\phi}_{\lambda,b}(x) = \sum\limits_{n=0}^{\infty} \lambda^n \phi(b^n x)

where {\phi} is a {\mathbb{Z}}-periodic {C^2}-function.

Weierstrass (1872) and Hardy (1916) were interested in {W_{\lambda,b}} because they are concrete examples of continuous but nowhere differentiable functions.

Remark 1 The graph of {f^{\phi}_{\lambda,b}} tends to be a “fractal object” because {f^{\phi}_{\lambda,b}} is self-similar in the sense that

\displaystyle f^{\phi}_{\lambda, b}(x) = \phi(x) + \lambda f^{\phi}_{\lambda,b}(bx)

We will come back to this point later.

Remark 2 {f^{\phi}_{\lambda,b}} is a {C^{\alpha}}-function for all {0\leq \alpha < \frac{-\log\lambda}{\log b}}. In fact, for all {x,y\in[0,1]}, we have

\displaystyle \frac{f^{\phi}_{\lambda, b}(x) - f^{\phi}_{\lambda,b}(y)}{|x-y|^{\alpha}} = \sum\limits_{n=0}^{\infty} \lambda^n b^{n\alpha} \left(\frac{\phi(b^n x) - \phi(b^n y)}{|b^n x - b^n y|^{\alpha}}\right),

so that

\displaystyle \frac{f^{\phi}_{\lambda, b}(x) - f^{\phi}_{\lambda,b}(y)}{|x-y|^{\alpha}} \leq \|\phi\|_{C^{\alpha}} \sum\limits_{n=0}^{\infty}(\lambda b^{\alpha})^n:=C(\phi,\alpha,\lambda,b) < \infty

whenever {\lambda b^{\alpha} < 1}, i.e., {\alpha < -\log\lambda/\log b}.

The study of the graphs of {W_{\lambda,b}} as fractal sets started with the work of Besicovitch-Ursell in 1937.

Remark 3 The Hausdorff dimension of the graph of a {C^{\alpha}}-function {f:[0,1]\rightarrow\mathbb{R}}is

\displaystyle \textrm{dim}(\textrm{graph}(f))\leq 2 - \alpha

Indeed, for each {n\in\mathbb{N}}, the Hölder continuity condition

\displaystyle |f(x)-f(y)|\leq C|x-y|^{\alpha}

leads us to the “natural cover” of {G=\textrm{graph}(f)} by the family {(R_{j,n})_{j=1}^n} of rectangles given by

\displaystyle R_{j,n}:=\left[\frac{j-1}{n}, \frac{j}{n}\right] \times \left[f(j/n)-\frac{C}{n^{\alpha}}, f(j/n)+\frac{C}{n^{\alpha}}\right]

Nevertheless, a direct calculation with the family {(R_{j,n})_{j=1}^n} does not give us an appropriate bound on {\textrm{dim}(G)}. In fact, since {\textrm{diam}(R_{j,n})\leq 4C/n^{\alpha}} for each {j=1,\dots, n}, we have

\displaystyle \sum\limits_{j=1}^n\textrm{diam}(R_{j,n})^d\leq n\left(\frac{4C}{n^{\alpha}}\right)^d = (4C)^{1/\alpha} < \infty

for {d=1/\alpha}. Because {n\in\mathbb{N}} is arbitrary, we deduce that {\textrm{dim}(G)\leq 1/\alpha}. Of course, this bound is certainly suboptimal for {\alpha<1/2} (because we know that {\textrm{dim}(G)\leq 2 < 1/\alpha} anyway).Fortunately, we can refine the covering {(R_{j,n})} by taking into account that each rectangle {R_{j,n}} tends to be more vertical than horizontal (i.e., its height {2C/n^{\alpha}} is usually larger than its width {1/n}). More precisely, we can divide each rectangle {R_{j,n}} into {\lfloor n^{1-\alpha}\rfloor} squares, say

\displaystyle R_{j,n} = \bigcup\limits_{k=1}^{\lfloor n^{1-\alpha}\rfloor}Q_{j,n,k},

such that every square {Q_{j,n,k}} has diameter {\leq 2C/n}. In this way, we obtain a covering {(Q_{j,n,k})} of {G} such that

\displaystyle \sum\limits_{j=1}^n\sum\limits_{k=1}^{\lfloor n^{1-\alpha}\rfloor} \textrm{diam}(Q_{j,n,k})^d \leq n\cdot n^{1-\alpha}\cdot\left(\frac{2}{n}\right)^d\leq (2C)^{2-\alpha}<\infty

for {d=2-\alpha}. Since {n\in\mathbb{N}} is arbitrary, we conclude the desired bound

\displaystyle \textrm{dim}(G)\leq 2-\alpha

A long-standing conjecture about the fractal geometry of {W_{\lambda,b}} is:

Conjecture (Mandelbrot 1977): The Hausdorff dimension of the graph of {W_{\lambda,b}} is

\displaystyle 1<\textrm{dim}(\textrm{graph}(W_{\lambda,b})) = 2 + \frac{\log\lambda}{\log b} < 2

Remark 4 In view of remarks 2 and 3, the whole point of Mandelbrot’s conjecture is to establish the lower bound

\displaystyle \textrm{dim}(\textrm{graph}(W_{\lambda,b})) \geq 2 + \frac{\log\lambda}{\log b}

Remark 5 The analog of Mandelbrot conjecture for the box and packing dimensions is known to be true: see, e.g., these papers here and here).

In a recent paper (see here), Shen proved the following result:

Theorem 1 (Shen) For any {b\geq 2} integer and for all {1/b < \lambda < 1}, the Mandelbrot conjecture is true, i.e.,

\displaystyle \textrm{dim}(\textrm{graph}(W_{\lambda,b})) = 2 + \frac{\log\lambda}{\log b}

Remark 6 The techniques employed by Shen also allow him to show that given {\phi:\mathbb{R}\rightarrow\mathbb{R}} a {\mathbb{Z}}-periodic, non-constant, {C^2} function, and given {b\geq 2} integer, there exists {K=K(\phi,b)>1} such that

\displaystyle \textrm{dim}(\textrm{graph}(f^{\phi}_{\lambda,b})) = 2 + \frac{\log\lambda}{\log b}

for all {1/K < \lambda < 1}.

Remark 7 A previous important result towards Mandelbrot’s conjecture was obtained by Barańsky-Barány-Romanowska (in 2014): they proved that for all {b\geq 2} integer, there exists {1/b < \lambda_b < 1} such that

\displaystyle \textrm{dim}(\textrm{graph}(W_{\lambda,b})) = 2 + \frac{\log\lambda}{\log b}

for all {\lambda_b < \lambda < 1}.

The remainder of this post is dedicated to give some ideas of Shen’s proof of Theorem1 by discussing the particular case when {1/b<\lambda<2/b} and {b\in\mathbb{N}} is large.

2. Ledrappier’s dynamical approach

If {b\geq 2} is an integer, then the self-similar function {f^{\phi}_{\lambda,b}} (cf. Remark 1) is also {\mathbb{Z}}-periodic, i.e., {f^{\phi}_{\lambda,b}(x+1) = f^{\phi}_{\lambda,b}(x)} for all {x\in\mathbb{R}}. In particular, if {b\geq 2} is an integer, then {\textrm{graph}(f^{\phi}_{\lambda,b})} is an invariant repeller for the endomorphism {\Phi:\mathbb{R}/\mathbb{Z}\times\mathbb{R}\rightarrow \mathbb{R}/\mathbb{Z}\times\mathbb{R}} given by

\displaystyle \Phi(x,y) = \left(bx\textrm{ mod }1, \frac{y-\phi(x)}{\lambda}\right)

This dynamical characterization of {G = \textrm{graph}(f^{\phi}_{\lambda,b})} led Ledrappier to the following criterion for the validity of Mandelbrot’s conjecture when {b\geq 2} is an integer.

Denote by {\mathcal{A}} the alphabet {\mathcal{A}=\{0,\dots,b-1\}}. The unstable manifolds of {\Phi}through {G} have slopes of the form

\displaystyle (1,-\gamma \cdot s(x,u))

where {\frac{1}{b} < \gamma = \frac{1}{\lambda b} <1}, {x\in\mathbb{R}}, {u\in\mathcal{A}^{\mathbb{N}}}, and

\displaystyle s(x,u):=\sum\limits_{n=0}^{\infty} \gamma^n \phi'\left(\frac{x + u_1 + u_2 b + \dots + u_n b^{n-1}}{b^n}\right)

In this context, the push-forwards {m_x := (u\mapsto s(x,u))_*\mathbb{P}} of the Bernoulli measure {\mathbb{P}} on {\mathcal{A}^{\mathbb{N}}} (induced by the discrete measure assigning weight {1/b} to each letter of the alphabet {\mathcal{A}}) play the role of conditional measures along vertical fibers of the unique Sinai-Ruelle-Bowen (SRB) measure {\theta} of the expanding endomorphism {T:\mathbb{R}/\mathbb{Z}\times\mathbb{R} \rightarrow \mathbb{R}/\mathbb{Z}\times\mathbb{R}},

\displaystyle T(x,y) = (bx\textrm{ mod }1, \gamma y + \psi(x)),

where {\gamma=1/\lambda b} and {\psi(x)=\phi'(x)}. In plain terms, this means that

\displaystyle \theta = \int_{\mathbb{R}/\mathbb{Z}} m_x \, d\textrm{Leb}(x) \ \ \ \ \ (1)

where {\theta} is the unique {T}-invariant probability measure which is absolutely continuous along unstable manifolds (see Tsujii’s paper).

As it was shown by Ledrappier in 1992, the fractal geometry of the conditional measures {m_x} have important consequences for the fractal geometry of the graph {G}:

Theorem 2 (Ledrappier) Suppose that for Lebesgue almost every {x\in\mathbb{R}} the conditional measures {m_x} have dimension {\textrm{dim}(m_x)=1}, i.e.,

\displaystyle \lim\limits_{r\rightarrow 0}\frac{\log m_x(B(z,r))}{\log r} = 1 \textrm{ for } m_x\textrm{-a.e. } z

Then, the graph {G=\textrm{graph}(f^{\phi}_{\lambda,b})} has Hausdorff dimension

\displaystyle \textrm{dim}(G) = 2 + \frac{\log\lambda}{\log b}

Remark 8 Very roughly speaking, the proof of Ledrappier theorem goes as follows. By Remark 4, it suffices to prove that {\textrm{dim}(G)\geq 2 + \frac{\log\lambda}{\log b}}. By Frostman lemma, we need to construct a Borel measure {\nu} supported on {G} such that

\displaystyle \underline{\textrm{dim}}(\nu) := \textrm{ ess }\inf \underline{d}(\nu,x) \geq 2 + \frac{\log\lambda}{\log b}

where {\underline{d}(\nu,x):=\liminf\limits_{r\rightarrow 0}\log \nu(B(x,r))/\log r}. Finally, the main point is that the assumptions in Ledrappier theorem allow to prove that the measure {\mu^{\phi}_{\lambda, b}} given by the lift to {G} of the Lebesgue measure on {[0,1]} via the map {x\mapsto (x,f^{\phi}_{\lambda,b}(x))}satisfies

\displaystyle \underline{\textrm{dim}}(\mu^{\phi}_{\lambda,b}) \geq 2 + \frac{\log\lambda}{\log b}

An interesting consequence of Ledrappier theorem and the equation 1 is the following criterion for Mandelbrot’s conjecture:

Corollary 3 If {\theta} is absolutely continuous with respect to the Lebesgue measure {\textrm{Leb}_{\mathbb{R}^2}}, then

\displaystyle \textrm{dim}(G) = 2 + \frac{\log\lambda}{\log b}

Proof: By (1), the absolute continuity of {\theta} implies that {m_x} is absolutely continuous with respect to {\textrm{Leb}_{\mathbb{R}}} for Lebesgue almost every {x\in\mathbb{R}}.

Since {m_x\ll \textrm{Leb}_{\mathbb{R}}} for almost every {x} implies that {\textrm{dim}(m_x)=1} for almost every {x}, the desired corollary now follows from Ledrappier’s theorem. \Box

3. Tsujii’s theorem

The relevance of Corollary 3 is explained by the fact that Tsujii found an explicittransversality condition implying the absolute continuity of {\theta}.

More precisely, Tsujii firstly introduced the following definition:

Definition 4

  • Given {\varepsilon>0}, {\delta>0} and {x_0\in\mathbb{R}/\mathbb{Z}}, we say that two infinite words {u, v\in\mathcal{A}^{\mathbb{N}}} are {(\varepsilon,\delta)}-transverse at {x_0} if either

    \displaystyle |s(x_0,u)-s(x_0,v)|>\varepsilon

    or

    \displaystyle |s'(x_0,u)-s'(x_0,v)|>\delta

  • Given {q\in\mathbb{N}}, {\varepsilon>0}, {\delta>0} and {x_0\in\mathbb{R}/\mathbb{Z}}, we say that two finite words {k,l\in\mathcal{A}^q} are {(\varepsilon,\delta)}-transverse at {x_0} if {ku}, {lv} are {(\varepsilon,\delta)}-transverse at {x_0}for all pairs of infinite words {u,v\in\mathcal{A}^{\mathbb{N}}}; otherwise, we say that {k} and {l} are{(\varepsilon,\delta)}-tangent at {x_0};
  • {E(q,x_0;\varepsilon,\delta):= \{(k,l)\in\mathcal{A}^q\times\mathcal{A}^q: (k,l) \textrm{ is } (\varepsilon,\delta)\textrm{-tangent at } x_0\}}
  • {E(q,x_0):=\bigcap\limits_{\varepsilon>0}\bigcap\limits_{\delta>0} E(q,x_0;\varepsilon,\delta)};
  • {e(q,x_0):=\max\limits_{k\in\mathcal{A}^q}\#\{l\in\mathcal{A}^q: (k,l)\in E(q,x_0)\}}
  • {e(q):=\max\limits_{x_0\in\mathbb{R}/\mathbb{Z}} e(q,x_0)}.

Next, Tsujii proves the following result:

Theorem 5 (Tsujii) If there exists {q\geq 1} integer such that {e(q)<(\gamma b)^q}, then

\displaystyle \theta\ll\textrm{Leb}_{\mathbb{R}^2}

Remark 9 Intuitively, Tsujii’s theorem says the following. The transversality condition {e(q)<(\gamma b)^q} implies that the majority of strong unstable manifolds {\ell^{uu}}are mutually transverse, so that they almost fill a small neighborhood {U} of some point {x_0} (see the figure below extracted from this paper of Tsujii). Since the SRB measure {\theta} is absolutely continuous along strong unstable manifolds, the fact that the {\ell^{uu}}‘s almost fill {U} implies that {\theta} becomes “comparable” to the restriction of the Lebesgue measure {\textrm{Leb}_{\mathbb{R}^2}} to {U}.

tsujiiacta

Remark 10 In this setting, Barańsky-Barány-Romanowska obtained their main result by showing that, for adequate choices of the parameters {\lambda} and {b}, one has {e(1)=1}. Indeed, once we know that {e(1)=1}, since {1<\gamma b}, they can apply Tsujii’s theorem and Ledrappier’s theorem (or rather Corollary 3) to derive the validity of Mandelbrot’s conjecture for certain parameters {\lambda} and {b}.

For the sake of exposition, we will give just a flavor of the proof of Theorem 1 by sketching the derivation of the following result:

Proposition 6 Let {\phi(x) = \cos(2\pi x)}. If {1/2<\gamma=1/\lambda b <1} and {b\in\mathbb{N}} is sufficiently large, then

\displaystyle e(1)<\gamma b

In particular, by Corollary 3 and Tsujii’s theorem, if {1/2<\gamma=1/\lambda b <1} and {b\in\mathbb{N}} is sufficiently large, then Mandelbrot’s conjecture is valid, i.e.,

\displaystyle \textrm{dim}(W_{\lambda,b}) = 2+\frac{\log\lambda}{\log b}

Remark 11 The proof of Theorem 1 in full generality (i.e., for {b\geq 2} integer and {1/b<\lambda<1}) requires the introduction of a modified version of Tsujii’s transversality condition: roughly speaking, Shen defines a function {\sigma(q)\leq e(q)}(inspired from Peter-Paul inequality) and he proves

  • (a) a variant of Proposition 6: if {b\geq 2} integer and {1/b<\lambda<1}, then {\sigma(q)<(\gamma b)^q} for some integer {q};
  • (b) a variant of Tsujii’s theorem: if {\sigma(q)<(\gamma b)^q} for some integer {q}, then {\theta\ll\textrm{Leb}_{\mathbb{R}^2}}.

See Sections 2, 3, 4 and 5 of Shen’s paper for more details.

We start the (sketch of) proof of Proposition 6 by recalling that the slopes of unstable manifolds are given by

\displaystyle s(x,u):=-2\pi\sum\limits_{n=0}^{\infty} \gamma^n \sin\left(2\pi\frac{x + u_1 + u_2 b + \dots + u_n b^{n-1}}{b^n}\right)

for {x\in\mathbb{R}}, {u\in\mathcal{A}^{\mathbb{N}}}, so that

\displaystyle s'(x,u)=-4\pi^2\sum\limits_{n=0}^{\infty} \left(\frac{\gamma}{b}\right)^n \cos\left(2\pi\frac{x + u_1 + u_2 b + \dots + u_n b^{n-1}}{b^n}\right)

Remark 12 Since {\gamma/b < \gamma}, the series defining {s'(x,u)} converges faster than the series defining {s(x,u)}.

By studying the first term of the expansion of {s(x,u)} and {s'(x,u)} (while treating the remaining terms as a “small error term”), it is possible to show that if {(k,l)\in E(1,x_0)}, then

\displaystyle \left|\sin\left(2\pi\frac{x_0+k}{b}\right) - \sin\left(2\pi\frac{x_0+l}{b}\right)\right| \leq\frac{2\gamma}{1-\gamma} \ \ \ \ \ (2)

and

\displaystyle \left|\cos\left(2\pi\frac{x_0+k}{b}\right) - \cos\left(2\pi\frac{x_0+l}{b}\right)\right| \leq \frac{2\gamma}{b-\gamma} \ \ \ \ \ (3)

(cf. Lemma 3.2 in Shen’s paper).

Using these estimates, we can find an upper bound for {e(1)} as follows. Take {x_0\in\mathbb{R}/\mathbb{Z}} with {e(1)=e(1,x_0)}, and let {k\in\mathcal{A}} be such that {(k,l_1),\dots,(k,l_{e(1)})\in E(1,x_0)} distinct elements listed in such a way that

\displaystyle \sin(2\pi x_i)\leq \sin(2\pi x_{i+1})

for all {i=1,\dots,e(1)-1}, where {x_i:=(x_0+l_i)/b}.

From (3), we see that

\displaystyle \left|\cos\left(2\pi x_i\right) - \cos\left(2\pi x_{i+1}\right)\right| \leq \frac{4\gamma}{b-\gamma}

for all {i=1,\dots,e(1)-1}.

Since

\displaystyle (\cos(2\pi x_i)-\cos(2\pi x_{i+1}))^2 + (\sin(2\pi x_i)-\sin(2\pi x_{i+1}))^2 = 4\sin^2(\pi(x_i-x_{i+1}))\geq 4\sin^2(\pi/b),

it follows that

\displaystyle |\sin(2\pi x_i)-\sin(2\pi x_{i+1})|\geq \sqrt{4\sin^2\left(\frac{\pi}{b}\right) - \left(\frac{4\gamma}{b-\gamma}\right)^2} \ \ \ \ \ (4)

Now, we observe that

\displaystyle \sqrt{4\sin^2\left(\frac{\pi}{b}\right) - \left(\frac{4\gamma}{b-\gamma}\right)^2} > \frac{4}{b} \ \ \ \ \ (5)

for {b} large enough. Indeed, this happens because

  • {\sqrt{z^2-w^2}>2(z-w)} if {z+w>4(z-w)};
  • {z+w>4(z-w)} if {z/w:=u < 5/3};
  • {\frac{2\sin(\frac{\pi}{b})}{\frac{4\gamma}{b-\gamma}}\rightarrow \frac{2\pi}{4\gamma} (< \frac{5}{3})} as {b\rightarrow\infty}, and {2\sin(\frac{\pi}{b}) - \frac{4\gamma}{b-\gamma} \rightarrow (2\pi-4\gamma)\frac{1}{b} (>\frac{2}{b})} as {b\rightarrow\infty} (here we used {\gamma<1}).

By combining (4) and (5), we deduce that

\displaystyle |\sin(2\pi x_i)-\sin(2\pi x_{i+1})| > 4/b

for all {i=1,\dots, e(1)-1}.

Since {-1\leq\sin(2\pi x_1)\leq\sin(2\pi x_2)\leq\dots\leq\sin(2\pi x_{e(1)})\leq 1}, the previous estimate implies that

\displaystyle \frac{4}{b}(e(1)-1)<\sum\limits_{i=1}^{e(1)-1}(\sin(2\pi x_{i+1}) - \sin(2\pi x_i)) = \sin(2\pi x_{e(1)}) - \sin(2\pi x_1)\leq 2,

i.e.,

\displaystyle e(1)<1+\frac{b}{2}

Thus, it follows from our assumptions ({\gamma>1/2}, {b} large) that

\displaystyle e(1)<1+\frac{b}{2}<\gamma b

This completes the (sketch of) proof of Proposition 6 (and our discussion of Shen’s talk).

低维动力系统

One Dimensional Real and Complex Dynamics需要学习的资料:

复分析基础:本科生课程

(1) Complex Analysis, 3rd Edition, Lars V. Ahlfors

(2) Complex Analysis, Elias M. Stein

进阶复分析:研究生课程

(1) Lectures on Riemann Surfaces (GTM 81), Otto Forster

(2) Lectures on Quasiconformal Mappings, Lars V. Ahlfors

实分析基础:本科生课程

(1) Real Analysis, Rudin

(2) Real Analysis, Elias M. Stein

专业书籍:

实动力系统:

(1) One Dimensional Dynamics, Welington de Melo & Sebastian VanStrien

(2) Mathematical Tools for One-Dimensional Dynamics (Cambridge Studies in Advanced Mathematics), Edson de Faria / Welington de Melo

复动力系统:

(3) Dynamics in One Complex Variable, John Milnor

(4) Complex Dynamics, Lennart Carleson

(5) Complex Dynamics and Renormalization, Curtis T. McMullen

(6) Renormalization and 3-Manifolds Which Fiber over the Circle, Curtis T. McMullen

(7) Iteration of rational functions (GTM 132), Alan F. Beardon

遍历论:

(8) An Introduction to Ergodic Theory (GTM 79), Walters Peter

Ergodic Properties

One Dimensional Dynamics

— Welington De Melo, Sebastian van Strien

Chapter 5. Ergodic Properties and Invariant Measures.

1. Ergodicity, Attractors and Bowen-Ruelle-Sinai Measures.

A distortion result for unimodal maps with recurrence

Given a unimodal map f, we say that an interval U is symmetric if \tau(U)=U where \tau:[-1,1]\rightarrow [-1,1] is so that f(\tau(x))=f(x) and \tau(x)\neq x if x\neq c. Furthermore, for each symmetric interval U let

D_{U}=\{x: \text{ there exists } k>0 \text{ with } f^{k}(x)\in U\};

for x\in D_{U} let k(x,U) be the minimal positive integer with f^{k}(x)\in U and let

R_{U}(x)=f^{k(x,U)}(x).

We call R_{U}: D_{U}\rightarrow U the Poincare map or transfer map to U and k(x,U) the transfer time of x to U. The distortion result states that one can fined a sequence of symmetric neighbourhoods of the turning point such that the Poincare maps to these intervals have a distortion which is universally bounded:

Theorem 1.1.  Let f:[-1,1]\rightarrow [-1,1] be a unimodal map with one non-flat critical point with negative Schwarzian derivative and without attracting periodic points. Then there exists \rho>0 and a sequence os symmetric intervals U_{n}\subseteq V_{n} around the turning point which shrink to c such that V_{n} contains a \rho-scaled neighbourhood of U_{n} and such that the following properties hold.

1. The transfer time on each component of D_{U_{n}} is constant.

2. Let I_{n} be a component of the domain D_{U_{n}} of the transfer map to U_{n} which does not intersect U_{n}. Then there exists an interval T_{n}\supseteq I_{n} such that f^{k}|T_{n} is monotone, f^{k}(T_{n})\supseteq V_{n} and f^{k}(I_{n})=U_{n}. Here k is the transfer time on I_{n}, i.e., R_{U_{n}}|I_{n}=f^{k}.

Corollary. There exists K<\infty such that

1. for each component I_{n} of D_{U_{n}} not intersecting U_{n}, the transfer map R_{U_{n}} to U_{n} sends I_{n} diffeomorphically onto U_{n} and the distortion of R_{U_{n}} on I_{n} is bounded from above by K.

2. on each component I_{n} of D_{U_{n}} which is contained in U_{n}, the map R_{U_{n}}:I_{n}\rightarrow U_{n} can be written as (f^{k(n)-1}|f(I_{n}))\circ f|I_{n} where the distortion of f^{k(n)}|f(I_{n}) is universally bounded by K.

As before, we say that f is ergodic with respect to the Lebesgue measure if each completely invariant set X (Here X is called completely invariant if f^{-1}(X)=X) has either zero or full Lebesgue measure. An alternative way to define this notation of ergodicity goes as follows: f is ergodic if for each two forward invariant sets X and Y such that X\cap Y has Lebesgue measure zero, at most one of these sets has positive Lebesgue measure. (Here X is called forward invariant if f(X)\subseteq X.)

Theorem 1.2 (Blokh and Lyubich). Let f:[-1,1]\rightarrow [-1,1] be a unimodal map with a non-flat critical point with negative Schwarzian derivative and without an attracting periodic points. Then f is ergodic with respect to the Lebesgue measure.

Theorem 1.3.  Let f:[-1,1]\rightarrow [-1,1] be a unimodal map with a non-flat critical point with negative Schwarzian derivative. Then f has a unique attractor A, \omega(x)=A for almost all x and A either consists of intervals or has Lebesgue measure zero. Furthermore, one has the following:

1. if f has an attracting periodic orbit then A is this periodic orbit;

2. if f is infinitely often renormalizable then A is the attracting Cantor set \omega(c) (in which case it is called a solenoidal attractor);

3. f is only finitely often renormalizable then either

(a) A coincides with the union of the transitive intervals, or,

(b) A is a Cantor set and equal to \omega(c).

If \omega(c) is not a minimal set then f is as in case 3.a and each closed forward invariant set either contains intervals or has Lebesgue measure zero. Moreover, if \omega(c) does not contain intervals, then \omega(c) has Lebesgue measure zero.

Remark. Here a forward invariant set X is said to be minimal if the closure of the forward orbit of a point in X is always equal to X. The attractors in case 3.b is called a non-renormalizable attracting Cantor set, or absorbing Cantor attractor or wild Cantor attractor. Such an attractor really exists which is proven in [BKNS], and one has the following strange phenomenon: there exist many orbits which are dense in some finite union of intervals and yet almost all points tend to a minimal Cantor set of Lebesgue measure zero (this Cantor set is \omega(c)). The Fibonacci map is non-renormalizable and for which \omega(c) is a Cantor set. It was shown by Lyubich and Milnor that the quadratic map with this dynamics has no absorbing Cantor attractors. More generally, Jakobson and Swiatek proved that maps with negative Schwarzian derivative and which are close to the map f(x)=4x(1-x) do not have such Cantor attractors. Moreover, Lyubich has shown that these absorbing Cantor attractors can not exist if the critical point is quadratic. However, Bruin, Keller, Nowicki and Van Strien showed that the absorbing Cantor attractors exist for Fibonacci maps when the critical order \ell is sufficiently large enough.

Theorem (Lyubich). If f:[-1,1]\rightarrow [-1,1] is C^{3} unimodal, has a quadratic critical point, has negative Schwarzian derivative and has no periodic attractors, then each closed forward invariant set K which has positive Lebesgue measure contains an interval.

The next result, which is due to Martens (1990), shows that if these absorbing Cantor attractors do not exist then one has a lot of ‘expansion’. Let x not be in the pre orbit of c and define T_{n}(x) to be the maximal interval on which f^{n}|T_{n}(x) is monotone. Let R_{n}(x) and L_{n}(x) be the components of T_{n}\setminus x and define r_{n}(x) be the minimum of the length of f^{n}(R_{n}(x)) and f^{n}(L_{n}(x)).

Theorem 1.4 (Martens). Let f be a C^{3} unimodal map with negative Schwarian derivative whose critical point is non-flat. Then the following three properties are equivalent.

1. f has no absorbing Cantor attractor;

2. \limsup_{n\rightarrow \infty} r_{n}(x)>0 for almost all x;

3. there exist neighbourhoods U\subseteq V of c with cl(U)\subseteq int(V) such that for almost every x there exists a positive integer m and an interval neighbourhood T of x such that f^{m}|T is monotone, f^{m}(T)\supseteq V and f^{m}(x)\in U.

Perron-Frobenius Operator

Perron-Frobenius Operator

Consider a map f which possibly has a finite (or countable) number of discontinuities or points where possibly the derivative does not exist. We assume that there are points

\displaystyle q_{0}<q_{1}<\cdot\cdot\cdot <q_{k} or q_{0}<q_{1}<\cdot\cdot\cdot<q_{\infty}<\infty

such that f restricted to each open interval A_{j}=(q_{j-1},q_{j}) is C^{2}, with a bound on the first and the second derivatives. Assume that the interval [q_{0},q_{k}] ( or [q_{0},q_{\infty}] ) is positive invariant, so f(x)\in [q_{0},q_{k}] for all x\in [q_{0}, q_{k}] ( or f(x)\in [q_{0},q_{\infty}]  for all x\in[q_{0},q_{\infty}] ).

For such a map, we want a construction of a sequence of density functions that converge to a density function of an invariant measure. Starting with \rho_{0}(x)\equiv(q_{k}-q_{0})^{-1} ( or \rho_{0}(x)\equiv(q_{\infty}-q_{0})^{-1} ),assume that we have defined densities up to \rho_{n}(x), then define define \rho_{n+1}(x) as follows

\displaystyle \rho_{n+1}(x)=P(\rho_{n})(x)=\sum_{y\in f^{-1}(x)}\frac{\rho_{n}(y)}{|Df(y)|}.

This operator P, which takes one density function to another function, is called the Perron-Frobenius operator. The limit of the first n density functions converges to a density function \rho^{*}(x),

\displaystyle \rho^{*}(x)=\lim_{k\rightarrow \infty}\frac{1}{k}\sum_{n=0}^{k-1}\rho_{n}(x).

The construction guarantees that \rho^{*}(x) is the density function for an invariant measure \mu_{\rho^{*}}.

Example 1. Let

\displaystyle f(x)= \begin{cases}  x &\mbox{if } x\in(0,\frac{1}{2}), \\  2x &\mbox{if } x\in(\frac{1}{2},1).  \end{cases}

Screen Shot 2014-11-08 at 9.55.51 am

We construct the first few density functions by applying the Perron-Frobenius operator, which indicates the form of the invariant density function.
Take \rho_{0}(x)\equiv1 on [0,1]. From the definition of f(x), the slope on (0,\frac{1}{2}) and (\frac{1}{2},1) are 1 and 2, respectively. If x\in (\frac{1}{2},1), then it has only one pre-image on (\frac{1}{2},1); else if x\in(0,\frac{1}{2}), then it has two pre-images, one is x^{'} in (0,\frac{1}{2}), the other one is x^{''} in (\frac{1}{2},1). Therefore,

\rho_{1}(x)= \begin{cases}  \frac{1}{1}+\frac{1}{2} &\mbox{if } x\in(0,\frac{1}{2}), \\  \frac{1}{2} &\mbox{if } x\in(\frac{1}{2},1).  \end{cases}

By similar considerations,

\displaystyle \rho_{2}(x)=\begin{cases}1+\frac{1}{2}+\frac{1}{2^{2}} &\mbox{if } x\in(0,\frac{1}{2}), \\ \frac{1}{2^{2}} &\mbox{if } x\in(\frac{1}{2},1).\end{cases}

By induction, we get

\displaystyle \rho_{n}(x)=\begin{cases}1+\frac{1}{2}+\cdot\cdot\cdot+\frac{1}{2^{n}} &\mbox{if } x\in(0,\frac{1}{2}), \\ \frac{1}{2^{n}} &\mbox{if } x\in(\frac{1}{2},1).\end{cases}

Now, we begin to calculate the density function \rho^{*}(x). If x\in(0,\frac{1}{2}), then
\displaystyle  \rho^{*}(x)=\lim_{k\rightarrow \infty}\frac{1}{k}\sum_{n=0}^{k-1}\rho_{n}(x)  =\lim_{k\rightarrow \infty}\frac{1}{k}\sum_{n=0}^{k-1} \sum_{m=0}^{n}\frac{1}{2^{m}}  =\lim_{k\rightarrow \infty}\frac{1}{k}\sum_{n=0}^{k-1}\left(2-\frac{1}{2^{n}}\right)=2.
If x\in(\frac{1}{2},1), then
\displaystyle  \rho^{*}(x)=\lim_{k\rightarrow \infty}\frac{1}{k}\sum_{n=0}^{k-1}\rho_{n}(x)  =\lim_{k\rightarrow \infty}\frac{1}{k}\sum_{n=0}^{k-1}\frac{1}{2^{n}}  =\lim_{k\rightarrow \infty}\frac{1}{k}\left(2-\frac{1}{2^{k}}\right)=0.
i.e.

\displaystyle \rho^{*}(x)= \begin{cases}  2 &\mbox{if } x\in(0,\frac{1}{2}), \\  0 &\mbox{if } x\in(\frac{1}{2},1).  \end{cases}

Example 2. Let

\displaystyle f(x)=\begin{cases}  2x &\mbox{if } x\in(0,\frac{1}{2}), \\  2x-1 &\mbox{if } x\in(\frac{1}{2},1).  \end{cases}

Screen Shot 2014-11-08 at 9.56.12 am

Take \rho_{0}(x)\equiv1 on (0,1). By induction, \rho_{n}(x)\equiv1 on (0,1) for all n\geq 0. Therefore, \rho^{*}(x)\equiv1 on (0,1).

Example 3. Let

\displaystyle f(x)=\begin{cases}  x &\mbox{if } x\in(0,\frac{1}{2}), \\  2^{n+1}\cdot\left(x-\left(1-\frac{1}{2^{n}}\right)\right) &\mbox{if } x\in\left(1-\frac{1}{2^{n}},1-\frac{1}{2^{n+1}}\right) \text{ for all } n\geq 1.\end{cases}

Screen Shot 2014-11-08 at 9.56.31 am

Take \rho_{0}(x)\equiv1 on (0,1). Assume

\displaystyle \rho_{n}(x)= \begin{cases}  a_{n} &\mbox{if } x\in(0,\frac{1}{2}), \\  b_{n} &\mbox{if } x\in(\frac{1}{2},1).  \end{cases}

for all n\geq 0. It is obviously that a_{0}=b_{0}=1. By similar considerations,
\displaystyle \rho_{n+1}(x)= \begin{cases}  \frac{a_{n}}{1}+\frac{b_{n}}{4}+\frac{b_{n}}{8}+\frac{b_{n}}{16}+\cdot\cdot\cdot= a_{n}+\frac{b_{n}}{2} &\mbox{if } x\in(0,\frac{1}{2}), \\  \frac{b_{n}}{4}+\frac{b_{n}}{8}+\frac{b_{n}}{16}+\cdot\cdot\cdot = \frac{b_{n}}{2} &\mbox{if } x\in(\frac{1}{2},1).  \end{cases}
That means

\displaystyle \left( \begin{array}{ccc}  a_{n+1} \\  b_{n+1}  \end{array} \right)  =\left( \begin{array}{ccc}  a_{n}+\frac{1}{2}b_{n} \\  \frac{1}{2}b_{n}  \end{array} \right)  = \left( \begin{array}{ccc}  1 & \frac{1}{2} \\  0 & 1  \end{array} \right)  \left( \begin{array}{ccc}  a_{n} \\  b_{n}  \end{array} \right)

for all n\geq 0. From direct calculation, \displaystyle a_{n}=2-\frac{1}{2^{n}} and \displaystyle b_{n}=\frac{1}{2^{n}} for all n\geq 0. Therefore,

\displaystyle \rho^{*}(x)=\lim_{k\rightarrow \infty}\frac{1}{k}\sum_{n=0}^{k-1}\rho_{n}(x)=\begin{cases}  2 &\mbox{if } x\in (0,\frac{1}{2}), \\  0 &\mbox{if } x\in (\frac{1}{2},1).  \end{cases}

Example 4. Let

\displaystyle f(x)=\begin{cases}  1.5 x &\mbox{if } x\in(0,\frac{1}{2}), \\  2^{n+1}\cdot\left(x-\left(1-\frac{1}{2^{n}}\right)\right) &\mbox{if } x\in\left(1-\frac{1}{2^{n}},1-\frac{1}{2^{n+1}}\right) \text{ for all } n\geq 1.\end{cases}

Screen Shot 2014-11-08 at 9.56.38 am

Take \rho_{0}(x)\equiv1 on (0,1). Assume

\displaystyle \rho_{n}(x)= \begin{cases}  a_{n} &\mbox{if } x\in(0,\frac{3}{4}), \\  b_{n} &\mbox{if } x\in(\frac{3}{4},1).  \end{cases}

for all n\geq 0. It is obviously that a_{0}=b_{0}=1. By similar considerations,

\displaystyle \left( \begin{array}{ccc}  a_{n+1} \\  b_{n+1}  \end{array} \right)  =\left( \begin{array}{ccc}  \frac{11}{12}a_{n}+\frac{1}{4}b_{n} \\  \frac{1}{4}a_{n}+\frac{1}{4}b_{n}  \end{array} \right)  = \left( \begin{array}{ccc}  \frac{11}{12} & \frac{1}{4} \\  \frac{1}{4} & \frac{1}{4}  \end{array} \right)  \left( \begin{array}{ccc}  a_{n} \\  b_{n}  \end{array} \right)

for all n\geq 0. From matrix diagonalization , \displaystyle a_{n}=\frac{6}{5}-\frac{1}{5}\cdot\frac{1}{6^{n}} and \displaystyle b_{n}=\frac{2}{5}+\frac{3}{5}\cdot\frac{1}{6^{n}} for all n\geq 0.

Therefore,

\displaystyle \rho^{*}(x)=\lim_{k\rightarrow \infty}\frac{1}{k}\sum_{n=0}^{k-1}\rho_{n}(x)=\begin{cases}  \frac{6}{5} &\mbox{if } x\in (0,\frac{3}{4}), \\  \frac{2}{5} &\mbox{if } x\in (\frac{3}{4},1).  \end{cases}

Perron-Frobenius Theory

Definition. Let A=[a_{ij}] be a k\times k matrix. We say A is non-negative if a_{ij}\geq 0 for all i,j. Such a matrix is called irreducible if for any pair i,j there exists some n>0 such that a_{ij}^{(n)}>0 where a_{ij}^{(n)} is the (i,j)-th element of A^{n}. The matrix A is irreducible and aperiodic if there exists n>0 such that a_{ij}^{(n)}>0 for all i,j.

Perron-Frobenius Theorem Let A=[a_{ij}] be a non-negative k\times k matrix.

(i) There is a non-negative eigenvalue \lambda such that no eigenvalue of A has absolute value greater than \lambda.

(ii) We have \min_{i}(\sum_{j=1}^{k}a_{ij})\leq \lambda\leq \max_{i}(\sum_{j=1}^{k}a_{ij}).

(iii) Corresponding to the eigenvalue \lambda there is a non-negative left (row) eigenvector u=(u_{1},\cdot\cdot\cdot, u_{k}) and a non-negative right (column) eigenvector v=(v_{1},\cdot\cdot\cdot, v_{k})^{T}.

(iv) If A is irreducible then \lambda is a simple eigenvalue and the corresponding eigenvectors are strictly positive (i.e. u_{i}>0, v_{i}>0 all i).

(v) If A is irreducible then \lambda is the only eigenvalue of A with a non-negative eigenvector.

Theorem.
Let A be an irreducible and aperiodic non-negative matrix. Let u=(u_{1},\cdot\cdot\cdot, u_{k}) and v=(v_{1},\cdot\cdot\cdot, v_{k})^{T} be the strictly positive eigenvectors corresponding to the largest eigenvalue \lambda as in the previous theorem. Then for each pair i,j, \lim_{n\rightarrow \infty} \lambda^{-n}a_{ij}^{(n)}=u_{j}v_{i}.

Now, let us see previous examples, again. The matrix A is irreducible and aperiodic non-negative matrix, and \lambda=1 has the largest absolute value in the set of all eigenvalues of A. From Perron-Frobenius Theorem, u_{i}, v_{j}>0 for all pairs i,j. Then for each pari i,j,
\lim_{n\rightarrow \infty}a_{ij}^{(n)}=u_{j}v_{i}. That means \lim_{n\rightarrow \infty}A^{(n)} is a strictly positive k\times k matrix.

Markov Maps

Definition of Markov Maps. Let N be a compact interval. A C^{1} map f:N\rightarrow N is called Markov if there exists a finite or countable family I_{i} of disjoint open intervals in N such that

(a) N\setminus \cup_{i}I_{i} has Lebesgue measure zero and there exist C>0 and \gamma>0 such that for each n\in \mathbb{N} and each interval I such that f^{j}(I) is contained in one of the intervals I_{i} for each j=0,1,...,n one has

\displaystyle \left| \frac{Df^{n}(x)}{Df^{n}(y)}-1 \right| \leq C\cdot |f^{n}(x)-f^{n}(y)|^{\gamma} \text{ for all } x,y\in I;

(b) if f(I_{k})\cap I_{j}\neq \emptyset, then f(I_{k})\supseteq I_{j};

(c) there exists r>0 such that |f(I_{i})|\geq r for each i.

As usual, let \lambda be the Lebesgue measure on N. We may assume that \lambda is a probability measure, i.e., \lambda(N)=1. Usually, we will denote the Lebesgue measure of a Borel set A by |A|.

Theorem.  Let f:N\rightarrow N be a Markov map and let \cup_{i}I_{i} be corresponding partition. Then there exists a f-invariant probability measure \mu on the Borel sets of N which is absolutely continuous with respect to the Lebesgue measure \lambda. This measure satisfies the following properties:

(a) its density \frac{d\mu}{d\lambda} is uniformly bounded and Holder continuous. Moreover, for each i the density is either zero on I_{i} or uniformly bounded away from zero.

If for every i and j one has f^{n}(I_{j})\supseteq I_{i} for some n\geq 1 then

(b) the measure is unique and its density \frac{d\mu}{d\lambda} is strictly positive;

(c) f is exact with respect to \mu;

(d) \lim_{n\rightarrow \infty} |f^{-n}(A)|=\mu(A) for every Borel set A\subseteq N.

If f(I_{i})=N for each interval I_{i}, then

(e) the density of \mu is also uniformly bounded from below.

2. 刚性定理

考虑二次多项式 f_{a}(x)=ax(1-x), a\in[0,4], f_{a}:[0,1]\rightarrow [0,1].

问题:

\{ a\in[0,4]: f_{a} \text{ satisfies Axiom A} \} 是否在 [0,4] 中稠密?

引理:f_{a} 满足 Axiom A \Leftrightarrow f_{a} 有双曲吸引周期轨。

定义 Kneading 序列: K(f_{a})=\{ i_{1}, i_{2},... \}, i_{k}=L \text{ if } f_{a}^{k}(\frac{1}{2})<\frac{1}{2};  i_{k}=c=\frac{1}{2} \text{ if } f_{a}^{k}(\frac{1}{2})=\frac{1}{2};  i_{k}=R \text{ if } f_{a}^{k}(\frac{1}{2})>\frac{1}{2}.

例子:

K(f_{4})=(R,L,L,L,...)=RLLL,

K(f_{1})=(L,L,L,L,...)=LLLL,

K(f_{2})=(c,c,c,c,...)=cccc,

K(f_{1.9})=(L,L,L,L,...)=LLLL,

在这里,f_{1}f_{1.9} 不是拓扑共轭的,即使它们的 Kneading 序列是一样的。

定义:f 和 g 称为拓扑共轭,如果存在同胚映射 h 使得 h\circ f= g \circ h.

性质1: 如果 f_{a_{1}} f_{a_{2}} 拓扑同胚,则有 K(f_{a_{1}})= K(f_{a_{2}}).

引理:如果 f_{a_{1}} f_{a_{2}} 没有双曲吸引或者双曲中性周期轨,则 K(f_{a_{1}})= K(f_{a_{2}}) \Rightarrow  f_{a_{1}} f_{a_{2}} 拓扑同胚 \Rightarrow a_{1}=a_{2}.

定义:拟共形映射的分析定义: \varphi: \Omega\rightarrow \tilde{\Omega}, 在这里 \Omega, \tilde{\Omega} 都是复平面上面的连通开集, \varphi 是保持定向的同胚映射,称 \varphi 是 K 拟共形映射 (K\geq 1), 如果

(1) \varphi 是 ACL 的,也就是线段上绝对连续,absolutely continuous on lines.

(2) | \frac{\partial \varphi}{\partial \overline{z}} | \leq \frac{K-1}{K+1} |\frac{\partial \varphi}{\partial z}| 几乎处处成立。

拟共形映射的一些性质:假设 \varphi 是 K-拟共形映射,K\geq 1.

(i) \varphi 几乎处处可微。对几乎所有的 z_{0}\in \Omega

\varphi(z) = \varphi(z_{0}) + \frac{\partial \varphi}{\partial z}(z_{0})(z-z_{0}) + \frac{\partial \varphi}{\partial \overline{z}}(z_{0})\overline{(z-z_{0})}+ o(|z-z_{0}|).

| \frac{\partial \varphi}{\partial z}|>0 几乎处处成立。

定义 \varphi 的复特征是 \mu_{\varphi}= \frac{\partial \varphi}{\partial \overline{z}} / \frac{\partial \varphi}{\partial z},||\mu_{\varphi}||_{\infty} \leq \frac{K-1}{K+1} <1.

(ii) Measurable Riemann Mapping Theorem ( Ahlfors-Bers )

 

Assume f_{a}(x)=ax(1-x), a_{0} \in (0,4]

Comb(a_{0})=\{ a\in(0,4]: K(f_{a})=K(f_{a_{0}}) \},

Top(a_{0})= \{ a\in (0,4]: f_{a} \text{ and } f_{a_{0}} \text{ are topological conjugate } \},

\Rightarrow Top(a_{0}) \subseteq Comb(a_{0}).

Qc(a_{0}) = \{ a\in (0,4]: f_{a} \text{ and } f_{a_{0}} \text{ are quasi-conformal conjugate} \},

Aff(a_{0}) = \{ a\in (0,4]: f_{a} \text{ and } f_{a_{0}} \text{ are linear conjugate} \},

\Rightarrow Aff(a_{0}) \subseteq Qc(a_{0}).

刚性问题:Comb(a_{0})=Qc(a_{0}) ? Comb(a_{0})=Aff(a_{0})?

 

定理:( Graczyk – Swiatek, Lyubich, 1997) 假设 f_{a_{0}} 没有双曲吸引或者中性周期轨,则 Comb(a_{0})=Qc(a_{0}).

推论:( Sullivan, 1988) Axiom A 系统在实系数二次多项式中稠密。

1.一维动力系统中的双曲性

定理: 假设f:[0,1]\rightarrow [0,1] C^{k}, k是正整数,则存在C^{k} 函数 f_{n}:[0,1]\rightarrow [0,1] 使得 || f_{n}- f ||_{C^{k}}=\max_{x\in[0,1]} \max_{0\leq m\leq k} |D^{m}f_{n}(x)-D^{m}f(x)| \rightarrow 0 as k\rightarrow \infty, 这里的每个f_{n}都满足Axiom A。

 

假设X是紧致度量空间,f:X\rightarrow X是连续函数。如果n是使得f^{n}(x)=x的最小正整数,则称x是以n为周期的周期点。

定义:

\omega(x)=\{ y\in X: \exists n_{k} \rightarrow \infty, f^{n_{k}}(x)\rightarrow y\}.

正向不变集:f(A)\subseteq A,

反向不变集:f^{-1}(A)\subseteq A,

完全不变集:f^{-1}(A)=A i.e. f(A)\subseteq A and f^{-1}(A)\subseteq A.

假设X=[0,1], f(x)\in C^{1}[0,1], \{ x, f(x), ... , f^{n-1}(x)\} 是以n为周期的周期轨道, 定义乘子(multiplier) \lambda=Df^{n}(x)=Df(x)\cdot Df(f(x)) ... Df(f^{n-1}(x))

|\lambda| \neq 1称为orb(x)=\{ f^{k}(x): k=0,1,2... \}是双曲周期轨。

|\lambda|=1称为中性周期轨。

|\lambda|<1称为双曲吸引轨。

|\lambda|>1称为双曲斥性轨。

双曲集合(hyperbolic set):假设f:[0,1]\rightarrow [0,1]C^{1}映射,A是紧集并且f(A)\subseteq A。如果存在C>0, \lambda>1使得对任意的x\in A, n\geq 1, 有|Df^{n}(x)| \geq C\lambda^{n},则称A是双曲集。

Axiom A: 假设 f:[0,1]\rightarrow [0,1]C^{1} 映射,称 f 满足 Axiom A是指:

(1)f 有有限多个双曲吸引轨 \theta_{1},...,\theta_{m},

(2)B(\theta_{i}) 是双曲吸引轨 \theta_{i} 的吸引区域, \Omega=[0,1]\setminus \cup_{i=1}^{m}B(\theta_{i}) 是双曲集。

例子1:f(x)=-x^{2},1是双曲斥性不动点,0是双曲吸引不动点。B(\{0\})=(-1,1), \Omega=[-1,1]\setminus B(\{0\})=\{-1,1\}. f^{n}(x)=x^{2^{n}} , Df^{n}(x)=2^{n}x^{2^{n}-1}. 取C=1, \lambda=2.

例子2:f(x)=2x(1-x), f(x)=ax(1-x).

 

性质1: 双曲斥性周期轨一定是双曲集。

性质2: 双曲集中没有临界点。

性质3: 双曲集合中任何一个周期轨都是双曲斥性的。

 

命题:假设f:[0,1]\rightarrow [0,1]属于C^{1+\alpha}并且\alpha \in(0,1). i.e. Df(x)\alpha-Holder连续的,|Df(x)-Df(y)|\leq C|x-y|^{\alpha}.如果A是双曲集,则A的Lebesgue测度是零。

证明:

 

 

定理(Mane,1985)(CMP)
假设 f:[0,1]\rightarrow [0,1] 是一个 C^{2} 的映射,

(1) f 的所有周期轨都是双曲的。

(2) Crit(f) 指的是 f 的临界点。\forall c\in Crit(f), 则存在双曲吸引周期轨 \theta_{c} 使得 d(f^{n}(c),\theta_{c})\rightarrow 0, n\rightarrow \infty.

\Longleftrightarrow f 满足 Axiom A。

另外一种形式:

假设f:[0,1]\rightarrow [0,1]是一个C^{2}的映射,

U\subseteq Crit(f)\cup \text{ hyperbolic attracting orbits }\cup \text{ and neutral orbits } ,

\Lambda_{U} = \{ x\in[0,1]: f^{n}(x)\notin U, \forall n\geq 0 \},

\Rightarrow \Lambda_{U} 是双曲集。

 

The Cross Ratio Tool and the Koebe Principle

Let j \subseteq t be intervals and let l, r be the components of t \setminus j . Then the Cross Ratio is defined as

C(t,j) = (|t| \cdot |j|) / ( |l| \cdot |r|).

Assume g is a C^{3} monotone function on the interval t, and g(t)=T, g(j)=J, g(l)=L, g(r)=R. Then define

B(g,t,j)=\frac{C(T,J)}{C(t,j)} = \frac{|T|\cdot |J|}{|L| \cdot |R|} \cdot \frac{|l|\cdot |r|}{|t|\cdot |j|}.

Define the Schwarzian Derivative for C^{3} function g,

Sg(x)=\frac{D^{3}g(x)}{Dg(x)} -\frac{3}{2}(\frac{D^{2}g(x)}{Dg(x)})^{2}.

Proposition 1. Assume f and g are C^{3} functions, then

S(f\circ g)(x)= Sf(g(x)) \cdot |Dg(x)|^{2}+ Sg(x).

S(f^{n})(x)= \sum_{i=0}^{n-1}(Sf(f^{i}(x)) \cdot |D(f^{i})(x)|^{2}.

Proposition 2. If f(x)=x^{\ell}+c for some c\in \mathbb{R} and \ell \geq 2, then Sf(x)<0 for all x \neq 0.

Proposition 3. Minimum Principle.

Assume I=[a,b], f: I \rightarrow \mathbb{R} is a C^{3} diffeomorphism with negative schwarzian derivative, then

|Df(x)| > \min \{|Df(a), |Df(b)|\} \text{ for all } x \in (a,b).

Theorem 1. Real Koebe Principle.

Let Sf<0. Then for any intervals j \subseteq t and any n for which f^{n}|t is a diffeomorphism one has the following. If f^{n}(t) contains a \tau-scaled neighbourhood of f^{n}(j), then

(\frac{\tau}{1+\tau})^{2} \leq \frac{|Df^{n}(x)|}{|Df^{n}(y)|} \leq (\frac{1+\tau}{\tau})^{2} \text{ for all } x, y \in j.

Moreover, there exists a universal function K(\tau)>0 which does not depend on f, n,  and t such that

|l| / |j| \geq K(\tau),

|r| /|j| \geq K(\tau).

Theorem 2. Complex Koebe Principle

Suppose that D \subseteq \mathbb{C} contains a \tau-scaled neighbourhood of the disc D_{1} \subseteq \mathbb{C}. Then for any univalent function f: D \rightarrow \mathbb{C} one has a universal function K(\tau)>0 which only depends on \tau>0 such that

1/K(\tau) \leq \frac{|Df(x)|}{|Df(y)|} \leq K(\tau) \text{ for all } x, y \in D_{1}.

Theorem 3. Schwarz Lemma (Original Form)

Assume \mathbb{D}=\{ z: |z|<1\} is the unit disc on the complex plane \mathbb{C}, f: \mathbb{D} \rightarrow \mathbb{D} is a holomorphic function with f(0)=0. Then |f(z)|\leq |z| for all z \in \mathbb{D} and |f^{'}(0)| \leq 1. Moreover, if |f(z_{0})|=|z_{0}| for some z_{0}\neq 0 or |f^{'}(0)|=1, then f(z)= e^{i\theta} z for some \theta \in \mathbb{R}.

Corollary 1.

Assume \mathbb{D} is the unit disc on the complex plane \mathbb{C}, and f: \mathbb{D} \rightarrow \mathbb{D} is a holomorphic function, then

|\frac{f(z)-f(z_{0})}{1-\overline{f(z_{0})}f(z)}| \leq |\frac{z-z_{0}}{1-\overline{z}_{0}z}| \text{ for all } z, z_{0} \in \mathbb{D}.

\frac{|f^{'}(z)|}{1-|z|^{2}} \leq \frac{1}{1-|z|^{2}} \text{ for all } z \in \mathbb{D}.

Corollary 2.

Assume \mathbb{H} is the upper half plane of the complex plane \mathbb{C}, f: \mathbb{H} \rightarrow \mathbb{H} is a holomorphic map. Then

\frac{|f(z_{1})-f(z_{2})|}{|f(z_{1})-\overline{f(z_{2})}|} \leq \frac{|z_{1}-z_{2}|}{|z_{1}-\overline{z_{2}}|} \text{ for all } z_{1}, z_{2} \in \mathbb{H} .

\frac{|f^{'}(z)|}{\Im{f(z)}} \leq \frac{1}{\Im{z}} \text{ for all } z\in \mathbb{H} .

Corollary 3. Pick Theorem

The hyperbolic metric on \mathbb{D} is \rho(z)= \frac{2}{1-|z|^{2}}dz , assume d(z_{1}, z_{2}) denotes the hyperbolic distance between z_{1} and z_{2} on \mathbb{D}. Assume f: \mathbb{D} \rightarrow \mathbb{D} is a holomorphic function, then

d(f(z_{1}), f(z_{2}))\leq d(z_{1}, z_{2}) \text{ for all } z_{1}, z_{2} \in \mathbb{D}.

Moreover, if d(f(z_{1}), f(z_{2}))= d(z_{1}, z_{2}) for some points z_{1}, z_{2} \in \mathbb{D}, then f \in Aut(\mathbb{D}), where

Aut(\mathbb{D})=\{e^{i\theta}\frac{z-z_{0}}{1-\overline{z_{0}}z}: \theta \in \mathbb{R}, z_{0} \in \mathbb{D}\}.

Background in hyperbolic geometry

Define

\mathbb{C}_{J}=(\mathbb{C} \setminus \mathbb{R}) \cup J

where J \subseteq \mathbb{R} is an interval. It is easy to show that \mathbb{C}_{J} is conformally equivalent to the upper half plane and define D_{k}(J) as

D_{k}(J)= \{ z: \text{the hyperbolic distance to J is at most k} \}.

k is determined by the external angle \alpha at which the discs intersect the real line. Moreover, k=\ln \tan( \frac{\pi}{2}- \frac{\alpha}{4}) . Define

D_{*}(J)=D(J,\frac{\pi}{2}) .

Corollary 4. (NS) Schwarz Lemma 

(1) Assume G: \mathbb{C}_{I} \rightarrow \mathbb{C}_{J} is a holomorphic map, then G((D_{*}{I})) \subseteq D_{*}(J).

(2) Assume F: \mathbb{C} \rightarrow \mathbb{C} is a real polynomial map, its critical points are on the real line. Assume F: I \rightarrow J is a diffeomorphism, then there exists a set D \subseteq D_{*}(I) such that D\cap \mathbb{R} =I and

F: D \rightarrow D_{*}(J) is a conformal map.

Corollary 5. 

Assume f: D \rightarrow \mathbb{C} is a univalent map and D contains \tau-scaled neighbourhood of D_{1}, and assume f maps the real line to the real line. For each \alpha \in (\pi/2, \pi) there exists \alpha^{'} \in (\alpha, \pi) such that if J is a real interval in D_{1}, then

f(D(J,\alpha)) \supseteq D(f(J), \alpha^{'}).

The Hyperbolic Metric On the Real Interval and Cross Ratio

As far as we know, the hyperbolic metric on the unit disc \mathbb{D}=\{|z|<1\} is

\rho_{D}(z)= \frac{2}{1-|z|^{2}}|dz| \text{ for all } z\in \mathbb{D}.

Then the restriction to the real line is

\rho_{I}(x)=\frac{2}{1-x^{2}} dx \text{ for all } x \in I=(-1,1).

Moreover, from it, we can deduce the hyperbolic metric on the real interval I=(a,b) is

\rho_{I}(x)=\frac{b-a}{(x-a)(b-x)} dx \text{ for all } x \in I=(a,b).

If (c,d) \subseteq (a,b), then the hyperbolic length of the interval (c,d) on the total interval (a,b) is

\ell_{(a,b)}((c,d))=\ell_{t}(j)=\ln(1+Cr(t,j)),

where l=(a,c), j=(c,d), r=(d,b), t=(a,b).

Theorem 4. Assume f: T \rightarrow f(T) \subseteq \mathbb{R} is a C^{3} diffeomorphism with negative schwarzian derivative. Assume J \subseteq T, then

\ell_{f(T)}(f(J)) \geq \ell_{T}(J).

That means f expands the hyperbolic metric on the real interval.

Proof.  Since the schwarzian derivative of f is negative, C(f(T),f(J)) \geq C(T,J).

Therefore, \ell_{f(T)}(f(J)) \geq \ell_{T}(J). That means f expands the hyperbolic metric on the real interval.

Remark. From Schwarz-Pick Theorem, for a holomorphic map f: \mathbb{D} \rightarrow \mathbb{D}, f contracts the hyperbolic distance in the unit disc \mathbb{D}. Conversely, from above, for a C^{3} diffeomorphism f with negative schwarzian derivative, f expands the hyperbolic distance in the real interval.

Exercise 1.  “Mathematical Tools for One Dimensional Dynamics” Exercise 6.5, Chapter 6

Let f: I \rightarrow f(I) \subseteq \mathbb{R} be a C^{3} diffeomorphism without fixed points ( I being a closed interval on the real line). If Sf(x)<0 for all x \in I, then there exists a unique x_{0} \in I such that |f(x_{0})-x_{0}| \leq |f(x)-x| for all x \in I.

Proof.  If f is a decreasing map, then the right boundary of the real interval I is the x_{0}. Therefore, assume that f is an increasing map on the real interval I.

Since f(x) has no fixed points on the real interval I, then f(x)>x or f(x)<x for all x \in I. Without lost of generality, assume f(x)>x for all x\in I. Since f(x)-x is a continuous function on the closed interval I, there exists x_{0} \in I such that |f(x_{0})-x_{0}| \leq |f(x)-x| for all x\in I.

By contradiction, there exist two distinct points x_{0}, x_{1} (x_{0}<x_{1}) such that |f(x_{0})-x_{0}| \leq |f(x)-x| and |f(x_{1})-x_{1}| \leq |f(x)-x| for all x\in I. From here, we know that |f(x_{0})-x_{0}|= |f(x_{1})-x_{1}|.

From Langrange’s mean value theorem, there exists \xi \in (x_{0}, x_{1}) such that (Df)(\xi)=1. Since the schwarzian derivative of f is negative, from the minimal principle, we get

(Df)(\xi) > \min(Df(x_{0}), Df(x_{1})).

i.e. Df(x_{0})<1, Df(x_{1})<1. However, from the definition of x_{0} and x_{1}, we get

Df(x_{0}) = \lim_{x\rightarrow x_{0}^{+}} \frac{f(x)-f(x_{0})}{x-x_{0}} \geq 1

Df(x_{1}) = \lim_{x\rightarrow x_{1}^{-}} \frac{f(x_{1})-f(x)}{x_{1}-x} \leq 1

This is a contradiction. Therefore, the existence of x_{0} is unique.

Assume f: I \rightarrow f(I) \subseteq \mathbb{R} is a C^{3} diffeomorphism, define the non-linearity of f as

f \mapsto Nf=\frac{D^{2}f}{Df} = D \ln Df \text{ whenever } Df \neq 0.

Proposition 4.  N(f \circ g)= (Nf \circ g) \cdot Dg+ Ng.

Proposition 5. Sf=\frac{D^{3}f}{Df} -\frac{3}{2}(\frac{D^{2}f}{Df})^{2}=D(Nf)-\frac{1}{2}(Nf)^{2}.

Theorem 5. Koebe Non-linearity Principle.

Given B, \tau>0, there exists K_{\tau,B}>0 such that, if f: [-\tau, 1+\tau] \rightarrow \mathbb{R} is a C^{3} diffeomorphism into the reals and Sf(t)\geq -B for all t\in [-\tau,1+\tau], then we have

|\frac{f^{''}(x)}{f^{'}(x)} | \leq K_{\tau,B}

for all 0\leq x \leq 1. Show that K_{\tau,B} \rightarrow 2/\tau as B\rightarrow 0. (This recovers the classical Koebe non-linearity principle).