# 你真的适合当自由职业者吗？

1. 自己拥有的技能是否真的有市场，能否给自己真正带来收入；
2. 对自己的要求是否高，在日常的生活中自律性是否足够强；
3. 对自己的未来是否有较为清晰的规划，是否能够扛住短期没有收入的风险。

# 美国官方：关于停止某些中国学生和研究人员非移民入境的公告

The People’s Republic of China (PRC) is engaged in a wide‑ranging and heavily resourced campaign to acquire sensitive United States technologies and intellectual property, in part to bolster the modernization and capability of its military, the People’s Liberation Army (PLA).  The PRC’s acquisition of sensitive United States technologies and intellectual property to modernize its military is a threat to our Nation’s long-term economic vitality and the safety and security of the American people.

中华人民共和国（PRC）正在进行广泛而资源丰富的运动，以获取敏感的美国技术和知识产权，部分是为了增强其军队人民解放军（PLA）的现代化和能力。中国获得敏感的美国技术和知识产权以使其军队现代化，这威胁到我们国家的长期经济活力以及美国人的安全与保障。

The PRC authorities use some Chinese students, mostly post‑graduate students and post-doctorate researchers, to operate as non-traditional collectors of intellectual property.  Thus, students or researchers from the PRC studying or researching beyond the undergraduate level who are or have been associated with the PLA are at high risk of being exploited or co-opted by the PRC authorities and provide particular cause for concern.  In light of the above, I have determined that the entry of certain nationals of the PRC seeking to enter the United States pursuant to an F or J visa to study or conduct research in the United States would be detrimental to the interests of the United States.

中国当局利用一些中国学生（主要是研究生和博士后研究人员）来作为非传统的知识产权收藏者。因此，与解放军有联系或曾经与解放军有联系的，在中国学习或研究的来自中国的学生或研究人员极有可能被中国当局剥削或选择，并引起特别关注。鉴于上述情况，我认为，某些想通过F或J签证进入美国学习或在美国进行研究的中国国民入境，将对美国的利益不利。

NOW, THEREFORE, I, DONALD J. TRUMP, President of the United States, by the authority vested in me by the Constitution and the laws of the United States of America, including sections 212(f) and 215(a) of the Immigration and Nationality Act (INA), 8 U.S.C. 1182(f) and 1185(a), and section 301 of title 3, United States Code, hereby find that the unrestricted entry into the United States as nonimmigrants of persons described in section 1 of this proclamation would, except as provided for in section 2 of this proclamation, be detrimental to the interests of the United States, and that their entry should be subject to certain restrictions, limitations, and exceptions.  I therefore hereby proclaim the following:

现在，我是美国总统唐纳德·特鲁姆（DONALD J. TRUMP），由美国《宪法》和美国法律（包括移民法第212（f）和215（a）条）赋予我的权力和《国籍法》（INA），8 USC据此，《美国法典》第1182（f）和1185（a）条以及第3篇第301条由此认定，本条第1节所述的人作为非移民者不受限制地进入美国，除非本条第1节规定本公告的第2条不利于美国的利益，并且其加入应受到某些限制，限制和例外。因此，我在此宣布以下内容：

Section 1.  Suspension and Limitation on Entry.  The entry into the United States as a nonimmigrant of any national of the PRC seeking to enter the United States pursuant to an F or J visa to study or conduct research in the United States, except for a student seeking to pursue undergraduate study, and who either receives funding from or who currently is employed by, studies at, or conducts research at or on behalf of, or has been employed by, studied at, or conducted research at or on behalf of, an entity in the PRC that implements or supports the PRC’s “military-civil fusion strategy” is hereby suspended and limited subject to section 2 of this proclamation.  For the purposes of this proclamation, the term “military-civil fusion strategy” means actions by or at the behest of the PRC to acquire and divert foreign technologies, specifically critical and emerging technologies, to incorporate into and advance the PRC’s military capabilities.

第1节。暂停和进入限制。寻求通过F或J签证进入美国学习或进行美国研究的任何中国公民的非移民入境美国，但寻求本科学习的学生除外，并且接受或执行某实体的资金，或从某实体接受其资助或目前由该实体从事研究或以其名义进行研究，或已由该实体实施或支持的实体聘用，由其进行研究或以其名义进行研究因此，中华人民共和国的“军民融合战略”被中止，并受本公告第2条的限制。就本公告而言，“军民融合战略”一词是指中国采取或应中国的指示，采取行动，获取和转移外国技术，特别是关键的和新兴的技术，以纳入和提高中国的军事能力。

Sec. 2.  Scope of Suspension and Limitation on Entry.
(a)  Section 1 of this proclamation shall not apply to:

(i)    any lawful permanent resident of the United States;

(ii)   any alien who is the spouse of a United States citizen or lawful permanent resident;

(iii)  any alien who is a member of the United States Armed Forces and any alien who is a spouse or child of a member of the United States Armed Forces;

(iv)   any alien whose travel falls within the scope of section 11 of the United Nations Headquarters Agreement or who would otherwise be allowed entry into the United States pursuant to United States obligations under applicable international agreements;

(v)    any alien who is studying or conducting research in a field involving information that would not contribute to the PRC’s military‑civil fusion strategy, as determined by the Secretary of State and the Secretary of Homeland Security, in consultation with the appropriate executive departments and agencies (agencies);

(vi)   any alien whose entry would further important United States law enforcement objectives, as determined by the Secretary of State, the Secretary of Homeland Security, or their respective designees, based on a recommendation of the Attorney General or his designee; or

(vii)  any alien whose entry would be in the national interest, as determined by the Secretary of State, the Secretary of Homeland Security, or their respective designees.

(b)  Nothing in this proclamation shall be construed to limit the ability of an individual to seek asylum, refugee status, withholding of removal, or protection under the Convention Against Torture and Other Cruel, Inhuman or Degrading Treatment or Punishment, consistent with the laws of the United States.

第2节.暂停范围和进入限制。
（a）本公告第1条不适用于：

（i）美国的任何合法永久居民；

（ii）是美国公民的配偶或合法永久居民的任何外国人；

（iii）任何是美国武装部队成员的外国人以及任何是美国武装部队成员的配偶或子女的外国人；

（iv）任何旅行属于《联合国总部协定》第11条范围之内的外国人，或根据适用国际协定所规定的美国义务被允许进入美国的任何外国人；

（v）经国务卿和国土安全大臣确定，在与有关信息无助于中国军民融合战略的领域研究或进行研究的任何外国人，并与有关行政部门协商和机构（代理商）；

（vi）根据国务卿，国土安全大臣或其各自指定人员根据总检察长或其指定人员的推荐决定，其入境将进一步促进美国重要的执法目标的任何外国人；要么

（vii）由国务卿，国土安全大臣或其各自指定人员确定的，符合国家利益的任何外国人。

（b）本声明中的任何内容均不得解释为限制个人根据法律禁止寻求庇护，难民身份，扣留遣返或根据《禁止酷刑和其他残忍，不人道或有辱人格的待遇或处罚公约》提供保护的能力。美国。

Sec. 3.  Implementation and Enforcement.  (a)  Persons covered by sections 1 or 2 of this proclamation shall be identified by the Secretary of State or the Secretary of State’s designee, in his or her sole discretion, pursuant to such standards and procedures as the Secretary of State may establish.  For purposes of subsections 2(a)(v), 2(a)(vi), and 2(a)(vii) of this proclamation, the Secretary of State shall provide for identifications of aliens based on the further determinations and recommendations provided for in those subsections by the Attorney General and the Secretary of Homeland Security.

(b)  The Secretary of State shall implement this proclamation as it applies to visas pursuant to such procedures as the Secretary of State, in consultation with the Secretary of Homeland Security, may establish in the Secretary of State’s discretion.  The Secretary of Homeland Security shall implement this proclamation as it applies to the entry of aliens pursuant to such procedures as the Secretary of Homeland Security, in consultation with the Secretary of State, may establish in the Secretary of Homeland Security’s discretion.

(c)  An alien who circumvents the application of this proclamation through fraud, willful misrepresentation of a material fact, or illegal entry shall be a priority for removal by the Department of Homeland Security.

第3节.实施和执行。 （a）本声明第1条或第2条所涵盖的人员，应由国务卿或国务卿指定人员根据国务卿制定的标准和程序，全权酌情确定。为了本公告第2（a）（v），2（a）（vi）和2（a）（vii）小节的规定，国务卿应根据所提供的进一步确定和建议规定对外国人的身份证明在总检察长和国土安全部部长的这些小节中。

（b）国务大臣应按照国务大臣与国土安全大臣协商，由国务大臣酌情决定的程序，执行适用于签证的本声明。国土安全部部长应按照国土安全部部长与国务卿协商，由国土安全部部长自行决定的程序，执行适用于外国人入境的这一声明。

（c）通过欺诈，故意虚假陈述重大事实或非法入境来规避本公告适用的外国人，应优先由国土安全部遣送。

Sec. 4.  Termination.  This proclamation shall remain in effect until terminated by the President.  The Secretary of State, in consultation with the Secretary of Homeland Security, may at any time recommend that the President continue, modify, or terminate this proclamation.

第四节.终止。该声明将继续有效直至总统终止。国务卿可在与国土安全部长协商后，随时建议总统继续，修改或终止该声明。

Sec. 5.  Effective Date.  This proclamation is effective at 12:00 p.m. eastern daylight time on June 1, 2020.

第5节.生效日期。该公告于下午12:00生效。东部夏令时为2020年6月1日。

Sec. 6.  Additional Measures.  (a)  The Secretary of State shall consider, in the Secretary’s discretion, whether nationals of the PRC currently in the United States pursuant to F or J visas and who otherwise meet the criteria described in section 1 of this proclamation should have their visas revoked pursuant to section 221(i) of the INA, 8 U.S.C. 1201(i).

(b)  Within 60 days of the effective date of this proclamation, the Secretary of State and the Secretary of Homeland Security, in consultation with the heads of appropriate agencies, shall review nonimmigrant and immigrant programs and shall recommend to the President, through the Assistant to the President for National Security Affairs, any other measures requiring Presidential action that would mitigate the risk posed by the PRC’s acquisition of sensitive United States technologies and intellectual property.

(c)  The Secretary of State and the Secretary of Homeland Security shall, within the scope of their respective authorities and in coordination with the heads of appropriate agencies, take action to further mitigate the risk posed by the PRC’s acquisition of sensitive United States technologies and intellectual property.  The Secretary of State and the Secretary of Homeland Security shall report to the President, within 60 days of the effective date of this proclamation, through the Assistant to the President for National Security Affairs, any such planned and executed actions.

(d)  The Secretary of State and the Secretary of Homeland Security shall consider issuing updated regulations and guidance, as appropriate, implementing the inadmissibility provisions in section 212(a)(3)(D) of the INA, 8 U.S.C. 1182(a)(3)(D).

第6节.附加措施。 （a）国务大臣应酌情考虑，是否根据F或J签证现居美国的中国公民以及其他符合本公告第1条所述标准的国民是否应根据其签证予以撤销符合INA的221（i），8 USC 1201（i）。

（b）在本公告生效之日起60天内，国务卿和国土安全部长应与有关机构负责人协商，审查非移民和移民计划，并应通过助手向总统推荐对于国家安全事务总统，任何其他需要采取总统行动的措施，都应减轻中国因购买敏感的美国技术和知识产权而带来的风险。

（c）国务卿和国土安全部长应在其各自职权范围内，并在有关机构负责人的协调下，采取行动，进一步减轻中国收购敏感的美国技术和知识产权。国务卿和国土安全部长应在本公告生效之日起60天内，通过国家安全事务总统助理向总统报告任何此类计划和执行的行动。

（d）国务卿和国土安全部长应考虑发布适当的最新法规和指南，以实施《美国法典》第8篇第212（a）（3）（D）条中的不可受理规定。 1182（a）（3）（D）。

Sec. 7.  General Provisions.  (a)  Nothing in this proclamation shall be construed to impair or otherwise affect:

(i)   the authority granted by law to an executive department or agency, or the head thereof; or

(ii)  the functions of the Director of the Office of Management and Budget relating to budgetary, administrative, or legislative proposals.

(b)  This proclamation shall be implemented consistent with applicable law and subject to the availability of appropriations.

(c)  This proclamation is not intended to, and does not, create any right or benefit, substantive or procedural, enforceable at law or in equity by any party against the United States, its departments, agencies, or entities, its officers, employees, or agents, or any other person.

第7节.一般规定。 （a）本声明中的任何内容均不得解释为损害或以其他方式影响：

（i）法律授予执行部门或机构或其负责人的权力；要么

（ii）管理和预算局局长与预算，行政或立法提案有关的职能。

（b）本公告应根据适用法律并在有拨款的情况下执行。

（c）此声明无意于也不会创造任何权利或利益，无论是实体还是程序上的任何权利或利益，任何一方均可针对美国，其部门，机关或实体，其高级职员，雇员在法律或权益上执行，代理商或任何其他人。

IN WITNESS WHEREOF, I have hereunto set my hand this twenty-ninth day of May, in the year of our Lord two thousand twenty, and of the Independence of the United States of America the two hundred and forty-fourth.

特此通知，我是在5月的第29天，即我们的大主2,000年，以及美利坚合众国的第二百四十四年，宣布我的这一手。

DONALD J. TRUMP

# 大数据领域的近似分析方法（一）

### HyperLogLog 的理论介绍

HyperLogLog 是大数据基数统计中的常见方法，无论是 Redis，Spark 还是 Flink 都提供了这个功能，其目的就是在一定的误差范围内，用最小的空间复杂度来估算一个数据流的基数。

HyperLogLog 算法简要思路是通过一个 hash 函数把数据流 $\mathcal{D}$ 映射到 $\{0,1\}^{\infty},$ 也就是说用二进制来表示数据流中的元素。每一个数据流中的元素 $x$ 都对应着一个 $0,1$ 序列。

• 出现序列 $1XXXXX$ 意味着不重复的元素估计有 $2^1=2$ 个；
• 出现序列 $01XXXX$ 意味着不重复的元素估计有 $2^2=4$ 个；
• 出现序列 $001XXX$ 意味着不重复的元素估计有 $2^3=8$ 个；
• 出现序列 $0001XX$ 意味着不重复的元素估计有 $2^4=16$ 个。

• $1$ 个桶：计算出 $M=\max_{w}\rho(w),$ 预估不重复的元素个数是 $2^{M}.$

• 算术平均数：$M=\sum_{j=1}^{m}M_{j};$
• 几何平均数：$M=\sqrt[m]{M_{1}\cdots M_{m}};$
• 调和平均数：$M=m/\sum_{j=1}^{m}M_{j}^{-1};$
• 中位数：$M = median\{M_{1},\cdots,M_{m}\}.$

• 第 1 个桶：计算出 $M_{1}=\max_{w}\rho(w),$ 预估元素个数 $2^{M_{1}};$
• 第 2 个桶：计算出 $M_{2}=\max_{w}\rho(w),$ 预估元素个数 $2^{M_{2}};$
• ….
• $m$ 个桶：计算出 $M_{m}=\max_{w}\rho(w),$ 预估元素个数 $2^{M_{m}};$

for v in M:
set x := h(v);
set j = 1 + <x(b),...,x(2),x(1)>;
set w := x(b+1)x(b+2)...;
set M[j] := max(M[j], \rho(w));

compute Z := (\sum_{j=1}^{m}2^{-M[j]})^{-1};

HyperLogLog 的空间复杂度特别低，大约是 $O(m\log_{2}\log_{2}n)$ 这个量级的，其中 $m$ 是桶的个数，$n$ 是基数。HyperLogLog 的时间复杂度则是 $O(n),$ 只需要遍历一遍所有元素即可得到最终结果。

• 假设基数为 $2^{k},$ 二进制就是 $k$ 位，$1$ 最晚就会出现在第 $k$ 个位置上；而 $k$ 只需要 $log_{2}k$ 个 bit 就能够存储；
• 假设基数为 $2^{64},$ 二进制就是 $64$ 位，$1$ 最晚会出现在第 $64$ 个位置上；而 $64$ 需要 $6$ 个 bit 就可以存储。

• 小范围；
• 中等范围；
• 大范围；

Case（1）：小范围

Answer：假设 $A_{1},\cdots,A_{m}$$m$ 个桶，

$P(A_{j}=\emptyset)=\bigg(1-\frac{1}{m}\bigg)^{n}$ 表示桶 $A_{j}$ 空的概率；

$P(A_{j}=\emptyset \cap A_{k}=\emptyset)=\bigg(1-\frac{2}{m}\bigg)^{n}$ 表示桶 $A_{j}, A_{k}$ 同时为空的概率（$j\neq k$）；

Case（2）：中等范围

$E$ 值不作调整。

Case（3）：大范围

$E>2^{32}/30,$ 那么更新为 $E^{*}=-2^{32}\ln(1-E/2^{32}),$ 其中 $E^{*}>E.$

$\alpha_{m}=\bigg(\int_{0}^{+\infty}\bigg(\log_{2}\bigg(\frac{2+u}{1+u}\bigg)\bigg)^{m}du\bigg)^{-1}.$

### HyperLogLog 的案例分析

• LogLog$\alpha_{m}\cdot m\cdot 2^{\sum_{j=1}^{m}M_{j}/m};$
• HyperLogLog$\alpha_{m}\cdot m^{2}\cdot\bigg(\sum_{j=1}^{m}2^{-M[j]}\bigg)^{-1};$

3852172429 的二进制是：11100101100110110111110010001101，可以划分为100 110110111110010 001101。最后的六位是 001101，十进制就是 13，那么这个数字就会被放入第 13 个桶；而 110110111110010（从低位到高位看），$\rho$ 函数的值就是 2；于是在第 13 个桶就会把 0 更新成 2。

2545698499 的二进制是 10010111101111000100011011000011，用同样的分析可得结论。

2577699815 的二进制是 10011001101001001001001111100111。

775376803 的二进制是 101110001101110100111110100011。

### 参考文献：

1. Count-distinct Problem 的维基百科：https://en.wikipedia.org/wiki/Count-distinct_problem
2. Heule, Stefan, Marc Nunkesser, and Alexander Hall. “HyperLogLog in practice: algorithmic engineering of a state of the art cardinality estimation algorithm.” Proceedings of the 16th International Conference on Extending Database Technology. 2013.
3. Flajolet, Philippe, et al. “Hyperloglog: the analysis of a near-optimal cardinality estimation algorithm.” 2007.
4. HyperLogLog 的 demo 网站：http://content.research.neustar.biz/blog/hll.html

# 统计与大数据专业究竟在学什么？

### 参考资料：

2. http://www.stat.nus.edu.sg：NUS 统计系官网。

# 《软技能：代码之外的生存指南》

《软技能：代码之外的生存指南》是笔者刚刚进入公司工作，开始职场生涯的时候，一个偶然的机会从同事那里看到的一本书。从其内容提要可以看出，这是一本关注软件开发人员自身发展的书籍，书中讲了 7 个部分，包括：

1. 职业；
2. 自我营销；
3. 学习；
4. 生产力；
5. 理财；
6. 健身；
7. 精神。

John Z. Sonmez 是不少程序员的人生导师，通过他写的教材，讲授的课程，传递的人生故事，让不少的程序员了解到了前辈的发展历程，并且能够启发程序员如何才能够过上更加充实的生活。通过“化繁为简”的方法，传授给程序员让他们达成自身目标的力量与动力。

### Chapter 1：职业

1. 雇员：对广大软件开发者而言，这是一项常见的，默认的就业选择。身为雇员的最大好处就是稳定。
2. 独立咨询师：独立咨询师通常有自己的公司，依照合同为客户工作，但并不与任何一个客户绑定。做独立咨询师最大的好处可能就是赚钱的潜力。
3. 创业者：创业之路可能是你职业生涯中最难，最不确定但却最具回报潜力的选择。雇员和独立咨询师都在以时间换金钱，而创业者尽管换不来预付的报酬，但是他却有机会在未来获得更大的收益。创业者的两大优势：完全自由和完全不封顶的赚钱潜力。

1. 一切都始于习惯。习惯是成为专业人士必不可少的部分。需要培养自己的专业习惯，需要具备时间管理技能。
2. 坚守正道。专业人士必须对工作的优先级做出艰难的抉择。
3. 追求品质，完善自我。你必须不断改善和提高自己的工作品质。

### Chapter 2：自我营销

1. 品牌所需要传递的信息；
2. 品牌的一致性；
3. 品牌的视觉符号；
4. 品牌的曝光率。

1. 打造成功博客的最大秘诀有且仅有一个—持之以恒；
2. 只是持之以恒还不足以使你的博客大获成功，你还应该确保你写的都是高质量的内容。
3. 重视博客内容品质的另一个重要原因是为你的博客提供更有价值的链接。
4. 在起步之初，你的博客很可能会很糟糕。但是，随着不断尝试贡献出优秀的内容，而不是将自己脑子里的东西随意丢在网上，不考虑格式和结构还有一大堆拼写错误，你终会成功。

### Chapter 3：学习

1. 第 1 步：了解全局；
2. 第 2 步：确定范围；
3. 第 3 步：定义目标；
4. 第 4 步：寻找资源；
5. 第 5 步：创建学习计划；
6. 第 6 步：筛选资源；
7. 第 7 步：开始学习，浅尝辄止；
8. 第 8 步：动手操作，边玩边学；
9. 第 9 步：全面掌握，学以致用；
10. 第 10 步：乐为人师，融会贯通

### Chapter 4：生产力

1. 季度计划：在做季度计划时，我会尽力列出我想在本季度完成的每一个大项目，我还会制定一些较小的目标。
2. 月计划；每个月的第一天我会打印出当月的月历，并且规划出每天要完成的工作。
3. 周计划；每周一的早晨，我会做我的周计划。
4. 日计划及执行：要计划好这一天，我首先要把对应日期里的卡片移到“今天”这一栏，并把它们按照重要性排序。我要保证自己优先完成最重要的事情。

1. 看电视；
2. 社交媒体；
3. 新闻网站；
4. 不必要的会议；
5. 烹饪：因人而异；
6. 玩电子游戏（尤其是网络游戏）；
7. 工间喝咖啡休息：因人而异。

### Chapter 6：健身

1. 减肥（减掉脂肪）；
2. 增肌（增长肌肉）；
3. 增加力量（不一定是增长肌肉）；
4. 增加肌肉耐力（改善运动表现）；
5. 改善心血管健康；
6. 在某些运动上表现更好。

# 时间序列异常检测—节假日效应的应对之道

1. 元旦：1 天；
2. 春节：7 天；
3. 清明节：3 天；
4. 五一劳动节：5 天；
5. 端午节：3 天；
6. 国庆节：8 天。

1. 周期性的多样性：通过实际案例可以看出，对于不同的时间序列，其周期是完全不一样的，而且在不同的周期上也有着完全不同的表现；
2. KPI 数量巨大：这个通常来说都是智能运维领域中的常见问题；
3. 周期的漂移：一般来说，通过时间序列的走势我们只能够看出一个大致的变化，但是具体到细节的话，周期是存在一定的波动的。例如不一定恰好是 7 天，有可能是 7 天加减 5 分钟之类的周期。这个跟业务的具体场景有关系，也跟当时的实际情况有关。

1. 离线周期性检测（offline periodicity detection）；

$X_{(s)}=\begin{cases}(0,\cdots,0,x_{1},\cdots,x_{m-s}), &\text{ if } s\geq 0 \\ (x_{1-s},x_{1-s+1},\cdots,x_{m},0,\cdots,0), &\text{ else } s<0.\end{cases}$

$CC_{s}(X,Y)=\begin{cases}\sum_{i=1}^{m-s}x_{i}\cdot y_{s+i}, &\text{ if } s\geq 0 \\ \sum_{i=1}^{m+s}x_{i-s}\cdot y_{i}, &\text{ else } s<0.\end{cases}$

$NCC(X,Y)=\max_{s\in[-w,w]\cap\mathbb{Z}}\frac{CC_{s}(X,Y)}{\|x\|_{2}\cdot\|y\|}.$

$SBD(X,Y) = 1-NCC(X,Y).$