2023年5月31日至2023年6月2日,香港中文大学经济系副教授史震涛应3308维多利亚优惠大厅邀请,开展主题为“Economic Data Science”的短期课程。2023年6月3日,史震涛教授还举行了一场主题为“Implicit Nickell Bias in Panel Local Projection: Financial Crises Are Worse Than You Think”的研讨会。3308维多利亚优惠大厅黄乃静副教授主持了课程。
史震涛,香港中文大学经济系副教授,决策科学与管理经济系副教授,2014年获得耶鲁大学经济学博士学位。史震涛教授的研究聚焦于计量经济学理论和机器学习方法等,他的研究成果已经发表在包括Econometrica, Journal of Econometrics, Journal of Business & Economic Statistics, International Economic Review, Computational Economics, Review of Economics and Statistics, Journal of Applied Econometrics, Journal of Financial Research等国际顶级期刊上,担任Journal of Econometrics, Econometric Theory, Journal of Business and Economic Statistics, Econometric Review, Computational Economics, International Journal of Forecasting, Journal of Time Series Analysis等期刊的审稿人。
从5月31日开始到6月2日共12课时的短期课程中,史震涛教授系统地讲解了大数据与机器学习的基础知识,以及在经济学研究中的应用现状。
首先,史震涛老师简要介绍了最近40年以来,大数据的逐步发展与随之一同发展的机器学习方法。他认为,数据规模的指数级增大给经济学分析开辟了新的道路,即基于数据的实证分析;但同时,大数据也带来了维度灾难,计算成本大幅提升等问题。
随后,史震涛老师介绍了大数据与机器学习的实用工具。他认为,基于互联网的同步编程是未来的主流趋势,并演示了github,gitpod等在线编程配套工具。特别地,针对可能出现的合作者之间软件版本不同带来的不便,他向同学们推荐docker。该工具可以上传某一使用者的工作环境,并由其他合作者下载访问。这些工具的使用大大提升了大数据分析的工作效率。
最后,史震涛老师系统讲解了各种机器学习模型的原理,发展与应用。他从最简单的最小二乘分析开始,引出了由于维度灾难而逐渐发展的惩罚线性回归算法(LASSO,adaptive LASSO,Ridge等)。此后,他转而讲解非线性算法,如梯度提升树模型、随机森林模型等,并简要介绍神经网络。为了加深同学们的理解,他还介绍了自己基于LASSO,随机森林模型等的理论与实证文章。
6月3日,史震涛教授进行了题目为“Implicit Nickell Bias in Panel Local Projection: Financial Crises Are Worse Than You Think”的研讨会,3308维多利亚优惠大厅黄乃静副教授主持了本次研讨会。
本次研讨会中,史震涛老师聚焦于局部预测问题。他指出,在面板数据局部预测中,由于其固有的动态结构,固定效应估计量存在隐性的Nickell偏差,通过重新审视关于金融危机和经济萎缩之间联系的三项开创性的宏观金融研究,研究发现固定效应估计量大大低估了金融危机后的经济损失。为了证实该发现,史震涛老师进行了蒙特卡洛模拟检验,并提出一个半面板的Jackknife估计量来消除这种低估效应。
在课程过程中,参会的老师,同学都积极地提出问题,参与讨论,史震涛教授也耐心且热心地解答了大家的疑问,讲座气氛十分热烈,史震涛教授实用又深入浅出的讲授引发了同学们浓厚的兴趣,帮助同学们上好了“大数据与机器学习”的第一课。
撰稿人:赵子轩
审稿人:黄乃静