paper Econometrics

Tell It by Myself…

Svetlana Bryzgalova 的文章,和 Andrew Chen 的


标题:处理缺失的公司特征数据:一种新的方法

摘要: 这篇论文主要探讨了缺失的财务数据对资产定价的影响,并提出了一种新的方法来处理缺失的公司特征数据。这种方法基于一个大维度的潜在因子模型,该模型可以同时处理时间序列和横截面数据的相关性。文章的主要贡献有三个方面:提出了一种新的处理缺失数据的方法,发现了公司特征的稳定的六因子结构,以及揭示了缺失的财务数据对资产定价的深远影响。

背景: 公司特征数据的缺失是一个普遍存在的问题,这对资产定价产生了深远的影响。传统的处理方法往往会导致选择偏误和插补偏误。因此,开发一种能够有效处理缺失数据的新方法具有重要的理论和实践意义。

新方法的描述: 这篇文章提出的新方法主要是处理公司特征数据缺失的问题。这个方法基于一个大维度的潜在因子模型,该模型可以同时处理时间序列和横截面数据的相关性。这个方法的关键优势在于,即使在复杂的缺失模式下,它仍然有效。

这个新方法主要解决了两个挑战:首先,它需要一个好的特征模型。由于特征在横截面和时间序列上都有复杂的依赖性,忽略任何这些信息都会导致遗漏变量偏差。这个方法使用潜在因子模型来捕捉特征的横截面依赖性,同时利用所有观察到的特征。其次,这个方法使用时间序列模型来捕捉特征的持久性。这个模型结合了横截面因子和时间序列观察,因此,它可以从时间序列中提取出缓慢的持久性运动,同时从同时期的因子实现中捕捉到快速的变化。

主要发现: 文章发现,公司特征的时间序列和横截面依赖性在特征空间中具有稳定的六因子结构。这些因子具有清晰的经济解释。此外,文章还发现,对于更加波动的特征,应该更多地依赖于

同时期的横截面信息,而对于持久的特征,如果有的话,应该更多地依赖于它们的历史信息。

影响和意义: 文章展示了缺失的财务数据对资产定价的深远影响。缺失的公司特征可以对资产定价产生两个基本的影响。首先,只使用具有完全观察到的特征的股票子样本可能会导致资产定价指标的选择偏误。其次,当使用偏误的插补方法时,估计资产定价模型的参数可能会产生插补偏误。

这篇文章的方法和洞见对经济学和金融学的其他领域也有更广泛的影响。例如,国际会计数据和 ESG 评级中的缺失观察问题更为突出。此外,由于大数据的重要性日益增长,新的数据源通常只提供部分覆盖,因此我们预计这个问题将变得更加相关。

结论: 这篇文章提出了一种新的处理缺失公司特征数据的方法,这种方法基于一个大维度的潜在因子模型,可以有效地处理缺失数据,同时保持对数据的解释性。这个方法的综合实证研究表明,它在处理公司特征数据缺失的问题上,明显优于现有的方法。这篇文章的研究为处理缺失数据提供了新的视角和工具,对经济学和金融学的研究具有重要的理论和实践价值。


Reference