Stata 学习专栏
作者:CodeFox
更新时间:2024-08-25
💡 这是一本 Stata 与公司金融计量的入门级在线教程,内容还在更新中,预计非常长。。。耐心看完应该还是能有所收获的(希望)
框架图
1. 数据获取与预处理
1.1 常见数据来源:CSMAR yyds
常见的数据来源包括如下几个:
1.1.1 国泰安数据库
你能想到的数据基本都在这里,企业财务报表、各种计算好的指标(如盈余管理、融资约束、股价崩盘)、上市公司股价收益率、市场收益率、Fama 因子等。
1.1.2 CNRDS数据库
试图替代 CSMAR 的后起之秀,比起 CSMAR,多了许多特色数据库,如年报、管理层讨论与分析文本和语气、业绩说明会文本等等。如果学校没买库,可以试着去咸鱼找人代下。
1.1.3 RESSET 金融大数据平台
一般需要从自己的图书馆进去,不常用,除非是比较喜欢做股价研究的。
1.1.4 Wind终端
通常需要学校的电脑提供,一般不会提供账号(除非去机构上班)
同类的有国外的 Bloomberge、汤森路透等
国内同类的平替有 Choice(东方财富网)和 iFind,建议使用 Choice( https://choice.eastmoney.com/ ),使用高校认证可以白嫖
数据是比较权威。。。但是不好操作和下载,对于案例分析来说还挺好的一平台。
1.1.5 经管之家、闲鱼、马克数据网、数据皮皮侠、众鲤数据网
一些需要甄别的数据来源,但不得不说,这些平台的存在极大地丰富了科研工作。
1.2 数据预处理步骤:从下载到描述性统计
主要参考文章:公司金融常用Stata代码
💡以 CSMAR 为例,下载企业基本信息表、资产负债表和利润表
1.2.1 数据下载
(1)下载上市公司基本信息
依次选择数据中心、公司研究系列、上市公司基本信息
选择合适的年份与样本区间
❗不要选择剔除金融或者剔除 ST 的样本,这些操作在 Stata 中实现更好,因为计算时可能需要用到 t - 1 的数据,这里尽可能保证数据的完整性
在左侧选择需要的数据,点击即可移动到右侧
选择默认的数据格式(其他的可能会错乱),然后点击下载即可得到一个 zip 压缩包
复制 zip 文件的绝对路径后
打开 Stata,输入如下代码:
1 | csmar "D:\code\Stata\stata-learn\上市公司基本信息年度表.zip" |
💡csmar 命令是我的自定义命令,可以通过如下代码下载
1 net install csmar, from("https://raw.githubusercontent.com/codefoxs/Stata-personal/main/csmar/") replace
显示如下结果则证明数据成功
然后将数据另存为上市公司基本信息-2000to2023.dta
即可
(2)下载企业资产负债表
类似的,选中财务报表数据库