具体流程:
步骤 | 具体流程及注意事项 |
1 | 确定需要选择的ESG报告范围,所需要提取的数据及关键字。比如A股与H股的“化学品管理”,或者钢铁企业的“吨钢能耗”。 |
2 | 对所选择的ESG领域与议题进行熟悉,找到至少2篇典型的ESG报告(比如1个A股,一个H股),分析所需要提取的量化数据或者定性描述的位置与特点,比如是比较统一的术语(适合全文检索),还是实际表现会有所分散(适合语义检索)。 |
3 | 利用2篇已经熟悉的典型ESG报告,测试所选择的关键字及检索方式的效果,主要查看有无遗漏,错误、多余,根据实际情况对关键字或者检索方式进行调整。 |
4 | 如果效果符合预期,再适当扩大测试集到5-10个,按上一步的方式进行测试调整。 |
5 | 如果效果符合预期,再扩大到百或者千级别目标报告集进行批量提取。 |
6 | 对上一步的大规模提取数据结果进行抽查复核,看有没有大的问题;如果发现有部分数据没有提取到,可以考虑采用更加窄和精准的关键字进行进一步提取补充。 |
7 | 对数据集利用excel或者其他工具进行进一步的分析利用。 |