中国资本市场问询函数据库(CCMILD)

一、数据简介
解构审核黑箱,重建资本市场监管行为的可观测边界!
在中国资本市场走向成熟的进程中,IPO审核制度始终是连接企业融资需求与市场质量的核心闸口,但长期以来,学界与实务界所能依赖的数据主要集中于“成功上市”的结果样本,大量在审核过程中被否决、中止或撤回的企业则缺乏系统记录,导致对审核机制与监管逻辑的理解存在显著的选择性偏差。本数据库正是基于这一关键研究断点而设计,通过对审核全过程的信息结构化重构,使原本不可观测的审核互动过程转化为可分析、可量化的微观数据体系。
依托审核问询机制所形成的连续信息披露轨迹,数据库以“问询—回复—再问询—结果”为主线,将企业申报过程中的每一次监管关注与企业回应进行精细拆解与标准化表达,不仅刻画不同审核阶段与板块下的问询强度、节奏与重点,还系统提炼出涵盖持续盈利能力、财务真实性、信息披露合规性等核心维度的议题结构。同时,通过引入回复时长、问询事项数量、轮次演化路径等核心指标,数据库能够刻画企业在审核压力下的信息调整策略与合规行为变化,从而揭示监管与企业之间动态博弈的内在机制。
在此基础上,数据库进一步在企业层面构建可横向比较的综合指标体系,包括总问询轮次、累计问询规模、最长回复周期以及被否或撤回的核心原因分类等,使研究者能够跨行业、跨板块识别审核标准差异与风险企业特征。相较于传统依赖财务报表或最终审核结果的数据,本数据库实现了从“结果可见”到“过程可测”的方法跃迁,为识别影响审核结论的关键中介变量提供了前所未有的数据支撑。
本数据库在设计上实现了三个具有方法论意义的突破:首次实现对全量申报企业(含未上市企业)的系统覆盖,从根本上缓解IPO研究中的选择性偏差问题;首次将IPO审核过程由黑箱转化为可度量的监管行为面板,使审核逻辑具备可追踪的动态结构;首次构建“问询议题—企业回应—审核结果”的完整因果链条数据框架,使监管关注重点、企业信息修正与最终审核结论之间的关系得以被严格刻画与检验。
《中国资本市场问询函数据库》不仅能够支持公司金融、资本市场微观结构与监管经济学领域的前沿研究,也为市场机构识别IPO风险、评估企业信息披露质量及研判审核政策演化提供高分辨率、强解释力的微观数据基础。通过将审核过程转化为可计算的数据资产,该数据库真正打开了理解中国资本市场运行机制的一扇“微观之门”。
二、数据概览



数据表格:
原始审核文件表:





企业汇总表:



三、相关处理
非结构化文本的要素提取
通过模式匹配从回复函全文中提取并测算相关指标。
defextract_inquiry_meta(text):# 匹配问询事项的编号 inquiry_items = re.findall(r"(?:问题|项目|一、)\s?(\d+|[一二三四五六七八九十]+)[\.\、\:]", text) item_count = len(set(inquiry_items))# 计算回复时长 date_pattern = r"(\d{4}年\d{1,2}月\d{1,2}日)" dates = [datetime.strptime(d, "%Y年%m月%d日") for d in re.findall(date_pattern, text)] reply_duration = (dates[-1] - dates[0]).days if len(dates) >= 2elseNonereturn {"inquiry_count": item_count, "reply_days": reply_duration}
数据汇总
将各轮问询记录整合为企业级的汇总数据。
firm_level_db = df_detail.groupby('申报企业名称').agg({'问询事项数量': 'sum', # 总问询事项数'问询函类型': 'nunique', # 总问询轮次'回复时长(天)': 'max', # 最长单次回复天数'核心问询议题': lambda x: ';'.join(set(';'.join(x).split(';'))) # 议题去重合集}).rename(columns={'问询事项数量': '总问询事项数', '问询函类型': '总问询轮次'})
四、相关研究
部分相关研究示例
[1]Li J, Li R. IPO policy and IPO underpricing: Evidence from the registration-based IPO reform in China[J]. Finance Research Letters, 2022, 47: 102623.
[2]Wang Y, Xue S, Zhao X. IPO comment letter responses and stock price volatility in the STAR market[J]. China Journal of Accounting Studies, 2024, 12(3): 457-480.
六、获取方式
数据编号
D2050
DataSeed大数据库
扫码添加会员助理,备注【市场问询函】

https://cndataseed.com/
点击左下角“阅读原文”,获取更多数据