中国投资者教育供给与市场行为数据库(IESDB)

一、数据简介
解码投教供给图谱,揭示资本市场理性进化的微观图谱!
在当前中国资本市场强调“以投资者为本”的转型背景下,投资者教育已由传统的公益性宣导升级为重塑市场生态、影响个体决策行为的核心变量。然而,长期以来,学术界对投教的研究多停留在定性描述或区域性抽样阶段,缺乏能够覆盖全国、透视机构策略并量化内容特征的微观数据库。针对这一关键研究瓶颈,CnDataSeed团队创新性地构建了《中国投资者教育供给与市场行为数据库》,旨在将碎片化、非结构化的投教实践转化为可实证、可追踪的学术资源。
该数据库在时空维度上精准还原投教基地的动态演进过程,更为核心的突破在于其对投教供给内容的深度解构。通过NLP算法对海量投教文本进行了语义层面的多维映射,将抽象的教学行为转化为复杂度、风险提示强度、专业度及情感倾向等结构化指标。这种从“物理存在”到“文本语义”再到“量化特征”的构建逻辑,使研究者能够深入剖析金融机构在投教供给上的竞争策略、资源配置偏好及其对投资者认知的塑造效应。
该数据库的应用价值在于,它为研究投教供给如何影响个人投资者的风险偏好、交易频次及资产配置效率提供了前所未有的数据支持,同时也为评估监管政策传导路径、金融素养跨地域差异及市场波动中的心理干预机制提供了精准的量化工具。对于致力于行为金融、公司治理、区域经济及金融监管研究的学者而言,本数据库不仅是刻画中国资本市场投教画像的基础设施,更是连接机构供给行为与市场宏观表现的桥梁,能够有效支持高水平的实证发现与政策建议,填补了国内在投教量化研究领域的空白。
通过系统性的指标设计与严谨的数据清洗,我们旨在为理解中国投资者保护的微观机制提供一个具备科学解释力的全新视角,为学术研究、政策制定及金融实践提供可操作的实证工具。
二、数据概览




数据表格:
投教基地信息表:


投教明细及特征表:



投教强度指数表:


三、相关处理
自动检索与数据获取
将不同层级、不同主题的检索词组织为结构化输入,实现数据库的自动化扩展采集。
def get_queries(): queries = []if os.path.exists(query_file): with open(query_file, 'r', encoding='utf-8-sig') asf: reader = csv.DictReader(f)for row in reader: queries.append(( row.get('title', ''), row.get('level', ''), row.get('query', '') ))return queries
投教活动文本清洗
文本清洗并用于后续关键词提取和指标计算。
defclean_text(text): text = re.sub(r"\s+", " ", text) text = re.sub(r"[^\w\s]", "", text)return textactivity_df["cleaned_text"] = activity_df["正文"].apply(clean_text)
四、相关研究
部分相关研究示例
[1]Liivamägi K. Investor education and trading activity on the stock market[J]. Baltic Journal of Economics, 2016, 16(2): 114-131.
[2]Xia T, Wang Z, Li K. Financial literacy overconfidence and stock market participation[J]. Social indicators research, 2014, 119(3): 1233-1245.
六、获取方式
数据编号
D2070
DataSeed大数据库
扫码添加会员助理,备注【投教】

https://cndataseed.com/
点击左下角“阅读原文”,获取更多数据