
Numinor Systems 研究 · v1.3 · 2026 年 6 月
Numinor 协同波动图谱 —— 由结构化关系网络评级的新闻协同波动图谱:辨别哪些 A 股协同波动具有结构性依据
作者:Numinor Systems
核心结果
- 深度产品同业 · 远期相关性增量(留出)
- +0.065(t ≈ 22)
- SAM 供应链 · 远期相关性增量
- +0.028(t ≈ 9)
- 已连接协动高于未连接
- 100% 留出月份
- 确认 vs 未确认 保留率(远期一季度)
- ~92% 对 ~75%
- 10 只结构对冲 · 远期残差方差削减
- ~45%(沪深 300)
- —— 对比同名仅新闻篮子
- 45% 对 15% · 图谱 89%
- 对冲换手 · 结构 vs 价格相关
- ~18% 对 ~40%
- 验证 · 2023+ 留出,可复现
- 42 切片 · 26/26
任何相关性或协方差估计都以价格历史为起点,而价格历史并不稳定:上一季度看似高度相关的两只个股,往往在下一季度并非如此。我们记录了一个建立在不同底层基质之上的数据层。我们以新闻协同波动图谱为起点——即市场当下正在共同提及的 A 股个股对——并用一张结构化关系网络对每一对进行评级:共享产品、供应链、共同持股,以及财报披露的客户—供应商关系。该评级预测哪些协同波动会在回看相关性所含信息之外持续;并通过其缺失,标记哪些已观测到的协同波动是图谱无法在结构上解释的——即那些市场共同提及、却没有我们所能看见的结构性理由的「暗」(dark)个股对。(「暗」意指没有已知的结构关联——而非该相关性虚假;一对个股完全可能因本图谱未捕捉的宏观或指数理由而一同移动。)
两个层级各司其职。新闻共同提及是底层基质——覆盖广、时效强、含噪;它告诉你当下哪些个股对正受到关注。结构化网络是其上的叠加层——它识别哪些协同波动根植于持久的关联。新闻激活网络,网络解释新闻。产品即二者交集的结构:新闻 ∩ 网络 = 结构确认的个股对,新闻 − 网络 = 结构未确认(「暗」)的个股对。产品是这张图谱及其相关性判断能力——一张成对相关性叠加层,而非收益信号、非投资组合,亦非协方差模型。 下文所有结果均在 2023 年起固定验证窗口(样本外)上取得,并可由配套代码从交付的数据包中复现。
核心实证发现
| 发现 | 数值 | 构建方式 |
|---|---|---|
| 深度产品同业——在回看相关性及其余各信号灯之上的远期相关性增量 | +0.065(t ≈ 22) | 逐信号灯 Fama–MacBeth,2023 年起验证窗口 |
| SAM 供应链关系 | +0.028(t ≈ 9) | 同上 |
| 披露的客户—供应商(2 年)——更弱,独立性调整后边际 | +0.013(t ≈ 2.6) | 同上 |
| 关联方(共同持股)——最弱,边际 | +0.005(t ≈ 2.2) | 同上 |
| 有连接的个股对协同波动高于无连接者 | 100% 的验证月份 | 评级闸门 |
| 评级阶梯(远期相关性) | 深度同业 0.52 > 多信号灯 0.41 > 单信号灯 0.36 > 随机 0.28 > 暗 0.27 | 各档均值,验证窗口 |
| 结构确认的相关性的远期保留度 | 约 92%,而随机配对价格筛选约 75% | 保留度,验证窗口(定义见白皮书 §5) |
| 10 名结构选取对冲——远期残差方差削减 | 约 45% | 沪深 300,11,262 个股-月 |
| — 相对 10 名仅新闻篮子(叠加层的价值) | 45% 对 15%(结构胜出 89%) | 同规模,验证窗口 |
| — 相对 10 名价格相关性篮子 | 45% 对约 50%(相当,非更优) | 同规模,验证窗口 |
| — 相对约 100 名行业篮子 / 指数 | 优于 76% / 84% 的月份 | 沪深 300,验证窗口 |
| 大盘边界 | 结构优于行业 76%(沪深 300)→ 49%(中证 1000) | 优势存在于流动性所在之处 |
| 招投标中标 | 剔除——作为持久关系在样本外不稳定 | 与 C2C 不同,后者中标携带事件式收益信息 |
我们报告的是信息含量——相关性预测系数、保留度与方差削减——而非投资组合夏普比率或回测损益;后者依赖于组合构建方式,应由买方在其自有组合中衡量。这些效应统计稳定且幅度温和——深度同业与供应链是承重的预测信号灯,这是关系型数据集的现实特征。
协同波动图谱是什么
一张覆盖 A 股的严格时点成对数据,分两层构建、以两张表交付。
- 基质——新闻协同波动图谱。 数据中每一对个股,都是市场在过去 90 日内于新闻中共同提及者(来自数库标签化新闻语料):典型月份约 5,450 只个股之间的约 54,000 对。共同提及是一种揭示性关注信号——当市场把两家公司一并讨论时,即视其为相关。覆盖广、时效强、且其本身含噪。
- 叠加层——四盏结构化「信号灯」。 每一对被共同提及的个股都被标注以深度产品同业(SAM 体系上的同一具体产品)、SAM 供应链(基于产品的投入关系)、披露的客户—供应商(财报关系,2 年有效窗口,剔除招投标)与关联方(共同持股)。至少点亮一盏信号灯者为已确认;一盏未亮者——被共同提及却无结构解释——为暗。
两张表为:一张关系表(每一对被共同提及的个股一行,携带基质、各信号灯标志、「已确认/暗」降权标志与远期相关性预测),以及一张派生的个股同业表(每只个股按结构排序的前十名同业——对冲篮子或可比公司全集的原料)。
这与一张结构化关系图谱不同。仅基于网络的数据会枚举约 6,000 只个股之间的每一条供应链或关联方关系——其中大多数在任一时点处于休眠,且无法判断哪些已观测协同波动具备结构基础。通过锚定于新闻基质,本数据仅保留市场当下正在作用的关系,并获得静态图谱无法拥有的一个字段:对每一条已观测协同波动的结构确认标志。只有先观察到某种协同波动,才谈得上判断其是否具有结构支撑;而新闻共同提及正提供了这一可被观察的对象。
机制:新闻激活,结构解释
经济含义很简单。两家因生产同一具体产品、或同处一条供应链而被共同提及的公司,共享需求与成本驱动,产生持久的协同波动——无论上一季度收益是否恰好显现;两家仅因上周同登一条头条而被共同提及的公司,则不然。各类结构化信号灯将两种情形区分开来。典型月份中,约三分之二被共同提及的个股对被至少一盏信号灯确认,三分之一为暗。
最强的一盏信号灯是深度产品同业:生产本质上同一具体产品的公司,在回看相关性之上额外贡献 +0.065 的远期相关性,计入共享产品基数后合计约 +0.11——约占整个随机到深度同业区间的四分之一。SAM 供应链带来更小但确凿显著的增量;披露与共同持股关系为正但弱——在就远期窗口重叠作调整后趋于边际(白皮书 §3.5)——故我们倚重两盏稳健的信号灯。
已确认 vs 未确认相关性(「降权清单」)
数据中最具区分度的字段,不是我们增加的某条相关性,而是我们为其持久度评级的某条相关性。在以回看相关性匹配后向前看,结构确认的个股对在一个季度后仍保留约 92% 的相关性,而仅凭价格历史筛选的个股对约为 75%——约 17 个百分点的持久度差距,且在各相关性水平上成立。这是买方无法从价格中重建的字段:哪些相关个股对是出于持久的结构性理由而相关,哪些只是近期如此。运用之道:信任已确认的相关性,对未确认(「暗」)者降权——其水平不优于随机,持久度则实质更低。
「起作用的是结构、而非新闻关注」最干净的证据来自对冲:一个由个股结构选取同业构成的 10 名篮子,削减约 45% 的远期残差方差;而一个 10 名仅新闻篮子——即该股共同提及度最高、却无任何结构信号灯点亮的同业——仅削减约 15%,结构篮子在 89% 的时间内胜出。相对一个强的纯价格基准(前 10 名回看相关性同业),图谱对冲相当,约 45% 对约 50%——它并不胜过一个好的价格选取,但它仅凭结构即达到相当水平,且换手不及其一半(每月约 18% 的名称更替,价格相关性篮子约为 40%),并决定性地胜过仅新闻篮子与约 100 名行业篮子(约 31%)。产品含义:图谱是一个结构先验——可解释的同业、低换手,并提示哪些价格选取的相关性更不值得信任——而非「唯一目标为最大化短期对冲拟合」时价格相关性选取的替代。
为何报告相关性预测,而非策略夏普
夏普是全集、加权、中性化、换手与交易成本的函数,对每位买方各不相同;而相关性预测系数与方差削减数值则独立于组合构建、可移植。买方将图谱应用于自己的风险模型与对冲账簿,并衡量自己的贡献——数据中的 corr_delta 字段精确指出图谱与价格筛选分歧之处。决定性检验是在买方系统上的买方端复现。
范围与局限——坦诚说明
- 大盘。 对冲优势从沪深 300(优于行业 76%)衰减至中证 1000 的持平(49%)。这源自基质:小盘股不会被足够频繁地共同提及而带信号进入图谱,故数据集中于覆盖充分的个股——正是优势所在之处。架构与边界源自同一事实。
- 并非全域风险模型的替代。 成对优势在全市场最小方差优化器中被稀释;价值是定向的——个股对冲、配对、集中持仓风险。
- 相关性,而非收益——这并非阿尔法。 同一图谱上的收益溢出信号在样本外为零至负。图谱预测个股如何一同移动,而非朝哪个方向。
- 剔除招投标中标。 作为持久相关性关系在样本外不稳定。(相较之下,在 C2C 收益论文中,中标仍携带事件式的方向性信息——这与为协同波动评级是不同的用途。)
- 幅度温和,且 2023 年起验证窗口在验证中被多次查验——应将数值理解为「已确认的样本外」。
后续步骤
完整证据、图表与数据交付规格见 协同波动图谱白皮书 v1.3,且每一个验证数值都可由交付的数据包经配套代码复现(verify_outputs.py → "✓ matches whitepaper")。如欲阅读白皮书、申请数据试用,或探讨将图谱应用于贵方的风险与对冲账簿,请联系 tyl@numinor.io。
Numinor Systems · 数库(ChinaScope) · 2026 年 6 月 · 白皮书 v1.3 配套内容摘要。一款风险/相关性构建数据产品——提供信息含量,而非收益信号。联系方式:tyl@numinor.io