数据方法论 · 来源、处理与局限性

透明的方法论是数据新闻可信度的基石。本页详细说明黑料网围绕黑料网的数据采集、清洗、可视化与质检流程。

1. 数据采集

我们仅采集已公开发布的数据，包含公开 API 接口、第三方授权数据集、学术开放数据库、行业协会年报与政府公开数据五类来源。每一个数据源都签署透明披露协议，并在每张图与每份报告中明确标注。

原始数据经过去重、字段标准化、单位换算、异常值检测四个步骤。异常值检测采用 IQR 与 Z-score 双重方法，被剔除的样本在报告附录中单独列出，保证可追溯。

所有图表遵循统一的色彩与排版规范：主色 #1976D2、辅助 #43A047、强调 #E91E63。坐标轴始终从零起步，避免视觉误导；色阶使用感知均匀模型，保证色盲友好。

每一份产出经历"数据记者→可视化设计师→主编"三级复核，发布前还需通过自动化校验脚本检查图表与数据的一致性。

公开数据具有时滞性与样本偏差，本站发布的所有结论仅在数据可获取范围内成立。我们不对衍生结论承担二次责任，请结合自身场景判断。

数据来源是否可核验？

是，所有数据来源在每张图的详情页明确标注名称、链接与更新时间。

如何处理异常值？

使用 IQR 与 Z-score 双重检测，异常值在报告附录中单独列出。

方法论是否会迭代？

是，每次大版本更新都会在本页公布更新日志。