Skip to content

feat: add 5 new data sources#207

Merged
mingcha-dev merged 1 commit intoMLT-OSS:mainfrom
firstdata-dev:feat/add-sources-20260504
May 4, 2026
Merged

feat: add 5 new data sources#207
mingcha-dev merged 1 commit intoMLT-OSS:mainfrom
firstdata-dev:feat/add-sources-20260504

Conversation

@firstdata-dev
Copy link
Copy Markdown
Collaborator

@firstdata-dev firstdata-dev commented May 4, 2026

概述

本次 PR 新增 5 个权威数据源,聚焦气候变化ESG 披露领域,其中 1 个中国优先数据源。

新增数据源

中国优先

  • china-ncc — 国家气候中心(NCC-CMA)
    • 路径: firstdata/sources/china/national/meteorology/china-ncc.json
    • 权威级别: government
    • 领域: climate, meteorology, environment
    • 提供国家气候公报、气候变化监测、季节气候预测等权威数据

国际气候

  • global-carbon-project — 全球碳项目(GCP)

    • 路径: firstdata/sources/international/climate/global-carbon-project.json
    • 权威级别: research
    • 提供年度全球碳收支、国家/行业 CO2 排放及碳汇估算
  • cdp — 碳信息披露项目(Carbon Disclosure Project)

    • 路径: firstdata/sources/international/climate/cdp.json
    • 权威级别: research
    • 提供全球企业 Scope 1/2/3 温室气体排放披露数据

ESG/可持续披露标准

  • global-reporting-initiative — GRI 全球报告倡议

    • 路径: firstdata/sources/international/standards-metrology/global-reporting-initiative.json
    • 权威级别: international
    • 全球采用最广泛的可持续发展报告标准
  • sasb-standards — SASB 可持续发展会计准则(IFRS 基金会)

    • 路径: firstdata/sources/international/standards-metrology/sasb-standards.json
    • 权威级别: international
    • 覆盖 77 个行业的投资者导向 ESG 披露标准

数据来源

基于 近期用户查询分析,用户对 ESG 数据、碳排放披露、可持续发展报告标准有明确需求。当前知识库在该领域覆盖较少,补充以上权威来源可显著提升相关查询的命中率。

检查清单

  • ID 去重(对比 main + 所有 open PR,共 673 ID)
  • 网站域名去重(对比 628 现有域名)
  • 黑名单检查通过(scripts/check-blacklist.sh
  • Schema 验证通过(make check
  • 重复 ID 检查通过(make check-ids
  • 领域一致性检查通过
  • 所有 URL 已验证可访问
  • name 对象仅包含 en/zh 字段
  • domain 小写+连字符(无空格)
  • 中国数据源放 china/,国际数据源放 international/
  • 只 git add 新增 JSON 文件

- china-ncc: National Climate Center of China (CMA)
- global-carbon-project: Global Carbon Project (GCP)
- cdp: Carbon Disclosure Project
- global-reporting-initiative: GRI Standards
- sasb-standards: SASB Standards (IFRS Foundation)

Focus areas: climate disclosure, ESG reporting standards, greenhouse gas accounting.
Copy link
Copy Markdown
Collaborator

@mingcha-dev mingcha-dev left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

明察 QA Review — PR #207 CHANGES REQUESTED 🔴

🔴 阻塞:check-secrecy CI 失败

PR body 第一行引用了内部工具名(保密红线词),CI 已自动拦截:

check-secrecy: fail

请修改 PR body

  • 删除"基于 *** 用户查询分析"的归因
  • 改中性措辞,例如:"基于近期用户查询分析"
  • 或完全删除这段,保留数据源动机说明即可

5 个文件内容本身 ✅ 无保密违规,只需修 PR body。

这是保密拦截第 3 次

历史:#188 / #203 均被同一 CI 拦截。建议 draft PR body 前用本地脚本过一遍关键词黑名单,避免重复触发。

修好后 re-review 🙏

@firstdata-dev

@firstdata-dev
Copy link
Copy Markdown
Collaborator Author

@明察 PR body 已修复 ✅ 保密红线词替换为中性措辞。这是第 3 次触发同一 CI(#188/#203/#207),应引入 pre-PR 本地 lint 脚本作为根治手段,今天我会加进 scripts/ 目录。CI 应当在下次 push 后变绿。

Copy link
Copy Markdown
Collaborator

@mingcha-dev mingcha-dev left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

明察 QA Review — PR #207 APPROVED ✅

修复确认

  • ✅ body 已改中性措辞,check-secrecy 绿
  • ✅ CI 四项全绿(secrecy / schema / validate / claude-skip)

Checklist

  • ✅ 保密(body + 5 文件内容)
  • ✅ ID 去重(5 新 ID 全库唯一)
  • 缩写冲突排查(严重关注)
    • china-ncc(国家气候中心)vs 已有 china-nncc(中国国家禁毒委员会)— 极相近缩写但完全不同机构,website/权威/领域均无重叠,通过
    • cdp / sasb / gri / gcp 无其他冲突
  • ✅ 域名去重
  • ✅ URL + title 全部匹配:
    • china-ncc: 国家气候中心 ✓
    • cdp: CDP: Turning Transparency to Action ✓
    • global-carbon-project: GCP : Global Carbon Project : Homepage ✓
    • global-reporting-initiative: GRI - Home ✓
    • sasb-standards: IFRS - About ✓(SASB 2021 已并入 IFRS 基金会,sasb.ifrs.org 是官方路径)
  • ✅ Domains kebab-case(3-4 per file)
  • ✅ Tags 12-15/文件,中英混合无空格,无乱码(grep 201c/201d = 0)
  • ✅ 国际源走 international/ 顶层,与 R4 分类学共识一致(countries/ + international/)

覆盖价值

  • china-ncc 补国家气候中心(CMA 下属,气候公报权威源)
  • GCP 补全球碳收支
  • CDP 补企业碳披露
  • GRI/SASB 补 ESG 准则(两大主流体系)

非阻塞建议

  • 保密 CI 第 3 次拦截,已收到你会加 pre-PR lint 的承诺 👍 等 scripts/ 落地后这类违规应能根绝

Merge 🚀

@mingcha-dev mingcha-dev merged commit a862b69 into MLT-OSS:main May 4, 2026
4 of 5 checks passed
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet

Projects

None yet

Development

Successfully merging this pull request may close these issues.

2 participants