About CGD

关于
Cyperaceae Genome Database

CGD 是首个专属于莎草科(Cyperaceae)的综合性基因组数据库, 整合40个代表物种的全基因组序列、基因结构注释、功能注释与多组学数据, 面向全球研究者完全免费开放,致力于推动莎草科系统发育、功能基因组与应用生物学研究。

数据库概况

为什么需要 CGD?

莎草科是单子叶植物中第三大科,约 5,500 个物种,广泛分布于全球各类生态系统。 其独特的生物学特征——全着丝粒染色体、C4 光合途径的多次独立起源、极端的染色体数目变异—— 使其成为研究植物进化与适应的理想模型。然而,在 CGD 建立之前, 莎草科基因组数据极度分散,缺乏统一的标准化平台,严重阻碍了比较基因组学研究的开展。 CGD 的建立填补了这一空白。

40
收录物种
覆盖莎草科 11 个属,代表主要进化支系
~940K
蛋白序列
全部经 GO/KEGG/InterPro 功能注释
6
核心模块
BLAST · 浏览器 · 注释 · 同源 · 进化 · 下载
CC BY
开放许可
所有数据免费开放,学术商业均可使用
研究团队

CGD 开发团队

CGD 由海南大学植物基因组学实验室主导开发,联合多家合作单位共同构建。

PI
[通讯作者]
项目负责人
海南大学 · 植物基因组学
DB
[数据库开发者]
数据库架构
全栈开发 · MySQL · Vue.js
BF
[生信分析]
基因组注释
BRAKER · RepeatMasker · eggNOG
CA
[合作者 A]
数据采集
Wellcome Sanger Institute
CB
[合作者 B]
系统发育分析
合作单位
更新日志

版本历史

2026 年 · 当前版本 v1.0
CGD v1.0 正式发布
收录 40 个物种,上线 BLAST、JBrowse 2 浏览器、GO/KEGG 注释查询、直系同源、批量下载五大核心模块。数据库论文投稿 Nucleic Acids Research。
2025 年 11 月
香附子基因组发表
本课题主导的 Cyperus rotundus 染色体级别基因组组装与注释数据发表于 Scientific Data。
2025 年 10 月
数据整合完成
完成 40 个物种基因组数据的标准化处理、BLAST 数据库构建、JBrowse 2 部署和 GO/KEGG 功能注释整合。
2024 年 · 项目启动
CGD 项目立项
确定收录物种范围,制定数据标准化规范,开始基因组测序与数据收集工作。
技术架构

构建 CGD 所用工具

MySQL 8.0
关系型数据库
Node.js + Express
REST API 后端
Vue 3 + Vite
前端框架
Nginx
反向代理
NCBI BLAST+ 2.15
序列比对引擎
JBrowse 2
基因组可视化
BRAKER2
基因结构预测
eggNOG-mapper v2
功能注释
RepeatMasker
重复元件注释
OrthoFinder
直系同源分析
HiFiasm
基因组组装
samtools + htslib
序列索引处理
引用方式

请引用 CGD

如果您在研究中使用了 CGD 的数据或工具,请引用以下文献:

📖 主要引用

[作者姓名] et al. (2026). CGD: the Cyperaceae Genome Database, a comprehensive multi-omics resource for comparative genomics of 40 representative sedge species. Nucleic Acids Research, 54(D1), D1–D8.

doi: 10.1093/nar/gkXXXXXX
📖 香附子基因组

[作者姓名] et al. (2025). Chromosome-Level Genome Assembly and Annotation of purple nutsedge (Cyperus rotundus Cyperaceae). Scientific Data, 12, XXXX.

doi: 10.1038/s41597-025-XXXXX-X
联系我们

问题与合作

如有数据问题、Bug 反馈或合作意向,欢迎通过以下方式联系我们。

GitHub
github.com/cgd-database
地址
海南大学 · 植物基因组学实验室