LogoLogo
中文
中文
  • 欢迎
  • 关于
    • 关于本项目
    • 收录范围
  • 技术架构
    • 概览
    • Crawler 模块介绍
    • 数据库结构
      • 歌曲类型
      • snapshot_schedule 表
    • 机器学习
  • API 文档
    • 目录
    • 视频快照
  • 参考
    • 颜色系统
    • 关于 APCA
  • 开发指南
    • 版本控制
由 GitBook 提供支持

如无特别声明,内容基于 CC BY 4.0 许可。

在本页

这有帮助吗?

在GitHub上编辑
  1. 技术架构

数据库结构

上一页Crawler 模块介绍下一页歌曲类型

最后更新于1个月前

这有帮助吗?

CVSA 使用 作为数据库。

CVSA 设计了两个数据库,cvsa_main 和 cvsa_cred。前者用于存储可公开的数据,而后者则存储用户相关的个人信息(如登录凭据、账户管理信息等)。

CVSA 的所有公开数据(不包括用户的个人数据)都存储在名为 cvsa_main 的数据库中,该数据库包含以下表:

  • songs:存储歌曲的主要信息。

  • bilibili_user:存储哔哩哔哩 UP主 的元信息。

  • bilibili_metadata:我们收录的哔哩哔哩所有视频的元数据。

  • labelling_result:包含由我们的机器学习模型标记的 bilibili_metadata 中视频的标签。

  • latest_video_snapshot:存储视频最新的快照。

  • video_snapshot:存储视频的快照,包括特定时间下视频的统计信息(播放量、点赞数等)。

  • snapshot_schedule:视频快照的规划信息,为辅助表。

快照:

我们定期采集哔哩哔哩视频的播放量、点赞收藏数等统计信息,在一个给定时间点下某支视频的统计数据即为该视频的一个快照。

PostgreSQL