数据库——规范数据库设计
为什么需要设计数据库
当数据库比较复杂的时候,就需要设计
糟糕的数据库设计
- 数据冗余,浪费空间
- 数据库插入和删除都会麻烦、异常(屏蔽使用物理外键)
- 程序性能差
良好的数据库设计
- 节省内存空间
- 保证数据库的完整性
- 方便我们开发系统
设计数据库的步骤(以个人博客为例):
- 收集信息,分析需求
- 用户表user(需求:用户登录注销,用户个人信息,写博客,创建分类)
- 分类表category(文章分类,谁创建的)
- 文章表blog(文章的信息)
- 友情链接表links(链接信息)
- 评论表comment
- 粉丝表user_follow
- 自定义表(系统信息。某个关键的字,或者一些主题)
- 标识实体(把需求落实到每个字段上)
- 标识实体之间的关系
- 写博客:user——>blog
- 创建分类:user——> category
- 关注:user——> user
- 友链:links
- 评论:user——>blog,user——> user
三大范式
范式(数据库设计范式,数据库的设计范式)是符合某一种级别的关系模式的集合。构造数据库必须遵循一定的规则。在关系数据库中,这种规则就是范式。关系数据库中的关系必须满足一定的要求,即满足不同的范式。
为什么需要数据规范化
防止:
- 信息重复
- 更新异常
- 插入异常
- 无法正常显示信息
- 删除异常
- 丢失有效信息
三大范式
第一范式(1NF)
原子性:保证每一列不可再分
说明:在任何一个关系数据库中,第一范式(1NF)是对关系模式的基本要求,不满足第一范式(1NF)的数据库就不是关系数据库。
第二范式(2NF)
前提:满足第一范式
第二范式需要确保数据库表中的每一列都和主键相关,而不能只与主键的某一部分相关
第三范式(3NF)
前提:满足第一范式,第二范式
第三范式需要确保数据表中的每一列数据都和主键直接相关,而不能间接相关,第三范式就是属性不依赖于其它非主属性
思考:规范性和性能的问题
- 考虑商业化的需求和目标(成本,用户需求),数据库的性能更重要
- 在规范性能问题的时候,需要适当考虑一下规范性
- 故意给某些表增加冗余的字段(反范式)
- 故意增加一些计算列(从大数据量降低为小数据量的查询)
反范式化
反范式化指的是通过增加冗余或重复的数据来提高数据库的读性能。
反范式化可以减少关联查询时,join表的次数。
关联查询的表不得超过三张 (参考阿里巴巴开发手册)
阿里巴巴开发手册