关系数据库如何存储和检索数据？

了解数据在磁盘上是如何组织的。

数据库旨在高效地存储、管理和检索数据。这一过程涉及多个关键组件和概念。

以下是数据库如何存储和检索数据的总体概述：

数据模型：
- 数据库使用数据模型来定义其存储的数据结构。常见的数据模型包括关系型、面向文档型、图型和键值模型。
- 在关系型数据库中，数据被组织成具有行和列的表格。每一行代表一条记录，每一列代表一个字段或属性。

表和字段：

主键：

索引：

SQL（结构化查询语言）：

ACID 属性：

数据库管理系统 (DBMS)：

存储引擎：

缓存：

优化器：

备份和恢复：

背后机制

不过，由于表的大小可能很大，在内存中存储整棵树通常不太现实。
取而代之的是，
每次只有部分树节点会存储在内存中。
这些节点通常被称为页。

B+Tree
B+Trees 和 B-Trees 树的节点最多可以有 N-1 个键。

因此，如果我有一棵阶数为 3 的 B+Tree 树（或 B-Tree树），这意味着每个节点最多可以包含 2 个键和 3 个指向子节点的链接。

B+Tree 与 B-Tree 的区别在于：

数据在磁盘上是如何组织的：

在进行写入操作时，可能会锁定整个页面，也可能不会锁定整个页，因此可能会导致同一页上的其他行也被锁定（一些引擎会使用一些技巧将锁定范围限制在行）。
使用自动递增主键有一个很好的特性，即总是写入树中最右边的页，这可以在进行多次 INSERT 时提高页面缓存的命中率。而使用随机主键（如 UUID4）则会导致页缓存崩溃和效率低下，因为会有很多缓存未命中，而且有可能进入不同的叶节点。
页面大小的选择历来与旋转磁盘读取头的默认读取量相匹配，以提高效率。随着固态硬盘的出现，不确定这是否仍然适用。
如果一条记录对于一个页面来说太大，那么节点中就会有一个指向溢出页面（至少在 SQLite 中是这样）的链接。溢出页面本身是一个链接列表，指向其他溢出页面，足以容纳所有数据。
尽管每个节点中可能有很多键需要遍历，但我们仍会通过页探测次数来衡量性能，因为这是迄今为止搜索成本最高的操作。
您可以使用哈希表索引来代替树，但这样就无法进行范围查询。
树的分支因子（一页能容纳多少个键）大致可以估算为（page_size - header_size）/（key_size + link_size）。如果你计算一下，就会发现在深度为 4 的树中，你可能要存储 TB 的行数据。