专栏名称: 算法爱好者

算法是程序员的内功！伯乐在线旗下账号「算法爱好者」专注分享算法相关文章、工具资源和算法题，帮程序员修炼内功。

算法数据结构-B树

算法爱好者 · 公众号 · 算法 · 2017-05-31 20:11

正文

（点击上方公众号，可快速关注）

来源：蘑菇先生

cnblogs.com/mushroom/p/4100087.html

如有好文章投稿，请点击 → 这里了解详情

介绍

B树的目的为了硬盘快速读取数据（降低IO操作次树）而设计的一种平衡的多路查找树。目前大多数据库及文件索引，都是使用B树或变形来存储实现。

为什么B树效率高

在大规模数据存储操作中，由于无法一次性加载到内存里。所以避免不了发生内外存交换。所以次数越少，效率表现也越高。

来看下面这张图：

这是个典型的b树结构，初始因子为1000，高度仅为3的b树，就可以存储1002001000的数据了。

假设要查询最后一个数据:

从硬盘加载根节点搜索，IO一次。
根据根节点的指针信息，去加载第二层的节点， IO一次。
重复2，IO一次。

IO只用了3次，就查询了需要的数据，所以说B树效率是非常高的。

B树的节点，在硬盘里表现为：柱面里的页(page)或盘块(block) ，如果把索引持久化到内存，只需要一次就够了。

B树的高效的前提是数据已排序。

B树结构

这是B树存储在硬盘的逻辑结构图。

其中根节点中17，35在称为关键字(key) ，实际中往往附带更多复杂类型数据。

可以看出一个节点包含 keys ChildNotePointer 2部分信息。

根据这张图介绍下b树的基础定义：

这是颗5阶B树的图，阶简写m。

树中每个结点最多含有m个子节点（m>=2）。
每个内节点至少 [ceil(m / 2)] 个子节点。内节点即非根节点非页子节点，也可以叫中间节点。
关键字key的数量 [ceil(m / 2)-1]<= n <= m-1，关键字按递增排序。
每个叶节点具有相同的深度，即树的高度h，而且不包含关键字信息。

上图也可称为最小度数为3的b树，(degree) ，简写t。

t其实是上面第二条定义中 [ceil(m / 2)] 的值，即t=[ceil(m/2)], 3=ceil(5/2) 。

每个非根节点至少有t-1个关键字，非根内节点至少有t个子节点。 t称为度数(degree)，t>=2 。
每个节点至多有2t-1关键字，每个内节点最多有2t个子节点。
每个叶节点具有相同的深度，即树的高度h，而且不包含关键字信息。

度和阶都是描述子节点的数量的。

算法导论译版中是用度来描述的。

数据结构与算法分析是用阶来描述，网上大多也是。

下面简单的描述实现逻辑。

搜索：从根节点搜索，找到返回，找不到递归子节点。一直搜索到叶子节点，找到返回，找不到则说明key不存在。

//伪代码

entry BTreeSearch(node, key) {

if (node == null )

return null ;

for ( int i = 0; i < node.keys.length; i++)

{

if (node.keys[i] == key)

return node.data[i];

}

请到「今天看啥」查看全文

推荐文章

九章算法 · 升到L6，谈谈今年的情况

昨天

算法爱好者 · OpenAI 之父奥特曼和他的程序员老公有了小宝宝……网友：走弯路？

14 小时前

算法爱好者 · 北京大学出的第二份 DeepSeek 教程来了！（PDF可下载）

14 小时前

算法爱好者 · 清北 DeepSeek 教程"神仙打架"，北大出品的 DeepSeek 教程来了！（PDF 可下载）

昨天

算法爱好者 · 他借助 ChatGPT 杀疯了！做了 3 个爆款 APP，年入千万美刀

昨天

虎嗅APP · 我眼中的未来：视频、AI、个性化、传统企业和AR

8 年前

腾讯时尚 · 关于"春天流行新衣服剪洞", 我们是认真的。(附妈妈看了会气疯教程)

7 年前

旅拍誌 · 不同画风的情侣照，哪种正中你的红心？

7 年前

每日健康生活 · 这种树叶太常见，用来洗头70岁也不会有白发

7 年前

南国都市报 · 和“白骨精”约会，而且还有神秘大礼，这场交友派对，你别错过！

7 年前

算法数据结构-B树

正文

（点击 (adsbygoogle = window.adsbygoogle || []).push({}); 上方公众号 ，可快速关注）

请到「今天看啥」查看全文

（点击上方公众号，可快速关注）