Chaoran's Blog

date

Dec 11, 2024

slug

indexeddb-data-storage-eviction

status

Published

前言

随着前端技术的不断发展，越来越多的应用逻辑、数据存储与状态管理被转移到浏览器端，从而减少对后端的依赖，提升用户体验。其中，一个核心问题是：在浏览器这样一个存储、性能都相对受限的环境中，如何高效地缓存和管理大量的数据？

典型问题与挑战

数据量庞大：聊天应用、复杂的离线 Web 应用中，需要存储大量的消息、用户数据或配置文件。

存储空间有限：浏览器提供的本地存储（localStorage、sessionStorage）容量有限，一般只有几MB级别。

访问性能要求：需要实现快速的数据读写与检索，而不是每次都从后端拉取数据。

基于上述问题，我们需要合理的缓存策略和存储方案。

缓存淘汰策略

在浏览器端实现数据缓存时，如果任由数据无限增长，很快就会耗尽存储资源。淘汰策略的出现就是为了解决这个问题。LRU（Least Recently Used）是最常见的缓存淘汰算法之一。

LRU 算法简介

核心思想：最近最少使用的数据是最不重要的，当缓存达到容量上限时，应优先删除最久未访问的元素。

应用场景：操作系统的内存页替换、浏览器缓存、数据库数据缓存等。

简单示例（基于内存 LRU）

通过 Map 维护插入顺序，put 和 get 操作会更新访问顺序，从而简单实现 LRU 功能。

浏览器端大量数据缓存的现实问题

然而，纯内存（如 Map）缓存有明显的局限性：

数据不会持久化，一旦刷新页面，数据即丢失；

内存缓存容量通常较小，不适合存储大量聊天记录或大型数据集。

结合浏览器本地存储

为了在前端持久化大量数据，我们可以使用更强大的浏览器存储方案：

localStorage / sessionStorage：简单、同步、容量小。

IndexedDB：异步、容量较大、支持索引查询，更适合存储复杂数据结构和大数据量。

在一个纯前端的聊天应用中，可能需要存储成千上万条消息，甚至按照会话进行查询和分页展示。这时，IndexedDB 是一个更有前景的选择。

使用 IndexedDB 构建聊天应用的存储体系

设计目标

高效读写：聊天消息可能频繁更新和读取。

可扩展性：需要按会话 ID、时间戳快速查询指定范围的消息。

淘汰机制：消息长期积累需要清理，比如只保留最近30天的消息。

数据结构设计

为聊天应用规划两张表：

Conversations（会话表）：

conversationId: 主键

lastActive: 会话最后活跃时间，用于按活跃度排序和清理。

Messages（消息表）：

messageId: 主键

conversationId: 外键，索引以支持按会话查询

timestamp: 消息时间戳，支持按时间查询和排序

content: 消息内容

通过在 IndexedDB 中使用索引（Index），我们可以按照 conversationId 或 timestamp 查询消息，从而实现分页加载或按时间范围检索。

IndexedDB 工具封装与现代编程风格

下面的代码展示了如何使用更现代的 ES 语法和函数式编程风格对 IndexedDB 进行简单的封装，提供 init、insert、query、delete 等通用操作。

数据初始化与消息存储

初始化数据库并插入消息的示例代码：

淘汰策略与维护机制

随着时间推移，消息可能越来越多，需要定期清理。这里可以引入多种策略：

1. TTL（Time To Live）：定期清理超出存储期限的老旧消息。

2. LRU：对会话进行访问计数和排序，淘汰最久未访问的会话。

3. 空间上限控制：监控存储占用，超出限制后删除最不常用或最古老的数据。

示例：清理过期消息（超过7天）

背后的思考与实践建议

分层存储：将常用的最近数据保存在内存（如一个 LRU 缓存结构），将大量历史数据存储到 IndexedDB，以实现快速访问与大容量存储的平衡。

分页与懒加载：当数据量很大时，避免一次性加载所有消息，而是实现分页查询（如一次加载20条），提高响应速度。

数据压缩与加密（可选）：对敏感数据使用加密（WebCrypto API），对冗余数据进行一定程度压缩，以节省空间。

离线优先与同步机制：在网络不稳定时，IndexedDB 提供离线访问数据的能力。日后可加入后台同步逻辑，将本地数据与云端数据定期合并。

总结

本文从浏览器缓存策略入手，介绍了 LRU 算法在客户端缓存中的作用，接着阐述了在纯客户端聊天应用中如何运用 IndexedDB 进行大规模数据存储与查询。通过合理的数据结构设计（会话表与消息表）、索引和淘汰策略（LRU、TTL），我们实现了一个高效、可扩展、具有持久化能力的前端数据存储方案。

使用 IndexedDB 实现高效数据存储与淘汰策略

前言

典型问题与挑战

缓存淘汰策略

浏览器端大量数据缓存的现实问题

使用 IndexedDB 构建聊天应用的存储体系

IndexedDB 工具封装与现代编程风格

总结