DuckDB 近期已成为最热门的轻量级嵌入式 SQL 引擎之一。凭借其高度集成的列式存储架构、出色的查询性能以及对多种数据格式(如 Excel、CSV、Parquet 等)的广泛支持,DuckDB 正在迅速吸引越来越多的数据分析师关注。DuckDB 在 GitHub 上的星标数量增长迅猛,充分展现了其在业内的高度关注与认可。
DuckDB 作为一款嵌入式 SQL 引擎,不仅支持多种编程语言,如 Python 和 C++,还提供了广泛的灵活性和兼容性。无论是在本地环境还是嵌入到其他应用程序中,DuckDB 都能轻松应对各种数据处理需求。更令人兴奋的是,DuckDB 还支持 WebAssembly 技术,使其能够在浏览器中直接运行。这意味着,用户可以通过 Web 浏览器访问 DuckDB,进行 SQL 查询而无需任何额外的安装,从而实现更高的便捷性和灵活性。这种全方位的支持使 DuckDB 成为一个极具前瞻性的工具,适用于各种数据分析场景。
基于 DuckDB 的 WebAssembly 版本的DuckDB Web Shell(
https://shell.duckdb.org/
), 提供了一个极为便捷的数据分析工具。只需访问 DuckDB Web Shell 的网址,您即可在浏览器中加载 DuckDB 引擎,直接使用 SQL 进行数据分析。这一无缝的体验让数据处理变得简单而高效。无论是处理本地数据还是进行即时查询,DuckDB Web Shell 都无需任何额外安装,极大地提升了数据分析的便利性和效率。
第一步:打开DuckDB Web Shell
https://shell.duckdb.org/
第二步:添加本地文件
将数据移动到 DuckDB 实例的一种方法是添加本地文件。添加文件的命令是
.files add
,在 CLI 中输入
.files add
时,浏览器文件对话框窗口会打开,就可以可以选择一个或多个文件(支持 CSV、JSON、Parquet 格式)。
查看的文件列表:
.files list