AI魔法学院客服
3.5k star!一款万能的 SQL 分析工具,厉害了!
dsq是一款强大的SQL分析工具,支持Excel、JSON、CSV等本地文件格式,使用标准SQL语法进行查询、分析和处理,功能全面且性能卓越,在GitHub上获得近3.5k星标。项目开源免费,安装简便,支持正则表达式、缓存、函数和脚本等高级功能,可通过命令行轻松使用,适用于各种数据处理场景。
 2024-07-16
收藏 复制地址分享海报

3.5k star!一款万能的 SQL 分析工具,厉害了!

大家好,我是开源君!

众所周知,SQL是数据分析领域的利器,但它通常只能用于分析数据库中的数据。而现实生活中,我们经常会遇到各种各样的本地文件,比如Excel、JSON、CSV等。如果要分析这些文件,就需要借助专门的工具。

DSQ的出现,正是为了解决这一痛点。它是一款支持本地文件的SQL分析工具,可以让你用熟悉的SQL语法,轻松分析各种本地文件。

今天开源君介绍一个超级棒的开源项目dsq

简介

dsq它是一个命令行工具,可以对数据文件进行 SQL 查询,让你轻松对各种文件进行查询、分析和处理。

支持多种数据格式,包括 JSON、CSV、Excel、Parquet 等,

 

市面上类似的工具其实也有不少,作者也做了很细致的研究和分析,得出比较结论:dsq 目前是功能最为全面的,性能最极致的。

下面这张图是市面上各种数据处理工具的对比,相比较而言,dsq还是很有优势的。

 

目前项目在 github 上面获得了接近 3.5k 的 star。

 

性能特色

· 支持多种文件格式,包括 Excel、JSON、CSV、XML、YAML、Markdown 和 Text

· 使用标准的 SQL 语句进行操作,无需学习新的语法

· 支持多种高级功能,包括正则表达式、缓存、函数和脚本

· 性能优异,采用高效的底层库,分析速度快

· 开源免费,代码开源,可自由使用和修改

安装

项目安装很简单,win系统的话,直接到项目 releases 页面下载,然后解压即可使用。

 

macOS的话,执行下面的安装命令

brew install dsq

Linux系统则可以用下面的安装:

VERSION="v0.23.0"
FILE="dsq-$(uname -s | awk '{ print tolower($0) }')-x64-$VERSION.zip"
curl -LO "https://github.com/multiprocessio/dsq/releases/download/$VERSION/$FILE"
unzip $FILE
sudo mv ./dsq /usr/local/bin/dsq

使用方法

最基本的使用就是, dsq filename 或者 dsq filename "SELECT * FROM {}

比如:

dsq testdata.json "SELECT * FROM {} WHERE x > 10"

有时候直接读取的话,样式会比较难看。

可以用-p 或者 --pretty参数,对内容进行美化。

 

如果要读取多个文件,可以用如下的方法:

dsq a.csv b.json "select {0}.name, {1}.age from {0} join {1} on {0}.id = {1}.id"

a.csv b.json代表要查询的两个文件,在上述 select 语句中分别用 {0}、{1}代表。

另外,dsq还支持读取excel所有sheets的内容的。

比如说c.xlsx这个文件有两个 sheets,可以使用如下的方法来查询 sheet2 里面的内容。

dsq c.xlsx "SELECT COUNT() FROM {'Sheet2'} where Country='China'"

关于管道传递数据,直接使用管道符| 来传递数据,要加-s参数来指明传递的文件类型。如:

cat testdata.csv | dsq -s csv "SELECT * FROM {} LIMIT 1"

以上只是dsq 的一些基本功能实用,另外还有更加高级复杂的操作,如正则、缓存等等,详细可以去官方页面进行查看。

关于项目的更多细节、功能,感兴趣的小伙伴可以去项目地址探索~~~

项目地址:
https://github.com/multiprocessio/dsq

 

 

 

 

 

出自:https://mp.weixin.qq.com/s/iong0RRAe6SHmbMk0Upuig

本文档由网友提供,仅限参考学习,如有不妥或产生版权问题,请联系我们及时删除。 客服请加微信:skillupvip
评论
1 评论
八字没一撇2024/7/16 9:37:05
哇塞,这dsq工具简直是个神器啊!

1. 功能全面:支持Excel、JSON、CSV,还有标准SQL语法,完全满足日常数据处理需求。
2. 性能卓越:性能强劲,处理数据更高效。
3. 开源免费:完全免费,还能享受GitHub近3.5k的社区支持,太值了!
4. 安装简便:安装轻松,上手简单,小白也能轻松玩转。
5. 高级功能:正则表达式、缓存、函数、脚本... 这么多高级功能,简直让人惊喜!

强烈推荐给各位数据处理的小伙伴们,dsq绝对是你们的好帮手!
20秒读懂全文
伴读
### 1. 一句话总结文章摘要

DSQ,一款功能全面、性能卓越的SQL分析工具,支持多种文件格式(Excel、JSON、CSV等),允许用户通过熟悉的SQL语法轻松分析本地文件,并在GitHub上获得了近3.5k的star。

### 2. 生成关键词和可能相关的关键词

**关键词**:
- DSQ
- SQL分析工具
- 本地文件分析
- 数据处理工
One More Thing
One More Thing again ...

找组织,加入AI魔法学院群