专栏名称: 新语数据故事汇
《新语数据故事汇,数说新语》科普数据科学、讲述数据故事,深层次挖掘数据价值。
目录
相关文章推荐
51好读  ›  专栏  ›  新语数据故事汇

探索数据的神器:揭秘D-Tale

新语数据故事汇  · 公众号  ·  · 2024-07-23 19:08

正文

D-Tale 是一个结合了 Flask 后端和 React 前端的工具,为你提供了一种简便的方法来查看和分析 Pandas 数据结构。它可以无缝集成到 ipython notebooks 和 python/ipython 终端中。目前,该工具支持 Pandas 对象,如 DataFrame、Series、MultiIndex、DatetimeIndex 和 RangeIndex。

安装D-Tale

pip install dtale  -i https://pypi.tuna.tsinghua.edu.cn/simple




引入数据和初始化 D-Tale

在SmartNotebook 可以连接外部数据源利用SQL加载外部数据,也可以加载csv数据到DataFrame ,然后初始化D-Tale:

select id,phys,engl,math,chin,chem,total,school from grade_score_demo

这里由于kernel 是docker 容器化部署的,需要访问地址做适当的转换处理(转化宿主机的访问访问地址及端口访问)

snb_dtale=dtale.show(df1,host='0.0.0.0',port=7880)
from IPython.display import IFrameIFrame(snb_dtale._main_url.replace('0.0.0.0','172.30.81.86'), width='100%', height='500')

为了方便操作,可以在新的窗口(菜单项中的open in new Tab)打开D-Tale 。

列操作(数据转换和清洗)

支持列的排序、重命名、过滤、锁定(非常宽的 DataFrame,这会很方便)、隐藏、复制、类型转换、格式化、聚合、重复项的处理等数据转换和数据清洗的工作。

可视化的特征统计摘要

D-Tale提供的信息远比普通 pandas 函数更多。由于被称为列分析,它为每种数据类型提供了独特的摘要。它还为特征生成直方图和值计数图:对于整数类型的列,它提供了集中趋势和分布的度量,以及最频繁值的频率,还包括峰度和偏度。它还通过箱线图、直方图、值计数图和 Q-Q 图来表示数据。







请到「今天看啥」查看全文