在 VS Code 中调试时查看 Pandas 数据框

在 VS Code 中调试时查看 Pandas 数据框

在本文中,我们将介绍如何在使用 Visual Studio Code(以下简称 VS Code)进行 Python 调试时,在调试器中查看 Pandas 数据框的方法。

阅读更多:Pandas 教程

简介

调试是软件开发中非常重要的一环。在 VS Code 中进行 Python 调试时,我们可以使用调试器中的“监视”功能来查看变量的值。但是当我们想查看 Pandas 数据框的内容时,单纯的使用“监视”功能可能不够直观。

例如,我们有一个数据框 df,想查看其中前五行数据。在调试过程中,我们可以在变量面板中展开 df,找到 DataFrame 对象,再手动点击其中的_data 属性,再展开其中的 BlockManager 对象,再找到 DataBlock 对象,最后才能找到 values 属性,看到其中的前 5 行数据,非常繁琐。

解决方法

为了实现更加直观的数据框查看方法,我们可以使用 pandas-visual-qa 这个 VS Code 插件。

安装插件

首先需要安装 pandas-visual-qa 插件。在 VS Code 中打开命令面板,输入 ext install pandas-visual-qa,按回车键进行安装。

查看数据框

安装完成后,我们可以在变量面板中找到 df,右键点击,选择“Visualize dataframe” -> “Open in new editor”。

这时会在 VS Code 界面中打开一个新的编辑器窗口,其中会显示 df 中的数据。

我们可以在该窗口中进行数据框的浏览。我们可以将鼠标移到列名上,找到列名,或者对数据进行表格排序。如果查看的数据较多,我们还可以使用筛选器或者搜索框进行筛选。

在新的编辑器窗口中,可以将数据框进行最大化浏览,也可以将窗口进行拆分,同时查看多个数据框和代码。

查看缺失值

在数据分析中,我们经常需要关注缺失值。pandas-visual-qa 插件还提供了一个非常方便的功能——查看数据框中缺失值的比例。

我们可以在新的编辑器窗口中点击“NA ratio”按钮,可以看到缺失值的比例。

我们可以看到数据框中缺失值比例并不高,最高的是 value 列,约为 5.76%。

查看数据类型

在数据处理过程中,我们也需要关注数据类型。pandas-visual-qa 插件中可以查看数据框中各列的数据类型。

我们可以在新的编辑器窗口中点击“Data types”按钮,可以看到各列的数据类型。

我们可以看到 value 列是字符串类型,而其他列都是浮点数类型。知道各列的数据类型,可以帮助我们更好地进行后续数据预处理。

总结

在本文中,我们介绍了 pandas-visual-qa 这个 VS Code 插件,可以帮助我们在 VS Code 的调试器中查看 Pandas 数据框。通过该插件,我们可以方便地进行数据框的浏览、查看缺失值、查看数据类型等操作,提高数据分析效率。

Camera课程

Python教程

Java教程

Web教程

数据库教程

图形图像教程

办公软件教程

Linux教程

计算机教程

大数据教程

开发工具教程