在 VS Code 中调试时查看 Pandas 数据框
在本文中,我们将介绍如何在使用 Visual Studio Code(以下简称 VS Code)进行 Python 调试时,在调试器中查看 Pandas 数据框的方法。
阅读更多:Pandas 教程
简介
调试是软件开发中非常重要的一环。在 VS Code 中进行 Python 调试时,我们可以使用调试器中的“监视”功能来查看变量的值。但是当我们想查看 Pandas 数据框的内容时,单纯的使用“监视”功能可能不够直观。
例如,我们有一个数据框 df
,想查看其中前五行数据。在调试过程中,我们可以在变量面板中展开 df
,找到 DataFrame
对象,再手动点击其中的_data
属性,再展开其中的 BlockManager
对象,再找到 DataBlock
对象,最后才能找到 values
属性,看到其中的前 5 行数据,非常繁琐。
解决方法
为了实现更加直观的数据框查看方法,我们可以使用 pandas-visual-qa
这个 VS Code 插件。
安装插件
首先需要安装 pandas-visual-qa
插件。在 VS Code 中打开命令面板,输入 ext install pandas-visual-qa
,按回车键进行安装。
查看数据框
安装完成后,我们可以在变量面板中找到 df
,右键点击,选择“Visualize dataframe” -> “Open in new editor”。
这时会在 VS Code 界面中打开一个新的编辑器窗口,其中会显示 df
中的数据。
我们可以在该窗口中进行数据框的浏览。我们可以将鼠标移到列名上,找到列名,或者对数据进行表格排序。如果查看的数据较多,我们还可以使用筛选器或者搜索框进行筛选。
在新的编辑器窗口中,可以将数据框进行最大化浏览,也可以将窗口进行拆分,同时查看多个数据框和代码。
查看缺失值
在数据分析中,我们经常需要关注缺失值。pandas-visual-qa
插件还提供了一个非常方便的功能——查看数据框中缺失值的比例。
我们可以在新的编辑器窗口中点击“NA ratio”按钮,可以看到缺失值的比例。
我们可以看到数据框中缺失值比例并不高,最高的是 value
列,约为 5.76%。
查看数据类型
在数据处理过程中,我们也需要关注数据类型。pandas-visual-qa
插件中可以查看数据框中各列的数据类型。
我们可以在新的编辑器窗口中点击“Data types”按钮,可以看到各列的数据类型。
我们可以看到 value
列是字符串类型,而其他列都是浮点数类型。知道各列的数据类型,可以帮助我们更好地进行后续数据预处理。
总结
在本文中,我们介绍了 pandas-visual-qa
这个 VS Code 插件,可以帮助我们在 VS Code 的调试器中查看 Pandas 数据框。通过该插件,我们可以方便地进行数据框的浏览、查看缺失值、查看数据类型等操作,提高数据分析效率。