Pandas 如何避免在jupyter notebook中输出到滚动框

在本文中，我们将介绍如何使用Pandas避免数据在jupyter notebook中输出到滚动框，以便更好地查看和操作。

为什么要避免输出到滚动框？

在jupyter notebook中，当数据的行数或列数较多时，Pandas默认会将数据输出到滚动框中，这使得我们需要不断上下滚动来查看数据的完整内容。这不仅不方便，而且容易遗漏重要信息或导致操作出错。因此，我们需要采取措施来避免出现这种情况。

如何避免输出到滚动框？

以下是几种方法：

方法一：设置显示选项

使用Pandas的set_option方法设置显示选项可以避免在输出数据时出现滚动框。例如，我们可以将max_rows和max_columns设置为None或较大的值：

import pandas as pd

pd.set_option('display.max_rows', None)
pd.set_option('display.max_columns', None)

df = pd.read_csv('data.csv')
print(df)

这样，当数据集较大时，Pandas将自动展示所有行和列，而不是将它们输出到滚动框中。

方法二：使用Jupyter Notebook插件

有些Jupyter Notebook插件可以自动将数据输出到分页显示框中，避免默认的滚动框出现。例如，qgrid和pandas_profiling都提供了这样的功能。

方法三：使用分页器

使用Pandas自带的分页器可以将数据分成多个页面显示，从而避免滚动框。例如，我们可以使用head方法显示前10行数据，然后使用interact方法分成多个页面显示：

from IPython.display import display
import pandas as pd
from ipywidgets import interact

df = pd.read_csv('data.csv')

def display_dataframe(df, rows_per_page=10):
    _, total = divmod(len(df), rows_per_page)
    pages = len(df) // rows_per_page + 1 if total > 0 else len(df) // rows_per_page
    def view_page(page_number=0):
        start = page_number*rows_per_page
        end = (page_number+1)*rows_per_page
        end = end if end < len(df) else len(df)
        display(df[start:end])
    interact(view_page, page_number=(0, pages - 1))

display_dataframe(df)

这样，我们就可以按照每页10行的数量显示数据，而无需滚动框。