pandas技巧之 DataFrame中的排序与汇总方法

1. 排序方法

1.1 按列排序

在使用Pandas处理数据的过程中,经常需要对DataFrame的行或列进行排序,以便更好地理解和分析数据。Pandas提供了多种排序方法,其中最常用的是按列排序。

使用sort_values()函数对DataFrame按照某一列的值进行排序。下面是一个示例:

import pandas as pd

data = {'Name': ['Tom', 'Nick', 'John', 'Kevin'],

'Age': [25, 30, 18, 22],

'City': ['New York', 'Paris', 'London', 'Tokyo']}

df = pd.DataFrame(data)

# 按照Age列进行升序排序

df_sorted = df.sort_values('Age')

print(df_sorted)

运行结果如下:

Name Age City

2 John 18 London

3 Kevin 22 Tokyo

0 Tom 25 New York

1 Nick 30 Paris

在上述示例中,我们对DataFrame按照'Age'列进行了升序排序,并将结果保存在df_sorted中。

如果要按照多列进行排序,可以传递一个列表作为参数:df.sort_values(['column1', 'column2'])。DataFrame将先按照column1进行排序,然后在每个column1值的基础上按照column2排序。

1.2 按行排序

除了按列排序,我们还可以按照DataFrame的行进行排序。要按行排序,可以使用sort_index()函数。

下面的示例演示了如何按照行索引对DataFrame进行排序:

import pandas as pd

data = {'Name': ['Tom', 'Nick', 'John', 'Kevin'],

'Age': [25, 30, 18, 22],

'City': ['New York', 'Paris', 'London', 'Tokyo']}

df = pd.DataFrame(data, index=['B', 'A', 'D', 'C'])

# 按照行索引排序

df_sorted = df.sort_index()

print(df_sorted)

运行结果如下:

Name Age City

A Nick 30 Paris

B Tom 25 New York

C John 18 London

D Kevin 22 Tokyo

在上述示例中,我们按照行索引进行了排序,并将结果保存在df_sorted中。

默认情况下,sort_index()函数会按照升序对行索引进行排序。如果要按照降序排序,可以将参数ascending=False传递给sort_index()函数。

以上是对DataFrame进行排序的常用方法,根据需要选择合适的方法即可。

后端开发标签