使用pandas进行数据处理之 Series篇

1. Series简介

在pandas中,Series是一种一维的数据结构,类似于数组或列表。每个Series对象包含一个值序列,并且可以通过索引对序列进行标记。Series可以包含不同类型的数据,包括整数、浮点数、字符串等。

2. 创建Series对象

2.1 使用列表创建Series

可以使用列表创建一个Series对象,列表中的每个元素将成为Series中的一个值。可以通过传递参数给Series构造函数,来指定索引。

import pandas as pd

data = [1, 2, 3, 4, 5]

s = pd.Series(data)

print(s)

输出结果:

0 1

1 2

2 3

3 4

4 5

dtype: int64

上面的例子中,我们创建了一个包含整数的Series,索引从0到4,对应列表中的元素。

2.2 使用字典创建Series

除了使用列表,还可以使用字典来创建Series。字典中的每个键值对将成为Series中的一个项,键将成为索引,值将成为对应项的值。

data = {'a': 1, 'b': 2, 'c': 3, 'd': 4, 'e': 5}

s = pd.Series(data)

print(s)

输出结果:

a 1

b 2

c 3

d 4

e 5

dtype: int64

上面的例子中,我们创建了一个包含整数的Series,索引是字典中的键。

3. Series的基本操作

3.1 访问Series的值

可以通过索引访问Series中的值。可以使用索引值、索引切片或布尔索引来访问特定的值。

s = pd.Series([1, 2, 3, 4, 5], index=['a', 'b', 'c', 'd', 'e'])

print(s['a']) # 访问单个值

print(s[['a', 'c', 'e']]) # 访问多个值

print(s[:3]) # 访问前三个值

print(s[s > 3]) # 使用布尔索引访问大于3的值

输出结果:

1

a 1

c 3

e 5

dtype: int64

a 1

b 2

c 3

dtype: int64

d 4

e 5

dtype: int64

后端开发标签