1. Series简介
在pandas中,Series是一种一维的数据结构,类似于数组或列表。每个Series对象包含一个值序列,并且可以通过索引对序列进行标记。Series可以包含不同类型的数据,包括整数、浮点数、字符串等。
2. 创建Series对象
2.1 使用列表创建Series
可以使用列表创建一个Series对象,列表中的每个元素将成为Series中的一个值。可以通过传递参数给Series构造函数,来指定索引。
import pandas as pd
data = [1, 2, 3, 4, 5]
s = pd.Series(data)
print(s)
输出结果:
0 1
1 2
2 3
3 4
4 5
dtype: int64
上面的例子中,我们创建了一个包含整数的Series,索引从0到4,对应列表中的元素。
2.2 使用字典创建Series
除了使用列表,还可以使用字典来创建Series。字典中的每个键值对将成为Series中的一个项,键将成为索引,值将成为对应项的值。
data = {'a': 1, 'b': 2, 'c': 3, 'd': 4, 'e': 5}
s = pd.Series(data)
print(s)
输出结果:
a 1
b 2
c 3
d 4
e 5
dtype: int64
上面的例子中,我们创建了一个包含整数的Series,索引是字典中的键。
3. Series的基本操作
3.1 访问Series的值
可以通过索引访问Series中的值。可以使用索引值、索引切片或布尔索引来访问特定的值。
s = pd.Series([1, 2, 3, 4, 5], index=['a', 'b', 'c', 'd', 'e'])
print(s['a']) # 访问单个值
print(s[['a', 'c', 'e']]) # 访问多个值
print(s[:3]) # 访问前三个值
print(s[s > 3]) # 使用布尔索引访问大于3的值
输出结果:
1
a 1
c 3
e 5
dtype: int64
a 1
b 2
c 3
dtype: int64
d 4
e 5
dtype: int64