Python Pandas 系列:快速指南

如果您像我一样,那么您喜欢学习新事物。Python 是实现这一点的绝佳语言。Pandas 是一个很棒的 Python 数据处理库。

在本快速指南中,我将向您展示如何在 Python 中使用 Pandas Series。我们将介绍什么是系列、如何创建系列以及如何操作和访问系列中的数据的基础知识。

那么让我们开始吧!

什么是系列?

Pandas Series 是一个一维数组,存储各种数据类型的数据。我们可以通过索引访问系列的内容,就像访问数组数据一样。pandas 系列最重要的两个关键特征如下。

  • 系列不能包含多列。所以它是一维的。
  • 我们可以使用该方法轻松地将列表、元组和字典转换为系列series()

可以使用以下命令创建 pandas 系列 –

pandas.Series( data, index, dtype )

上述python命令中的参数为:

  • 数据——它可以有多种形式,如数组、列表或常量。
  • 索引– 该值是唯一且可散列的,与数据的长度相同。默认情况下,如果不传递索引,则从0开始,依此类推。
  • dtype – 这是我们输入内容的数据类型。如果没有通过,则进行推断。

让我们创建我们的熊猫系列

现在我们将以不同的方式创建我们的系列,并举例如下。

从 ndarray 创建系列

实施例1

#We need to import both the pandas and numpy libraries to create a series
import pandas as pd
import numpy as np
 
data = np.array(['h','e','l','l','o'])
our_series = pd.Series(data)
#our series created named our_series

我们可以在上面的代码片段中看到,我们刚刚创建了第一个名为 our_series 的 Python 系列。它将创建我们的系列,索引从 0 开始,依此类推。让我们打印这个并看看它是如何创建的。

print (our_series)
0   h
1   e
2   l
3   l
4   o
dtype: object

实施例2

让我们使用相同的方法创建另一个,但在本例中,我们将传递一些手动索引。让我们进入我们的代码片段。

#We need to import both the pandas and numpy libraries to create a series
import pandas as pd
import numpy as np
 
data = np.array(['h','e','l','l','o'])
our_series = pd.Series(data, index=[100,101,102,103,104])
#our series created named our_series

让我们通过打印创建的系列来查看代码片段的输出。

print (our_series)
100   h
101   e
102   l
103   l
104   o
dtype: object

在这里我们可以看到索引与我们在创建系列时传递的值相同。

从字典创建系列

实施例1

#importing the pandas and numpy library
import pandas as pd
import numpy as np
 
data = {'a' : 0., 'b' : 1., 'c' : 2.}
our_series = pd.Series(data)
print (our_series)

可以将字典作为输入传递,如果未指定索引,则按排序顺序获取字典键来构​​造索引。如果索引通过,则优先选择对应的数据作为索引,如下。

print(our_series)
a 0.0
b 1.0
c 2.0
dtype: float64

实施例2

#importing the pandas and numpy library
import pandas as pd
import numpy as np
 
data = {'a' : 0., 'b' : 1., 'c' : 2.}
our_series = pd.Series(data, index=['b','c','a'])

这里我们传递了与字典键对应的手动索引。通过打印创建的系列,我们可以获得如下输出。

print (our_series)
b 1.0
c 2.0
a 0.0
dtype: float64

从标量创建系列

我们将以标量值输入数据,必须提供索引。该值将重复以匹配索引的长度 我们将要使用pandas.Series(). 让我们按照下面的代码片段进行操作。

#import the pandas library and numpy library
import pandas as pd
import numpy as np
 
ssss = pd.Series(5, index=[0, 1, 2, 3])

我们可以通过打印新创建的系列来查看最终的系列。

print(ssss)
0  5
1  5
2  5
3  5
dtype: int64

创建一个空系列

#importing only pandas library as pd
import pandas as pd
 
s = pd.Series()

如果我们打印上面的系列,我们可以得到我们的空系列,如下所示。

print (s)
Series([], dtype: float64)

我们将学习如何使用各自的索引访问系列数据

在这里,我们将检索系列的第一个元素。我们已经知道,索引计数从零开始,这意味着第一个元素存储在第零 位置,依此类推。

import pandas as pd
sss = pd.Series([1,2,3,4,5],index = ['a','b','c','d','e'])
#our series created
 
#retrieving the first element using his index
print (s['a'])

我们将得到如下输出。

1

这样,如果我们打印任何其他索引,我们可以得到如下结果。

print (s[['a','c','d']])
1
3
4
dtype: int64
 
print (sss[0])
1
 
print (sss[4])
5
 
#retieving first three elements
print (sss[:3])
1
2
3
dtype: int64
 
#retrieving the last three elements
print(sss[-3:])
3
4
5
dtype: int64

结论

在本快速指南中,我们了解了 Python Pandas 系列。我们已经了解了如何创建系列、如何操作和访问系列中的数据以及如何对系列执行一些基本操作。我希望本指南对您有所帮助。如果您有任何疑问,请随时在下面的评论中发表。