如果您像我一样,那么您喜欢学习新事物。Python 是实现这一点的绝佳语言。Pandas 是一个很棒的 Python 数据处理库。
在本快速指南中,我将向您展示如何在 Python 中使用 Pandas Series。我们将介绍什么是系列、如何创建系列以及如何操作和访问系列中的数据的基础知识。
那么让我们开始吧!
什么是系列?
Pandas Series 是一个一维数组,存储各种数据类型的数据。我们可以通过索引访问系列的内容,就像访问数组数据一样。pandas 系列最重要的两个关键特征如下。
- 系列不能包含多列。所以它是一维的。
- 我们可以使用该方法轻松地将列表、元组和字典转换为系列
series()
。
可以使用以下命令创建 pandas 系列 –
pandas.Series( data, index, dtype ) |
上述python命令中的参数为:
- 数据——它可以有多种形式,如数组、列表或常量。
- 索引– 该值是唯一且可散列的,与数据的长度相同。默认情况下,如果不传递索引,则从0开始,依此类推。
- dtype – 这是我们输入内容的数据类型。如果没有通过,则进行推断。
让我们创建我们的熊猫系列
现在我们将以不同的方式创建我们的系列,并举例如下。
从 ndarray 创建系列
实施例1
#We need to import both the pandas and numpy libraries to create a series import pandas as pd import numpy as np data = np.array([ 'h' , 'e' , 'l' , 'l' , 'o' ]) our_series = pd.Series(data) #our series created named our_series |
我们可以在上面的代码片段中看到,我们刚刚创建了第一个名为 our_series 的 Python 系列。它将创建我们的系列,索引从 0 开始,依此类推。让我们打印这个并看看它是如何创建的。
print (our_series) 0 h 1 e 2 l 3 l 4 o dtype: object |
实施例2
让我们使用相同的方法创建另一个,但在本例中,我们将传递一些手动索引。让我们进入我们的代码片段。
#We need to import both the pandas and numpy libraries to create a series import pandas as pd import numpy as np data = np.array([ 'h' , 'e' , 'l' , 'l' , 'o' ]) our_series = pd.Series(data, index = [ 100 , 101 , 102 , 103 , 104 ]) #our series created named our_series |
让我们通过打印创建的系列来查看代码片段的输出。
print (our_series) 100 h 101 e 102 l 103 l 104 o dtype: object |
在这里我们可以看到索引与我们在创建系列时传递的值相同。
从字典创建系列
实施例1
#importing the pandas and numpy library import pandas as pd import numpy as np data = { 'a' : 0. , 'b' : 1. , 'c' : 2. } our_series = pd.Series(data) print (our_series) |
可以将字典作为输入传递,如果未指定索引,则按排序顺序获取字典键来构造索引。如果索引通过,则优先选择对应的数据作为索引,如下。
print (our_series) a 0.0 b 1.0 c 2.0 dtype: float64 |
实施例2
#importing the pandas and numpy library import pandas as pd import numpy as np data = { 'a' : 0. , 'b' : 1. , 'c' : 2. } our_series = pd.Series(data, index = [ 'b' , 'c' , 'a' ]) |
这里我们传递了与字典键对应的手动索引。通过打印创建的系列,我们可以获得如下输出。
print (our_series) b 1.0 c 2.0 a 0.0 dtype: float64 |
从标量创建系列
我们将以标量值输入数据,必须提供索引。该值将重复以匹配索引的长度 。我们将要使用pandas.Series()
. 让我们按照下面的代码片段进行操作。
#import the pandas library and numpy library import pandas as pd import numpy as np ssss = pd.Series( 5 , index = [ 0 , 1 , 2 , 3 ]) |
我们可以通过打印新创建的系列来查看最终的系列。
print (ssss) 0 5 1 5 2 5 3 5 dtype: int64 |
创建一个空系列
#importing only pandas library as pd import pandas as pd s = pd.Series() |
如果我们打印上面的系列,我们可以得到我们的空系列,如下所示。
print (s) Series([], dtype: float64) |
我们将学习如何使用各自的索引访问系列数据
在这里,我们将检索系列的第一个元素。我们已经知道,索引计数从零开始,这意味着第一个元素存储在第零个 位置,依此类推。
import pandas as pd sss = pd.Series([ 1 , 2 , 3 , 4 , 5 ],index = [ 'a' , 'b' , 'c' , 'd' , 'e' ]) #our series created #retrieving the first element using his index print (s[ 'a' ]) |
我们将得到如下输出。
1 |
这样,如果我们打印任何其他索引,我们可以得到如下结果。
print (s[[ 'a' , 'c' , 'd' ]]) a 1 c 3 d 4 dtype: int64 print (sss[ 0 ]) 1 print (sss[ 4 ]) 5 #retieving first three elements print (sss[: 3 ]) a 1 b 2 c 3 dtype: int64 #retrieving the last three elements print (sss[ - 3 :]) c 3 d 4 e 5 dtype: int64 |
结论
在本快速指南中,我们了解了 Python Pandas 系列。我们已经了解了如何创建系列、如何操作和访问系列中的数据以及如何对系列执行一些基本操作。我希望本指南对您有所帮助。如果您有任何疑问,请随时在下面的评论中发表。