Pandas库用于在 python 中创建数据帧。让我们了解使用 Python在循环中创建多个数据帧的过程。数据框就像Python中的容器一样用来存储数据。
这些数据帧用于与机器学习、数据科学和数据分析等不同领域相关的不同应用程序。如果我们有大量分散格式的数据,操作起来会很不方便。为此,Python 在数据框中提供了 Excel 结构。因此,以表格的形式可视化和分析数据变得很容易。
什么是数据框?
数据框是一个简单的容器,以表的形式保存数据。pandas 的库用一行代码创建了这个数据框。数据框提供类似 excel 的可视化结构。数据框被认为是保存数据的二维且可变形式的容器。我们可以同时在单个数据框中添加任何类型的数据,例如字符串、整数、浮点或任何其他类型的数据。
该数据框提供了类似于 Excel 的结构来表示数据。例如,数据始终采用列和行格式。如果我们想在 Excel 中创建一个简单的类似表格的结构,我们可以手动完成。让我们看一下例子。
在 Excel 中创建此表并表示数据非常简单。Python 还提供了类似的结构来以表格形式表示这些数据。
如何创建数据框?
Pandas 的库用于在 python 中创建数据框。‘.DataFrame()’ 有助于在 pandas 库中形成数据帧。让我们看看下面的示例,了解数据帧的详细实现。
1
2
3
4
|
import pandas as pd Test_Data = [ 1 , 2 , 3 , 4 , 5 , 6 , 7 ] Data_Frame = pd.DataFrame( Test_Data, columns = [ 'Index' ]) print (Data_Frame) |
这里,Test_Data 是元素列表,Data_Frame 是包含数据帧的变量。
现在我们可以分析excel和dataframe函数之间的相似性。两者都以类似的方式工作。
Python 中的多个数据框
如果我们有大量数据需要以表格格式可视化,那么我们可以使用“.merge()”函数。“.merge()”函数的确切含义和工作原理是组合不同的数据帧并形成一个新的数据帧。
多个Dataframe的应用
多个数据帧用于处理机器学习和数据科学领域中的大量数据。举个简单的例子,对课堂上的学生进行分析。如果我们想以表格格式收集与学生相关的信息,在这种情况下,使用多个数据框进行可视化变得很容易。学生的信息将以栏的形式插入。考虑一下城市、电话号码、姓名、年级、父母姓名和地址的列。因此,信息将显示为行和列结构。
多个数据帧的 merge() 函数
Merge() 函数用于组合不同的数据帧。例如,如果我们有两个数据帧,我们可以将这些数据帧打印为同一个表的一部分。让我们看一下例子。
1
2
3
4
5
6
7
8
9
10
|
import pandas as pd D1 = pd.DataFrame({ 'id' :[ 1 , 2 , 3 , 4 , 5 ], 'Name' : [ 'A' , 'B' , 'C' , 'D' , 'E' ], 'subject_id' :[ 'Math' , 'English' , 'History' , 'Science' , 'Geography' ]}) D2 = pd.DataFrame({ 'id' :[ 1 , 2 , 3 , 4 , 5 ], 'Name' : [ 'F' , 'G' , 'H' , 'I' , 'J' ], 'subject_id' :[ 'Math' , 'English' , 'History' , 'Science' , 'Geography' ]}) print (pd.merge(D1,D2,on = 'id' )) |
导入第一个 pandas 库。首先,创建 D1 和 D2(两个数据框),其中 2 列具有相同的 ID。这些数据帧是使用“.DataFrame()”函数创建的。为了将这些数据帧表示为单个/组合数据帧,代码中使用了“.merge()”函数。
在此示例中,两个不同的数据帧组合在一起形成一个新的数据帧。通过这种方式,我们可以组合多个数据帧并将它们表示为单个数据帧。这是使用 merge() 函数组合多个数据帧的一种方法。‘.merge()’ 和 ‘.DataFrame()’ 函数之间的唯一区别是 ‘.merge()’ 用于组合数据帧,而另一方面,’.DataFrame()’ 用于创建数据帧在Python中。
在 Python 中使用循环创建多个数据框
现在让我们看看使用 for 循环创建多个数据帧的算法。for 循环用于多次重复函数的单个语句。为了理解这项工作,让我们为不同的主题创建多个数据框。为此,我们将初始化主题列表和一个空字典。python 中的字典有助于将数据保存为键值对。创建字典后,for 循环将应用于主题列表以创建唯一的数据帧。最后,打印字典。让我们来实现代码吧!
1
2
3
4
5
6
7
8
9
10
|
import pandas as pd List = [ 'Maths' , 'Science' , 'Geography' , 'History' , 'English' ] Dictionary = {} for i in List : Dictionary[i] = pd.DataFrame() print ( "Created multiple dataframes in a loop:\n" , Dictionary) |
在此示例中,首先导入 pandas 的库,然后初始化列表和空字典。“for 循环”用于为初始化列表创建单独的数据帧。因此,在打印字典后,我们可以看到为列表的每个元素创建了空数据框。
在这里,我们没有为每列输入任何数据,因此它将被打印为空数据列。
这样,我们就可以在Python语言中使用循环创建多个数据框。
概括
本文主要介绍 Python 中的数据帧。数据框架在数据可视化领域、机器学习和数据科学中发挥着重要作用,其中数据广泛用于预测和分析。本文介绍了数据框的详细信息、如何使用它们、为什么需要数据框、Python 中多个数据框的重要性以及使用循环创建多个数据框的示例。希望您会喜欢这篇文章。
参考
请阅读pandas库的官方文档。