如果您熟悉数据科学领域,那么您就会知道 R 和 python 是两种非常重要的语言。数据科学几乎在每个行业都有其应用,从财务部门到医疗保健再到营销等等。
为什么我们需要这些语言?
在数据科学领域,R 是使用最广泛的开源语言。它通常用于结构化和非结构化数据的统计分析和数据可视化。与其他数据科学语言相比,R 支持许多功能。
Python 是一种面向对象的高级编程语言。它是一种多功能、完全解释性的编程语言,具有许多优点,经常用于简化庞大而复杂的数据收集。
另请阅读:适用于 Python 的 Jupyter Notebook – 综合指南
在 Google Colab 中将 R 与 Python 结合使用
现在,Google Colab(协作实验室)允许任何人通过浏览器编写和执行任意 Python 代码,特别适合机器学习、数据分析和教育。
默认情况下,Colab 创建一个 Python 笔记本,但也可以在 Colab 中创建一个 R 笔记本。为此,请点击以下链接。
https://colab.research.google.com/#create=true&language=r
要在同一个笔记本中同时使用 R 和 python,我们需要首先激活 rpy2 包。
% load_ext rpy2.ipython |
rpy2 是一个高级接口,使 R 函数成为像 Python 函数一样的对象,并提供到 NumPy 和 pandas 数据结构的无缝转换。激活后,单元格会以Python语言正常执行,并通过添加额外的方法以R语言执行代码。
方法是——细胞魔法和线条魔法。
1. 细胞魔法
这用于用 R 语言运行整个单元。单元格的第一行必须是下面给出的行,之后从第二行开始我们可以开始用 R 语言编写代码,它将成功执行。
% % R ...... ..... |
2. 线条魔法
这用于运行 R 语言中的单行代码。该单元格可以包含 python 语言的其他代码行。包含以下代码的行将在 R 中执行。
% R ........... |
基本实现
安装包和库
在同一个笔记本中使用 R 和 Python 的最佳部分是,通过将库直接导入到 Colab 笔记本中,可以在 Python 中使用 R 提供的所有包。这使得数据科学家或任何从事项目的人员的工作更加高效。
将数据从一种语言导入到另一种语言
考虑开发一个同时使用 python 和 R 语言的项目。使用 rpy2 和 magic 命令,可以将数据帧从一种语言转换为另一种语言
Python 到 R
% R - i df_1 |
R 到 Python
% R - o df_i |
概括
R 和 Python 都是数据科学领域广泛使用的语言。有时可能会出现需要使用两种语言的情况。在本文中,我们讨论了这种情况的解决方案。我们已经学会了如何在 google colab 平台上的单个笔记本中使用两种语言。