R教程:使用R的快速入门指南

作者 : IT 大叔 本文共2979个字,预计阅读时间需要8分钟 发布时间: 2020-08-28

R教程:使用R的快速入门指南插图

编程语言R非常受欢迎。无论您是看它提供的10,000个软件包还是它是第六大最受欢迎的编程语言,毫无疑问R越来越流行。随着数据科学和机器学习等领域的发展,R的使用随之而来。

那么,为什么要使用R?R编程语言甚至是什么?今天,我们将提供R编程语言的入门指南,以便您可以开始使用这种流行的通用语言。

今天,我们将介绍:

  • R的简史
  • R概述
  • R的实际用途
  • R工具,软件包和语法
  • 创建您的第一个R应用程序
  • 接下来要学什么

向Scratch学习R。

学习编程语言的秘诀是实践。动手使用Educative的交互式学习平台。

R的简史

R编写是S编程语言,它是由约翰·钱伯斯在贝尔实验室创造的实现。

R由新西兰奥克兰大学的Robert Gentleman和Ross Ihaka创建。该团队将S与词汇作用域语义相结合以创建R。R项目最初是在1992年构思的,然后在1995年首次发布。2000年2月29日,发布了稳定的beta版本。

R概述

R是用于统计计算图形的编程语言和环境。R提供了各种各样的统计信息(线性和非线性建模,经典统计检验,聚类,时间序列分析,分类等)和图形技术。它也是高度可扩展的。

以前,S语言是统计方法论研究的流行选择。当R发布时,它是参与此活动的开源途径,自那以后开始流行。

环境

R是用于数据处理,计算器和图形的一套软件工具和环境。它提供的一些功能包括:

  • 强大的数据处理和存储功能
  • 一组运算符,可用于数组和特定矩阵的计算
  • 大量集成的数据分析工具
  • 用于数据分析并显示在屏幕或硬拷贝上的图形功能
  • 强大,全面,简单的编程语言,包括条件,循环,用户定义的递归函数和输入/输出功能

术语“环境”用于将R描述为系统,而不是简单地描述为编程语言。R通常与其他数据分析工具一起使用。

为什么要使用R?

  • 开源和免费: R是根据GNU通用公共许可的条款免费下载的。如果您想了解引擎盖下的实际情况,可以查看源代码。除此之外,您还可以使用相同的许可证访问大量R软件包。您也可以在商业应用中使用。
  • 流行度: IEEE发布了最受欢迎的编程语言列表,该列表在2020年排名第六,并一直稳定在该排名附近。R比C#这样的通用语言更受欢迎,这表明R语言特别是对R编程语言的兴趣日益增加,以及数据科学和机器学习等领域的普遍增长。
  • 在所有平台上运行:您可以在所有流行的平台上找到R的发行版:Windows,Linux和Mac。此外,在一个平台上编写的R代码可以轻松转换为另一个平台,几乎没有问题。正如Microsoft寻求使其所有平台都可用的Microsoft所看到的那样,R的跨平台互操作性在当今的计算世界中至关重要。
  • 就业市场:美国的数据科学家平均年薪超过100,000美元。许多数据科学家角色要求您了解R编程语言。尽管知道R不会自动为您找到工作,但由于数据科学家需要使用各种工具来工作,因此R编程经验将帮助您在其他申请人中脱颖而出。
  • 技术巨头的采用:如果技术巨头采用编程语言,则表明该语言的潜力和发展。由于R的简单性和强大功能,公司正在做出使用R编程语言和环境的明智决策。例如,Twitter使用R监视用户体验,使用福特分析社交媒体,使用纽约时报信息图表。

R教程:使用R的快速入门指南插图(2)

R难学吗?

R并不比任何其他语言都难,尤其是如果您已经对C或C ++等较旧的语言有一定的经验。

许多年前,大多数人会说R是一门难学的语言。它不仅令人困惑,而且结构也不够好。为了解决这些问题,Hadley Wickham创建了一个名为tidyverse的软件包的集合,这使数据操作更加直观。

现在,可以轻松地通过R实现用于机器学习的最佳算法。从软件包到Keras到TensorFlow到Xgboost,在使用R语言时,您已经提供了非常强大的功能。

除此之外,R已经发展为允许并行化运算以加快其计算速度。该软件包允许您同时执行任务,而不是仅执行一项。

R的实际用途

那么,R在计算机工程领域的主要用途是什么?R用于:

  • 统计推断
  • 数据分析
  • 机器学习
  • 执行科学模拟
  • 行动调查

统计计算

R编程语言最初是由统计学家为统计学家构建的。R是迄今为止统计学家最流行的编程语言。R的语法使研究人员可以轻松地从各种来源导入,清理和分析其数据。除此之外,R还提供了广泛而强大的制图功能,这意味着您可以绘制数据并创建可视化效果。

数据科学

在许多方面,数据科学家都是具有其他技能的统计学家:计算机编程技能。R使数据科学家能够实时收集数据,执行预测和统计形式的分析,创建可视化效果,并将结果传达给必要的利益相关者。R是数据科学家最喜欢的工具。

机器学习(ML)

R通常用于预测分析和ML。R生态系统提供的一些有用的软件包包括线性和非线性回归,决策树,线性和非线性分类等等。R可以在零售,市场营销,金融等领域实现ML算法。

真实示例

仅用三行代码,您就可以生成10,000个随机分布的数字。那就是R的力量。如果我们编写这段代码:

n <- floor(rnorm(10000, 500, 100))
t <- table(n)
barplot(t)

在右下角,您将可以看到以下图表:

R教程:使用R的快速入门指南插图(4)
  • 代码的第一行以正态分布模式生成一个10,000个随机数的列表,以使这些数字的平均值为500,标准差为100。该floor函数将列表中的所有数字都删除,并删除小数点。
  • 对于第二行代码,表格函数采用10,000个数字并计算每个数字的频率。
  • 在代码的第三行中,barplot函数获取此频率表,并根据数据创建条形图。

R工具,软件包和语法

现在我们对R及其使用有了更多的了解,让我们开始使用R语法。这是我们实际上在R中编写代码以使计算机做出相应响应的方式。我们还需要学习用R编写所需的工具和软件包。让我们深入研究。

工作空间

工作区是当前的工作ř环境,其中包括用户设计的对象,例如矩阵,向量,数据帧,列表和功能。会话结束后,您可以保存当前工作空间的图像,再次启动R后将自动重新加载该图像。

图形用户界面

除了内置的R控制台外,RStudio是最受欢迎的R编辑器,它可以将R与Windows,MacOS和Linux平台接口。

R中的运算符

R的运算符看起来与其他编程语言相似。一些算术运算符包括:

  • + -加法
  • - -减法
  • * -乘法
  • / -除法
  • ^ -求幂

逻辑运算符包括:

  • > - 比...更棒
  • >= -大于或等于
  • == -完全等于
  • != - 不等于

资料类型

R具有五种主要数据类型。在R语言中,如果更改变量中的数据,则先前的信息将被删除。因此,每种数据类型都需要一个唯一的名称。

R教程:使用R的快速入门指南插图(6)

创建变量

变量用于存储数据。它们的价值可以根据需要进行更改,使用和操纵。赋予变量(函数或对象)的唯一名称称为identifier

注意:在R中,标识符可以包含字母,数字和一个句点的组合。还有一个下划线。但是,它们必须以字母或句点开头。如果以句点开头,则不能跟数字。

要声明变量,我们需要为变量分配一个标识符。使用<-赋值运算符创建一个新变量。

R中的方法

方法就像可以应用于代码的内置操作一样。让我们看一下两种流行的方法,以熟悉它们在R中的工作方式。

列出变量

我们可以使用关键字检查在工作区中创建的所有变量ls()。在下面尝试一下。

免责声明:
1. 本站资源转自互联网,源码资源分享仅供交流学习,下载后切勿用于商业用途,否则开发者追究责任与本站无关!
2. 本站使用「署名 4.0 国际」创作协议,可自由转载、引用,但需署名原版权作者且注明文章出处
3. 未登录无法下载,登录使用金币下载所有资源。
IT小站 » R教程:使用R的快速入门指南

常见问题FAQ

没有金币/金币不足 怎么办?
本站已开通每日签到送金币,每日签到赠送五枚金币,金币可累积。
所有资源普通会员都能下载吗?
本站所有资源普通会员都可以下载,需要消耗金币下载的白金会员资源,通过每日签到,即可获取免费金币,金币可累积使用。

发表评论