R语言作为一种广泛应用于统计分析、数据可视化和科学计算的工具,其基本命令是掌握该语言的核心基础,R语言的命令通常通过交互式控制台执行,也可编写为脚本批量运行,以下从数据结构、对象操作、基本计算、数据管理和函数调用五个方面详细介绍R语言的基本命令。

R语言中最常用的数据结构包括向量、矩阵、数据框和列表,向量是R语言的基本单位,可通过c()函数创建,如x <- c(1, 2, 3)创建了一个数值向量,矩阵通过matrix()函数生成,需指定数据、行数和列数,例如mat <- matrix(1:6, nrow=2, ncol=3),数据框是类似表格的结构,用data.frame()函数创建,如df <- data.frame(name=c("Alice", "Bob"), age=c(25, 30)),是数据分析中最常用的结构,列表则可容纳不同类型对象,通过list()函数构建,如lst <- list(num=1:3, char="hello")。
对象操作方面,ls()命令用于查看当前环境中的所有对象,rm()用于删除对象,如rm(x)会删除名为x的对象,str()函数可查看对象的结构,summary()则提供对象的描述性统计,如summary(df)会显示数据框各列的最小值、最大值、中位数等,head()和tail()分别用于查看对象的前几行和后几行,默认显示前6行或后6行,可通过参数调整行数,如head(df, n=10)。
基本计算命令中,算术运算符包括+、-、*、/、^(幂运算),如2^3结果为8,比较运算符如>、<、==、!=用于逻辑判断,如x > 2会返回逻辑向量,逻辑运算符包括&(与)、|(或)、!(非),如(x > 1) & (x < 3)会判断x是否在1和3之间,统计函数如mean()、median()、sd()(标准差)、var()(方差)等,如mean(x)计算x的平均值,sd(x)计算标准差。
数据管理命令中,subset()用于提取子集,如subset(df, age > 25)会筛选age大于25的行,merge()用于合并数据框,类似SQL的join操作,如merge(df1, df2, by="id")以id列为键合并,reshape2包中的melt()和cast()函数可实现数据的宽转长和长转宽操作,处理缺失值时,is.na()用于判断缺失值,na.omit()用于删除含缺失值的行,如na.omit(df)会返回删除缺失值后的数据框。

函数调用方面,R语言通过函数名加括号调用函数,参数可通过位置或名称传递,如mean(x, trim=0.1)计算x的10%截尾均值,自定义函数使用function()关键字,如square <- function(x) {x^2}定义了一个计算平方的函数,apply()系列函数是高效处理数据结构的工具,apply()用于矩阵或数组,lapply()返回列表,sapply()简化为向量,如apply(mat, 1, mean)计算矩阵每行的平均值。
以下是一些常见问题的解答:
FAQs
-
如何检查R语言对象的类型?
可使用class()函数查看对象的类型,如class(x)会返回x的数据类型(如"numeric"、"character"、"data.frame"等),mode()函数也可返回对象的存储模式,如numeric、character等,若x <- c(1, 2, 3),则class(x)返回"numeric",mode(x)也返回"numeric"。(图片来源网络,侵删) -
如何将数据从CSV文件读入R语言?
使用read.csv()函数读取CSV文件,基本语法为data <- read.csv("文件路径.csv"),若文件包含列名,需设置header=TRUE(默认为TRUE);若分隔符不是逗号,可用sep参数指定,如read.csv("file.txt", sep="\t")读取制表符分隔的文件,读取后,可用str(data)检查数据结构,确保导入正确。