从mlogit R包中提取对数正态随机系数

我使用R中的mlogit包来估计一个带有对数正态参数的混合logit模型。软件包运行良好,但是否有办法提取随机系数,特别是非正态分布参数 以Kenneth Train的练习为例,使用R的mlogit包,第22页 library(mlogit) data("Electricity", package = "mlogit") Electr <- mlogit.data(Electricity, id = "id", choice = "choice", vary

无法在linux下安装Cairo包

我在本地下载该软件包并使用atempt进行安装,但出现以下错误: R CMD INSTALL -l /usr/local/lib64/R/library Cairo_1.5-1.tar.gz checking for PNG support in Cairo... yes checking for ATS font support in Cairo... no configure: CAIRO_LIBS=-L/usr/local/lib -lcairo ch

自动索引R中选定包的数据集列表

我正试图从一系列软件包中为所有数据集编制索引。下面的代码有错误,但我不明白为什么: pn<-c("robust","rrcov","robustbase") for(j in 1:length(pn)){ a1<-length(data(package=pn[j])$results[,3]) for(i in 1:a1){ data(cat(as.vector(data(package=pn[j])$results[i,3]),"\n"),packag

for循环输出r中的不同对象

我尝试使用创建多个对象,只是示例不准确: l_gr <- list (1:10, 11:20, 21:30) for (i in 1:length(l_gr)){ grp <- NULL grp[[i]] <- mean(l_gr[[i]]) } 这不是我期望的,而是我需要输出不同类的多个对象,但是名称与I级别不同,例如:这里是grp1、grp2、grp3。 每个对象都有特定i列表的函数输出。很抱歉问这么简单的问题 编辑:响应以提供具体示例: install.

R 将向量与矩阵中的选定元素进行比较

我想比较一个巨大的向量和从R中的矩阵中选择的元素 A是矩阵,B是向量。我想将B的每个元素与A中选定的元素进行比较。C和D是选择标准。它们是与B长度相同的向量。C指定A的行号,D指定列号。A的尺寸为10*100,B、C、D都是长度为72000的向量。带有for循环的代码: for ( j in 1:length(B) ){ E[j] <- B[j] >= A[ C[j], D[j] ] } 这太慢了。我通过定义一个包含第一个元素的向量将其矢量化: A1 <- array(

无法远程执行加载库“rhdfs”的R脚本

我正在使用R-Hadoop进行一个项目,遇到了这个问题 我正在使用JAVA中的JSch来ssh远程hadoop伪集群,下面是创建连接的JAVA代码的一部分 /* Create a connection instance */ Connection conn = new Connection(hostname); /* Now connect */ conn.connect(); /* Authenticate */ boolean isAuthenticated = conn.authentic

Excel中的空白元素:如何在R中将其填充为0

我在Excel中有一个CSV文件,可以使用read.CSV函数读取到R中。但是,在Excel文件中,某些元素为空,表示0。当我将文件读入R时,这些元素仍然是空的。如何在R中将这些元素填充为0?似乎类似is.na的函数不适用于这种情况。谢谢 取决于它们如何读入R。数字列中的空白单元格通常应解释为NA,在这种情况下 your_df$your_column[is.na(your_df$your_column)] <- 0 应该有用。您的问题表明这不起作用,在这种情况下,它们可能会作为空字符读入

R 反应式数据帧

我想访问一个data.frame数据,它在shiny的反应函数中被读入R 数据帧 反应性ggvis图 server.ui 当我检查printstrdata数据结构时,它不是data.frame对象,而是给出以下输出: function () - attr(*, "observable")=Reference class 'Observable' [package "shiny"] with 9 fields ..$ .func :function () ..

R 用于预测数据帧上的值的循环

我有一个数据框,其中有一个日期列和100列,其中包含不同位置的值,应该对这些值进行预测。我使用tbats和来自package forecast的forecast进行预测,这对我从数据框中提取的第一列非常有效。 但是现在我想在所有列上运行一个循环。在该循环中,应为每个列计算拟合模型TBAT,然后通过预测,应在365天内计算所有独立列的未来值 我搞不懂循环,我尝试了不同的方法,比如: for(i in names(test)) df <- data.frame(forecast(tbats(t

R 准备饼图以添加到散点图

在我之前的一篇文章中得到帮助后,我决定做一个饼图的散点图;我遇到的问题是准备单独的饼图进行绘图 我有四个变量,我们把它们叫做firstvar到fourthvar,每个变量都是1或0。我想将饼图的每个象限映射到一个变量,如果该变量为一,则对该象限进行着色,否则将其保留为白色。按照我编写代码的方式,我会有一系列嵌套的ifelse调用,我无法使用它们 非常感谢您的帮助,我的代码如下: test <- c(1,1,1,1) lbls <- c("PY1 NM Sig", "PY2 NM Si

带strsplit-in-R错误的for循环

我想在这篇文章的前言中说,我对R和生物信息学编码是新手,我非常感谢这个知识渊博的社区提供的一些信息。下面代码的目标是生成饼图,显示BLAST结果中每种蛋白质的氨基酸丰度。我从UniProt上传了一个csv文件,将其转换为矩阵,并写出下面的代码。我不断得到错误:在AAs[I]=tabletsrsplitblast_AA_seqs[I]中,useBytes=TRUE:要替换的项目数不是替换长度的倍数。第8列是包含氨基酸序列的输出列。提前谢谢 mydata=read.table("CDPKbeta_B

R 要循环遍历列表中的数据帧列吗

我想循环遍历数据帧列表并更改列名,我希望每个列具有相同的名称 是否有人有使用以下数据的解决方案 df <- data.frame(x = 1:10, y = 2:11, z = 3:12) df2 <- data.frame(x = 1:10, y = 2:11, z = 3:12) df3 <- data.frame(x = 1:10, y = 2:11, z = 3:12) x <- list(df, df2, df3) 使用for循环或apply?如果可能的话,

R ggplot geom点和geom段的颜色问题

我试图从下面的R数据框中绘制一个简单的图。我已复制了以下数据帧的dput输出: structure(list(troponin.cat = c(0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15), percentage = c(0, 13, 29, 40, 47, 53, 57, 60, 62, 65, 66, 67, 69, 70, 71, 78)), .Names = c("troponin.cat", "percentage")

R中的Laplace算子(逆delta)

我试图解决一个由拉普拉斯算子组成的偏微分方程列表。问题是我不知道如何在R中表示拉普拉斯算子。 例如: dX/dt - del(u.X) = 0 在这个方程中,del表示拉普拉斯算子,但我不知道如何用R来写它。 这是Wikipedia链接,其中包含有关此运算符的数学描述。我正在尝试一种化学物质的扩散模型,所以,我在我的ODE模型中使用这个操作符。现在的问题是,我不知道如何用R来编写这个运算符。我正在使用deSolve R包来实现这一点你能用标准数学符号来编写del运算符吗?您需要的另一件事是提供

R 在ldply中将NULL传递给.id将返回错误

我想在不创建.id列的情况下使用ldply。在plyr::ldply文档中,它说 .id传递NULL以避免创建索引列 但是当我尝试这个的时候 require(plyr) foo <- list(rnorm(10),rnorm(10)) ldply(foo, .id=NULL, FUN=mean) 我知道 if is.na.id{:参数长度为零时出错 此外:警告信息: In is.na.id:is.na应用于“NULL”类型的非列表或向量 我遗漏了什么吗?不要输入任何内容,比如ldplyf

R 如何将集合转换为集合成员的指示器?

我所拥有的每一次观察的数据都是一组味道。我想将那些在PostgreSQL中作为text[]数组存在的集合转换为单个味道的存在的指示器,因为我想检查味道是如何结合在一起的 我现在所做的工作正在进行中,但实际上我希望运行更复杂的变体,我有一种预感,即我收集数据的方式远不如它可能的优雅。我尝试使用tidyr和dplyr包,但看不到如何应用它们 有更好的方法使用R吗 以下是一些示例代码: 图书馆PostgreSQL pg任何postgres解决方案都将变得不那么优雅。您必须使用交叉表,这将需要为每种口味

R:如果出现错误,则循环跳过/tryCatch

我有一个1000行的数据帧。我想循环的代码非常简单——我只想让第4列中的所有值都大写。我希望这样,如果任何一行中有错误,我希望它跳过该行并继续到其余的行 我编写了以下代码: for(i in 1:1000) { tryCatch(toupper(Total_Data_2[i,4]), error = function(e) next) } 但是,我得到了一个错误:error in value[[3L]]cond:no-loop for break/next,跳到顶层 有人能帮我吗?我可以试

R闪亮布局-如何将.co xs-[]添加到列?

如何将.co xs-[]添加到Shining布局 比如说, fluidRow( sidebarPanel(... ), mainPanel(... ) ) 我知道 <div class="row"> <div class="col-sm-4"> ... </div> </div> <div class="col-sm-8"> ... </div> </div&g

R:如何将矩阵转换为成对表

以下是我的数据: # dput(df.test) df.test <- structure(c(-0.137235615851502, -0.344759702428411, -0.500276100624054, 0.122807828503122, -0.130924743022576, -0.0542704064363563, 0.039391925478255, 0.243784953115516, 0.0883309513092308, 0.0675697778557

R geom_平滑或带有geom_箱线图的stat_函数

我无法使ggplot2在箱线图中显示geom_平滑或stat_函数 我最终想要在箱线图的顶部显示一个自定义stat_函数 library(ggplot2) #joke dataset, similar looking ish to my own data data=data.frame(date=as.Date(c("2011-02-01","2011-02-01","2011-02-01","2011- 02-01","2011-02-01",

R 聚合函数和表函数之间的差异

然而,我很想知道聚合函数显示了什么 table(df$Tenure) 1 2 3 4 5 15 13 7 这两个输出之间有什么不同?产生差异的原因是您在聚合中包含了unique。您是按任期计算不同年龄的数量,而不是按任期计算年龄。要使用聚合获得类似的输出,请尝试 或者只是加总任期,df,length@G5W我们又见面了。谢谢你的回答。这里有很多常客,我希望答案能有所帮助 table(df$Tenure) 1 2 3 4 5 15 13 7 aggregate(Age~

向量上的函数不在R中工作

我想使用lappy命令在向量上运行函数。这是我的尝试,可复制: set.seed(10101) # define parameters N <- 1000 a <- 0.3 # create vector of variables e <- rnorm(N) l <- rchisq(N, df = 3, ncp = 0) k <- rbeta(N, shape1 = 2, shape2 = 5, ncp = 0) # vector over which

如何在R中从basename的结尾删除文件扩展名?

如何列出文件夹中的数据文件并将其文件名存储在数据帧中,而不将扩展名作为因素?换句话说:如何从省略“.csv”扩展名的文件名列表中创建一个字符向量,并在从这些文件创建数据帧后将该向量存储为数据帧中的因子列表 我的最终目标是将包含我的数据的文件名存储为studyID,作为数据帧中的因子。我认为这是一项非常简单的任务,但我还没有发现正则表达式所需的格式,或者sapply和gsub之间是否存在更改格式的交互 “计划”和“模糊”两个文件夹分别包含名为1.csv、2.csv等的文件,有时带有非序列号。具体而

根据r中的列值将两行合并为一行

请忽略此部分,请看下面的@START HERE 我正在尝试合并以下两行: 像这样排成一行: 以下是创建数据集的代码: dataset <- data.frame(Environment=c("PRODUCTION","PRODUCTION"), Green=c("Yes","No"), Red=c("No","Yes"), Completed=c("Yes",

使用R获取多条Quandl未来曲线

我试图从Quandl上的12条不同的未来曲线中获取沉降值,然后将它们分配到xts对象中。我目前得到的错误 错误:“closure”类型的对象不可子集 只有一列。理想情况下,我希望有十二个列,分别命名为CL1、CL2等 for (i in 1:12) { data1 = Quandl(paste("CHRIS/CME_CL", i, sep = ""), start_date= "2017-01-01", type = "xts") if (i == 1){ CL <- cbind(

R 在面板数据集中处理NAs

假设我有这个数据集: library(data.table) comb <- CJ(1:4, 2005:2008) comb$var3 <- c(1, NA, 2, NA, 3, NA, 4, NA, 5, NA, 6, NA, 7, NA, 8, NA) 我想根据前面的值填充NAs。例如,我希望Id 1和year 2006的值为1。2008年的价值为2。其他ID也一样。最后,数据集应如下所示: library(data.table) comb <- CJ(1:4, 200

R Purrr-系数

第一回归 library(lmtest) library(tidyverse) library(texreg) structure(list(tg = structure(c(1L, 2L, 1L, 1L, 2L, 1L, 1L, 2L, 1L, 2L, 2L, 2L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 2L, 1L, 2L, 1L, 1L, 1L, 1L, 1L, 1L, 2L, 2L, 2L, 2L, 2L, 1L, 1L, 1L, 1L, 1L, 2L, 1L,

如何通过复杂条件将列转换为列表中存储的矩阵和表[R]

我有一个数据框架,其中包含了家庭一天出行的信息 df <- data.frame( hid=c("10001","10001","10001","10001"), mid=c(1,2,3,4), thc=c("010","01010","0","02030"), mdc=c("000","01010","0","02020"), thc1=c(0,0,0,0), thc2=c(1,1,NA,2), thc3=c(0,0,NA,0), thc4=c(NA,1,0,3), thc5=c(NA,

R 自定义函数线性回归

我试图用python实现以下R代码: fit = lm(log(y) ~ log(x1) + log(x2) + x3, data=data); 我知道在sklearn中,你可以用多个变量进行线性回归。然而,我特别想提出上面的公式 欢迎提供任何指导。对x1和x2应用对数变换,然后运行线性回归: import numpy as np from sklearn.linear_model import LinearRegression log_x1 = np.log(x1) log_x2 = n

R 乘以数据帧内的累积乘积

我有一个data.frame,有四列,T,Price,Adjustment\u factor和adjustd Price。因此,通过列Price和Adjustment_factor,我想计算调整后的_价格,如下表所示 T Price Adjustment_factor Adjusted_price ---------------------------------------------------- 2010 78,974 1,000

R ggplot2如何在单个面上叠加标记?

我想用geom_line()facets创建一个ggplot,但我希望一些facets在数据上叠加标记。当前代码示例: sig.1 <- c(rep(c(rep(0,9),2,4,7,10,7,4,2),3),rep(0,7)) sig.2 <- c(rep(c(rep(0,12),10,rep(0,3)),3),rep(0,7)) sig.2.markers <- sig.2*1.2 sig.2.markers[which(sig.2 == 0)] <- NA df

使用多变量聚集/扩散的dplyr重塑df

我正在尝试使用dplyr聚集和扩散函数来改变数据集的形状,以从该数据形状移动: library(tidyverse) # test data set df = tibble(factor = c("a","a","b","b"), factor2 = c("d1","d2","d1","d2"), value1 = round(rnorm(4),1)*10, value2 = round(runif(4),2)*100) 看起来

R 如何根据邮政编码确定地区

我有两个数据帧,一个包含带有邮政编码的数据,另一个包含带有一组邮政编码的区域 我想在Dataframe 1中添加一个基于邮政编码的Regions列,如何才能做到这一点?注意:数据帧2中的区域可以包含多个邮政编码 感谢您的帮助。这可以通过dplyr和tidyr解决。我相信还有其他解决办法 # create the data df1 <- data.frame(pcodes = c(1001, 1002, 1003)) df2 <- data.frame(regions = c(1, 2

R 用一个准则识别顶点序列

我有一个顶点序列列表,如下所示。这是所有简单路径函数的输出 vs <- list(structure(c(B = 1L, C = 3L, C1 = 4L, C2 = 5L, C3 = 6L, X = 7L), class = "igraph.vs"), structure(c(B = 1L, C = 3L, C1 = 4L, C2 = 5L, C3 = 6L, X = 7L, P = 8L), class = "igraph.vs"),

R 尝试重新创建网络时,如何为特定边指定边权重?

因此,我的任务是重新创建一个特定的网络,如下所示: 虽然我已经能够弄清楚如何处理节点,但我不确定如何将每个边指定为宽度。我假设它应该类似于存储为向量的节点颜色/形状。但是,我如何确切地知道哪条边是什么 library(sna) hw2 <- rbind( # 1 2 3 4 5 6 7 8 932 1 2 3 4 8 0 2 c(0,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1), c(1,0,1,1,0,0,0,1,0,0,0,0,0,1,1,1,1),

如何在R中四舍五入到特定的十进制数

我目前有两个全局数据集。一个是气候空间,另一个是物种发生数据。两个数据集都有纬度和经度列。但是,气候空间纬度和经度列为NNN.75或NNN.25。我的事件数据纬度和经度更具体,从NNN.01到NNN.99不等。如何使用R将事件数据四舍五入到最接近的.25或.75点 下面是我如何将发生点舍入到小数点后2位的,但为了加入数据集,我需要匹配纬度和经度值 occurrence <- Solanum_OccurrenceClean %>% mutate_at(vars(lat,lon),

使用dplyr根据两个条件执行两个操作

在下面的数据集中,对于每个id,我已经为m列标记了m_标志,为w列标记了f_标志,即m列或w列中3之后第一次出现1或2 我正在努力: 1如果m缺失,但var 1未缺失,则在3英寸m之前的行中,将m_标志设置为1 然后,将m_标志中的前一个1转换为0 2如果w缺失但变量2不存在,则在w中3之前的行中将f_标志设置为1,例如第7行 然后,将f_标志中的前一个1转换为0,例如第6行 df <- data.frame(id=c(1,1,1, 2,2, 3,3,3, 4,4,4),

R 将降雨量计为雨日

我想计算不同年份在不同地点一个月内降雨的天数 这是我的数据: Location Year Month Day Precipitation A 2008 1 1 0 A 2008 1 2 8.32 A 2008 1 3 4.89 A 2008 1 4 0 我有多达18个地点,年份从2008年到2018年,每年12个月,降水量为0表示那天没有雨 根据可用信息 df <- df %>%

R 当行位置为动态时,将变量指定给数据框中的特定单元格

这里的目标是自动化数据处理管道,在这里我可以读取.csv文件并运行脚本并输出处理后的文件,为数据打印做好准备。我所做的只是对一些列应用一些操作,但自动化一个步骤对我来说并不清楚: 我需要将一列中的值除以另一列中的值,但在除法之前,我需要从特定单元格中减去一个值。但是,在每个不同的.csv中,特定的单元格位置将发生变化,因此我不能简单地将列/行单元格提取为变量并使用它。作为示例数据帧: df<- sampleid t1 t2 a1 4 15 a2

从R中的data.table中删除基于两个条件的行

我有一个data.table,其中包含国家代码和相应的国家名称。在某些情况下,国家不知道,而另一个用于表示未知代码。我的数据不一致,因为对于某些代码,我有国家名称,但也与其他代码有一行,例如爱尔兰或卢森堡 期望输出: code <- c(104, 105, 106, 109, 112, 115) country <- c("GERMANY", "IRLAND", "FRANCE", "FRANCE", "ITALY", "LUXEMBURG") id_country <- cb

R 寻找唯一变量

我有三个数据帧(森林、农业和城市),每个数据帧有一行和24145列(见底部的示例)。每列代表不同的分子式,每个单元格内的值对应于样本中该分子式的相对量(森林、农业和城市) 我正试图找出最好的方法来找出哪种分子式对上述三个样本都是唯一的。例如,如果我有一个分子式(C10H10),对于森林,它的值为0.12,但是对于农业和城市,它的值为0,那么我希望能够得到一个最终产品,它表明特定的分子式只存在于森林样本中 最后,我想用这个最终产品做一个图,我可以在轴上绘制分子式信息(x上的氧碳比和y上的氢碳比),

自定义R帮助文件-字体着色

我想知道是否有可能定制R帮助文件,以便某些文本采用颜色编码,更易于阅读。rdoc已经这样做了,只是它将输出发送到控制台。相反,我希望它被发送到我正在使用Rstudio的帮助面板。有什么解决办法吗 如果我们正常运行?lm,我们可以在下面右侧的“帮助”面板中看到常用的帮助文件,但当您在Rstudio中使用rdoc后再次执行此操作时,我们会得到颜色编码的帮助文件,这很好,但会发送到控制台输出左侧。理想情况下,我们希望它在运行代码时仍显示在帮助面板中。它现在的样子——当你运行某个东西的时候,它就消失了

R中的日期转换问题

我在导入数据的第三列中有一个日期字段作为字符串。我正在尝试将其转换为一个适当的日期字段 mydata[1,3] [1] 04/01/1957 该字段最初是作为因子键入的。我尝试将其转换为具有以下内容的日期: mydata$Date <- as.Date(mydata$Date, "%m/%d/%y") 错误是您使用了%y而不是%y。 %y是两位数的年份,%y是四位数的年份 检查错误在于您使用了%y而不是%y。 %y是两位数的年份,%y是四位数的年份 检查一下,这是重

在tidyverse中通过索引将较小的数据帧连接到较大的数据帧?

假设我有以下数据: df <- data.frame(a=c(1,2,3,4)) index <- data.frame(a=c(1,3), data=c('x', 'y')) 我希望将df和index连接起来,这样我最终得到的结果是df行,但索引$data与适当的索引$a连接在一起。出于某种原因,英语单词让我不及格,但“x”应该应用于1和2,因为索引$a有1,3是下一个索引值,“y”应该应用于3和4 以下是我想用的数据: df2 <- data.frame(a=c(1,2,

R 生成包含两个列表之间所有可能组合的数据帧

您好,我有两个列表: list1<-c("A","B") list2<-c(1,2,3) 解决方案: > expand.grid(list1,list2) 没有我所说的,因为它给出: Var1 Var2 1 A 1 2 B 1 3 A 2 4 B 2 5 A 3 6 B 3 我想你可以试试下面的扩展.grid data.frame( lst1 = lis

R 将两列转换为行以与时间序列数据集中的用户id相对应

我有一个需要修改的时间序列数据集,我想将两列转换为具有每个用户id对应值的行 正如您所看到的,每个用户_id有25个Week和Average.Steps值。我能够使用以下代码按用户id压缩数据集,以创建一个名为Users的新数据集。我提供了以下代码的输出图像: Users <- AllData %>% select(user_id,gender,age,income_level,Province,current_provider,Baseline,Experience,Engage

  1    2   3   4   5   6  ... 下一页 最后一页 共 5861 页