R:从R中的大型数据集中删除基于列中的值的行数据

由网友([E.X.O])分享简介:我在R中处理104500个观测值的数据集。我想删除基于列名"STATE"的行,该列名为"TX"和"NY"。我正在使用以下代码customers <- customers[customers$State != "TX"]我收到以下错误错误:逻辑索引向量的长度必须是1或11(行数),而不是104541有人能帮我这个忙吗?...

我在R中处理104500个观测值的数据集。我想删除基于列名"STATE"的行,该列名为"TX"和"NY"。

我正在使用以下代码

customers <- customers[customers$State != "TX"]
Excel数据分析的4大技神技 处理数据就这么高效

我收到以下错误

错误:逻辑索引向量的长度必须是1或11(行数),而不是104541

有人能帮我这个忙吗?

推荐答案

我建议您学习如何使用dplyr以及tidyverse中的其他包。我发现它们是清理数据不可或缺的工具。

我将如何使用dplyr在您的数据集中同时筛选出德克萨斯州和纽约州:

library(dplyr)
customers = filter(customers, State != "TX" & State != "NY")

或者

customers = filter(customers, !(State %in% c("TX", "NY")))
阅读全文

相关推荐

最新文章