由网友([E.X.O])分享简介:我在R中处理104500个观测值的数据集。我想删除基于列名"STATE"的行,该列名为"TX"和"NY"。我正在使用以下代码customers <- customers[customers$State != "TX"]我收到以下错误错误:逻辑索引向量的长度必须是1或11(行数),而不是104541有人能帮我这个忙吗?...![Excel数据分析的4大技神技 处理数据就这么高效](https://p.xsw88.cn/allimgs/daicuo/20230904/68.png)
我在R中处理104500个观测值的数据集。我想删除基于列名"STATE"的行,该列名为"TX"和"NY"。
我正在使用以下代码
customers <- customers[customers$State != "TX"]
![Excel数据分析的4大技神技 处理数据就这么高效](https://p.xsw88.cn/allimgs/daicuo/20230904/68.png)
我收到以下错误
错误:逻辑索引向量的长度必须是1或11(行数),而不是104541
有人能帮我这个忙吗?
推荐答案
我建议您学习如何使用dplyr
以及tidyverse
中的其他包。我发现它们是清理数据不可或缺的工具。
我将如何使用dplyr
在您的数据集中同时筛选出德克萨斯州和纽约州:
library(dplyr)
customers = filter(customers, State != "TX" & State != "NY")
或者
customers = filter(customers, !(State %in% c("TX", "NY")))
相关推荐
最新文章