过滤项仅出现一次在一个非常大名单大名单

过滤项仅出现一次在一个非常大名单大名单

由网友(年少轻狂你狂我更狂)分享简介：我有一个大名单（超过100万件），其中包含英文单词：I have a large list(over 1,000,000 items), which contains english words:tokens = ["today", "good", "computer", "people", "good", ......

我有一个大名单（超过100万件），其中包含英文单词：

I have a large list(over 1,000,000 items), which contains english words:

tokens = ["today", "good", "computer", "people", "good", ... ]

我想获得一切只发生一次，在列表中的项目

I'd like to get all the items that occurs only once in the list

现在，我使用：

tokens_once = set(word for word in set(tokens) if tokens.count(word) == 1)

但它真的很慢。我怎么能做出这样快？

but it's really slow. how could I make this faster?

推荐答案

您遍历列表，然后你再这样做的每个元素，这使得O（N²）。如果你使用计数器更换你的计数，您通过独特的列表迭代一次在列表中，然后再次元素，这使得它在最坏的情况下，O（2N），即O（N）。

You iterate over a list and then for each element you do it again, which makes it O(N²). If you replace your count by a Counter, you iterate once over the list and then once again over the list of unique elements, which makes it, in the worst case, O(2N), i.e. O(N).

from collections import Counter

tokens = ["today", "good", "computer", "people", "good"]
single_tokens = [k for k, v in Counter(tokens).iteritems() if v == 1 ]
# single_tokens == ['today', 'computer', 'people']

阅读全文

相关专题：大名单；发布时间：2023-09-11 05:58:45

相关推荐

岸线规划（岸线规划）

风尘误（2009年刘湘如所著书籍）

莱文斯坦距离：从矩阵推断编辑操作矩阵、推断、文斯、距离

的SqlProfileProvider - 你能在项目中使用Profile.GetProfile（）？能

INSTALL_FAILED_EAS_POLICY_REJECTED_PERMISSION？INSTALL_FAILED_E

RcppEigen程序包&quot；#杂注点击诊断弹出窗口警告(&Q；)弹出窗口、程

可靠地检测了我的另一个应用程序正在运行我的、应用程序、正在运

力HTTP，而不是HTTPS只为一个特定的文件只为、而不是、文件、HTTP

乌鲁木齐78路公交车路线细路线图在这里_乌鲁木齐78路公交车路线

五五普法学习心得体会_学习五五普法的心得体会

中秋送什么给父母中秋送什么给父母比较好_中秋送什么给父母中秋

人一天排便几次正常呢_排便困难的偏方

肠粉的做法是什么_肥肠粉的做法

孕早期不能吃什么_孕早期能吃金针菇吗？

金融家蛋糕的做法_千层雪蛋糕的做法

鸽子汤有什么功效与作用(奇异果的功效与作用)

富士山下国语，相关资料是什么

教师座谈会发言稿(教师交流发言稿)

迎国庆主题演讲稿(教师迎国庆主题演讲稿)

节约粮食拒绝浪费的演讲稿(爱惜粮食从我做起)

最新文章

李富真（新罗酒店社长和三星爱宝乐园的负责人）

无损音频（2023最新无损音频百科介绍）

普里多（普里多）

张花岭村（张花岭村）

吴川广州商会（吴川广州商会）

如何获得短信发送的确认为每个联系人/人机器人？人机、如何获得、短

把人分成小组的最大的满意把人、小组、满意、最大

AS3当我用装载机，我总是得到则httpStatus code 200事件虽然则httpS

如何从远程域使用Flash（AS3）调用Flex的SWF？Flash、SWF、Flex

BackgroundWorker的匿名方法？方法、BackgroundWorker

合并2配置文件配置文件

2022年躲春时间几点几分几秒躲春是哪天2022_2022年哪些属相躲春

胃不舒服呕吐会造成那些原因_吃中药胃不舒服有哪些原因

头疼头晕是怎么回事，你可能是颈椎病了_长期头疼头晕是怎么回事

身体虚弱的表现有哪些？身体出现这些状况就要加以重视了_产后身体虚

十二星座中谁最容易分居_十二星座中最漂亮的是谁

绿色保健水果_纯天然保健水果——雪莲果

一般饭后健身好吗_饭后适合哪些健身运动呢

薏米赤小豆汤怎么做？详细步骤交给你！_薏米赤小豆汤的做法和功效有哪

到底什么情况下需要做输卵管造影呢_什么情况下要做输卵管造影呢