Я совершенно новичок в программировании. Что я пытаюсь сделать: у меня есть csv-файл с идентификаторами в третьей строке и textfile с собранными идентификаторами из Tweepy. Теперь я хочу удалить все идентификаторы в textfile, которые не находятся в списке csv.
Я создал такой код:
#file with the IDs I am looking at
with open("twitter_ids.csv","r") as input:
#file with gathered IDs
with open("all.txt","rw") as output:
if id in output & input:
keep_ids=[]
if id not in output & input:
delete_ids=[]
Я предполагаю, что ваш csv настроен примерно так
Где номера являются идентификаторами. Я предполагаю, что ваш txt-файл имеет идентификатор oen в каждой строке
Сначала мы прочитаем все идентификаторы из csv-файла в набор
Затем мы пройдем через txt-файл и вытащим идентификаторы, которые находятся
id_set
в спискеSay you have a
list
of Twitter IDs:И a
list
» всех » идентификаторов:Это просто пример, но в зависимости от того, сколько элементов у вас есть в каждом из этих списков, вы можете преобразовать их в
set
s для более быстрого поиска членства.В любом случае, есть ли у вас
set
илиlist
, вы можете получить идентификаторы только вtwitter_ids
этом:Это » понимание списка «в основном говорит:» Дайте мне каждый элемент,
twitter_ids
который не является элементомall_ids
. Итак, храните вonly_twitter
Twitter идентификаторы, уникальные дляtwitter_ids
списка.Примечание:
set
объекты в Python действительно хорошо справляются с этим типом проблемы:only_twitter
содержать это:который является тем же результатом, что и выше, элементарно, просто хранится в разностной структуре данных.