поиск дубликатов

Дубликаты, .duplicated(), .drop_duplicates(), value_counts()

Опубликовано чт, 11/19/2020 - 18:34 пользователем Ksenia

Для избавления от полных дубликатов duplicated() и drop_duplicates()
1) duplicated()
df.duplicated().sum()
возвращает количество дубликатов

df['col'].duplicated().sum()
возвращает количество дубликатов в столбце col

2) .value_counts()
анализирует столбец, выбирает каждое уникальное значение и подсчитывает частоту его встречаемости в списке
df['col'].value_counts()
Покажет все уникальные значения в столбце "col", а также, сколько раз встречается каждое из них.

Подробнее о Дубликаты, .duplicated(), .drop_duplicates(), value_counts()
Войдите или зарегистрируйтесь, чтобы отправлять комментарии

Главное меню

Навигация

поиск дубликатов

Дубликаты, .duplicated(), .drop_duplicates(), value_counts()

Полезная информация

Главное меню

Вы здесь

Навигация

поиск дубликатов

Дубликаты, .duplicated(), .drop_duplicates(), value_counts()

Полезная информация