Перейти к основному содержанию
Data scientists
Главное меню
Главная
Вы здесь
Главная
»
Предобработка и анализ данных. Статистика
Навигация
Форумы
Python, pandas
Опубликовано вт, 11/17/2020 - 14:47 пользователем
Ksenia
Источники информации о Pandas
Вывод части таблицы, head()
Подсчет количества уникальных значений столбца и количества их упоминаний методом value_counts()
Подсчет строк, count()
Подсчет количества или суммы значений, count(), sum()
.apply()
.loc поиск/доступ и логическая индексация по условию, логические операции
csv
matplotlib, plt.ylim, plt.xlim
Булев массив и условия
Визуализация
Выбросы
Вырезать лишние столбцы
Графики
Группировка по столбцу
Дата, время, день недели
День недели, месяц, год из даты
Добавление строк, append(row); добавление столбцов
Дубликаты
Категории, таксономия
Обработка ошибок, try-except, .append(row)
Объединение разных строк в единую таблицу. Объединение таблиц.
Объединение таблиц, .merge()
Описание данных столбца, describe()
Ошибки
Пакеты, библиотеки, модули
Перевод в целочисленный формат(int) или в вещественный формат (float)
Переименовать столбцы, заменить индексы
Перемешивание строк shuffle
Проверить тип данных
Пропуски
Работа с несколькими показателями и подсчет долей, сводные таблицы
Сделать столбец индексом index_col=
Среднее и медиана, mean
Срезы, query()
Теория
Уникальные значения в столбце .unique
Фильтр. Выбор строк с нужным значением в столбце, .loc
Циклы. Автоматизация графиков в цикле. Группировка по совпадениям столбца.
Часто используемые команды
Чтение файлов
номер дня недели , dt.weekday
отображение таблиц, max_rows
‹ Предобработка и анализ данных. Статистика
Вверх
Источники информации о Pandas ›
Войдите
или
зарегистрируйтесь
, чтобы отправлять комментарии
Полезная информация
Авторы
Машинное обучение
Предобработка и анализ данных