Python, pandas
Опубликовано вт, 11/17/2020 - 14:47 пользователем Ksenia
- Источники информации о Pandas
- Вывод части таблицы, head()
- Подсчет количества уникальных значений столбца и количества их упоминаний методом value_counts()
- Подсчет строк, count()
- Подсчет количества или суммы значений, count(), sum()
- .apply()
- .loc поиск/доступ и логическая индексация по условию, логические операции
- csv
- matplotlib, plt.ylim, plt.xlim
- Булев массив и условия
- Визуализация
- Выбросы
- Вырезать лишние столбцы
- Графики
- Группировка по столбцу
- Дата, время, день недели
- День недели, месяц, год из даты
- Добавление строк, append(row); добавление столбцов
- Дубликаты
- Категории, таксономия
- Обработка ошибок, try-except, .append(row)
- Объединение разных строк в единую таблицу. Объединение таблиц.
- Объединение таблиц, .merge()
- Описание данных столбца, describe()
- Ошибки
- Пакеты, библиотеки, модули
- Перевод в целочисленный формат(int) или в вещественный формат (float)
- Переименовать столбцы, заменить индексы
- Перемешивание строк shuffle
- Проверить тип данных
- Пропуски
- Работа с несколькими показателями и подсчет долей, сводные таблицы
- Сделать столбец индексом index_col=
- Среднее и медиана, mean
- Срезы, query()
- Теория
- Уникальные значения в столбце .unique
- Фильтр. Выбор строк с нужным значением в столбце, .loc
- Циклы. Автоматизация графиков в цикле. Группировка по совпадениям столбца.
- Часто используемые команды
- Чтение файлов
- номер дня недели , dt.weekday
- отображение таблиц, max_rows