groupby()

Циклы. Автоматизация графиков в цикле. Группировка по совпадениям столбца.

Опубликовано чт, 12/03/2020 - 10:40 пользователем Ksenia

Группировка по совпадениям столбца и подсчет количества совпадений для каждого из вариантов
df.groupby(col1').count()

То же но с текстом:
for name1, result1 in df.groupby('col1'):
----print('Текст1 до вставки {} текст2 {} текст3'.format(name1, len(result1))

for name1, result1 in df.groupby('col2'):
----result1.hist(column = 'col3', bins=10 )

for name1, result1 in df.groupby('col2'):
----result1.plot(kind='hist', y='col3', title = name1, bins=10)

Подробнее о Циклы. Автоматизация графиков в цикле. Группировка по совпадениям столбца.
Войдите или зарегистрируйтесь, чтобы отправлять комментарии

Сводные таблицы, .pivot_table() или .groupby() и .agg()

Опубликовано чт, 11/19/2020 - 16:09 пользователем Ksenia

1. С помощью .pivot_table()

Аргументы метода:
• index — столбцы, по которым группируют данные (идет в левый столбец)
• columns — столбец, по значениям которого происходит группировка (идет в строку-шапку)
• values — значения, которые будут использованы (будут в ячейках)
• aggfunc — функция, применяемая к значениям (например суммирование)

pivot_table_name = old_table_name.pivot_table(index=['col', 'col3'], columns='old_source_to_make_head_line', values='col4', aggfunc='sum')