Чтобы из общей выбореи df выделить тестовую df_test или валидационную выборку df_valid:
from sklearn.model_selection import train_test_split
df_train, df_valid = train_test_split(df, test_size=0.25, random_state=5678)
или
df_train, df_test = train_test_split(df, test_size=0.25, random_state=5678)