120 практических задач
Шрифт:
data = pd.read_csv('sports_data.csv')
# Предобработка данных
# Пример: преобразование
data['team1'] = data['team1'].astype('category').cat.codes
data['team2'] = data['team2'].astype('category').cat.codes
# Выбор признаков и целевой переменной
X = data[['team1', 'team2', 'team1_score', 'team2_score', 'team1_wins', 'team2_wins']]
y = data['outcome'] # Целевая переменная (победа/поражение)
# Разделение данных на тренировочную и тестовую выборки
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# Масштабирование признаков
scaler = StandardScaler
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)
# Создание и обучение модели логистической регрессии
model = LogisticRegression
model.fit(X_train, y_train)
# Прогнозирование на тестовых данных
Конец ознакомительного фрагмента.