IIS_2023_1/malkova_anastasia_lab_3/titanic.py

import pandas as pd
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import train_test_split

data = pd.read_csv('titanic.csv', index_col='Passengerid')
clf = DecisionTreeClassifier(random_state=241)

# Выбираем параметры
Y = data['2urvived']
X = data[['Pclass', 'Age', 'Fare', ]]
print(X)

# Разделяем набор на тренировочные и тестовые данные
X_train, X_test, y_train, y_test = train_test_split(
    X, Y, test_size=0.05, random_state=42)

# Запуск на тренировочных данных
clf.fit(X_train, y_train)

# Точность модели
print(f'Score: {clf.score(X_test, y_test)}')

# Значимость параметров
importances = clf.feature_importances_
print(f'Means: {importances}')
lab3 ready 2023-11-11 22:55:33 +04:00			`import pandas as pd`
			`from sklearn.tree import DecisionTreeClassifier`
			`from sklearn.model_selection import train_test_split`

			`data = pd.read_csv('titanic.csv', index_col='Passengerid')`
			`clf = DecisionTreeClassifier(random_state=241)`

			`# Выбираем параметры`
			`Y = data['2urvived']`
			`X = data[['Pclass', 'Age', 'Fare', ]]`
			`print(X)`

			`# Разделяем набор на тренировочные и тестовые данные`
			`X_train, X_test, y_train, y_test = train_test_split(`
			`X, Y, test_size=0.05, random_state=42)`

			`# Запуск на тренировочных данных`
			`clf.fit(X_train, y_train)`

			`# Точность модели`
			`print(f'Score: {clf.score(X_test, y_test)}')`

			`# Значимость параметров`
			`importances = clf.feature_importances_`
			`print(f'Means: {importances}')`