# Лабораторная работа №4: Кластеризация
## Задание. Вариант 3
Мой вариант 28, поэтому взял 3 вариант

Использовать метод кластеризации по варианту для данных из таблицы 1 по варианту (таблица 9), самостоятельно 
сформулировав задачу. Интерпретировать результаты и оценить, насколько хорошо он подходит для решения сформулированной 
вами задачи.

Вариант 3 - t-SNE

Задача:
Провести кластеризацию хостелов на основе их суммарных оценок (summary.score), расстояния от центра города (Distance)
и категории города (City).

## Описание программы

Программа выполняет кластеризацию данных о хостелах с использованием метода t-SNE. В качестве признаков для 
кластеризации используются суммарная оценка хостела, расстояние от центра города и категория города.

## Как запустить лабораторную работу

1. Установите необходимые библиотеки:

    ```bash
    pip install pandas scikit-learn numpy
    ```

2. Запустите скрипт:

    ```bash
    python main.py
    ```
   
3. Результаты будут сохранены в файле "Clustering.png", а средние значения для каждого кластера выведены в консоль.

## Использованные технологии

- Python
- matplotlib
- Pandas
- scikit-learn

## Что программа делает

Программа читает данные из файла CSV, проводит предобработку, визуализирует кластеры на двумерной диаграмме рассеяния и 
выводит средние значения для каждого кластера.

## Тесты

![Графики моделей](Clustering.png)
![Графики моделей](img.png)

## Вывод

_По графику можно сделать вывод, что только один признак отчётливо прослеживается и это расстояние от центра города. Он 
сыграл ключевую роль в разделении хостелов на два кластера. В целом программа успешно применяет метод t-SNE для 
уменьшения размерности данных и добавляет кластеры на основе полученных значений, но возможно другие методы лучше 
подходят для решения поставленной задачи._

---