- загрузить данные из файлов parqet.
- обучить модель, предсказывающую выход клиента в дефолт.
- подготовить автоматизированный пайплайн, который по вызову fit будет готовить данные и обучать модель, а по вызову predict — делать предсказания на заданном наборе данных.
- обученный пайплайн сериализовать в файл pickle.
- Обучена модель классификации, на основе ансамбля деревьев HistGradientBoostingClassifier из библиотеки Sklearn.
- Сконфигурирован pipeline для обучения модели и получения предсказаний.
- Модель сериализована в файл pickle.
- Для получения предсказаний модель обернута в localhost web app, с помощью фреймворка FastApi.
- С помощью библиотеки pydantic, настроена валидация данных, получаемых через API.
- Получено значение метрики roc-auc: 0.7594
- Откройте терминал Bash.
- Клонируйте репозиторий проекта.
git clone https://github.com/MawneIl/CreditRiskModeling.git
- Перейдите в корневой каталог проекта.
cd CreditRiskModeling
- Установите необходимые библиотеки, выполнив команду:
pip install requirements.txt
- Запустите приложение командой:
uvicorn main:app --reload
- Запустите локальное приложение Postman, либо перейдите по ссылке и создайте новый запрос.
- Выполните один из запросов.
- Проверить готовность приложения:
GET>> http://127.0.0.1:8000/status
- Узнать версию приложения и метаданные:
GET>> http://127.0.0.1:8000/version
- Получить предсказание модели:
POST>> http://127.0.0.1:8000/predict
- Для последнего запроса передайте один из json'ов из папки 'samples'. Для этого выберете 'Body -> raw -> JSON -> вставьте данные в поле.
- Для проверки кода, с обучением модели, потребуется тренировочный датасет, он не вложен в репозиторий по причине большого объема, напишите мне и я загружу его в Ваше облако.