Проект находится в файле nlp_project.ipynb
Интернет-магазин запускает новый сервис. Теперь пользователи могут редактировать и дополнять описания товаров, как в вики-сообществах. То есть клиенты предлагают свои правки и комментируют изменения других. Магазину нужен инструмент, который будет искать токсичные комментарии и отправлять их на модерацию.
-
Провести предобработку данных: лемматизировать текст, убрать стоп-слова и прочие символы, и тд
-
Обучить модель классифицировать комментарии на позитивные и негативные. В нашем распоряжении набор данных с разметкой о токсичности правок.
-
Постройте модель со значением метрики качества F1 не меньше 0.75.
pandas
numpy
spacy
sklearn
lightgbm
catboost