История страницы
...
Папка с результатом путь к папке, в которую будет сохранена обученная модель классификации.
В указанной папке в результате работы действия должно быть создано 2 файла: machine_model.pkl – модель машинного обучения и tfidf_model.pk – сохранение словаря,
токены.
Метод метод, который будет использоваться для обучения модели классификации.
Значение по умолчанию – RandomForest. Методы базируются на различных алгоритмах классификации.
Параметр содержит следующие методы:
...
Стоп-слова путь к txt-файлу, который содержит стоп-слова, которые не будут учитываться при обучении модели классификации.
Каждое стоп-слово должно быть записано на новой строке. Слова, несущие мало смысла для классификации, но часто встречающиеся, например, в письмах: Доброе утро!,
Добрый день!, С уважением, tel:, email:.
...