История страницы
...
Задача классификации - определение типа объекта из двух или более существующих классов.
В зависимости от задачи классификации подбираются подходящие типы классификаторов.
Более подробно о методах классификации можно посмотреть здесь: Обзор методов классификации в машинном обучении с помощью Scikit-Learn (tproger.ru)
Параметры и их настройка
Свойство | Описание | Тип | Пример заполнения | Обязательность заполнения поля |
Параметры | ||||
Данные для обучения | Путь к папке с данными для обучения модели классификации. Внутри папки содержатся подпапки, названия которых – это название класса. Внутри каждой подпапки должны быть txt-файлы с различными текстами, которые соответствуют классу | Путь к папке | C:\Users\123\OneDrive\Рабочий стол\Папка с текстами | Да |
Папка с результатом | Путь к папке, в которую будет сохранена обученная модель классификации | Путь к папке | C:\Users\123\OneDrive\Рабочий стол\Индексация | Да |
Метод | Метод, который будет использоваться для обучения модели классификации. Значение по умолчанию – RandomForest Параметр содержит следующие методы:
| Строка | AdaBoost | Да |
Перезаписать | Если значение «true», и в папке с результатом уже существует файл с таким же именем и расширением, то он будет перезаписан. Если «false», файл перезаписан не будет, и действие вернет ошибку | Логический | true | Нет |
Стоп-слова | Путь к txt-файлу, который содержит стоп-слова, которые не будут учитываться при обучении модели классификации. Каждое стоп-слово должно быть записано на новой строке | Путь к файлу | C:\Users\123\OneDrive\Рабочий стол\Стоп-слова.txt | Нет |
Словосочетания | Путь к txt-файлу, содержащему словосочетания, которые при обучении модели важно не разделять на отдельные слова для сохранения смысла всей фразы. Каждое словосочетание должно быть записано на новой строке | Путь к файлу | C:\Users\123\OneDrive\Рабочий стол\Словосочетания.txt | Нет |
Результаты | ||||
Результат | Процент точности обученной модели | Число |
...
Обзор
Инструменты контента