Сравнение версий

Ключ

  • Эта строка добавлена.
  • Эта строка удалена.
  • Изменено форматирование.

...

Задача классификации - определение типа объекта из двух или более существующих классов.
В зависимости от задачи классификации подбираются подходящие типы классификаторов. 
Более подробно о методах классификации можно посмотреть здесь: Обзор методов классификации в машинном обучении с помощью Scikit-Learn (tproger.ru)

Иконка действия

Параметры и их настройка

СвойствоОписаниеТипПример заполненияОбязательность заполнения поля
Параметры
Данные для обученияПуть к папке с данными для обучения модели классификации. Внутри папки содержатся подпапки, названия которых – это название класса. Внутри каждой подпапки должны быть txt-файлы с различными текстами, которые соответствуют классуПуть к папкеC:\Users\123\OneDrive\Рабочий стол\Папка с текстамиДа
Папка с результатомПуть к папке, в которую будет сохранена обученная модель классификацииПуть к папкеC:\Users\123\OneDrive\Рабочий стол\ИндексацияДа
МетодМетод, который будет использоваться для обучения модели классификации. Значение по умолчанию – RandomForest

Параметр содержит следующие методы: 

  1. Выбрать наиболее подходящий
  2. SVC (Support Vector Machines) – метод опорных векторов 
  3. RandomForest – метод случайного леса
  4. GradientBoosting – градиентный бустинг
  5. AdaBoost (Adaptive Boosting) – адаптивный бустинг
  6. DecisionTree (Decision Tree Classifier) – классификатор дерева решений 
  7. KNeighboors (K-Nearest Neighbors) – метод k-ближайших соседей
  8. Naive Bayes – наивный байесовский метод
СтрокаAdaBoostДа
ПерезаписатьЕсли значение «true», и в папке с результатом уже существует файл с таким же именем и расширением, то он будет перезаписан. Если «false», файл перезаписан не будет, и действие вернет ошибкуЛогическийtrueНет
Стоп-словаПуть к txt-файлу, который содержит стоп-слова, которые не будут учитываться при обучении модели классификации. Каждое стоп-слово должно быть записано на новой строкеПуть к файлуC:\Users\123\OneDrive\Рабочий стол\Стоп-слова.txtНет
СловосочетанияПуть к txt-файлу, содержащему словосочетания, которые при обучении модели важно не разделять на отдельные слова для сохранения смысла всей фразы. Каждое словосочетание должно быть записано на новой строкеПуть к файлуC:\Users\123\OneDrive\Рабочий стол\Словосочетания.txtНет
Результаты
РезультатПроцент точности обученной моделиЧисло

...