Сравнение версий

Ключ

  • Эта строка добавлена.
  • Эта строка удалена.
  • Изменено форматирование.

...

  • Результат                 Результат показывает  процент точности обученной модели, полученный путем сравнения тестовой и тренировочной выборки  в процентном соотношении

Настройки               


Свойство

Описание

Тип данных

Пример заполнения

Обязательное

Параметры



Данные для обученияПуть к папке с данными для обучения модели классификации. Внутри папки содержатся подпапки, названия которых – это название класса. Внутри каждой подпапки должны быть txt-файлы с различными текстами, которые соответствуют классу.

Robin.FolderPath


Да

Папка с результатом

Путь к папке, в которую будет сохранена обученная модель классификации.




Robin.FolderPath
Да
Метод

Метод, который будет использоваться для обучения модели классификации.

Robin.String
Да

Перезаписать

Если значение "true", и в папке с результатом уже существует файл с таким же именем и расширением, то он будет перезаписан. Если "false", файл перезаписан не будет, и действие вернет ошибку.Robin.Boolean
Нет

Стоп-слова

Путь к txt-файлу, который содержит стоп-слова, которые не будут учитываться при обучении модели классификации. Каждое стоп-слово должно быть записано на новой строке.

Robin.FilePath
Нет
СловосочетанияПуть к txt-файлу, содержащему словосочетания, которые при обучении модели важно не разделять на отдельные слова для сохранения смысла всей фразы. Каждое словосочетание должно быть записано на новой строке.Robin.FilePath
Нет
Результаты



РезультатПроцент точности обученной модели.Robin.Numeric

Особые условия использования

  1. В списке при смене языка студии на английский "Выбрать наиболее подходящий" сменяется на "Choose the most suitable", остальные варианты остаются на английском.
  2. При невыполнении условий проверки параметров робот будет выдавать следующие сообщения об ошибках:
УсловиеИсключениеТекст сообщений об ошибках
Проверки для параметра "Путь к исходной папке"

Если в имени пути превышена допустимая длинаValidationErrorПревышено ограничение на длину имени пути "{folder_path}"
Если в имени пути используются недопустимые символыValidationErrorНедопустимые символы в имени пути "{folder_path}"
Если директория не найденаDirectoryNotFoundДиректория "{folder_path}" не найдена
Если путь не является директориейDirectoryNotFoundРесурс "{folder_path}" не является директорией
Если к папке нет доступаDirectoryNotAvailableОшибка доступа к "{folder_path}" для чтения
Проверки для параметра "Путь к папке с результатом"

Если в имени пути превышена допустимая длинаValidationErrorПревышено ограничение на длину имени пути "{folder_path}"
Если в имени пути используются недопустимые символыValidationErrorНедопустимые символы в имени пути "{folder_path}"
Если директория не найденаDirectoryNotFoundДиректория "{folder_path}" не найдена
Если путь не является директориейDirectoryNotFoundРесурс "{folder_path}" не является директорией
Если у папки нет доступаDirectoryNotAvailableОшибка доступа к "{folder_path}" для записи
Проверка для файла machine_model.pkl, который будет сохранен в "Путь к папке с результатом"

Если файл уже существует и не выбран параметр "Перезаписать"FileAlreadyExistsФайл по пути: {result_file_path} уже существует
Проверка для файла tfidf_model.pk, который будет сохранен в "Путь к папке с результатом"

Если файл уже существует и не выбран параметр "Перезаписать"FileAlreadyExistsФайл по пути: {result_file_path} уже существует
Проверка для параметра "Пользовательские стоп-слова"

Если в имени пути превышена допустимая длинаValidationErrorПревышено ограничение на длину имени пути "{folder_path}"
Если в имени пути используются недопустимые символыValidationErrorНедопустимые символы в имени пути "{folder_path}"
Если файл не найденFileNotFoundФайл "{file_path}" не найден
Если путь не является файломFileNotFoundРесурс "{folder_path}" не является файлом
Если у файла нет доступаFileNotAvailableОшибка доступа к "{folder_path}" для чтения
Ошибка чтения файла, например неправильная кодировкаValidationErrorОшибка чтения .txt файла по пути {filepath}: {ex}
У входного файла расширение не .txtValidationErrorФайл по пути {list_words_path} имеет неверное расширение. Допустимые значения: .txt
Проверка для параметра "Словосочетания"

Если в имени пути превышена допустимая длинаValidationErrorПревышено ограничение на длину имени пути "{folder_path}"
Если в имени пути используются недопустимые символыValidationErrorНедопустимые символы в имени пути "{folder_path}"
Если файл не найденFileNotFoundФайл "{file_path}" не найден
Если путь не является файломFileNotFoundРесурс "{folder_path}" не является файлом
Если у файла нет доступаFileNotAvailableОшибка доступа к "{folder_path}" для чтения
Ошибка чтения файла, например неправильная кодировкаValidationErrorОшибка чтения .txt файла по пути {filepath}: {ex}
У входного файла расширение не .txtValidationErrorФайл по пути {list_words_path} имеет неверное расширение. Допустимые значения: .txt



Если после прохода по папкам и очистки текстов нет ни одного текста для обученияValidationErrorОшибка входных данных: нет подходящих данных или данные пустые

 Более подробно о методах обучения модели классификации можно посмотреть тут:   

...