Сравнение версий

Ключ

  • Эта строка добавлена.
  • Эта строка удалена.
  • Изменено форматирование.

...

Классифицировать текст Версия 1 (net)

Группа "Robin AI", подгруппа "Классификатор (Preferentum)"

...

Описание

Действие классифицирует текст в соответствии с заданными индексами и определяет его класс

Иконка действия

Image Removed

Параметры

Входные параметры

  1. Контекст - использует результат действия "Открыть классификатор", которое включает в себя путь до папки с классификатором.

  2. Текст - строковое значение, которое необходимо классифицировать.

  3. Многоклассовая классификация - используется для выбора, какое количество классов будет получено в результате.

    Если значение "false", то для текста будет определяться класс с наибольшим процентом вероятности. Если "true", то будут определятся несколько классов, к которым может относиться текст.

  4. Порог уверенности - позволяет установить разницу между первыми двумя рубриками (тематиками), при которой система сможет уверенно отнести текст к единственной рубрике. Параметр учитывается, если "Многоклассовая классификация" = false, иначе параметр игнорируется. 

    • Если процент вхождения ≥ порога уверенности, то "Уверенный результат" =  true

    • Если процент вхождения < порога уверенности, то "Уверенный результат" =  false

  5. Количество классов - максимальное количество классов, которое будет выведено в результирующий словарь.

    Параметр учитывается, если "Многоклассовая классификация" = true, иначе параметр игнорируется. 

    • Если в результирующей выборке в словаре классов больше, чем в "Количество классов", то выводится количество классов, указанное в параметре.

    • Если в результирующей выборке в словаре классов меньше, чем в "Количество классов", то выводится столько классов, сколько было получено.

Выходные параметры

  1. Классы - словарь с результирующей выборкой классов, где ключ - класс, а значение - процент вероятности, т.е. ранг класса
    (отображается в том же виде, что и в классификаторе).

  2. Уверенный результат:

    • Если "Многоклассовая классификация" = false и "Порог уверенности" не заполнен, то "Уверенный результат" = false

    • Если "Многоклассовая классификация" = true, то "Уверенный результат" = false

Настройки

Image Added

Параметры и их настройка

Название

Обязательное

Описание

Тип данных

Действие

Классифицировать текст

Действие классифицирует текст в соответствии с заданными индексами и определяет его класс

Входные параметры

Контекст

Да
Свойство

Описание

Тип

Пример заполнения

Обязательность заполнения поля
Параметры
Контекст

Контекст классификатора для работы действия

Контекст
Robin.Context
Открыть классификатор. КлассификаторДа
Текст
Да
Текст, который необходимо классифицироватьСтрока

Добрый день!

Обновили Robin

.String

до версии Enterprise с оркестратором и теперь система предупреждает об истечении срока действия лицензии через 9 дней.

Подскажите что нужно сделать?

Да
Многоклассовая классификация
Нет
Если "false", то для текста будет определяться класс с наибольшим процентом вероятности. Если "true", то будут определятся несколько классов, к которым может относиться текст. По умолчанию falseЛогический
Robin.Boolean

Нет
Порог уверенности
Нет
Число от 1 до 100, которое определяет, достаточно ли точен результат классификации. Используется, если нужно определить только один класс. Чем выше указанное число, тем больше должна быть разница между двумя наиболее вероятными классами. Параметр учитывается, если "Многоклассовая классификация" = false
Robin.Numeric
Число80Нет
Количество классов
Нет
Максимальное количество классов, которые может вернуть действие. Если при классификации для текста было определено больше классов, действие вернет только указанное количество классов

Robin.Numeric

Выходные параметры
Число5Нет
Результаты
Классы
Словарь с классами, к которым может относиться указанный текст. Ключ - класс, значение ключа - процент вероятности вхождения текста в класс
Robin.Dictionary
Словарь

Уверенный результатЕсли "true", то результат классификации достаточно точен. Если "false", то результат классификации может быть неточным
Robin.Boolean
Логический

Описание работы классификатора

Руководство по использованию системы классификации Preferentum - https://preferentum.ru/wp-content/uploads/2022/04/preferentumclass_manual.pdf.

Класс в классификаторе указан как "Рубрика", а вероятность вхождения в класс указана как "Ранг".

Image RemovedImage Added

  • Алгоритм, когда "Многоклассовая классификация" = false:

...

Система классифицирует текст в возможные рубрики и вычисляет ранг для каждой рубрики. Все соседние рубрики сравниваются между собой по формуле: X/Y, где x - первый ранг, y - последующий ранг. Наибольшее число, полученное при сравнении, определяет какие рубрики не будут входить в результирующий словарь. Действие возвращает словарь с рубриками, которые находились выше по списку рубрики с наибольшим числом сравнения. Рубрика с наибольшим числом сравнения тоже входит в результирующий словарь.

Особые условия использования 

  1. Если параметр "Многоклассовая классификация" = false и текст классифицировался в классы с одинаковым процентом вероятности, то действие завершится ошибкой.

  2. Если параметр "Многоклассовая классификация" = true, "Количество классов" - указано несколько классов, а текст классифицировался в классы с одинаковым процентом вероятности, то действие завершится ошибкой. 
    (Пример: "Количество классов" = 2. Текст классифицировался в три класса, два с одинаковым процентом вероятности = 50, а третий классифицировался с процентом вероятности = 80, действие завершится ошибкой.)

  3. Если текст не классифицировался ни в один класс или у классификатора не имеется классов, то действие завершится ошибкой.

Пример использования

Задача 1

Классифицировать текст на основе обученной модели с определением класса с наибольшим процентом вероятности

Решение

Воспользоваться действием "Классифицировать текст". 

Реализация

Предусловие

Для работы действия "Открыть классификатор" необходима обученная модель классификатора. 
Обучение осуществляется при помощи действия "Создать индекс".

  1. Перенести действие "Открыть классификатор" на рабочую область.

    Image RemovedImage Added

  2. Заполнить параметры действия "Открыть классификатор".

    Указать путь к папке, которая содержит обученную модель. 

    Image RemovedImage Added

  3. Перенести действие "Классифицировать текст" на рабочую область. 

    Image RemovedImage Added

  4. Заполнить параметры действия "Классифицировать текст". 

    1. Указать контекст, полученный в действии "Открыть классификатор".

    2. Установить значение в поле "Порог уверенности"

      Image RemovedImage Added

    3. В поле "Текст" указать следующий текст: 

      Image RemovedImage Added

4. Нажать на кнопку "Старт" в верхней панели.  

Результат

Программный робот отработал успешно.

...

а также подтверждение, что результат классификации достаточно точен ( параметр "Уверенный результат"/"Confident Result" - True).

Image RemovedImage Added

Задача 2

Классифицировать текст на основе обученной модели для определения классов, к которым может относиться текст

Решение

Воспользоваться действием "Классифицировать текст". 

Реализация

Предусловие

Для работы действия "Открыть классификатор" необходима обученная модель классификатора. 
Обучение осуществляется при помощи действия "Создать индекс".

  1. Повторить шаги 1-3 из Задачи 1
  2. Заполнить параметры действия "Классифицировать текст". 
    1. Указать контекст, полученный в действии "Открыть классификатор".
    2. Установить чекбокс "Многоклассовая классификация"
    3. Добавить данные в поле "Количество классов"
      Image RemovedImage Added
    4. В поле "Текст" указать следующий текст: 
      Image RemovedImage Added

...

3. Нажать на кнопку "Старт" в верхней панели.  

Результат

Программный робот отработал успешно.

Получен словарь с классами, к которым может относиться указанный текст, при этом параметр "Уверенный результат"/"Confident Result" - False.

Image RemovedImage Added

Задача 3

Получить результаты действия "Классифицировать текст"

Решение

Воспользоваться действиями "Получить ключи", "Получить значение по индексу" и "Получить значение".

Реализация

  1. Повторить шаги 1-3 из Задачи 2
  2. Перенести действие "Получить ключи" на рабочую область. 
    Image RemovedImage Added
  3. Заполнить параметр "Словарь" действия "Получить ключи" 
    Image RemovedImage Added
  4. Перенести действие "Получить значение по индексу" на рабочую область. 
    Image RemovedImage Added
  5. Заполнить параметры действия "Получить значение по индексу" 
    1. Установить результат действия "Получить ключи" в поле "Коллекция"
    2. Установить индекс коллекции
      Image RemovedImage Added
  6. Перенести действие "Получить значение" на рабочую область. 
    Image RemovedImage Added
  7. Заполнить параметры действия "Получить значение" 
    1. Установить результат действия "Классифицировать текст" в поле "Словарь"
    2. Установить ключ, полученный из действия "Получить значение по индексу"
      Image RemovedImage Added
  8.  Нажать на кнопку "Старт" в верхней панели. 

Результат

Программный робот отработал успешно.

...

  • ключи словаря - классы
  • значение ключей - процент вероятности вхождения текста в класс

Image RemovedImage Added

Значение
параметра 
параметра "Многоклассовая классификация"

в действии

"Классифицировать текст"


Полученные значения в результате работы действия 
"Классифицировать текст"


Многоклассовая классификация = false

Image Removed

Image Added

Image Removed

Image Added

В результате получен один класс, имеющий наибольший процент вероятности, к которому может относиться указанный текст, и процент вероятности вхождения текста в класс



Многоклассовая классификация = true

Image Removed


Image Added

Image Removed

Image Added

В результате получены классы, к которым может относиться указанный текст и процент вероятности вхождения текста в класс
Image Removed

Image Added

Image Removed

Image Added