Сравнение версий

Ключ

  • Эта строка добавлена.
  • Эта строка удалена.
  • Изменено форматирование.

Классифицировать текст / Classify text

Группа действий: ROBIN AI "Robin AI", подгруппа "Машинное обучение"

...

Действие определяет класс, к которому относится текст, на основе обученной модели классификации, т.е. показывает Действие показывает вероятность вхождения текста в рубрику на основе обученного метода классификации.

Целью выполнения действия является получение той рубрики Цель - получить ту рубрику, к которой скорее ближе всего относится текст (то есть должна быть рубрика с наибольшим процентом точности), чтобы потом предпринять что-то, что нужно делать с текстом из этой рубрики. 

Иконка

Image Added

Параметры

Входные параметры:

  • Текст для классификации   Текст, класс которого необходимо определить. Язык может быть любой. Если будет язык отличный от языка обучающей выборки, то процент определения класса будет близким к нулю.
  • Обученная модель                Путь к папке, которая содержит обученную модель классификации. В папке должно содержаться два файла: machine_model.pkl и tfidf_model.pk Отсутствие какого-то файла или изменение имени папки на другое может привести к ошибке.

Выходные параметры: 

  • Результат  -Словарь, где ключ - название класса, а значение - процент вхождения в данный класс. Сортировка в словаре производится по проценту вхождения в класс.

Настройки

Свойство

Описание

Тип

Пример заполнения

Обязательность заполнения поля

Параметры

Текст для классификации

Текст для классификации

Robin.String


Да

Обученная модель

Путь к папке, которая содержит обученную модель.

Robin.FolderPath

C:\doc\img

Да

Результаты

Результат

Словарь, где Ключ - рубрика, а Значение - процент вхождения в данную рубрику. Сортировка в словаре по проценту вхождения в рубрику.

Robin.Dictionary




Особые условия использования 

1.В папке должно содержаться два файла.  Файлы предоставляются заказчику по требованию.  Данные файлы представляют из себя запакованную модель машинного обучения. 



2.Если какого-то файла нет/другое название, то это приведет к ошибке при работе действия. 

3.Робот вернет ошибку, если:

  • в поле "Обученная модель" указан неверный путь/не содержит обученную модель (один или два файла изменены);
  • в поле "Текст для классификации" указана пустая строка или действие не смогло определить класс.
  1. Робот не вернет ошибку, если:
  • подан текст не на языке обученной модели. будет небольшой % совпадения с классом.


Дополнительная информация о теории классификации текста: https://pro.arcgis.com/ru/pro-app/latest/tool-reference/geoai/how-text-classification-works.htm#:~:text=%D0%9A%D0%BB%D0%B0%D1%81%D1%81%D0%B8%D1%84%D0%B8%D0%BA%D0%B0%D1%86%D0%B8%D1%8F%20%D1%82%D0%B5%D0%BA%D1%81%D1%82%D0%B0%20%E2%80%94%20%D1%8D%D1%82%D0%BE%20%D0%BF%D1%80%D0%BE%D1%86%D0%B5%D1%81%D1%81%20%D0%BF%D1%80%D0%B8%D1%81%D0%B2%D0%BE%D0%B5%D0%BD%D0%B8%D1%8F,%D0%B8%D0%BB%D0%B8%20%D0%B4%D1%80%D1%83%D0%B3%D0%B8%D0%BC%20%D1%84%D0%BE%D1%80%D0%BC%D0%B0%D0%BC%20%D0%BD%D0%B5%D1%81%D1%82%D1%80%D1%83%D0%BA%D1%82%D1%83%D1%80%D0%B8%D1%80%D0%BE%D0%B2%D0%B0%D0%BD%D0%BD%D0%BE%D0%B3%D0%BE%20%D1%82%D0%B5%D0%BA%D1%81%D1%82%D0%B0.

https://vas3k.blog/blog/machine_learning/

https://www.edureka.co/blog/classification-in-machine-learning/

Пример

...

использования

Задача: классифицировать текст на основе обученной модели. 

...

  1. Перенести действие "Классифицировать текст" на рабочую область. 

  2. Заполнить параметры действия "Классифицировать текст". 
    В поле "Текст для классификации" указать следующий текст: 

          


        3. Указать путь к папке, которая содержит обученную модель. 


Image Modified


3. Нажать на кнопку "Старт" в верхней панели.  

...