Извлечь адреса Версия 4 (python)
Группа "Robin AI", подгруппа "NER (ROBIN)"
Описание
Действие извлекает из указанного текста адреса.
Каждый адрес сохраняется в виде словаря, где ключ – отдельный элемент адреса, а значения - извлеченные данные.
Иконка действия
Параметры и их настройка
Свойство | Описание | Тип | Пример заполнения | Обязательность заполнения поля |
Параметры | ||||
Текст | Текст, из которого будут извлечены адреса | Строка | Школа Евгении расположена по адресу: Нижегородская область, г.Нижний Новгород, ул.Ленина, д.100 | Да |
Без вида элемента адреса | Если значение "true", то будет указано только значение элемента адреса. Если "false", в словаре будут записаны значение и вид элемента адреса | Логический | True | Нет |
Исходный вид элемента адреса | Если значение "true", то вид элемента адреса будет указан как в исходном тексте. Если "false", в словаре будет записан официальный полный вид элемента адреса | Логический | True | Нет |
Результаты | ||||
Результат | Коллекция словарей с извлеченными данными. Если один и тот же адрес встречается в тексте несколько раз, то в результирующей коллекции он будет записан один раз | Коллекция |
Особые условия использования
- Если в поле "Текст" заданный текст не имеет какого-либо поля адреса, то значение в словаре вернется пустым. При отсутствии в тексте всех адресообразующих элементов действие вернет пустой результат.
- Словарь всегда создается с полным набором ключей, чтобы не возникало ошибки при обращении к любому ключу словаря.
- Если одновременно отмечены параметры "Без вида элемента адреса" и "Исходный вид элемента адреса", то галочка у "Исходный вид элемента адреса" будет проигнорирована.
- Если в одном предложении указаны страна, и город, а в другом предложении списком улица, дом, индекс, то есть в разных предложениях части одной сущности, то они извлекутся как разные адреса в отдельные словари, не дополняя друг друга.
В ключ "Полный адрес" попадает вся найденная строка с адресом, а остальные поля будут заполнены согласно ключам словаря.
Робот вернет пустую коллекцию словарей, если:
В исходном тексте не будет найдено ни одного элемента адреса.
Исходный текст на неподдерживаемом языке. В текущей версии поддерживается русский язык.
Ключи словаря адресов:
- Страна
- Субъект Российской Федерации
- Муниципальное образование
- Административно-территориальная единица
- Населенный пункт
- Элемент планировочной структуры
- Элемент улично-дорожной сети
- Элемент объекта адресации
- Тип здания
- Тип помещения
- Почтовый индекс
- Полный адрес
Справочная таблица
Общепринятые сокращения слов, которые включаются в адрес и адресообразующие элементы приведены в таблице.
Пример использования
Задача
Имеется текст для распознавания:
Необходимо извлечь из текста адреса и записать в имеющийся табличный документ.
Решение
Воспользоваться действиями: "Извлечь адреса", "Получить ключи", "Получить значения", "Открыть", "Установить значения столбца", цикл "Для каждого", "Сохранить".
Реализация
- Перетащить на рабочую область действие "Извлечь адреса".
- Настроить параметры действия "Извлечь адреса".
В поле "Текст" ввести текст для распознавания.
Для параметра "Исходный вид элемента адреса" установить значение "true". - Перетащить на рабочую область действие "Открыть" и настроить параметры действия.
- Перетащить на рабочую область цикл "Для каждого".
- В параметр "Коллекция" цикла "Для каждого" добавить результат действия "Извлечь адреса".
- Перетащить на рабочую область действия "Получить ключи" и "Получить значения" в цикл "Для каждого".
- Настроить параметры действий "Получить ключи" и "Получить значения".
В параметр "Словарь" добавить результат цикла "Для каждого". - Перетащить на рабочую область действия "Установить значения столбца" и "Сохранить".
- Настроить параметры действий "Установить значения столбца".
- Установить контекст - результат действия "Открыть"
- В параметр "Имя столбца" добавить столбцы A и B
- В параметр "Значение ячеек" добавить результаты действий "Получить ключи" и "Получить значения"
- Установить номер начальной строки диапазона
- Нажать на кнопку "Старт" в верхней панели.
Результат
Программный робот отработал успешно.
Извлеченные адреса записаны в табличный документ.
При установке значения "true" параметра "Без вида элемента адреса" действия "Извлечь адреса"
В результирующем словаре не будут указаны виды элементов адреса: