История страницы
Извлечь адреса
...
Версия 4 (python)
Группа действий: "Robin AI", подгруппа "NER (ROBIN)"
...
Описание
Действие извлекает из указанного текста адреса.
Каждый адрес сохраняется в виде словаря, где ключ – отдельный элемент адреса, а а значения - извлеченные данные.
Варианты значений для ключей словаря:
...
Страна
...
АССР, УССР, УЗССР, ССР, СССР
...
Субъект Российской Федерации
...
федеральный округ, республика, край, область, автономный округ, автономная область
...
Муниципальное образование
...
Административно-территориальная единица
...
Населенный пункт
...
Элемент планировочной структуры
...
Элемент улично-дорожной сети
...
Элемент объекта адресации
...
Тип здания
...
Тип помещения
...
Иконка действия
Параметры и их настройка
Если в одном предложении указаны страна, и город, а в другом предложении списком улица, дом, индекс, то есть в разных предложениях части одной сущности, то они извлекутся как разные адреса в отдельные словари.
Параметры
Входные параметры:
- Текст - текст, из которого будут извлекаться адреса.
- Без вида элемента адреса - параметр, с помощью которого в результирующем словаре будут указаны\не указаны вид элемента адреса. Пример с включенным и выключенным параметром:
- Исходный вид элемента адреса - параметр, с помощью которого адрес будет представлен как в исходном тексте или записан как официальный полный вид элемента адреса. Например, с включенный параметром адрес "улица Ленина" так и будет записан, а если параметр отключен, то адрес в результате будет "ул.Ленина".
Выходные параметры:
- Результат - коллекция словарей с извлеченными адресами. Повторяющиеся в тексте адреса записываются в коллекции один раз.
Настройки
Свойство | Описание | Тип | Пример заполнения | Обязательность |
заполнения поля | ||||
Параметры | ||||
Текст | Текст, из которого будут извлечены адреса |
Строка | Школа Евгении расположена по адресу: Нижегородская область, г.Нижний Новгород, ул.Ленина, д.100 | Да |
Без вида элемента адреса | Если значение "true", то будет указано |
только значение элемента адреса. Если "false", в словаре будут |
записаны значение и вид элемента адреса |
Логический | True | Нет |
Исходный вид элемента адреса | Если значение "true", то вид элемента адреса будет указан как в исходном тексте. Если "false", в словаре будет записан официальный полный вид элемента адреса |
Логический | True | Нет | ||
Результаты | ||||
Результат | Коллекция словарей с извлеченными данными. Если один и тот же адрес встречается в тексте несколько раз, то в результирующей коллекции он будет записан один раз |
Коллекция |
Особые условия использования
- Если в
...
- поле "Текст" заданный текст не имеет какого-либо поля адреса, то значение в словаре вернется пустым. При отсутствии в тексте всех адресообразующих элементов действие вернет пустой результат.
- Словарь всегда создается с полным набором ключей, чтобы не возникало ошибки при обращении к любому ключу словаря.
- Если одновременно отмечены параметры "Без вида элемента адреса" и "Исходный вид элемента адреса", то галочка у "Исходный вид элемента адреса" будет проигнорирована.
- Если в одном предложении указаны страна, и город, а в другом предложении списком улица, дом, индекс, то
...
- есть в разных предложениях части одной сущности, то они извлекутся как разные адреса в отдельные словари, не дополняя друг друга.
В ключ "Полный адрес" попадает вся найденная строка с адресом, а остальные поля будут заполнены согласно ключам словаря.
Робот вернет пустую коллекцию словарей, если:
В исходном тексте не будет найдено ни одного элемента адреса.
Исходный текст на неподдерживаемом языке. В текущей версии поддерживается русский язык.
Ключи словаря адресов:
...
- Страна
- Субъект Российской Федерации
- Муниципальное образование
- Административно-территориальная единица
- Населенный пункт
- Элемент планировочной структуры
- Элемент улично-дорожной сети
- Элемент объекта адресации
- Тип здания
- Тип помещения
- Почтовый индекс
В первый ключ "Полный адрес" попадает вся найденная строка с адресом, а остальные поля будут заполнены согласно ключам словаря.
Робот вернет пустую коллекцию словарей, если:
- в исходном тексте не будет найдено ни одного элемента адреса,
- исходный текст на неподдерживаемом языке. На данный момент поддерживается только русский язык.
Пример использования
Задача: извлечь из текста адрес и получить коллекцию всех значений словаря.
Текст: Школа Евгении расположена по адресу: Нижегородская область, г.Нижний Новгород ,ул.Ленина, д.100
Решение: воспользоваться действиями "Извлечь адреса", "Для каждого", "Получить значения".
Реализация:
- Полный адрес
Справочная таблица
Общепринятые сокращения слов, которые включаются в адрес и адресообразующие элементы приведены в таблице.
Раскрыть | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Пример использования
Задача
Имеется текст для распознавания:
Информация | ||
---|---|---|
| ||
Обращением к архитектуре итальянского ренессанса в 1930-е годы стал знаменитый дом на Моховой, построенный в 1932–1934 годах И.В. Жолтовским по адресу: Россия, Московская область, г. Москва, ул. Моховая, д. 13. Здание строилось по заказу Моссовета как жилой дом. Шестой и седьмой этажи со стороны главного фасада занимали двухэтажные квартиры, во двор выходили комнаты-мастерские высотой в два этажа, застеклённые большими окнами-витражами. |
Необходимо извлечь из текста адреса и записать в имеющийся табличный документ.
Решение
Воспользоваться действиями: "Извлечь адреса", "Получить ключи", "Получить значения", "Открыть", "Установить значения столбца", цикл "Для каждого", "Сохранить".
Реализация
- Перетащить на рабочую область действие "Извлечь адреса".
- Настроить параметры действия "Извлечь адреса".
В поле "Текст" ввести текст для распознавания.
Для параметра "Исходный вид элемента адреса" установить значение "true". - Перетащить на рабочую область действие "Открыть" и настроить параметры действия.
- Перетащить на рабочую область цикл "Для каждого".
- В параметр "Коллекция" цикла "Для каждого" добавить результат действия "Извлечь адреса".
- Перетащить на рабочую область действия "Получить ключи" и "Получить значения" в цикл "Для каждого".
- Настроить параметры действий "Получить ключи" и "Получить значения".
В параметр "Словарь" добавить результат цикла "Для каждого". - Перетащить на рабочую область действия "Установить значения столбца" и "Сохранить".
- Настроить параметры действий "Установить значения столбца".
- Установить контекст - результат действия "Открыть"
- В параметр "Имя столбца" добавить столбцы A и B
- В параметр "Значение ячеек" добавить результаты действий "Получить ключи" и "Получить значения"
- Установить номер начальной строки диапазона
- Собрать схему робота, состоящего из действий:
- Настроить параметр действия "Извлечь адреса". Создать переменную ,которая будет включать в себя целевой текст.
- Настроить параметр действия "Для каждого".
- Настроить параметр действия "Получить значения".
- Нажать на кнопку "Старт" в верхней панели.
Результат
...
Программный робот отработал успешно.
Значения коллекции с извлеченными данными получены.
Извлеченные адреса записаны в табличный документ.
При установке значения "true" параметра "Без вида элемента адреса" действия "Извлечь адреса"
В результирующем словаре не будут указаны виды элементов адреса: