История страницы
Извлечь адреса
...
Версия 4 (python)
Группа действий: "Robin AI", подгруппа "NER (ROBIN)"
...
Описание
Действие извлекает из указанного текста адреса.
Каждый адрес сохраняется в виде словаря, где ключ – отдельный элемент адреса, а значения - извлеченные данные.
...
Иконка действия
Параметры и их настройка
Свойство | Описание | Тип | Пример заполнения | Обязательность |
заполнения поля | ||||
Параметры | ||||
Текст | Текст, из которого будут извлечены адреса | Строка | Школа Евгении расположена по адресу: Нижегородская область, г. |
Robin.String
Нижний Новгород, ул.Ленина, д.100 | Да | |||
Без вида элемента адреса | Если значение "true", то будет указано только значение элемента адреса. Если "false", в словаре будут записаны значение и вид элемента адреса | Логический | True | Нет |
Исходный вид элемента адреса | Если значение "true", то вид элемента адреса будет указан как в исходном тексте. Если "false", в словаре будет записан официальный полный вид элемента адреса | Логический | True | Нет |
Результаты | ||||
Результат | Коллекция словарей с извлеченными данными. Если один и тот же адрес встречается в тексте несколько раз, то в результирующей коллекции он будет записан один раз |
Коллекция |
Особые условия использования
...
- Если в поле "Текст" заданный текст не имеет какого-либо поля адреса, то значение в словаре вернется пустым. При отсутствии в тексте всех адресообразующих элементов действие вернет пустой результат.
- Словарь всегда создается с полным набором ключей, чтобы не возникало ошибки при обращении к любому ключу словаря.
- Если одновременно отмечены параметры "Без вида элемента адреса" и "Исходный вид элемента адреса", то галочка у "Исходный вид элемента адреса" будет проигнорирована.
- Если в одном предложении указаны страна, и город, а в другом предложении списком улица, дом, индекс, то есть в разных предложениях части одной сущности, то они извлекутся как разные адреса в отдельные словари, не дополняя друг друга.
В ключ "Полный адрес" попадает вся найденная строка с адресом, а остальные поля будут заполнены согласно ключам словаря.
Робот вернет пустую коллекцию словарей, если:
- в
В исходном тексте не будет найдено ни одного элемента адреса
, .
исходный Исходный текст на неподдерживаемом языке.
Только русский поддерживаем пока что.В текущей версии поддерживается русский язык.
Ключи словаря адресов:
- Страна
- Субъект Российской Федерации
- Муниципальное образование
- Административно-территориальная единица
- Населенный пункт
- Элемент планировочной структуры
- Элемент улично-дорожной сети
- Элемент объекта адресации
- Тип здания
- Тип помещения
- Почтовый индекс
- Полный адрес
Справочная таблица
Общепринятые сокращения слов, которые включаются в адрес
...
и адресообразующие элементы приведены в таблице.
Раскрыть | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Пример использования
Задача
Имеется текст для распознавания:
Информация | ||
---|---|---|
| ||
Обращением к архитектуре итальянского ренессанса в 1930-е годы стал знаменитый дом на Моховой, построенный в 1932–1934 годах И.В. Жолтовским по адресу: Россия, Московская область, г. Москва, ул. Моховая, д. 13. Здание строилось по заказу Моссовета как жилой дом. Шестой и седьмой этажи со стороны главного фасада занимали двухэтажные квартиры, во двор выходили комнаты-мастерские высотой в два этажа, застеклённые большими окнами-витражами. |
Необходимо извлечь из текста адреса и записать в имеющийся табличный документ.
Решение
Воспользоваться действиями: "Извлечь адреса", "Получить ключи", "Получить значения", "Открыть", "Установить значения столбца", цикл "Для каждого", "Сохранить".
Реализация
- Перетащить на рабочую область действие "Извлечь адреса".
- Настроить параметры действия "Извлечь адреса".
В поле "Текст" ввести текст для распознавания.
Для параметра "Исходный вид элемента адреса" установить значение "true". - Перетащить на рабочую область действие "Открыть" и настроить параметры действия.
- Перетащить на рабочую область цикл "Для каждого".
- В параметр "Коллекция" цикла "Для каждого" добавить результат действия "Извлечь адреса".
- Перетащить на рабочую область действия "Получить ключи" и "Получить значения" в цикл "Для каждого".
- Настроить параметры действий "Получить ключи" и "Получить значения".
В параметр "Словарь" добавить результат цикла "Для каждого". - Перетащить на рабочую область действия "Установить значения столбца" и "Сохранить".
- Настроить параметры действий "Установить значения столбца".
- Установить контекст - результат действия "Открыть"
- В параметр "Имя столбца" добавить столбцы A и B
- В параметр "Значение ячеек" добавить результаты действий "Получить ключи" и "Получить значения"
- Установить номер начальной строки диапазона
- Нажать на кнопку "Старт" в верхней панели.
Результат
Программный робот отработал успешно.
Извлеченные адреса записаны в табличный документ.
При установке значения "true" параметра "Без вида элемента адреса" действия "Извлечь адреса"
В результирующем словаре не будут указаны виды элементов адреса:
...
Субъект Российской Федерации
...
Муниципальное образование
...
Административно-территориальная единица
...
Населенный пункт
...
Элемент планировочной структуры
...
Элемент улично-дорожной сети
...
Элемент объекта адресации
...
Тип здания
...
Тип помещения
...
Каждый найденный адрес будет записан в словарь, где ключами являются поля адреса, а значениями извлеченные данные.
Если в поданном тексте нет искомого поля, то оно вернется пустым. Ошибки не будет. Чтобы робот не ломался, если пользователь захочет вытащить этот ключ.
Если в одном предложении указаны страна, и город, а в другом предложении списком улица, дом, индекс, то есть в разных предложениях части 1 сущности, то они извлекутся как разные адреса в отдельные словари, не дополняя друг друга.
Ключи словаря адресов:
- Полный адрес
- Страна
- Субъект Российской Федерации
- Муниципальное образование
- Административно-территориальная единица
- Населенный пункт
- Элемент планировочной структуры
- Элемент улично-дорожной сети
- Элемент объекта адресации
- Тип здания
- Тип помещения
- Почтовый индекс
В первый ключ "Полный адрес" попадает вся найденная строка с адресом, а остальные поля будут заполнены согласно ключам словаря.
Пример использования
Задача:
Решение:
Реалзиация:
Результат: