Извлечь адреса Версия 4 (python)
Группа "Robin AI", подгруппа "NER (ROBIN)"
Описание
Действие извлекает из указанного текста адреса.
Каждый адрес сохраняется в виде словаря, где ключ – отдельный элемент адреса, а значения - извлеченные данные.
Иконка действия

Параметры и их настройка
Свойство | Описание | Тип | Пример заполнения | Обязательность заполнения поля |
Параметры |
Текст | Текст, из которого будут извлечены адреса | Строка | Школа Евгении расположена по адресу: Нижегородская область, г.Нижний Новгород, ул.Ленина, д.100 | Да |
Без вида элемента адреса | Если значение "true", то будет указано только значение элемента адреса. Если "false", в словаре будут записаны значение и вид элемента адреса
| Логический | True | Нет |
Исходный вид элемента адреса | Если значение "true", то вид элемента адреса будет указан как в исходном тексте. Если "false", в словаре будет записан официальный полный вид элемента адреса | Логический | True | Нет |
Результаты |
Результат | Коллекция словарей с извлеченными данными. Если один и тот же адрес встречается в тексте несколько раз, то в результирующей коллекции он будет записан один раз | Коллекция |
|
|
Особые условия использования
- Если в поле "Текст" заданный текст не имеет какого-либо поля адреса, то значение в словаре вернется пустым. При отсутствии в тексте всех адресообразующих элементов действие вернет пустой результат.
- Словарь всегда создается с полным набором ключей, чтобы не возникало ошибки при обращении к любому ключу словаря.
- Если одновременно отмечены параметры "Без вида элемента адреса" и "Исходный вид элемента адреса", то галочка у "Исходный вид элемента адреса" будет проигнорирована.
- Если в одном предложении указаны страна, и город, а в другом предложении списком улица, дом, индекс, то есть в разных предложениях части одной сущности, то они извлекутся как разные адреса в отдельные словари, не дополняя друг друга.
В ключ "Полный адрес" попадает вся найденная строка с адресом, а остальные поля будут заполнены согласно ключам словаря.
Робот вернет пустую коллекцию словарей, если:
Ключи словаря адресов:
- Страна
- Субъект Российской Федерации
- Муниципальное образование
- Административно-территориальная единица
- Населенный пункт
- Элемент планировочной структуры
- Элемент улично-дорожной сети
- Элемент объекта адресации
- Тип здания
- Тип помещения
- Почтовый индекс
- Полный адрес
Справочная таблица
Общепринятые сокращения слов, которые включаются в адрес и адресообразующие элементы приведены в таблице.
| Субъекты Российской Федерации | АССР | Республика | респ., республики | УССР | Край | край | УЗССР | Область | обл. | ССР | Город федерального значения | г.ф.з. | СССР | Автономная область | а.обл., автоном. область | Автономный округ | а.окр., автоном. округ | Муниципальные образования | Административно-территориальные единицы |
---|
Муниципальный район | м.р-н | Поселение | пос. | Городской округ | г.о. | Городское поселение | г.п. | Район | р-н | Сельское поселение | с.п. | Внутригородской район | вн.р-н | Сельсовет | с/с | Внутригородская территория (внутригородское муниципальное образование) города федерального значения | вн.тер.г. | Населенные пункты | Элементы планировочной структуры |
---|
Город | г. | Берег | б-г | Поселок городского типа | пгт. | Вал | вал | Рабочий поселок | рп. | Жилой район | ж/р | Курортный поселок | кп. | Зона (массив) | зона | Городской поселок | гп. | Квартал | кв-л | Поселок | п. | Микрорайон | мкр. | Аал | аал | Остров | ост-в | Арбан | арбан | Парк | парк | Аул | аул | Платформа | платф. | Выселки | в-ки | Промышленный район | п/р | Городок | г-к | Район | р-н | Заимка | з-ка | Сад | сад | Починок | п-к | Сквер | сквер | Кишлак | киш. | Территория | тер. | Поселок при станции (поселок станции) | п. ст. | Территория садоводческих некоммерческих объединений граждан | тер. СНО | Поселок при железнодорожной станции | п. ж/д ст. | Территория огороднических некоммерческих объединений граждан | тер. ОНО | Железнодорожный блокпост | ж/д бл-ст | Территория дачных некоммерческих объединений граждан | тер. ДНО | Железнодорожная будка | ж/д б-ка | Территория садоводческих некоммерческих товариществ | тер. СНТ | Железнодорожная ветка | ж/д в-ка | Территория огороднических некоммерческих товариществ | тер. ОНТ | Железнодорожная казарма | ж/д к-ма | Территория дачных некоммерческих товариществ | тер. ДНТ | Железнодорожный комбинат | ж/д к-т | Территория садоводческих потребительских кооперативов | тер. СПК | Железнодорожная платформа | ж/д пл-ма | Территория огороднических потребительских кооперативов | тер. ОПК | Железнодорожная площадка | ж/д пл-ка | Территория дачных потребительских кооперативов | тер. ДПК | Железнодорожный путевой пост | ж/д п.п. | Территория садоводческих некоммерческих партнерств | тер. СНП | Железнодорожный остановочный пункт | ж/д о.п. | Территория огороднических некоммерческих партнерств | тер. ОНП | Железнодорожный разъезд | ж/д рзд. | Железнодорожная станция | ж/д ст. | Территория дачных некоммерческих партнерств | тер. ДНП | Местечко | м-ко | Деревня | д., дер. | Территория товарищества собственников недвижимости | тер. ТСН | Село | с. | Слобода | сл. | Территория гаражно-строительного кооператива | тер. ГСК | Станция | ст. | Станица | ст-ца | Усадьба | ус. | Улус | у. | Территория фермерского хозяйства | тер.ф.х. | Хутор | х. | Разъезд | рзд. | Юрты | ю. | Зимовье | зим. | Совхоз | свх | Элементы улично-дорожной сети | Элементы объектов адресации |
---|
Аллея | ал. | Здание | зд. | Бульвар | б-р | Домовладение | двлд. | Взвоз | взв. | Владение | влд. | Въезд | взд. | Земельный участок | з/у | Дорога | дор. | Сооружение | coop. | Заезд | ззд. | Дом | д. | Километр | км | Объект незавершенного строительства | ОНС | Кольцо | к-цо | Коса | коса | Типы зданий | Линия | лн. | Корпус | к. | Магистраль | мгстр. | Строение | стр. | Набережная | наб. | Шахта | шах. | Переезд | пер-д | Гараж | г-ж | Переулок | пер. | Котельная | кот. | Площадка | пл-ка | Типы помещений | Площадь | пл. | Квартира | кв. | Проезд | пр-д | Комната | ком. | Просек | пр-к | Офис | офис | Просека | пр-ка | Павильон | пав. | Проселок | пр-лок | Помещение | пом. | Проспект | пр-кт | Рабочий участок | раб.уч. | Проулок | проул. | Склад | скл. | Разъезд | рзд. | Торговый зал | торг.зал | Ряд(ы) | ряд | Цех | цех | Сквер | с-р | Подвал | подв. | Спуск | с-к |
| | Съезд | сзд. |
|
| Тракт | тракт |
|
| Тупик | туп. |
|
| Улица | ул. |
|
| | ш. |
|
|
|
Пример использования
Задача
Имеется текст для распознавания:
Обращением к архитектуре итальянского ренессанса в 1930-е годы стал знаменитый дом на Моховой, построенный в 1932–1934 годах И.В. Жолтовским по адресу: Россия, Московская область, г. Москва, ул. Моховая, д. 13. Здание строилось по заказу Моссовета как жилой дом. Шестой и седьмой этажи со стороны главного фасада занимали двухэтажные квартиры, во двор выходили комнаты-мастерские высотой в два этажа, застеклённые большими окнами-витражами. |
Необходимо извлечь из текста адреса и записать в имеющийся табличный документ.
Решение
Воспользоваться действиями: "Извлечь адреса", "Получить ключи", "Получить значения", "Открыть", "Установить значения столбца", цикл "Для каждого", "Сохранить".
Реализация
- Перетащить на рабочую область действие "Извлечь адреса".

- Настроить параметры действия "Извлечь адреса".
В поле "Текст" ввести текст для распознавания.

Для параметра "Исходный вид элемента адреса" установить значение "true".

- Перетащить на рабочую область действие "Открыть" и настроить параметры действия.


- Перетащить на рабочую область цикл "Для каждого".

- В параметр "Коллекция" цикла "Для каждого" добавить результат действия "Извлечь адреса".

- Перетащить на рабочую область действия "Получить ключи" и "Получить значения" в цикл "Для каждого".

- Настроить параметры действий "Получить ключи" и "Получить значения".
В параметр "Словарь" добавить результат цикла "Для каждого".


- Перетащить на рабочую область действия "Установить значения столбца" и "Сохранить".

- Настроить параметры действий "Установить значения столбца".
- Установить контекст - результат действия "Открыть"
- В параметр "Имя столбца" добавить столбцы A и B
- В параметр "Значение ячеек" добавить результаты действий "Получить ключи" и "Получить значения"
- Установить номер начальной строки диапазона


- Нажать на кнопку "Старт" в верхней панели.
Результат
Программный робот отработал успешно.

Извлеченные адреса записаны в табличный документ.

При установке значения "true" параметра "Без вида элемента адреса" действия "Извлечь адреса"

В результирующем словаре не будут указаны виды элементов адреса:
