Извлечь адреса Версия 4 (python)
Группа "Robin AI", подгруппа "NER (ROBIN)"
Описание
The action extracts the address from the text. Each address is stored as a dictionary, where the key is a separate element of the address
Иконка действия

Параметры
Входные параметры
- Текст – текст, из которого будут извлекаться адреса.
- Без вида элемента адреса – параметр, с помощью которого в результирующем словаре будут указаны/не указаны вид элемента адреса.
- Исходный вид элемента адреса – параметр, с помощью которого адрес будет представлен как в исходном тексте или записан как официальный полный вид элемента адреса. Например, с включенный параметром адрес "г. Нижний Новгород" так и будет записан, а если параметр отключен, то адрес в результате будет "Нижний Новгород".
Выходные параметры
Настройки
Property
| Description
| Type
| Filling example
| Mandatory field |
Parameters
|
Text | The text from which the addresses will be extracted
| String | Школа Евгении расположена по адресу: Нижегородская область, г.Нижний Новгород, ул.Ленина, д.100 | Yes |
Without the address element type | If the value is «true», only the name of the address element will be specified. If «false», the name and type of the address element will be recorded in the dictionary | Boolean | true | No |
The original view of the address element | If the value is «true», then the type of the address element will be specified as in the source text. If «false», the dictionary will record the official full view of the address element | Boolean | true | No |
Results
|
Result | A collection of dictionaries with extracted data. If the same address occurs several times in the text, then it will be recorded once in the resulting collection
| Collection |
|
|
Особые условия использования
- Если в поле "Текст" заданный текст не имеет какого-либо поля адреса, то значение в словаре вернется пустым. При отсутствии в тексте всех адресообразующих элементов действие вернет пустой результат.
- Словарь всегда создается с полным набором ключей, чтобы не возникало ошибки при обращении к любому ключу словаря.
- Если одновременно отмечены параметры "Без вида элемента адреса" и "Исходный вид элемента адреса", то галочка у "Исходный вид элемента адреса" будет проигнорирована.
- Если в одном предложении указаны страна, и город, а в другом предложении списком улица, дом, индекс, то есть в разных предложениях части одной сущности, то они извлекутся как разные адреса в отдельные словари, не дополняя друг друга.
В ключ "Полный адрес" попадает вся найденная строка с адресом, а остальные поля будут заполнены согласно ключам словаря.
Робот вернет пустую коллекцию словарей, если:
Справочная таблица
Общепринятые сокращения слов, которые включаются в адрес и адресообразующие элементы приведены в таблице.
| Субъекты Российской Федерации | АССР | Республика | респ., республики | УССР | Край | край | УЗССР | Область | обл. | ССР | Город федерального значения | г.ф.з. | СССР | Автономная область | а.обл., автоном. область | Автономный округ | а.окр., автоном. округ | Муниципальные образования | Административно-территориальные единицы |
---|
Муниципальный район | м.р-н | Поселение | пос. | Городской округ | г.о. | Городское поселение | г.п. | Район | р-н | Сельское поселение | с.п. | Внутригородской район | вн.р-н | Сельсовет | с/с | Внутригородская территория (внутригородское муниципальное образование) города федерального значения | вн.тер.г. | Населенные пункты | Элементы планировочной структуры |
---|
Город | г. | Берег | б-г | Поселок городского типа | пгт. | Вал | вал | Рабочий поселок | рп. | Жилой район | ж/р | Курортный поселок | кп. | Зона (массив) | зона | Городской поселок | гп. | Квартал | кв-л | Поселок | п. | Микрорайон | мкр. | Аал | аал | Остров | ост-в | Арбан | арбан | Парк | парк | Аул | аул | Платформа | платф. | Выселки | в-ки | Промышленный район | п/р | Городок | г-к | Район | р-н | Заимка | з-ка | Сад | сад | Починок | п-к | Сквер | сквер | Кишлак | киш. | Территория | тер. | Поселок при станции (поселок станции) | п. ст. | Территория садоводческих некоммерческих объединений граждан | тер. СНО | Поселок при железнодорожной станции | п. ж/д ст. | Территория огороднических некоммерческих объединений граждан | тер. ОНО | Железнодорожный блокпост | ж/д бл-ст | Территория дачных некоммерческих объединений граждан | тер. ДНО | Железнодорожная будка | ж/д б-ка | Территория садоводческих некоммерческих товариществ | тер. СНТ | Железнодорожная ветка | ж/д в-ка | Территория огороднических некоммерческих товариществ | тер. ОНТ | Железнодорожная казарма | ж/д к-ма | Территория дачных некоммерческих товариществ | тер. ДНТ | Железнодорожный комбинат | ж/д к-т | Территория садоводческих потребительских кооперативов | тер. СПК | Железнодорожная платформа | ж/д пл-ма | Территория огороднических потребительских кооперативов | тер. ОПК | Железнодорожная площадка | ж/д пл-ка | Территория дачных потребительских кооперативов | тер. ДПК | Железнодорожный путевой пост | ж/д п.п. | Территория садоводческих некоммерческих партнерств | тер. СНП | Железнодорожный остановочный пункт | ж/д о.п. | Территория огороднических некоммерческих партнерств | тер. ОНП | Железнодорожный разъезд | ж/д рзд. | Железнодорожная станция | ж/д ст. | Территория дачных некоммерческих партнерств | тер. ДНП | Местечко | м-ко | Деревня | д., дер. | Территория товарищества собственников недвижимости | тер. ТСН | Село | с. | Слобода | сл. | Территория гаражно-строительного кооператива | тер. ГСК | Станция | ст. | Станица | ст-ца | Усадьба | ус. | Улус | у. | Территория фермерского хозяйства | тер.ф.х. | Хутор | х. | Разъезд | рзд. | Юрты | ю. | Зимовье | зим. | Совхоз | свх | Элементы улично-дорожной сети | Элементы объектов адресации |
---|
Аллея | ал. | Здание | зд. | Бульвар | б-р | Домовладение | двлд. | Взвоз | взв. | Владение | влд. | Въезд | взд. | Земельный участок | з/у | Дорога | дор. | Сооружение | coop. | Заезд | ззд. | Дом | д. | Километр | км | Объект незавершенного строительства | ОНС | Кольцо | к-цо | Коса | коса | Типы зданий | Линия | лн. | Корпус | к. | Магистраль | мгстр. | Строение | стр. | Набережная | наб. | Шахта | шах. | Переезд | пер-д | Гараж | г-ж | Переулок | пер. | Котельная | кот. | Площадка | пл-ка | Типы помещений | Площадь | пл. | Квартира | кв. | Проезд | пр-д | Комната | ком. | Просек | пр-к | Офис | офис | Просека | пр-ка | Павильон | пав. | Проселок | пр-лок | Помещение | пом. | Проспект | пр-кт | Рабочий участок | раб.уч. | Проулок | проул. | Склад | скл. | Разъезд | рзд. | Торговый зал | торг.зал | Ряд(ы) | ряд | Цех | цех | Сквер | с-р | Подвал | подв. | Спуск | с-к |
| | Съезд | сзд. |
|
| Тракт | тракт |
|
| Тупик | туп. |
|
| Улица | ул. |
|
| | ш. |
|
|
|
Пример использования
Задача
Имеется текст для распознавания:
"Обращением к архитектуре итальянского ренессанса в 1930-е годы стал знаменитый дом на Моховой, построенный в 1932–1934 годах И.В. Жолтовским по адресу: Россия, Московская область, г. Москва, ул. Моховая, д. 13. Здание строилось по заказу Моссовета как жилой дом. Шестой и седьмой этажи со стороны главного фасада занимали двухэтажные квартиры, во двор выходили комнаты-мастерские высотой в два этажа, застеклённые большими окнами-витражами."
Необходимо извлечь из текста адреса и записать в имеющийся табличный документ.
Решение
Воспользоваться действиями: "Извлечь адреса", "Получить ключи", "Получить значения", "Открыть", "Установить значения столбца", цикл "Для каждого".
Реализация
- Перетащить на рабочую область действие "Извлечь адреса".

- Настроить параметры действия "Извлечь адреса".
В поле "Текст" ввести текст для распознавания.

Для параметра "Исходный вид элемента адреса" установить значение "true".

- Перетащить на рабочую область действие "Открыть" и настроить параметры действия.


- Перетащить на рабочую область цикл "Для каждого".

- В параметр "Коллекция" цикла "Для каждого" добавить результат действия "Извлечь адреса".

- Перетащить на рабочую область действия "Получить ключи" и "Получить значения" в цикл "Для каждого".

- Настроить параметры действий "Получить ключи" и "Получить значения".
В параметр "Словарь" добавить результат цикла "Для каждого".


- Перетащить на рабочую область действия "Установить значения столбца".

- Настроить параметры действий "Установить значения столбца".
- Установить контекст - результат действия "Открыть"
- В параметр "Имя столбца" добавить столбцы A и B
- В параметр "Значение ячеек" добавить результаты действий "Получить ключи" и "Получить значения"
- Установить номер начальной строки диапазона


- Нажать на кнопку "Старт" в верхней панели.
Результат
Программный робот отработал успешно.
Извлеченные адреса записаны в табличный документ.


При установке значения "true" параметра "Без вида элемента адреса" действия "Извлечь адреса"

в результирующем словаре не будут указаны виды элементов адреса:
