Extract addresses Version 4 (python)
Group "Robin AI", subgroup "NER (ROBIN)"
Description
The action extracts the address from the text. Each address is stored as a dictionary, where the key is a separate element of the address
Action icon

Parameters and their settings
Property
| Description
| Type
| Filling example
| Mandatory field |
Parameters
|
Text | The text from which the addresses will be extracted
| String | Школа Евгении расположена по адресу: Нижегородская область, г.Нижний Новгород, ул.Ленина, д.100 | Yes |
Without the address element type | If the value is «true», only the name of the address element will be specified. If «false», the name and type of the address element will be recorded in the dictionary | Boolean | true | No |
The original view of the address element | If the value is «true», then the type of the address element will be specified as in the source text. If «false», the dictionary will record the official full view of the address element | Boolean | true | No |
Results
|
Result | A collection of dictionaries with extracted data. If the same address occurs several times in the text, then it will be recorded once in the resulting collection
| Collection |
|
|
Special conditions of use
- If the given text does not have any address field in the "Text" field, the value in the dictionary will return empty. If there are no all addressable elements in the text, the action will return an empty result.
- A dictionary is always created with a complete set of keys so that no error occurs when accessing any key in the dictionary.
- If "Without the address element type" and "The original view of the address element" are checked at the same time, the "The original view of the address element" checkbox will be ignored.
- If one sentence contains country, and city, and another sentence lists street, house, and index, that is, parts of the same entity in different sentences, they will be extracted as different addresses into separate dictionaries, not complementing each other.
The "Full address" key contains the entire address string found, and the rest of the fields will be filled in according to the dictionary keys.
The robot will return an empty dictionary collection if:
Address dictionary keys:
- Full address
- Country
- Subject of the Russian Federation
- Municipal entity
- Administrative-territorial unit
- Settlement
- Planning structure element
- Element of street and road network
- Addressing object element
- Building type
- Room type
- Postal code
Reference table
Commonly accepted abbreviations of words that are included in the address and address elements are listed in the table.
| Субъекты Российской Федерации | АССР | Республика | респ., республики | УССР | Край | край | УЗССР | Область | обл. | ССР | Город федерального значения | г.ф.з. | СССР | Автономная область | а.обл., автоном. область | Автономный округ | а.окр., автоном. округ | Муниципальные образования | Административно-территориальные единицы |
---|
Муниципальный район | м.р-н | Поселение | пос. | Городской округ | г.о. | Городское поселение | г.п. | Район | р-н | Сельское поселение | с.п. | Внутригородской район | вн.р-н | Сельсовет | с/с | Внутригородская территория (внутригородское муниципальное образование) города федерального значения | вн.тер.г. | Населенные пункты | Элементы планировочной структуры |
---|
Город | г. | Берег | б-г | Поселок городского типа | пгт. | Вал | вал | Рабочий поселок | рп. | Жилой район | ж/р | Курортный поселок | кп. | Зона (массив) | зона | Городской поселок | гп. | Квартал | кв-л | Поселок | п. | Микрорайон | мкр. | Аал | аал | Остров | ост-в | Арбан | арбан | Парк | парк | Аул | аул | Платформа | платф. | Выселки | в-ки | Промышленный район | п/р | Городок | г-к | Район | р-н | Заимка | з-ка | Сад | сад | Починок | п-к | Сквер | сквер | Кишлак | киш. | Территория | тер. | Поселок при станции (поселок станции) | п. ст. | Территория садоводческих некоммерческих объединений граждан | тер. СНО | Поселок при железнодорожной станции | п. ж/д ст. | Территория огороднических некоммерческих объединений граждан | тер. ОНО | Железнодорожный блокпост | ж/д бл-ст | Территория дачных некоммерческих объединений граждан | тер. ДНО | Железнодорожная будка | ж/д б-ка | Территория садоводческих некоммерческих товариществ | тер. СНТ | Железнодорожная ветка | ж/д в-ка | Территория огороднических некоммерческих товариществ | тер. ОНТ | Железнодорожная казарма | ж/д к-ма | Территория дачных некоммерческих товариществ | тер. ДНТ | Железнодорожный комбинат | ж/д к-т | Территория садоводческих потребительских кооперативов | тер. СПК | Железнодорожная платформа | ж/д пл-ма | Территория огороднических потребительских кооперативов | тер. ОПК | Железнодорожная площадка | ж/д пл-ка | Территория дачных потребительских кооперативов | тер. ДПК | Железнодорожный путевой пост | ж/д п.п. | Территория садоводческих некоммерческих партнерств | тер. СНП | Железнодорожный остановочный пункт | ж/д о.п. | Территория огороднических некоммерческих партнерств | тер. ОНП | Железнодорожный разъезд | ж/д рзд. | Железнодорожная станция | ж/д ст. | Территория дачных некоммерческих партнерств | тер. ДНП | Местечко | м-ко | Деревня | д., дер. | Территория товарищества собственников недвижимости | тер. ТСН | Село | с. | Слобода | сл. | Территория гаражно-строительного кооператива | тер. ГСК | Станция | ст. | Станица | ст-ца | Усадьба | ус. | Улус | у. | Территория фермерского хозяйства | тер.ф.х. | Хутор | х. | Разъезд | рзд. | Юрты | ю. | Зимовье | зим. | Совхоз | свх | Элементы улично-дорожной сети | Элементы объектов адресации |
---|
Аллея | ал. | Здание | зд. | Бульвар | б-р | Домовладение | двлд. | Взвоз | взв. | Владение | влд. | Въезд | взд. | Земельный участок | з/у | Дорога | дор. | Сооружение | coop. | Заезд | ззд. | Дом | д. | Километр | км | Объект незавершенного строительства | ОНС | Кольцо | к-цо | Коса | коса | Типы зданий | Линия | лн. | Корпус | к. | Магистраль | мгстр. | Строение | стр. | Набережная | наб. | Шахта | шах. | Переезд | пер-д | Гараж | г-ж | Переулок | пер. | Котельная | кот. | Площадка | пл-ка | Типы помещений | Площадь | пл. | Квартира | кв. | Проезд | пр-д | Комната | ком. | Просек | пр-к | Офис | офис | Просека | пр-ка | Павильон | пав. | Проселок | пр-лок | Помещение | пом. | Проспект | пр-кт | Рабочий участок | раб.уч. | Проулок | проул. | Склад | скл. | Разъезд | рзд. | Торговый зал | торг.зал | Ряд(ы) | ряд | Цех | цех | Сквер | с-р | Подвал | подв. | Спуск | с-к |
| | Съезд | сзд. |
|
| Тракт | тракт |
|
| Тупик | туп. |
|
| Улица | ул. |
|
| | ш. |
|
|
|
Example of use
Task
There is a text to recognize:
Обращением к архитектуре итальянского ренессанса в 1930-е годы стал знаменитый дом на Моховой, построенный в 1932–1934 годах И.В. Жолтовским по адресу: Россия, Московская область, г. Москва, ул. Моховая, д. 13. Здание строилось по заказу Моссовета как жилой дом. Шестой и седьмой этажи со стороны главного фасада занимали двухэтажные квартиры, во двор выходили комнаты-мастерские высотой в два этажа, застеклённые большими окнами-витражами. |
Addresses need to be extracted from the text and written into an existing tabular document.
Solution
Use the actions: "Extract addresses", "Get keys", "Get values", "Open", "Set column values", loop "For each", "Save".
Implementation
- Drag the "Extract addresses" action to the workspace.

- Set the parameters of the "Extract addresses" action.
Enter the text to be recognized in the "Text" field.

Set the "The original view of the address element" parameter to "true".

- Drag the "Open" action to the workspace and customize the action settings.


- Drag the "For each" loop to the workspace.

- In the "Collection" parameter of the "For each" loop, add the result of the "Extract Addresses" action.

- Drag the "Get keys" and "Get values" actions into the "For each" loop on the workspace.

- Set up the "Get keys" and "Get values" action parameters.
Add the result of the "For each" loop to the "Dictionary" parameter.


- Drag the "Set column values" and "Save" actions to the workspace.

- Set the "Set column values" action parameters.
- Set context - result of "Open" action
- Add columns A and B to the Column name parameter
- Add the results of the "Get keys" and "Get values" actions to the "Cell value" parameter
- Set the starting line number of the range


- Click on the "Start" button in the top panel.
Result
The program robot completed successfully.

The extracted addresses are recorded in a tabular document.

When "true" is set to "Without the address element type", the "Extract addresses" action is set to "Extract addresses"

the resulting dictionary will not include the types of address elements:
