Сравнение версий

Ключ

  • Эта строка добавлена.
  • Эта строка удалена.
  • Изменено форматирование.

Извлечь адреса

...

 Версия 4 (python)

Группа действий: "Robin AI", подгруппа "NER (ROBIN)"

...

Описание

Действие извлекает из указанного текста адреса.
Каждый адрес сохраняется в виде словаря, где ключ – отдельный элемент адреса, а значения - извлеченные данные.

...

Иконка действия

Image Added

Параметры и их настройка

Свойство

Описание

Тип

Пример заполнения

Обязательность

 

заполнения поля

Параметры

Текст

Текст, из которого будут извлечены адреса

Строка

Школа Евгении расположена по адресу: Нижегородская область, г.

Robin.String

Нижний Новгород, ул.Ленина, д.100

Да

Без вида элемента адресаЕсли значение "true", то будет указано только значение элемента адреса. Если "false", в словаре будут записаны значение и вид элемента адреса
ЛогическийTrueНет
Исходный вид элемента адресаЕсли значение "true", то вид элемента адреса будет указан как в исходном тексте. Если "false", в словаре будет записан официальный полный вид элемента адресаЛогическийTrueНет
Да
Результаты

Результат

Коллекция словарей с извлеченными данными. Если один и тот же адрес встречается в тексте несколько раз, то в результирующей коллекции он будет записан один раз

.

Robin.Collection

Коллекция



Особые условия использования 

...

  1. Если в поле "Текст" заданный текст не имеет какого-либо поля адреса, то значение в словаре вернется пустым. При отсутствии в тексте всех адресообразующих элементов действие вернет пустой результат.
  2. Словарь всегда создается с полным набором ключей, чтобы не возникало ошибки при обращении к любому ключу словаря.
  3. Если одновременно отмечены параметры "Без вида элемента адреса" и "Исходный вид элемента адреса", то галочка у "Исходный вид элемента адреса" будет проигнорирована.
  4. Если в одном предложении указаны страна, и город, а в другом предложении списком улица, дом, индекс, то есть в разных предложениях части одной сущности, то они извлекутся как разные адреса в отдельные словари, не дополняя друг друга.
  5. В ключ "Полный адрес" попадает вся найденная строка с адресом, а остальные поля будут заполнены согласно ключам словаря.

  6. Робот вернет пустую коллекцию словарей, если:

    в
    • В исходном тексте не будет найдено ни одного элемента адреса

    • .

  • исходный
    • Исходный текст на неподдерживаемом языке.

  • Только русский поддерживаем пока что.
    • В текущей версии поддерживается русский язык.

Ключи словаря адресов:

    • Страна
    • Субъект Российской Федерации
    • Муниципальное образование
    • Административно-территориальная единица
    • Населенный пункт
    • Элемент планировочной структуры
    • Элемент улично-дорожной сети
    • Элемент объекта адресации
    • Тип здания
    • Тип помещения
    • Почтовый индекс
    • Полный адрес

Справочная таблица

Общепринятые сокращения слов, которые включаются в адрес

...

и адресообразующие элементы приведены в таблице.

Раскрыть
titleТаблица сокращений


Страна

Субъекты Российской Федерации
АССРРеспубликаресп., республики
УССРКрайкрай
УЗССРОбластьобл.
ССРГород федерального значенияг.ф.з.
СССРАвтономная областьа.обл., автоном. область
Автономный округа.окр., автоном. округ
Муниципальные образованияАдминистративно-территориальные единицы
Муниципальный районм.р-нПоселениепос.
Городской округг.о.
Городское поселениег.п.Районр-н
Сельское поселениес.п.
Внутригородской районвн.р-нСельсоветс/с
Внутригородская территория (внутригородское муниципальное образование) города федерального значениявн.тер.г.
Населенные пунктыЭлементы планировочной структуры
Городг.Берегб-г
Поселок городского типапгт.Валвал
Рабочий поселокрп.Жилой районж/р
Курортный поселоккп.Зона (массив)зона
Городской поселокгп.Кварталкв-л
Поселокп.Микрорайонмкр.
АалаалОстровост-в
АрбанарбанПаркпарк
АулаулПлатформаплатф.
Выселкив-киПромышленный районп/р
Городокг-кРайонр-н
Заимказ-каСадсад
Починокп-кСкверсквер
Кишлаккиш.Территориятер.
Поселок при станции (поселок станции)п. ст. Территория садоводческих некоммерческих объединений граждантер. СНО
Поселок при железнодорожной станциип. ж/д ст. Территория огороднических некоммерческих объединений граждантер. ОНО
Железнодорожный блокпостж/д бл-стТерритория дачных некоммерческих объединений граждантер. ДНО
Железнодорожная будкаж/д б-каТерритория садоводческих некоммерческих товариществтер. СНТ
Железнодорожная веткаж/д в-каТерритория огороднических некоммерческих товариществтер. ОНТ
Железнодорожная казармаж/д к-маТерритория дачных некоммерческих товариществтер. ДНТ
Железнодорожный комбинатж/д к-тТерритория садоводческих потребительских кооперативовтер. СПК
Железнодорожная платформаж/д пл-маТерритория огороднических потребительских кооперативовтер. ОПК
Железнодорожная площадкаж/д пл-каТерритория дачных потребительских кооперативовтер. ДПК
Железнодорожный путевой постж/д п.п.Территория садоводческих некоммерческих партнерствтер. СНП
Железнодорожный остановочный пунктж/д о.п.Территория огороднических некоммерческих партнерствтер. ОНП
Железнодорожный разъездж/д рзд.
Железнодорожная станцияж/д ст. Территория дачных некоммерческих партнерствтер. ДНП
Местечком-ко
Деревняд., дер.Территория товарищества собственников недвижимоститер. ТСН
Селос.
Слободасл.Территория гаражно-строительного кооперативатер. ГСК
Станцияст. 
Станицаст-цаУсадьбаус.
Улусу.Территория фермерского хозяйстватер.ф.х.
Хуторх.
Разъездрзд.Юртыю.
Зимовьезим.Совхозсвх
Элементы улично-дорожной сетиЭлементы объектов адресации
Аллеяал.Зданиезд.
Бульварб-рДомовладениедвлд.
Взвозвзв.Владениевлд.
Въездвзд.Земельный участокз/у
Дорогадор.Сооружениеcoop.
Заездззд.Домд.
КилометркмОбъект незавершенного строительстваОНС
Кольцок-цо
КосакосаТипы зданий
Линиялн.Корпуск.
Магистральмгстр.Строениестр.
Набережнаянаб.Шахташах.
Переездпер-дГаражг-ж
Переулокпер.Котельнаякот.
Площадкапл-каТипы помещений
Площадьпл.Квартиракв.
Проездпр-дКомнатаком.
Просекпр-кОфисофис
Просекапр-каПавильонпав.
Проселокпр-локПомещениепом.
Проспектпр-ктРабочий участокраб.уч.
Проулокпроул.Складскл.
Разъездрзд.Торговый залторг.зал
Ряд(ы)рядЦехцех
Скверс-рПодвалподв.
Спускс-к


Съездсзд.

Тракттракт

Тупиктуп.

Улицаул.

Шоссе

ш.


Пример использования 

Задача

Имеется текст для распознавания:

Информация
iconfalse
Обращением к архитектуре итальянского ренессанса в 1930-е годы стал знаменитый дом на Моховой, построенный в 1932–1934 годах И.В. Жолтовским по адресу: Россия, Московская область, г. Москва, ул. Моховая, д. 13. Здание строилось по заказу Моссовета как жилой дом. Шестой и седьмой этажи со стороны главного фасада занимали двухэтажные квартиры, во двор выходили комнаты-мастерские высотой в два этажа, застеклённые большими окнами-витражами.

Необходимо извлечь из текста адреса и записать в имеющийся табличный документ.

Решение

Воспользоваться действиями: "Извлечь адреса", "Получить ключи", "Получить значения", "Открыть", "Установить значения столбца", цикл "Для каждого", "Сохранить".

Реализация

  1. Перетащить на рабочую область действие "Извлечь адреса".
    Image Added
  2. Настроить параметры действия "Извлечь адреса".
    В поле "Текст" ввести текст для распознавания.
    Image Added
    Для параметра "Исходный вид элемента адреса" установить значение "true".
    Image Added
  3. Перетащить на рабочую область действие "Открыть" и настроить параметры действия.
    Image Added
    Image Added
  4. Перетащить на рабочую область цикл "Для каждого".
    Image Added
  5. В параметр "Коллекция" цикла "Для каждого" добавить результат действия "Извлечь адреса".
    Image Added
  6. Перетащить на рабочую область действия "Получить ключи" и "Получить значения" в цикл "Для каждого".
    Image Added
  7. Настроить параметры действий "Получить ключи" и "Получить значения".
    В параметр "Словарь" добавить результат цикла "Для каждого".
    Image AddedImage Added
  8. Перетащить на рабочую область действия "Установить значения столбца" и "Сохранить".
    Image Added
  9. Настроить параметры действий "Установить значения столбца". 
    1. Установить контекст - результат действия "Открыть"
    2. В параметр "Имя столбца" добавить столбцы A и B
    3. В параметр "Значение ячеек" добавить результаты действий "Получить ключи" и "Получить значения"
    4. Установить номер начальной строки диапазона
      Image AddedImage Added
  10. Нажать на кнопку "Старт" в верхней панели.

Результат

Программный робот отработал успешно.
Image Added

Извлеченные адреса записаны в табличный документ.
Image Added

При установке значения "true" параметра "Без вида элемента адреса" действия "Извлечь адреса"
Image Added

В результирующем словаре не будут указаны виды элементов адреса:
Image Added

...

Субъект Российской Федерации

...

Муниципальное образование

...

Административно-территориальная единица

...

Населенный пункт

...

Элемент планировочной структуры

...

Элемент улично-дорожной сети

...

Элемент объекта адресации

...

Тип здания

...

Тип помещения

...

Каждый найденный адрес будет записан в словарь, где ключами являются поля адреса, а значениями извлеченные данные.

Если в поданном тексте нет искомого поля, то оно вернется пустым. Ошибки не будет. Чтобы робот не ломался, если пользователь захочет вытащить этот ключ.

Если в одном предложении указаны страна, и город, а в другом предложении списком улица, дом, индекс, то есть в разных предложениях части 1 сущности, то они извлекутся как разные адреса в отдельные словари, не дополняя друг друга.

Ключи словаря адресов:

  • Полный адрес
  • Страна
  • Субъект Российской Федерации
  • Муниципальное образование
  • Административно-территориальная единица
  • Населенный пункт
  • Элемент планировочной структуры
  • Элемент улично-дорожной сети
  • Элемент объекта адресации
  • Тип здания
  • Тип помещения
  • Почтовый индекс

В первый ключ "Полный адрес" попадает вся найденная строка с адресом, а остальные поля будут заполнены согласно ключам словаря.

Пример использования 

Задача:

Решение:

Реалзиация:

Результат: