История страницы
Извлечь адреса Версия
...
4 (
...
python)
Группа действий: "Robin AI", подгруппа "NER (ROBIN)"
...
Описание
Действие извлекает из указанного текста адреса. Каждый адрес сохраняется в виде словаря, где ключ – отдельный элемент адреса, а значения - извлеченные данные.
Варианты значений для ключей словаря:
...
Страна
...
АССР, УССР, УЗССР, ССР, СССР, Франция, ФРГ
...
Субъект Российской Федерации
...
федеральный округ, республика, край, область, автономный округ, автономная область
...
Муниципальное образование
...
Административно-территориальная единица
...
Населенный пункт
...
Элемент планировочной структуры
...
Элемент улично-дорожной сети
...
Элемент объекта адресации
...
Тип здания
...
Тип помещения
...
The action extracts the address from the text. Each address is stored as a dictionary, where the key is a separate element of the address
Иконка действия
Параметры
Входные параметры
- Текст – текст
Если в одном предложении указаны страна, и город, а в другом предложении списком улица, дом, индекс, то есть в разных предложениях части одной сущности, то они извлекутся как разные адреса в отдельные словари.
Параметры
Входные параметры:
- Текст - текст, из которого будут извлекаться адреса.
- Без вида элемента адреса - параметр – параметр, с помощью которого в результирующем словаре будут указаны\/не указаны вид элемента адреса. Пример с выключенным и включенным параметром:
- Исходный вид элемента адреса - параметр – параметр, с помощью которого адрес будет представлен как в исходном тексте или записан как официальный полный вид элемента адреса. Например, с включенный параметром адрес "г. Нижний Новгород" так и будет записан, а если параметр отключен, то адрес в результате будет "Нижний Новгород".
Выходные параметры
...
- Результат - коллекция – коллекция словарей с извлеченными адресами. Повторяющиеся в тексте адреса записываются в коллекции один раз.
Каждый найденный адрес будет записан в словарь, где ключами являются поля адреса, а значениями – извлеченные данные.
Ключи словаря адресов:
- Полный адрес
- Страна
- Субъект Российской Федерации
- Муниципальное образование
- Административно-территориальная единица
- Населенный пункт
- Элемент планировочной структуры
- Элемент улично-дорожной сети
- Элемент объекта адресации
- Тип здания
- Тип помещения
- Почтовый индекс
Настройки
Property |
Description |
Type |
Пример заполнения
Обязательность заполнения поля
Параметры
Текст
Текст, из которого будут извлечены адреса.
Filling example | Mandatoryfield | |||
Parameters | ||||
Text | The text from which the addresses will be extracted | String | Школа Евгении расположена по адресу: Нижегородская область, г.Нижний Новгород, ул.Ленина, д.100 |
Да
Результат
Коллекция словарей с извлеченными данными. Если один и тот же адрес встречается в тексте несколько раз, то в результирующей коллекции он будет записан один раз.
Yes | ||||
Without the address element type | If the value is «true», only the name of the address element will be specified. If «false», the name and type of the address element will be recorded in the dictionary | Boolean | true | No |
The original view of the address element | If the value is «true», then the type of the address element will be specified as in the source text. If «false», the dictionary will record the official full view of the address element | Boolean | true | No |
Results | ||||
Result | A collection of dictionaries with extracted data. If the same address occurs several times in the text, then it will be recorded once in the resulting collection |
Collection |
Особые условия использования
- Если в
...
- поле "Текст" заданный текст не имеет какого-либо поля адреса, то значение в словаре вернется пустым. При отсутствии в тексте всех адресообразующих элементов действие вернет пустой результат.
- Словарь всегда создается с полным набором ключей, чтобы не возникало ошибки при обращении к любому ключу словаря.
- Если одновременно отмечены параметры "Без вида элемента адреса" и "Исходный вид элемента адреса", то галочка у "Исходный вид элемента адреса" будет проигнорирована.
- Если в одном предложении указаны страна, и город, а в другом предложении списком улица, дом, индекс, то
...
- есть в разных предложениях части одной сущности, то они извлекутся как разные адреса в отдельные словари, не дополняя друг друга.
...
Ключи словаря адресов:
...
...
В
...
ключ "
...
Полный адрес" попадает вся найденная строка с адресом, а остальные поля будут заполнены согласно ключам словаря.
Робот вернет пустую коллекцию словарей, если:
- в
В исходном тексте не будет найдено ни одного элемента адреса
, .
исходный Исходный текст на неподдерживаемом языке.
На данный момент поддерживается только русский язык.
Пример использования
Задача: записать в текстовый файл извлеченные адреса из текста.
Текст: Школа Евгении расположена по адресу: Нижегородская область, г.Нижний Новгород ,ул.Ленина, д.100
Решение: воспользоваться действиями "Извлечь адреса", "Получить длину", "Вычитание", "Получить значение по индексу", "Получить значение", "Получить коллекцию ключей", "Записать в текстовый файл", циклом "Для".
Реализация:
В текущей версии поддерживается русский язык.
Справочная таблица
Общепринятые сокращения слов, которые включаются в адрес и адресообразующие элементы приведены в таблице.
Раскрыть | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Пример использования
Задача
Имеется текст для распознавания:
"Обращением к архитектуре итальянского ренессанса в 1930-е годы стал знаменитый дом на Моховой, построенный в 1932–1934 годах И.В. Жолтовским по адресу: Россия, Московская область, г. Москва, ул. Моховая, д. 13. Здание строилось по заказу Моссовета как жилой дом. Шестой и седьмой этажи со стороны главного фасада занимали двухэтажные квартиры, во двор выходили комнаты-мастерские высотой в два этажа, застеклённые большими окнами-витражами."
Необходимо извлечь из текста адреса и записать в имеющийся табличный документ.
Решение
Воспользоваться действиями: "Извлечь адреса", "Получить ключи", "Получить значения", "Открыть", "Установить значения столбца", цикл "Для каждого".
Реализация
- Перетащить на рабочую область действие "Извлечь адреса".
- Настроить параметры действия "Извлечь адреса".
В поле "Текст" ввести текст для распознавания.
Для параметра "Исходный вид элемента адреса" установить значение "true". - Перетащить на рабочую область действие "Открыть" и настроить параметры действия.
- Перетащить на рабочую область цикл "Для каждого".
- В параметр "Коллекция" цикла "Для каждого" добавить результат действия "Извлечь адреса".
- Перетащить на рабочую область действия "Получить ключи" и "Получить значения" в цикл "Для каждого".
- Настроить параметры действий "Получить ключи" и "Получить значения".
В параметр "Словарь" добавить результат цикла "Для каждого". - Перетащить на рабочую область действия "Установить значения столбца".
- Настроить параметры действий "Установить значения столбца".
- Собрать схему робота: Схема робота.
- Настроить параметры действия "Извлечь адреса". В поле "Текст" ввести нужный текст.
- Настроить параметры действия "Получить длину 1". В поле "Коллекция или массив" указать результат действия "Извлечь адреса".
- Настроить параметры действия "Вычитание 1". В поле "Первый операнд" указать результат действия "Получить длину 1". В поле "Второй операнд" указать "1".
- Настроить параметры действия "Для 1". В поле "Начальное значение" указать "0". В поле "Конечное значение" указать результат действия "Вычитание 2". В поле "Инкремент" указать "1".
- Настроить параметры действия "Получить значение по индексу 2". В поле "Коллекция" указать результат действия "Получить коллекцию ключей 1". В поле "Индекс" указать результат цикла "Для 1".
- Настроить параметры действия "Получить значение по индексу 3". В поле "Коллекция" указать результат действия "Получить значения 1". В поле "Индекс" указать результат цикла "Для 1".
- Настроить параметры действия "Записать текстовый файл 1". В поле "Файл" указать путь к текстовому файлу, куда будет записан результат. В поле "Данные" указать результат действия "Получить значение по индексу 2". В поле "Добавить" указать чекбокс = true. В поле "С новой строки" указать чекбокс = true.
- Настроить параметры действия "Записать текстовый файл 2". В поле "Файл" указать путь к текстовому файлу, куда будет записан результат. В поле "Данные" указать ":". В поле "Добавить" указать чекбокс = true.
- Настроить параметры действия "Записать текстовый файл 3". В поле "Файл" указать путь к текстовому файлу, куда будет записан результат. В поле "Данные" указать результат действия "Получить значение по индексу 3". В поле "Добавить" указать чекбокс = true.
- Заполнить параметры цикла "Для 2". В поле "Начальное значение" указать "0". В поле "Конечное значение" указать результат действия "Вычитание 1". В поле "Инкремент" указать "1".
- Заполнить параметры действия "Получить значение по индексу 1". В поле "Коллекция" указать результат действия "Извлечь адреса 1". В поле "Индекс" указать результат цикла "Для 2".
- Заполнить параметры действия "Получить значения 1". В поле "Словарь" указать результат действия "Получить значение по индексу 1".
- Заполнить параметры действия "Получить коллекцию ключей". В поле "Словарь" указать результат действия "Получить значение по индексу 1".
- Заполнить параметры действия "Получить длину 2". В поле "Коллекция или массив" указать результат действия "Получить значения 1".
- Заполнить параметры действия "Вычитание 2". В поле "Первый операнд" указать результат действия "Получить длину 2". В поле "Второй операнд" указать "1".
- Установить контекст - результат действия "Открыть"
- В параметр "Имя столбца" добавить столбцы A и B
- В параметр "Значение ячеек" добавить результаты действий "Получить ключи" и "Получить значения"
- Установить номер начальной строки диапазона
- Нажать на кнопку "Старт" в верхней панели.
Результат
...
Программный робот отработал успешно.
Извлеченные адреса записались записаны в текстовый файл.
Текстовый файл:
табличный документ.
При установке значения "true" параметра "Без вида элемента адреса" действия "Извлечь адреса"
в результирующем словаре не будут указаны виды элементов адреса: