Please use this identifier to cite or link to this item: https://dspace.znu.edu.ua/jspui/handle/12345/12491
Title: Реалізація методу виявлення поштових адрес у довгих текстах
Authors: Мержвинська, Єлизавета Олександрівна
Keywords: геокодування
машинне навчання
обробка природної мови
розпізнавання тексту
метод рухомого вікна
address parsing
Issue Date: 2023
Abstract: UA : Робота викладена на 37 сторінках друкованого тексту, містить 4 рисунки, 2 таблиці, 20 джерел, 1 додаток. Об’єкт дослідження – задача виявлення та розбору поштових адрес у довгих текстах. Мета роботи: визначення ефективності застосування методу рухомого вікна разом з методами розбору поштових адрес для пошуку адрес у довгому тексті. Метод дослідження – аналітичний. Для досягнення поставленої мети був розроблений метод виявлення адрес, що базується на методі рухомого вікна та на методах розбору поштових адрес з функціоналом бібліотеки Libpostal. Метод протестований на даних різних форматів та мов. Отримані результати свідчать про високу ефективність застосування методу рухомого вікна разом з методами розбору поштових адрес бібліотеки Libpostal у довгих текстах. Застосування цих методів дозволяє точно розпізнавати поштові адреси навіть у випадках, коли адреси мають різні формати, включають додатковий текст або містять помилки. Розроблений підхід до виявлення поштових адрес у довгих текстах може бути використаний для поліпшення точності та швидкості обробки текстової інформації. Його застосування є особливо актуальним у сферах обробки природної мови, пошуку нформації та електронної комерції. Використання цього підходу сприятиме автоматизації процесів індексації та категоризації текстів, покращенню пошукових систем.
EN : The work is presented on 37 pages of printed text, 4 figures, 2 tables, 20 references, 1 annex. Object of the study – the task of detecting and parsing postal addresses in long texts. Aim of the study: to determine the effectiveness of using the moving window method in combination with methods of parsing postal addresses for finding addresses in long texts. Method of research – analytical. To achieve the set goal, a method for detecting addresses has been developed, which is based on the moving window method and address parsing methods with the functionality of the Libpostal library. The method has been tested on data of various formats and languages. The obtained results demonstrate the high efficiency of applying the moving window method together with the address parsing methods of the Libpostal library in long texts. The application of these methods allows for accurate recognition of postal addresses even in cases where the addresses have different formats, include additional text, or contain errors. The developed approach to detecting postal addresses in long texts can be used to improve the accuracy and speed of processing textual information. Its application is particularly relevant to the fields of natural language processing, information retrieval, and e-commerce. The utilization of this approach will contribute to the automation of text indexing and categorization processes, as well as enhance search systems.
Description: Мержвинська Є. О. Реалізація методу виявлення поштових адрес у довгих текстах : кваліфікаційна робота бакалавра спеціальності 122 "Комп'ютерні науки" / наук. керівник Г. А. Добровольський. Запоріжжя : ЗНУ, 2023. 37 с.
URI: https://dspace.znu.edu.ua/jspui/handle/12345/12491
Appears in Collections:Кваліфікаційні випускні роботи здобувачів бакалаврського рівня кафедри комп’ютерних наук

Files in This Item:
File Description SizeFormat 
Merzhvynska_E_O.pdfРобота бакалавра453.83 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.