Девятиклассница из Владикавказа выбрала OCR‑систему для оцифровки осетинских книг и дообучения нейросетей

 

Девятиклассница из Владикавказа Милана Плиева сравнила существующие OCR‑системы в поисках наиболее подходящей для распознавания осетинских текстов и намерена дообучить выбранную модель для подготовки качественных данных для нейросетей, сообщили в IT‑кубе.

Исследование ученицы IT‑куба принесло ей победу в секции «Большие данные, искусственный интеллект и безопасность» регионального этапа всероссийского конкурса «Большие вызовы», уточнили в телеграм‑канале «Проекты. Северная Осетия». Милана отметила, что планирует автоматизировать процесс оценки результатов системы.

На осетинском языке мало цифровых ресурсов: большинство материалов представлены в виде сканов и фотографий, непригодных для обучения моделей. По словам авторов проекта, работа школьницы поможет эффективно оцифровывать книги и архивы и создать базу данных для обучения нейросетей, переводчиков и других цифровых сервисов на осетинском языке.

3 апреля / 22:07

Этот сайт использует cookie для хранения данных. Продолжая использовать сайт, вы даете согласие на работу с этими файлами.