В НГУ создали нейросеть для превращения научных книг в аудиоформат

Входит в сюжеты
В этой статье

В Новосибирском государственном университете разработали сервис на основе искусственного интеллекта, который автоматически преобразует тексты научных изданий в аудиокниги. Проект находится на стадии пилотного тестирования на базе Научной библиотеки НГУ.

Как сообщили представители университета, технология создана в Исследовательском центре искусственного интеллекта (Центр ИИ НГУ). На первом этапе в аудиоформат будут переведены книги университетского издательства и материалы из электронной библиотеки, доступные с согласия правообладателей — всего порядка семи тысяч наименований.

Процесс полностью автоматизирован: нейросеть извлекает текст из PDF-файлов, обрабатывает его и генерирует звуковую версию. Ведущий научный сотрудник Центра искусственного интеллекта НГУ, кандидат физико-математических наук Евгений Павловский пояснил, что проект не ставит целью заменить традиционное чтение, а предлагает альтернативный способ доступа к знаниям.

«Мы не делаем художественную озвучку, полностью повторяющую оригинал. Это дополнительный способ работы с книгой. Для массового использования важно, что решение не является ресурсоемким: на одну книгу уходит примерно полчаса процессорного времени, причем речь о 16-ядерном процессоре, даже без видеокарты», — отметил Павловский.

Базой для сервиса послужил фреймворк «Каппа», разработанный в Центре ИИ НГУ. Эта платформа предназначена для управления датасетами и моделями ИИ, их тестирования и снижения риска ошибок (так называемых «галлюцинаций»). В новом проекте «Каппа» используется для подготовки обучающих данных и сбора обратной связи о качестве озвучки.

В пилотном режиме нейросеть уже озвучила первую сотню книг. Сейчас разработчики ожидают отзывы от библиотекарей и читателей. По оценке команды проекта, технически возможно перевести в звук весь фонд в течение месяца, однако с учетом проверки качества и организационных процедур этот процесс может занять до года.

В НГУ подчеркивают, что проект носит технологический характер. После успешного завершения пилота и отработки механизмов взаимодействия с библиотекой, сервис планируют предложить другим университетам и публичным библиотекам, в том числе через партнерские платформы.