Skip to content

Репозиторий с бакалаврской НИР на тему "Применение больших языковых моделей для иерархической суммаризации текстов научных публикаций"

License

Notifications You must be signed in to change notification settings

intsystems/Sobolevsky-BS-Thesis

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Применение больших языковых моделей для иерархической суммаризации текстов научных публикаций

Название исследуемой задачи Применение больших языковых моделей для иерархической суммаризации текстов научных публикаций
Тип научной работы Выпускная квалификационная работа
Автор Соболевский Федор Александрович
Научный руководитель д.ф.-м.н. Воронцов Константин Вячеславович

Аннотация

В век экспоненциального роста количества доступной информации в мире особенно актуальной становится задача структурирования и систематизации научных знаний, а также повышения их доступности. Иерархическая организация основных идей и результатов в научных публикациях может позволить ускорить процесс получения читателем знаний и позволить ему двигаться при изучении темы от главного к деталям. Одним из видов структурированного представления текста являются интеллект-карты на основе предложений из текста. Поскольку человеческая обработка больших коллекций текстовых документов, особенно научных, занимает много времени и ресурсов, для решения задачи иерархической суммаризации необходимо разрабатывать автоматические методы, по качеству не уступающие ручной обработке.

Перспективным инструментом решения данной задачи являются большие языковые модели. В данной работе исследуется способность больших языковых моделей строить иерархические представления текстов научных публикаций на примере интеллект-карт на основе предложений. Поскольку для задачи автоматической иерархической суммаризации научных текстов на данный момент не существует достаточного количества обучающих данных и метрик для разностороннего и полного оценивания качества генерации, предварительно проводится работа по созданию новой коллекции иерархических сводок научных статей для обучения и тестирования моделей иерархической суммаризации и предлагаются новые способы оценивания результатов выполнения данной задачи.

About

Репозиторий с бакалаврской НИР на тему "Применение больших языковых моделей для иерархической суммаризации текстов научных публикаций"

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages