Эксперименты по автоматическому определению уровня сложности русских текстов
DOI:
https://doi.org/10.15170/SV.1/2025.191Ключевые слова:
русский язык, сложность текста, автоматическая обработка текстов, массовая обработка текстов, линейная регрессияАннотация
Аннотация: Чтение играет очень важную роль в изучении языка, однако выбор подходящего текста зачастую представляет собой непростую задачу. Хотя уже существуют адаптированные книги для изучающих язык, они в основном доступны только на английском языке и в ограниченном количестве. Поэтому я попытался разработать алгоритм, способный количественно оценивать уровень сложности большого объёма русскоязычных текстов. Алгоритм и связанный с ним инструментарий были размещены в свободном доступе в интернете. Однако важно отметить, что из-за различий в характеристиках текстов нельзя использовать одну и ту же формулу для оценки текстов разного назначения, поэтому предлагаемая мной формула применима только к художественным текстам.
Ключевые слова: русский язык, сложность текста, автоматическая обработка текстов, массовая обработка текстов, линейная регрессия