Please use this identifier to cite or link to this item: https://elar.rsvpu.ru/handle/123456789/46468
Title: Применение text mining в тестировании
Other Titles: Applying text mining in testing
Authors: Братищенко, В. В.
Bratischenko, V. V.
Issue Date: 2024
Publisher: Российский государственный профессионально-педагогический университет
Citation: Братищенко, В. В. Применение text mining в тестировании / В. В. Братищенко // Новые информационные технологии в образовании и науке. — 2024. — № 12. — С. 9-15. — 10.17853/2587-6910-2024-12-9-15.
Abstract: В работе предлагается использовать методы обработки текстов на естественном языке для оценивания ответов на тестовые задания открытого типа. Для тестирования нужен корпус заданий с вариантами правильных ответов. Для оценки соответствия ответа тестируемого образцу предлагается использовать два метода. Первый метод использует параметризацию текста в виде «мешка слов» и обученный по корпусу заданий классификатор, который оценивает соответствие ответа образцу как вероятность соответствующей классификации. Второй метод использует эмбеддинговую модель корпуса текстов по теме тестирования. Оценка соответствия ответа образцу вычисляется как косинус угла вектора образца и вектора ответа. Численные эксперименты продемонстрировали возможности применения предлагаемых оценок.
The paper proposes to use natural language text processing methods to estimate answers to open-type test tasks. For testing, you need a сorpus of tasks with correct answers. To assess the compliance of the test person's response with the sample, it is proposed to use two methods. The first method uses text parameterization in the form of a “bag of words” and a classifier trained on a corpus of tasks, which evaluates the correspondence of the answer to the sample as the probability of the corresponding classification. The second method uses the embedding model of a corpus of texts on the topic of testing. The assessment of the response's correspondence to the sample is calculated as the cosine of the angle of the sample vector and the response vector. Numerical experiments demonstrated the possibilities of using the proposed estimates.
Keywords: ТЕСТОВЫЕ ЗАДАНИЯ ОТКРЫТОГО ТИПА
ОБРАБОТКА ТЕКСТОВ НА ЕСТЕСТВЕННОМ ЯЗЫКЕ
КЛАССИФИКАЦИЯ ТЕКСТОВ
«МЕШОК СЛОВ»
ЭМБЕДДИНГИ ПРЕДЛОЖЕНИЙ
OPEN TEST TASKS
NATURAL LANGUAGE TEXT PROCESSING
TEXT CLASSIFICATION
"BAG OF WORDS"
SENTENCE EMBEDDING
ISSN: 2587-6910
2782-7429
DOI: 10.17853/2587-6910-2024-12-9-15
Origin: Новые информационные технологии в образовании и науке. — 2024. — № 12
Appears in Collections:Новые информационные технологии в образовании и науке

Files in This Item:
File Description SizeFormat 
nito_2024_12_003.pdf900,25 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.