Avaliação de Sotaque em Inglês L2 por Humanos e Modelos de Linguagem de Grande Escala (LLMs)
Discuss this preprint
Start a discussion What are Sciety discussions?Listed in
This article is not in any list yet, why not save it to one of your lists.Abstract
Este estudo investiga se Modelos de Linguagem de Grande Escala (LLMs), especificamente as versões gratuita (Flash) e paga (Pro) do Google Gemini, conseguem aproximar os julgamentos humanos de acento do inglês como L2 produzidos por falantes brasileiros. Utilizando gravações telefônicas de um subcorpus do CSLU: 22 Languages Corpus, as avaliações de acento realizadas por três juízes humanos nativos foram comparadas a avaliações geradas por IA em uma escala de quatro pontos. Modelos Mistos de Ligação Cumulativa revelaram divergências sistemáticas entre os avaliadores: os sistemas de IA, particularmente a versão Pro, superestimaram de forma consistente a força do acento, atribuindo avaliações severas a amostras julgadas como moderadas pelos humanos. Esses achados sugerem que, enquanto os julgamentos humanos integram pistas sociolinguísticas e contextuais, a IA se apoia predominantemente no desvio acústico, carecendo da tolerância sociofonética necessária para a avaliação de acento.