Ученые из Стэнфордского и Чикагского университетов обнаружили, что многие популярные модели искусственного интеллекта, такие как GPT-3,5 и GPT-4 от OpenAI, продолжают проявлять расистские стереотипы даже после переобучения.
В ходе исследования, опубликованного на портале arXiv, чат-боты с ИИ были обучены работе с текстами на афроамериканском и стандартном американском английском. Результаты показали, что многие из них проявляли предвзятость, выражая негативные стереотипы, связанные с расой.
Например, GPT-4 предполагал, что авторы текстов на афроамериканском английском склонны к агрессии, грубости и невежеству, в то время как авторов стандартных текстов оценивали более положительно. Эти результаты поднимают важные вопросы о необходимости коррекции алгоритмов искусственного интеллекта для избежания дискриминации на расовой основе.