研究显示,用于检测AI的程序对非英语母语者存在歧视

作者照片
编辑: 老夏

研究人员表示,用于检测由人工智能生成的论文、求职申请和其他工作的计算机程序可能会对非英语母语者产生歧视。在对七个流行的AI文本检测器进行测试后,发现非英语母语者写的文章经常被错误地标记为由AI生成,这种偏见可能对学生、学者和求职者产生严重影响。

随着ChatGPT这样的生成型AI程序的崛起,它可以写论文、解决问题和创建计算机代码,许多教师现在认为AI检测是“防止21世纪形式的作弊的关键对策”。但他们警告说,一些检测器声称的99%的准确率“至少是误导”。

斯坦福大学生物医学数据科学助理教授James Zou领导的科学家们将91篇由非英语母语者写的英语论文通过七个流行的GPT检测器,以查看这些程序的表现如何。超过一半的论文,这些论文是为了一个被广泛认可的英语熟练度测试,即TOEFL,被标记为由AI生成,其中一个程序将98%的论文标记为由AI撰写。当将美国的英语母语的八年级学生写的论文通过这些程序时,同样的AI检测器将超过90%的论文分类为人类生成。

科学家们在《Patterns》杂志中写道,他们追踪到了这种歧视的来源,即检测器评估什么是人类生成和什么是AI生成的方式。这些程序查看的是所谓的“文本困惑度”,这是一个衡量生成语言模型在试图预测句子中的下一个词时的“惊讶”或“困惑”的度量。如果模型可以轻易地预测下一个词,文本困惑度就被评为低,但如果下一个词很难预测,文本困惑度就被评为高。

像ChatGPT这样的大型语言模型被训练成产生低困惑度的文本,但这意味着如果人类在他们的写作中使用了许多常见的词汇和熟悉的模式,他们的作品就有被误认为是AI生成的文本的风险。研究人员说,非英语母语者的风险更大,因为他们更可能选择更简单的词汇。

在突出了AI检测程序中的内在偏见后,科学家们回到ChatGPT,要求它用更复杂的语言重写TOEFL论文。当这些编辑过的论文再次通过AI检测器时,它们都被标记为由人类写的。“矛盾的是,GPT检测器可能会迫使非母语写作者更多地使用GPT来避免被检测,”他们说。

“GPT检测器对非母语写作者的影响是严重的,我们需要考虑这些影响,以避免歧视的情况,”作者们在杂志中警告。AI检测器可能会错误地将大学和工作申请标记为GPT生成,并在互联网上边缘化非英语母语者,因为像Google这样的搜索引擎会降低被评估为AI生成的内容。他们警告说:“在教育中,这可能是GPT检测器最重要的市场,非母语学生面临更大的被错误指控作弊的风险,这可能对学生的学术生涯和心理健康产生破坏性的影响。”

原文链接:

https://www.theguardian.com/technology/2023/jul/10/programs-to-detect-ai-discriminate-against-non-native-english-speakers-shows-study

发表评论