Mitigating Bias in Queer Representation within Large Language Models: A Collaborative Agent Approach

本文是LLM系列文章,针对《Mitigating Bias in Queer Representation within Large Language Models: A Collaborative Agent Approach》的翻译。

减轻大型语言模型中Queer表征的偏见:协作代理方法

摘要

大型语言模型(LLMs)经常使代词使用中的偏见永久化,导致对queer个体的歪曲或排斥。本文探讨了LLM输出中有偏见的代词使用的具体问题,特别是当需要包容性语言来准确表示所有身份时,传统性别代词(“他”、“她”)的不当使用。我们引入了一个协作代理管道,旨在通过分析和优化代词的使用来减轻这些偏见,以实现包容性。我们的多代理框架包括用于偏见检测和纠正的专用代理。使用Tango数据集(一个专注于性别代词使用的基准)的实验评估表明,我们的方法显著提高了包容性代词分类,在正确反对不恰当的传统性别代词方面比GPT-4o提高了32.6个百分点(χ2=38.57,p<0.0001)。这些结果强调了代理驱动框架在增强人工智能生成内容的公平性和包容性方面的潜力,证明了它们在减少偏见和促进对社会负责的人工智能方面的有效性。

1 引言

2 相关工作

3 方法

4 结果

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

UnknownBody

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值