Instruction Tuning with Multimodal Large Language Model to Support Art Appreciation Education

828 篇文章

已下架不支持订阅

本文介绍了一种名为LLaVA Docent的多模态大语言模型,应用于艺术欣赏教育,旨在提高教育的可及性和参与度。通过与专家合作和文献综述,构建的数据框架用于训练模型,使用GPT-4生成的虚拟对话数据集。初步评估显示,LLaVA Docent在增强用户体验和弱势学生艺术欣赏教育方面具有优势,但也指出需要进一步的实证研究和数据集增强来提高模型的广泛适用性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

本文是LLM系列文章,针对《LLaVA-Docent: Instruction Tuning with Multimodal Large Language Model to Support Art Appreciation Education》的翻译。

LLaVA-Docent:多模态大语言模式的指令调整支持艺术欣赏教育

摘要

艺术欣赏对于培养学习者的批判性思维和情商至关重要。然而,传统的艺术欣赏教育往往受到阻碍,因为获得艺术资源的机会有限,尤其是弱势学生,以及主流教育对STEM科目的不平衡重视。为了应对这些挑战,最近的技术进步为创新解决方案铺平了道路。本研究探讨了多模态大语言模型(MLLMs)在艺术欣赏教育中的应用,重点是开发LLaVA Docent,一个利用这些进步的模型。我们的方法包括全面的文献综述和与该领域专家的协商,从而开发出一个强大的数据框架。利用这个框架,我们生成了一个虚拟对话数据集,GPT-4利用了这个数据集。该数据集有助于训练名为LLaVA Docent的MLLM。六名研究人员对LLaVA Docent进行了定量和定性评估,以评估其有效性,并在小样本设置中将其与GPT-4模型进行了比较。评估过程揭示了LLaVA Docent模型的明显优势和劣势。我们的研究结果强调了LLaVA Docent在提高艺术欣赏教育的可及性和参与度方面的有效性。通过利用MLLMs的潜力,本研究对艺术教育领域做出了重大贡献,提出了一种新颖的方法,重新构想了艺术欣赏的教学和体验方式。

已下架不支持订阅

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

UnknownBody

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值