❤️ 如果你也关注大模型与 AI 的发展现状,且对大模型应用开发非常感兴趣,我会快速跟你分享最新的感兴趣的 AI 应用和热点信息,也会不定期分享自己的想法和开源实例,欢迎关注我哦!
🥦 微信公众号|搜一搜:蚝油菜花 🥦
🚀 快速阅读
- Claude 3.5 Sonnet 新增的计算机使用功能,使其可以像人类一样进行鼠标操作、键盘输入等。
- 该功能包括屏幕阅读与交互、文本输入、文件操作、网页浏览、软件操作、代码编写与调试、自动化脚本执行等。
- 目前处于实验阶段,建议在受控环境中使用,并注意潜在风险。
正文(附运行示例)
Claude 3.5 Sonnet 计算机使用功能是什么
Claude 3.5 Sonnet 是由 Anthropic 公司推出的新功能,支持 AI 模型 Claude 3.5 Sonnet 执行类似人类的电脑操作,如查看屏幕、移动光标、点击按钮和输入文本。基于 API,开发者能将自然语言指令转化为计算机操作,实现自动化处理重复性任务。Claude 3.5 Sonnet 计算机使用功能目前处在实验阶段,代表了 AI 辅助自动化的重要进展,有潜力改变人们与计算机交互的方式。
Claude 3.5 Sonnet 的主要功能
- 屏幕阅读与交互:AI 查看屏幕截图,在屏幕上进行精准的光标移动和点击操作。
- 文本输入:用虚拟键盘输入文本,模拟人类打字。
- 文件操作:创建、编辑、保存和删除文件,以及下载和上传文件。
- 网页浏览:打开网页,进行搜索,填写表单,以及与网页元素交互。
- 软件操作:打开和使用各种软件应用程序,如文本编辑器、图像处理软件等。
- 代码编写与调试:编写和调试代码,执行软件开发任务。
- 自动化脚本执行:运行 Bash 命令和其他脚本,实现自动化任务。
如何运行 Claude 3.5 Sonnet 计算机使用功能
示例代码
以下是一个使用 Python 调用 Claude 3.5 Sonnet 计算机使用功能的示例:
import requests
import json
url =