UI-TARS 是下一代原生 GUI 代理模型,旨在使用类似人类的感知、推理和作功能与图形用户界面 (GUI) 无缝交互。与传统的模块化框架不同,UI-TARS 将所有关键组件(感知、推理、接地和记忆)集成到单个视觉语言模型 (VLM) 中,无需预定义的工作流程或手动规则即可实现端到端任务自动化。
UI-TARS