UI-TARS UI-TARS 是下一代原生 GUI 代理模型,旨在使用类似人类的感知、推理和作功能与图形用户界面 (GUI) 无缝交互。与传统的模块化框架不同,UI-TARS 将所有关键组件(感知、推理、接地和记忆)集成到单个视觉语言模型 (VLM) 中,无需预定义的工作流程或手动规则即可实现端到端任务自动化。
SoundView(声动视界) 一款解决跨境电商视频创作的平台,利用多语种翻译、语音合成、语音识别、大模型等技术,提供视频配音、视频翻译、文本配音等业务,让带货视频、产品视频、选窜视频的创作更简单更高效