英伟达今日发布 Jarvis 1.0 公测版,这是基于 NVIDIA GPU 提供实时性能的灵活、多模态对话式 AI 服务应用框架。官方表示,公测版中包含用于构建和部署实时对话式 AI 应用程序的端到端工作流程,例如转录、虚拟助手和聊天机器人等。
英伟达表示,此次发布的 Jarvis 包含多个新型对话式 AI 预训练模型,并支持迁移学习工具包(TLT),方便企业根据自己的具体用例和领域调整应用。这些应用能够理解上下文和细微差别,为用户提供更好的体验。
通过 Jarvis,企业可以获得各种先进的模型、通过 TLT 迁移学习实现开发速度高达 10 倍提升,以及全面优化的 GPU 加速流程,从而创建实时运行的智能语言型应用。
本次发布版本的亮点包括:
基于数千小时语音数据训练的 ASR、NLU 和 TTS 模型。
采用自定义数据通过零编码的方法快速重新训练模型的 TLT。
全面加速的深度学习流程经过优化,可作为可扩展服务运行。
使用一行代码部署服务的端到端工作流程和工具。
IT之家了解到,基于 Jarvis 构建的应用程序可以应用全新 NVIDIA A100 Tensor Core GPU 中的各项创新技术进行 AI 计算,并使用 NVIDIA TensorRT的最新优化进行推理。现在,使用最强大的视觉和语音模型运行整个多模态应用已成为可能,而且其速度比实时交互所需的 300 毫秒阈值还要快。Jarvis 提供了一整套 GPU 加速软件堆栈和工具,使开发者能够轻松地创建、部署和运行端到端的实时 AI 应用程序,并且能够准确理解各企业及其客户沟通时所用的各种专业术语。