AWS 在今年 re:Invent 宣布了新的多模态生成式 AI 模型系列「Nova」,共有四种文本生成模型 Micro、Lite、Pro 和 Premier、图像生成模型 Nova Canvas、视频生成模型 Nova Reel,模型除 Premier 要待明年之外,都已向 AWS 客户推出。
文本生成 Nova 模型针对 15 种语言进行了优化,其中 Micro 只能输入文本,但提供最低延迟的处理速度,其他三者皆可处理图像、视频和文本输入,Pro 则是在准确度、速度之间取得最佳平衡,而 Premier 为功能最强大的一款,且被定位为可用在创建更多自定义模型的教师模型。
Micro 上下文 token 数为 12.8 万、Lite 和 Pro 为 30 万,AWS 预告 2025 年某些 Nova 模型的 token 数将超过 200 万。
Nova Canvas 让用户使用提示产生和编辑图像,Reel 则可以通过文本指令或参考图像,花大约需要三分钟的时间,即能生成六秒的视频,也可加以调整来产生平移、360 度旋转和缩放视频效果。两款模型有导入浮水印功能,以促进负责任的 AI 使用。
AWS 号称 Nova 是同类之中速度最快的模型之一,且运行成本最低。公司目前仍尚未透露使用哪些数据来训练模型,只有在先前表示,训练数据是专有数据和授权数据的组合。
AWS 接下来的计划是于 2025 Q1 开发语音转语音模型,能提供类似人类的自然声音,并在明年中旬开发可在任意模态之间转换的模型,可以看做是可 AI 助理,亚马逊 CEO Andy Jassy 表示,「你将能够输入文本、语音、图像或视频,并输出文本、语音、图像或视频,这就是未来先进模型的建构和使用方式」。
亚马逊目前也正在开发一款改进版的 AI Alexa,虽然原有消息传出会在今年秋季推出,但发布时间显然已推迟到明年。
免责声明
本文内容(图片、文章)翻译/转载自国内外资讯/自媒体平台。文中内容不代表本站立场,如有侵权或其它,请联系 admin@eiefun.com,我们会第一时间配合删除。