MiniMax 自主研发了多模态的通用大模型,其中包括万亿参数的 MoE 文本大模型、语音&音乐大模型、图像大模型以及视频大模型。
MiniMax视频生成模型Video-01
该模型支持生成720p分辨率,25fps的高清视频,具备电影感的镜头移动效果,能根据文本描述快速创造出具有视觉冲击力的内容。
video-01具有压缩率高、文本响应好、风格多样,支持原生高分辨率、高帧率视频等特点,媲美电影质感。
目前,video-01支持生成最长6s的视频,下个大版本即将支持生成最长10s的视频。
video-01支持文生视频和图生视频两种模式,用户可以选择通过纯文字描述来生成视频,也可以上传一张参考图配合文字描述来生成。
音乐模型music-01
music-01支持多功能端到端音乐生成,可用于合成多种音乐形式,包括纯音乐、清唱作品,且满足伴奏、人声同时生成,大大简化音乐录制与创作过程。
结合深度学习技术,用户只需要上传一段音乐作品,模型自动学习人声、伴奏的节奏和风格,再输入歌词,就可以得到一份自动生成、完整的音乐作品。无论是为影视作品创作配乐,还是为AI歌手创作新歌,或是对经典曲目进行创新改编,音乐合成技术都能满足你的需求。
音乐合成技术支持多种音乐风格和情感表达,轻松驾驭古典、流行、摇滚和电子音乐等多种风格,大大简化音乐录制过程,拓宽创作边界。创作者将在音乐合成技术中感受到前所未有的便捷体验。
当前模型支持生成最长60s的音乐,在下一个大版本即将支持生成最长180s的音乐。