但对于超级智能这种尖端、前沿的研究来说,我认为我们需要打造小团队,整个团队都需要从整体上完全理解系统的运作方式、原理以及动态变化。不久前,Soul全双工语音通话大模型全面升级,重新定义全双工交互范式,摒弃了传统语音交互中依赖的VAD(话音活性检测)机制与延迟控制逻辑,打破行业中普遍存在的轮次对话模式,赋予AI自主决策对话节奏的能力。据了解,全双工通话大模型即将在Soul平台内测,后续将陆续落地于虚拟人实时通话、AI匹配等1V1、多对多互动场景。此次活动现场,Soul也展示了关于全双工实时视频通话能力的
相比数字世界中的大模型,MogoMind可以视为物理世界的实时搜索引擎,通过接入物理世界实时动态数据,MogoMind形成全局感知、深度认知和实时推理决策能力,能够从数据中抽取意义、从经验中学习规则、在场景中灵活决策。例如,用户输入黄昏、柔光、边缘光、暖色调、中心构图等关键词,模型可自动生成金色的落日余晖的浪漫画面。目前,该模型单次可生成5s的高清视频,用户可通过多轮提示词进一步完成短剧制作,未来通义万相还将继续提升单次视频生成的时长,让视频创作更高效。使用冷色调、硬光、平衡图、低角度的组合,