【EV视界综合报道】能说会看,还响应快、记性好、算得准——如此完美的AI,ta来了!
商汤科技日日新融合大模型交互版(SenseNova-5o),近日正式对外提供实时音视频对话服务,限时免费使用。
它是商汤“日日新”融合大模型的交互版本,拥有强大的实时交互、视觉识别、记忆思考、持续对话和复杂推理等能力,能帮助AI与人类更自然、更流畅地交流,让每次互动更加智能与贴心,帮助用户全面提升生活与工作体验。
同时通过整合大装置基础设施能力,商汤还为「SenseNova-5o」提供了配套的Realtime API的服务优化,实现与RTC网络的深度结合。用户在任何环境下都能享受稳定、实时、流畅、无延迟的音视频对话服务和沟通体验。
记忆卓绝:互动更贴心、更精准
「SenseNova-5o」拥有业内卓越领先的记忆能力,能够精确记录每一轮与用户的对话,支持超长多模态交互记忆不少于5分钟。
识别各地地标性建筑,对于「SenseNova-5o」来说小菜一碟~但看了这么多建筑后,依然能清楚地依次描述出它们,记忆力超群。
看了几个可爱玩偶后,名字和外貌特质也能记得一清二楚。
这考验的不仅仅是对信息的存储,更是一种深刻的理解与回忆能力。用户提出的每一个细节问题,交流中的不经意点滴,「SenseNova-5o」都能清晰存储,并在任何时刻快速回忆相关内容。
更重要的是,「SenseNova-5o」的记忆力并不限于短期对话,它能够持续跟踪和积累与用户的交互信息,不断完善和优化对用户需求的理解。
多轮对话:人机交互,畅快自然
「SenseNova-5o」拥有高效、精准的多模态实时交互能力,能够及时准确地响应用户的各种语音指令或动作示意,还可随时打断,如同和真人对话般丝滑。
「SenseNova-5o」当前的交互延迟已缩短至2秒以内,与人类自然交流几乎无差。
对起对联不仅反应迅速、回答精彩,对于“蛇年主题”这种“命题类问答”也能快速反馈,也可以随时打断哦!
同时,「SenseNova-5o」拥有强大的持续对话能力,能够根据上下文引导新话题,激发用户兴趣,开展深度互动。无论是日常闲聊、知识探讨还是情感交流,都如同一位博学多才、善解人意的朋友,兼具深度与广度,完美适应各种沟通场景。
个性化设置:满足用户交流偏好
「SenseNova-5o」还提供强大的个性化设置功能,支持根据用户偏好,个性化设置交流风格与使用习惯,从人设到语气都能自由调整。无论是严谨正式的商务风格,还是轻松幽默的日常交流,都能根据用户需求进行设置,让每次互动都贴心、自然。
此外,「SenseNova-5o」还提供不同的音色选择,涵盖从温暖柔和的女声到沉稳磁性的男声,从活泼欢快到专业庄重等多种风格。用户可以根据需要轻松切换,让每次交流都充满愉悦与舒适。
例如,设置好不同音色后,“男生5o”与“女生5o”无外界引导的情况就能来一场AI与AI的聊天局。
得益于能够自由进行个性化设置,「SenseNova-5o」还能扮演“人设”,拟人能力强大:这次它扮演《射雕英雄传》中的“郭靖”不仅可以接受用户的提问,还能与另一位「SenseNova-5o」扮演的“黄蓉”一起对话探讨杨过的教育问题。
落地应用:场景广泛,限时免费
目前,「SenseNova-5o」已成功应用于多个智能设备领域,如具身机器人、AI眼镜、手机等,以创新的人机交互体验,推动智能设备迈向更高水平,加速引领AI 2.0时代的到来。
除了各类智能硬件终端场景,商汤还在更多垂直业务领域积极拓展,并与超过50家企业客户展开商务沟通,将模型技术和场景深度结合,实现交互优化,不断提升用户体验。
例如,在教育场景中,「SenseNova-5o」可以帮助家长辅导孩子作业,清晰地给出解题思路。
现阶段,APP将供大家免费测试使用,不限使用次数。