Ai早报 7月19日
1.阿里云最新发布的 Qwen2-Audio 大规模音频语言型模型,革新了语音交互体验,用户无需输入文字即可与其进行语音交互,提供更便捷的体验。
2.百度网盘推出了名为「盘盘单词」的全球首个结合个人照片场景与英语学习的AI工具,旨在解决传统英语学习中的记忆困难和表达问题。用户可通过照片呈现单词和场景化内容,创造熟悉的英语环境。
3.OpenAI最近推出了Prover-Verifier Games(PVG)技术,旨在解决人工智能模型输出的“黑盒”问题。这项技术通过小模型监督大模型输出,提高了内容的准确性和可控性。
4.智源研究院联合大连理工大学、北京大学等高校推出了新一代无编码器的视觉语言模型EVE,通过精细化训练策略和额外的视觉监督,解决了多模态大模型训练分离导致的视觉归纳偏置问题。
5.微软推出了一款名为SpreadsheetLLM的新AI系统,它结合了大型语言模型的能力和电子表格中的结构化数据,能够更高效地处理数据,帮助企业获得更深入的见解。
6.Runway的iOS客户端迎来了重大更新,苹果用户也能在手机上体验到Gen3模型的强大功能。Gen-3Alpha支持多种生成工具,包括文本到视频、图像到视频、文本到图像转换,为创作者提供丰富创作选择。
7.小冰公司最近宣布了其AI数字员工产品线的全新升级,旨在进一步丰富产品并提升实时交互效果。新技术包括“零样本”数字人技术、超千亿大模型基座和透影音画传输系统,展现了小冰公司在数字人领域的技术创新和发展动力。
评论区