Ai早报 7月19日

1.阿里云最新发布的 Qwen2-Audio 大规模音频语言型模型，革新了语音交互体验，用户无需输入文字即可与其进行语音交互，提供更便捷的体验。

2.百度网盘推出了名为「盘盘单词」的全球首个结合个人照片场景与英语学习的AI工具，旨在解决传统英语学习中的记忆困难和表达问题。用户可通过照片呈现单词和场景化内容，创造熟悉的英语环境。

3.OpenAI最近推出了Prover-Verifier Games（PVG）技术，旨在解决人工智能模型输出的“黑盒”问题。这项技术通过小模型监督大模型输出，提高了内容的准确性和可控性。

4.智源研究院联合大连理工大学、北京大学等高校推出了新一代无编码器的视觉语言模型EVE，通过精细化训练策略和额外的视觉监督，解决了多模态大模型训练分离导致的视觉归纳偏置问题。

5.微软推出了一款名为SpreadsheetLLM的新AI系统，它结合了大型语言模型的能力和电子表格中的结构化数据，能够更高效地处理数据，帮助企业获得更深入的见解。

6.Runway的iOS客户端迎来了重大更新，苹果用户也能在手机上体验到Gen3模型的强大功能。Gen-3Alpha支持多种生成工具，包括文本到视频、图像到视频、文本到图像转换，为创作者提供丰富创作选择。

7.小冰公司最近宣布了其AI数字员工产品线的全新升级，旨在进一步丰富产品并提升实时交互效果。新技术包括“零样本”数字人技术、超千亿大模型基座和透影音画传输系统，展现了小冰公司在数字人领域的技术创新和发展动力。

Ai早报 7月18日