AI视野:高通发布骁龙X Elite芯片;AutoGPT获1200万美元融资;AI社交产品Airchat火了;百度Comate智能代码助手上线SaaS版本
📰🤖📢AI新鲜事
高通发布骁龙X Elite芯片 电脑可运行130亿参数大模型
高通发布骁龙X Elite芯片,成为全球性能最强的CPU,能在PC上运行130亿参数的大模型,实现离线AI应用。
【AiBase提要:】
1. 🚀 高通发布骁龙X Elite芯片,全球性能最强的CPU,支持PC上的130亿参数大模型运行,实现离线AI应用。
2. 📱 高通还发布第三代骁龙8生成式AI手机芯片,支持10亿参数大模型,提供强大的AI和图像生成体验,首发于小米手机。
3. 🌐 高通展示混合AI路线图,将云端和终端AI深度融合,引领AI新时代,为用户提供更无缝的AI应用体验。
爆火智能体项目AutoGPT获1200万美元融资
AutoGPT项目最近成功获得1200万美元的融资,备受GitHub关注,使用GPT-4和GPT-3.5等语言模型构建多功能智能体。
【AiBase提要】
📌 AutoGPT项目成功融资1200万美元,引起GitHub广泛关注。
📌 该项目采用GPT-4和GPT-3.5等语言模型,构建多功能智能体,可独立执行任务并不断提高性能。
📌 引入生成式智能体的概念,通过异步智能体和智能体间通信提高系统效率,前景看好。
Google Photos即将允许用户自定义AI生成视频亮点
Google Photos即将推出更新,用户可以自定义其AI生成的视频亮点,包括选择内容、剪辑、重新排列和更换音乐。
【AiBase提要】
😊 用户将能够自定义Google Photos生成的视频,包括选择人物、地点和活动。
🎥 更新允许用户在生成后剪辑、重新排列视频片段,并更改音乐。
📷 这项更新提供了更个性化的视频编辑选项,介于随机生成和手动选择之间。
北大数学课引入AI助教Brainiac Buddy
北京大学引入了名为Brainiac Buddy的AI助教,基于GPT-4开发,旨在提升学生和老师的学习和教学体验,为学生提供便捷的学习方式和老师更好的教学支持。
论文地址:https://arxiv.org/pdf/2310.14201.pdf
【AiBase提要】
📚 北大数学课引入AI助教,提供更好的学习和教学体验。
🤖 AI助教名为Brainiac Buddy,基于GPT-4,协助学生理解课程和回答问题。
👨🏫 老师可以交给AI助教课程教案,提高教学效率。
谷歌准备在其AI搜索中投放广告
根据Alphabet公司第三季度财报,谷歌搜索业务仍然是主要盈利来源,计划将广告融入AI搜索体验中,但影响尚不明确。
【AiBase提要】
🔍 谷歌搜索业务仍是盈利主力,计划将广告与AI搜索融合。
🔍 虽面临激烈竞争,广告业务去年同期增长11%。
🔍 谷歌长期规划中,AI搜索将带来重大变革,广告仍是核心焦点之一。
这家OpenAI投资的公司,造出的芯片比iPad还大
Cerebras Systems开发的巨型芯片WSE-2比iPad还大,具备超强的算力和内存,成为世界上最大的计算机芯片,用于支持人工智能训练。
【AiBase提要:】
🌟 Cerebras Systems的WSE-2巨型芯片创纪录,拥有比iPad更大的面积,提供强大的算力和内存。
🌟 这款芯片支持人工智能训练,可达到人脑级别的参数规模,降低了训练成本。
🌟 尽管价格昂贵,Cerebras的计算机已被多个科研机构和厂商采用,具备出色的训练能力。
研究揭示:ChatGPT可能被诱骗生成恶意代码
英国谢菲尔德大学的研究发现,ChatGPT等AI工具存在安全漏洞,可被操纵生成恶意代码,潜在威胁数据库安全和网络攻击。
【AiBase提要】:
🔍 研究揭示,AI工具如ChatGPT存在漏洞,可生成恶意代码,危及数据库安全。
🛡️ 研究团队成功攻击了六种商业AI工具,包括BAIDU-UNIT,广泛应用于多个领域。
🔑 研究警告用户要意识到Text-to-SQL系统潜在风险,建立社区对抗未来高级攻击,确保网络安全。
AI辅助设备Humane AI Pin:AI将发布 搭载GPT-4
Humane的首款AIPin设备将于11月9日发布,搭载GPT-4,能磁性附着在衣物上,提供通话、语音翻译和食品信息识别功能,同时引入了“信任灯”指示录音状态。
【AiBase提要】:
📌 首款AIPin设备,11月9日发布,搭载GPT-4。
📌 可磁性附着在衣物上,提供通话、语音翻译和食品信息识别功能。
📌 引入“信任灯”指示录音状态,被列为Time杂志“2023年最佳发明”之一。
👨💻💡🎯聚焦开发者
苹果发布MDM扩散模型 训练步数减少七成!
苹果推出MDM扩散模型,通过嵌套低分辨率过程,减少训练步数,提升高分辨率图像性能,表现优越。
论文地址:https://arxiv.org/abs/2310.15111
【AiBase提要:】
🍏 苹果发布MDM扩散模型,通过套娃技术提高高分辨率图像性能。
📊 MDM在ImageNet和CC12M上表现卓越,参数较少,接近SOTA模型。
🔁 利用渐进训练和预训练的图像分类模型,MDM生成高质量图像和视频。
微软LongLLMLingua技术可将“文本提示”实现最高20倍的极限压缩
微软的LongLLMLingua技术可以将文本提示最高压缩20倍,提高性能、降低成本,解决大语言模型在长文本场景中面临的挑战。
论文地址:https://arxiv.org/abs/2310.06839
开源地址:https://github.com/microsoft/LLMLingua
【AiBase提要】:
💡LongLLMLingua技术最多可将文本提示压缩20倍,提升性能17.1%,减少成本。
💡它采用四大模块,包括问题感知的粗粒度压缩、文档重排序、动态压缩比率和压缩后子序列恢复。
💡实验结果表明,它在问答准确率、生成文本质量等方面明显优于其他提示压缩方法。
Meta推出MemWalker技术:大模型记忆增强方法,无需额外训练
MemWalker技术允许大型语言模型克服窗口长度限制,处理长文本并回答问题,依赖prompt而无需额外训练,通过树形记忆策略实现。
论文地址:https://arxiv.org/abs/2310.05029
【AiBase提要】
🌲 MemWalker技术采用树形记忆策略,克服大模型窗口长度限制,处理长文本问题。
🍃 工作原理包括记忆树构建和导航检索,提高答案定位和推理准确性。
🚀 整个过程仅依赖于prompt,为大型语言模型处理长文本迈出一重要一步。
多模态神经网络SALMONN 能够理解声音世界的AI模型
SALMONN是一种多模态神经网络,可以直接处理包括语音、音频事件和音乐等音频输入,并在各种语音和音频任务上表现出竞争力。该模型具有跨模态的能力,有望推动通用听觉能力的人工智能发展。
论文地址:https://arxiv.org/pdf/2310.13289v1.pdf
AiBase提要:
1. SALMONN是一多模态神经网络,处理语音和非语音音频事件,在多种音频任务上表现出竞争力。
2. 该模型通过激活调整阶段获得跨模态能力,如问答和叙述,解决了任务过度拟合问题。
3. 这项研究有望推动通用听觉能力的人工智能发展,为普通用户生活带来更多便利、效率和可持续性。
🤖📱💼AI应用
百度Comate智能代码助手上线SaaS版本
百度Comate智能代码助手正式推出SaaS版本,支持10余项编码功能,并适配100种不同的开发语言,为企业和开发者提供高效的编程辅助工具。
官网体验地址:https://comate.baidu.com
【AiBase提要:】
🚀 百度Comate SaaS版本上线,支持10余项编码功能。
💡 适配100种不同的开发语言,助力企业和开发者提高研发效率。
🌐 SaaS版Comate降低使用成本,实现开箱即用,无需自行训练模型。
AI社交产品Airchat火了,以语音为内容载体
Airchat是一款新的社交产品,具备AI大模型加成,以语音为主要内容形式,支持实时翻译功能,吸引了广泛关注。
【AiBase提要:】
🔹 Airchat以语音为主要内容形式,支持文字和图片,实现异步语音留言互动。
🔹 最显著特点是实时语音翻译功能,模仿口音用其他语言表达,促进跨语言交流。
🔹 尽管存在生命力疑虑,Airchat展示了AI大模型在产品应用中的潜力,提高了机器翻译准确性。
🤖📈💻💡大模型动态
谷歌发布性能出色的PaLI-3视觉语言模型,参数仅50亿
谷歌发布了名为PaLI-3的新一代视觉语言模型,仅拥有50亿参数,但在多模态测试中性能出色,可以回答有关图像的问题、描述视频、识别对象和读取图像上的文本。
项目网址:https://github.com/kyegomez/PALI3
【AiBase提要】:
🔍 谷歌发布名为PaLI-3的视觉语言模型,仅50亿参数,但性能出色。
🖼️ PaLI-3在多模态测试中表现出色,可以处理图像问题、视频描述、对象识别和文本读取。
🌱 小型模型更环保,适合培训和部署,有望推动大规模视觉语言模型的发展。
元象 XVERSE 与腾讯音乐推出 lyraXVERSE 加速大模型
元象 XVERSE 与腾讯音乐联手推出 lyraXVERSE 大模型,将应用于音乐助手 "AI 小琴",提供用户个性化的音乐互动体验。
【AiBase提要:】
🔹 元象 XVERSE 与腾讯音乐共同发布 lyraXVERSE 大模型,用于音乐助手 "AI 小琴"。
🔹 用户可以在 QQ 音乐上与 "AI 小琴" 互动,获得闲聊、推歌、音乐解读和词曲创作等服务。
🔹 该大模型的应用将提高运营效率,降低运营成本,提高回复准确性,增加用户聊天深度。
复旦大学团队发布金融领域的大语言模型——DISC-FinLLM
复旦大学的FudanDISC团队发布了DISC-FinLLM,一款多专家微调框架的中文智慧金融系统,旨在满足金融领域多样化需求。
【AiBase提要】
🚀 复旦大学的FudanDISC团队推出DISC-FinLLM,多专家智慧金融系统,支持金融行业各项任务。
💼 DISC-FinLLM的四个模组覆盖金融咨询、文本分析、计算和知识检索问答,展现卓越性能。
📚 该系统采用高质量金融数据集构建,开源模型参数和技术报告,为金融领域提供强有力的支持。
- 0000
- 0000
- 0000
- 0000
- 0003