AI视野:Azure AI新增40种大模型;Yi-34B-Chat微调模型开源;GPT-4在图灵测试中成功率超过41%;微软谷歌推出AI入门课程
📰🤖📢AI新鲜事
微软Azure AI新增40种大模型
微软宣布在Azure AI云开发平台中新增40个大模型,包括Whisper V3、Stable Diffusion、Phi、Falcon、SAM、CLIP、Code Llama等,支持文本生成、图像处理、代码编写、语音识别等多种功能。
【AiBase提要:】
🗣 Whisper V3: OpenAI最新语音模型,使用百万小时数据,支持语音翻译和转录。
🎨 Stable Diffusion: 由Stability AI开发,强大的图像生成模型,包括多种类型的图片生成。
🤖 Phi:13亿参数的Transformer架构,成为参数较少但卓越的模型之一。
三星确认Galaxy S24是AI手机
三星确认其即将推出的 Galaxy S24系列将聚焦于人工智能,申请了与 AI 相关的商标,预计在1月17日发布,并计划推出多项 AI 功能。
【AiBase提要:】
🔍 AI聚焦: 三星计划在 Galaxy S24系列中引入人工智能,通过申请商标如 AI Phone 和 AI Smartphone 突显其对 AI 的重视。
📅 发布日期确认: 预计 Galaxy S24将于2024年1月17日发布,展示多项 AI 功能,成为人工智能手机的代表。
🌐 全球申请: 三星不仅在智能手机领域,还在其他类别产品如智能戒指和 AR 眼镜上提交商标申请,展示全球范围内的人工智能布局。
微软谷歌DeepMind推出AI入门课程
谷歌和微软合作发布面向11-14岁初学者的AI入门课程,旨在培养下一代对人工智能的兴趣和理解,强调教育在推动科技领域发展中的重要性。
【AiBase提要:】
🚀 谷歌与Raspberry Pi基金会合作推出「Experience AI」课程,教11-14岁学生基本AI知识。
🌐 微软发布「Generative AI for beginners」课程,重点介绍生成式AI,提供详细教程和GitHub代码库。
🎓 谷歌和微软共同传达AI教育重要性,致力于培养多样化思想家和未来AI领袖。
GPT-4在图灵测试中成功率超过41%,人类保持在63%
最新研究表明,GPT-4在图灵测试中的成功率达到41%,超过传统人工智能模型,但仍低于人类63%的水平,突显了人工智能发展的潜在局限性。
【AiBase提要:】
🧪 图灵测试研究中,GPT-4成功率达到41%,人类有63%。
🤯 对比GPT-3.5和GPT-4,显示付费版本在测试中表现更出色。
🧠 图灵预测的计算能力要求未实现,人工智能仍有进步空间。
OpenAI开发者日干货笔记
本文揭示了OpenAI在ChatGPT产品发展中的团队合作、技术优化以及为创业者提供的工程实践经验,涵盖了产品与研究团队的密切协作、非线性策略优化大模型性能,以及应用从原型到成熟产品的实际指导。
【AiBase提要:】
👥 团队合作创新: OpenAI展示了研究团队和产品团队紧密合作的模式,使ChatGPT从原型到成熟产品的发展更为顺畅,为通用人工智能的目标打下基础。
🔄 非线性策略优化: 在GPT-4的开发中,OpenAI采用了非线性优化框架,包括提示工程、搜索增强生成(RAG)和微调,以更灵活地提升大模型的性能,解决实际问题。
🚀 创业者指南: OpenAI分享了将基于其模型的应用从原型走向完整产品的工程实践经验,强调以人为本的用户体验,减少模型不确定性,提高安全性和可控性。
亚马逊推出全新一代ASR系统
亚马逊的新一代语音基础模型驱动的ASR系统,覆盖100多种语言,提升20%至50%的准确度,支持自动标点、自定义词汇等多种功能,为语音转文本提供更全面、准确的服务。
【AiBase提要:】
🎙️ 多语言支持: 新一代语音基础模型涵盖100多种语言,提供全面的自动语音识别服务。
🚀 性能提升: 利用先进的自监督算法,提高20%至50%的准确度,尤其在电话语音等挑战性领域提高了30%至70%的准确度。
🌐 全面功能: 新ASR系统支持自动标点、自定义词汇、自动语言识别、说话人分离等特性,提供更准确的输出并有效嵌入语音技术。
LeCun:超级AI不会主宰人类,但必须开源
LeCun认为未来可能出现超越人类智能的情景,但这些人工智能不会主宰人类,而是成为与数字世界互动的中介,并强调其必须是开源的,以确保广泛参与学习和优化。
【AiBase提要:】
🌐 LeCun强调超级AI将充当人类智能助手,而非主宰者,成为与数字世界互动的中介。
🤖 他呼吁人工智能系统建立能够预测动作序列后果的世界模型,实现更通用的规划能力。
🌍 LeCun强调人工智能的开源,以避免少数公司垄断,确保多元参与和避免左右个体观点和文化。
Girolamo AI 聊天机器人 Beta 版发布
CardanoGPT推出Girolamo AI聊天机器人Beta版,以Girolamo Cardano命名,标志着Cardano在区块链领域探索人工智能的新阶段,具备实时、语境感知的响应和图像生成解读能力。
【AiBase提要】
🚀 技术融合创新: CardanoGPT发布Girolamo AI聊天机器人Beta版,标志着人工智能与区块链技术的深度融合,为交互性和多功能性的AI应用在区块链框架内开辟新可能。
🤖 功能丰富聊天机器人: Girolamo聊天机器人在Beta测试阶段承诺成为AI集成区块链解决方案中的新成员,提供实时、语境感知的响应,并具备生成和解读图像的能力,增强用户体验。
🔗 参与门槛设定: 参与Girolamo beta测试的用户需持有至少5000CGI代币,通过CardanoGPT Discord服务器验证钱包后,可与聊天机器人直接互动,尽管Girolamo仍处于Beta阶段,信息准确性无法百分之百保证。
斯坦福大学研究NOIR系统:实现用意念控制AI机器人
斯坦福大学研发的NOIR系统通过解码大脑信号,使人类能够用意念来操控机器人,为残障人士和老年人提供支持,同时在危险环境中执行任务,为智能机器人的发展提供新思路。
【AiBase提要:】
🌐 NOIR系统:通过脑电信号实现人类对机器人的指令,涉及解码目标物体、互动方式和位置三个关键阶段。
🤯 应用广泛:不仅支持残障人士和老年人,还可在危险环境中执行任务,为未来智能机器人的发展提供新思路。
👥 技术突破:NOIR的突破性技术使得通过大脑信号操控机器人成为可能,为身体受损的人们提供独立控制环境的新可能性。
维基百科创始人表示,ChatGPT 的维基百科写作“糟糕”且“混乱”
维基百科创始人吉米·威尔士批评ChatGPT的维基百科写作糟糕且混乱,指出存在错误和虚构信息,但对AI在支持维基百科的潜在作用持开放态度。
【AiBase提要:】
🧐 吉米·威尔士批评ChatGPT在维基百科上的写作存在错误和虚构信息,形成混乱。
🌐 尽管批评,威尔士对AI在支持维基百科方面的潜在作用持开放态度,考虑与开源AI公司合作,以识别不准确信息。
🤝 Meta公司展示了PEER和Side等AI模型,但目前尚未与维基媒体建立合作,维基百科领域对AI潜在作用的探索仍在继续。
索尼推出相机内真实性认证技术,应对 AI 合成图像挑战
索尼推出相机内真实性认证技术,通过在拍摄时为图像文件添加基于机器的数字签名,以应对人工智能合成图像的挑战。
【AiBase提要:】
📷 技术原理: 索尼相机内真实性认证技术通过在拍摄时为图像添加数字签名,消除了在拍摄和传输过程中操纵图像的可能性。
🔄 硬件优势: 与莱卡技术不同,索尼的方案基于现有硬件,使得未来相机更易实现,并通过固件更新使旧型号相机向后兼容。
🤝 与美联社合作: 在与美联社的测试中,确保数字签名在新闻摄影工作流程中保持完整,为应对假冒和操纵图像提供更可靠的解决方案。
🤖📈💻💡大模型动态
零一万物Yi-34B-Chat微调模型及量化版开源
零一万物发布了Yi-34B-Chat微调模型,并提供4bit/8bit量化版,在评测中取得优异成绩,可在消费级显卡上使用,已开源并可免费商用。
【AiBase提要:】
🚀 模型开源与微调发布: 零一万物发布Yi-34B-Chat微调模型,同时提供4bit/8bit量化版,在评测中表现优异,已开源并可免费商用。
⚙️ 量化版适用性:4bit量化版模型可在消费级显卡上使用,如RTX3090,提供更高的计算效率。
🏆 评测成绩突出: Yi-34B-Chat在英文知识水平、中文综合考试以及数学推理能力评测中表现出色,为开发者提供强大的语言理解和处理能力。
Inflection推全球计算级别最佳AI模型Inflection-2
Inflection-2是由Inflection AI推出的全球计算级别最佳的语言模型,号称仅次于OpenAI最新模型,在语言理解、生成、事实知识、推理和风格控制等方面表现卓越,通过大规模GPU训练,并强调负责任的模型扩展。
项目网址:https://inflection.ai/inflection-2
【AiBase提要:】
🌟 Inflection-2致力于提升语言理解和生成能力,在科学问答等任务上超越了谷歌和Meta的语言模型。
🤖 通过深度增强事实知识、推理和风格控制,Inflection-2展现出在常识和数学推理方面的出色性能。
💡 公司计划通过扩展GPU集群,大规模培训更大型的模型,同时强调在AI开发中的道德和伦理考虑。
🤖📱💼AI应用
Xboard:一款基于ChatGPT的智能键盘
Xboard是一款基于人工智能技术的先进键盘,旨在提高用户在消息、电子邮件、内容和搜索生成上的智能、迅速和高效体验。该键盘利用ChatGPT技术,能够自动生成多种类型的消息、电子邮件、内容和搜索,并在输入过程中主动纠正拼写和语法错误。
地址:https://play.google.com/store/apps/details?id=com.xboard.keyboard.gpt
【AiBase提要:】
🚀 智能生成: Xboard利用ChatGPT技术,智能生成多种类型的消息、电子邮件、内容和搜索,提升用户生产力。
🔄 上下文学习: 键盘能够学习用户输入习惯和上下文,提供更为精准的建议和预测,使输入体验更高效。
🔐 纠错功能: Xboard不仅生成内容,还主动纠正拼写和语法错误,提供准确的建议和预测,增强用户输入准确性。
爆款短视频利器!Klap可一键生成适用于多平台的短视频
Klap是一款基于人工智能技术的工具,专为内容创作者和社交媒体推广设计。它能将YouTube视频一键转换为适用于多个社交媒体平台的短视频,包括TikTok、Shorts和Reels。Klap支持YouTube视频链接,而文件上传功能即将推出,提供更多选择。
体验地址:https://top.aibase.com/tool/klap
【AiBase提要:】
🚀 Klap可将YouTube视频转换为适用于多平台的短视频。
💡 一键生成视频,具备主题检测和多语言自动字幕功能,支持微调。
🎥 面部聚焦功能使人脸成为焦点,提高视频吸引力。
Janitor AI:一个动漫风格的角色聊天机器人网站
Janitor AI是由janitorai.com开发的AI互动平台,用户可轻松打造具有各种个性的NSFW虚构聊天机器人角色,采用OpenAI的GPT模型提供高质量自然语言交互体验。
体验地址:https://top.aibase.com/tool/janitorai-ai
【AiBase提要:】
🤖 角色创作平台: 用户可在janitorai.com注册账号,通过选择模板和设定性格、语言风格,打造个性化聊天机器人角色。
🔄 API和SDK支持: Janitor AI提供丰富的API和SDK,方便开发者将虚构聊天机器人体验整合到自己的应用程序中。
🌈 个性化交互体验: 平台独特之处在于为用户和开发者提供一站式虚构聊天机器人体验,打开了无限可能。
👨💻💡🎯聚焦开发者
Adobe发布创新的DMV3D方法 单个A100生成3D图像只需30秒
Adobe与斯坦福大学合作推出DMV3D方法,利用基于Transformer的单阶段全类别扩散模型,在单个A100GPU上只需30秒生成高保真3D图像,通过稀疏的多视图投影解决传统3D生成方法中的模糊和难以去噪的问题。
论文地址:https://arxiv.org/pdf/2311.09217.pdf
官网地址:https://justimyhxu.github.io/projects/dmv3d/
【AiBase提要】
🚀 创新方法: Adobe与斯坦福大学研究者合作推出DMV3D方法,利用Transformer模型在30秒内生成高保真3D图像。
🔄 全类别扩散模型: DMV3D采用新型单阶段全类别扩散模型,通过2D多视图图像扩散、3D NeRF重建和渲染的端到端训练,避免传统方法问题。
🌐 稀疏多视图投影: 利用稀疏的多视图投影作为训练数据,DMV3D在单个图像或文本输入情况下实现3D生成,超越先前方法,为AI视觉领域带来新可能性。
IDEA提出ToG思维图谱 大模型性能提升214%!
由IDEA研究院等多方合作推出的Think-on-Graph技术,通过深度融合大模型与知识图谱,在多领域取得214%性能提升,解决大模型在金融、法律、医疗等领域的幻觉问题。
论文地址:https://arxiv.org/pdf/2307.07697.pdf
代码链接:https://github.com/IDEA-FinAI/ToG
【AiBase提要:】
😮 创新技术: Think-on-Graph技术通过紧耦合大模型与知识图谱,成功弥补了大模型在各领域幻觉问题的能力短板。
😎 推理链条优化: 采用紧耦合范式,将大模型作为“跑腿”与知识图谱相互协作,提供更清晰、可追溯的推理链条。
🚀 性能突破: 在多个基准数据集上实现巨大性能提升,刷新深度推理领域的性能榜单,为大模型在各领域应用中提供可靠、可解释的推理能力。
腾讯披露最新大模型训练方法:Angel框架升级 效率提升2.6倍
腾讯通过升级自研机器学习框架Angel,成功提升大模型训练效率,千亿级大模型训练成本降低50%,并推出大模型推理框架AngelHCF,提高推理速度1.3倍。
【AiBase提要】
😇 框架升级:腾讯使用Angel框架,通过多维度并行优化存储和软硬件结合解决通讯问题,使大模型训练效率提升2.6倍。
😈 推理框架创新:推出AngelHCF,通过扩展并行和关键能力优化,相较主流框架提高了推理速度1.3倍。
🚀 全面支持:提供一站式训练精调,已有超过300项业务接入,标志着整个生产链路的全面升级,进一步推动大模型应用的发展。
马毅团队5年心血提出白盒Transformer结构CRATE
马毅团队通过提出的CRATE结构,将数据从高维度分布压缩到低维结构,揭示了智能的本质可能是数据压缩,打开了深度学习黑盒。
论文地址:https://arxiv.org/abs/2311.13110
【AiBase提要:】
🧠 智能本质解析: 马毅团队提出的CRATE结构通过将数据压缩到低维结构,揭示了智能可能是数据压缩的结果,从而增强模型可解释性。
💻 黑盒问题突破: CRATE结构作为「白盒」Transformer,解决了大模型的黑盒问题,提升了模型的可解释性,为安全性问题提供了新的解决途径。
🚀 新学习范式: 研究指出「压缩就是一切」,弥合了深度学习理论和实践之间的鸿沟,为构建更智能系统提供了新的学习范式。
芝加哥大学研究人员推出3D画笔:使用文本生成局部风格化纹理的AI方法
3D画笔是一种由芝加哥大学研究人员与SnapResearch合作推出的人工智能方法,通过文本描述能够自动生成网格上的局部语义区域的纹理,为纹理编辑领域带来新的可能性。
【AiBase提要:】
🌐 直观编辑纹理:3D画笔通过文本描述实现在网格上进行纹理编辑,使用户能够直观、自由地控制纹理。
🤖 细节与分辨率提升: 采用级联分数蒸馏和神经场,提高局部纹理区域的细节和分辨率,实现清晰的定位和高分辨率的纹理。
🚀 多层感知器创建神经纹理: 使用多层感知器在3D表面上创建神经纹理,实现平滑变化、减少噪点,并具备超分辨率能力。
- 0000
- 0001
- 0000
- 0000
- 0000