AI视野:OpenAI员工集体辞职逼宫董事会;Runway正式发布运动画笔功能;animatediff-webui即将开源;北大开源Video-LLaVA大模型
📰🤖📢AI新鲜事
超过500名OpenAI员工集体辞职逼宫董事会
OpenAI数百名员工集体威胁辞职,指责董事会解职Altman处理不当,要求董事会辞职,或将跟随Altman加入微软。
【AiBase提要:】
😠 超过500名员工批评OpenAI董事会解职Altman不当,缺乏有效监督,威胁集体辞职。
🤝 员工信中警告,除非董事会辞职并重新任命Altman和前总裁Brockman,否则将跟随Altman加入微软。
💔 内部分歧凸显,Altman忠实追随者威胁辞职,微软保证OpenAI员工职位。
Runway正式发布运动画笔和Gen-2风格预设
Runway近日发布了一系列新功能和更新,其中包括运动画笔(Motion Brush)、Gen-2风格预设、更新的相机控制以及图像模型的改进。这些更新目前已正式上线,对所有用户开放使用。
【AiBase提要:】
🚀 创新工具发布: Runway推出运动画笔和Gen-2风格预设,为用户提供可控制的新视频生成方式。
💡 视频生成游戏规则改变: 行业专家表示,Gen-2的发布将彻底改变视频生成的游戏规则,运动画笔的加入省去了繁琐的编辑流程,提高了创作效率。
🌐 行业变革引领者: Runway在技术创新和用户体验方面展现卓越能力,发布的新功能不仅是技术突破,也是对用户体验的全面升级。
Discord宣布将于12月1日起关闭其人工智能聊天机器人Clyde
Discord宣布关闭实验性人工智能聊天机器人Clyde,原计划将其作为聊天和社区应用的基本部分,但具体原因尚未明确。
【AiBase提要:】
🤖 Clyde停用计划: Discord将于12月1日停用实验性人工智能聊天机器人Clyde,用户将无法在私聊、群聊或服务器中调用。
🔍 AI聊天机器人实验: Clyde是Discord的实验项目,使用OpenAI的模型进行测试,但具体停止服务原因未明确。
🚀 Discord的AI发展: Discord除了Clyde外,仍在尝试各种AI功能,包括生成会话摘要的AI,并努力将平台定位为AI开发者的家园。
微软调整AI图像生成工具以应对迪士尼版权问题
微软为防止迪士尼标志侵权,调整人工智能图像生成工具,禁止输入「迪士尼」,引发知识产权争议。
【AiBase提要:】
🚫 微软采取行动,阻止「迪士尼」输入到图像生成器,回应社交媒体趋势,避免侵犯迪士尼版权。
⚖️ 知识产权法律公司表示,复制迪士尼标志可能侵犯商标权,引发对 AI 处理标志的担忧。
🌐 存在疑问:迪士尼内容是否用于训练 AI 程序?微软调整政策,显示迪士尼文本和标志为混乱状态。
DeepMind推出OPRO技术,优化ChatGPT提示
Google DeepMind最新推出的OPRO技术利用大型语言模型(LLM)作为优化器,通过自然语言描述问题指导LLM生成和改进,特别适用于梯度难以获取的提示优化问题。该技术已在线性回归和数学优化问题上测试,展示了在优化LLM如ChatGPT和PaLM上的潜在效果。
【AiBase提要:】
🧠 OPRO是由Google DeepMind开发的技术,利用LLM作为自身提示的优化器,通过自然语言描述问题指导生成和改进,解决梯度难以获取的提示优化问题。
🔄 OPRO通过在元提示中包含任务的自然语言描述和示例,以自然语言方式解决问题,评估候选解决方案的结果,循环迭代直到找到最佳提示,可在数学优化问题上应用。
🌐 DeepMind测试了OPRO在线性回归和“旅行推销员问题”等数学问题上,展示了其在优化LLM如ChatGPT和PaLM上的潜在效果。
亚马逊推出全新免费AI培训课程
亚马逊宣布推出“AI Ready”计划,旨在到2025年免费培训全球200万人Generative AI职业所需技能,包含在线课程、奖学金计划和与Code.org的合作。
【AiBase提要:】
🎓 全球培训计划: 亚马逊计划通过"AI Ready"到2025年为200万人提供生成式AI职业所需技能的免费培训。
💻 免费课程与奖学金: 提供专业人士和初学者的免费Generative AI培训课程,以及面向高中和大学学生的奖学金计划。
💰 投资Udacity奖学金: 亚马逊将投资1200万美元提供5万个Udacity奖学金,支持全球高中和大学学生获取Generative AI技能,同时与Code.org合作在计算机科学教育周推出“Hour of Code”活动。
密歇根州议会采用新的 AI 技术来检测枪支
密歇根州议会将在议会大楼安装名为ZeroEyes的人工智能技术,通过分析监控录像识别枪支,提供额外安全保障。一旦有人在摄像头前拿出枪支,警报将发送到监控中心,由分析师进行审查和发送警报。
【AiBase提要:】
🔍 密歇根州议会引入ZeroEyes人工智能技术,通过监控录像识别枪支,增强议会安全。
🔍 技术特点在于只识别枪支本身,无论携带者身份,提供全面安全警报服务。
🔍 安装该技术是为应对过去几年发生的枪支进入议会大楼事件,以进一步确保公共安全。
OnePlus为用户推出人工智能驱动的音乐创作平台
一加最新推出人工智能音乐创作平台,为用户提供创意空间,标志着其从智能手机制造商转型为创新科技领域领导者。
【AiBase提要:】
🎵 创新平台推出: 一加公司推出人工智能音乐创作平台,扩展服务范围,让用户通过简单界面借助人工智能技术轻松创作个性化音乐作品。
🛠️ 强大功能支持: 新平台提供智能合成、音频处理和编曲功能,使非专业用户能轻松制作高质量音乐,同时提供丰富音频素材库。
🌐 创造力无限空间: 一加创始人表示,通过引入人工智能音乐创作平台,公司致力于让创造力成为每个人都能享受的体验,不仅局限于专业音乐人。
长虹推出基于大模型的智慧家电 AI 平台“长虹云帆”
长虹云帆是全球首个基于大模型的智慧家电AI平台,通过生成式人工智能应用于电视终端,实现电视的智能化和智能家居的全新阶段。
【AiBase提要:】
🌐 长虹云帆是全球首个大模型智慧家电AI平台。
💡 云帆具备简单易用、多维感知、多任务管理等五大能力,满足个性化需求。
📺 云帆已应用于长虹的8K系列、ARTIST星箔系列和288Hz超羽速系列电视。
🤖📱💼AI应用
vivo千询AI助手开放下载 基于蓝心大模型打造
vivo在开发者大会上发布了“蓝心千询”机器人,基于蓝心大模型,可向所有手机品牌开放使用,支持自然语言对话、知识回答、文学创作、图片生成、程序编写,并提供AI灵感功能。
【AiBase提要:】
🤖 开放使用: vivo发布基于蓝心大模型的“蓝心千询”机器人,向所有手机品牌开放下载和使用。
🔍 多功能应用: 该机器人支持自然语言对话、知识回答、文学创作、图片生成、程序编写等多项功能。
✨ AI灵感功能: “蓝心千询”具备AI灵感功能,为用户提供社交媒体文案创作、PPT大纲、中英互译、生活妙招等创作灵感。
WhatsApp推出Llama2驱动的AI聊天机器人测试版
在追求提升用户体验的过程中,WhatsApp正测试推出Llama2驱动的人工智能聊天机器人,为用户带来更便捷的通讯体验。Meta公司采用先进的Llama2语言模型,与Microsoft Bing合作,为其AI聊天机器人做最后的完善工作。最新的WhatsApp测试版中出现了一个新的快捷方式,使用户能够通过AI聊天机器人执行各项任务。
【AiBase提要:】
🚀 AI技术支持: WhatsApp测试Llama2驱动的AI聊天机器人,提升通讯体验。
🌐 Meta与Microsoft合作: Meta公司采用Llama2语言模型,与Microsoft Bing合作完善AI聊天机器人。
⚙️ 便捷操作方式: WhatsApp测试版中新增快捷方式,用户可通过AI聊天机器人执行任务。
Powder利用AI为游戏主播自动剪辑
法国初创公司Powder最近发布了一款基于人工智能的视频剪辑工具,通过训练40多个游戏专用的AI模型,能够自动检测游戏直播中的重要时刻,如取胜、击杀,大大简化游戏主播的后期编辑工作。
【AiBase提要:】
🎮 AI自动剪辑: Powder利用AI训练了40多个游戏专用的模型,能自动提取游戏直播中的精彩片段,减轻主播后期编辑负担。
🔊 音频分析与功能扩展: 除了检测取胜、击杀等瞬间,Powder计划增加检测主播尖叫的功能,并推出语音转文字技术,提供更多剪辑可能性。
⏰ 剪辑时间大幅减少: Powder声称其AI助手每周可为游戏主播节省多达10小时的剪辑时间,成为内容创作者的“圣杯”。
👨💻💡🎯聚焦开发者
gpt crawler:从URL爬取网站生成结构化知识,创建定制GPT
gpt crawler是一强大工具,能全面爬取网站内容,生成结构化知识,为定制GPT提供支持。用户可通过灵活配置爬虫、定制化知识文件生成,轻松上传至OpenAI,支持Docker容器化执行,促进个性化ChatGPT开发。
项目地址:https://github.com/BuilderIO/gpt-crawler
【AiBase提要:】
🌐 灵活配置爬虫: 用户可通过编辑config.ts文件自定义爬虫,适应不同网站结构和需求。
🧠 定制化知识文件生成: gpt-crawler生成包含知识数据的文件,为用户提供定制GPT的基础知识。
🚀 轻松上传到OpenAI: 生成的知识文件可方便上传至OpenAI,用于创建自定义GPT或助手。
animatediff-webui即将开源 简化配置,提升易用性
animatediff-webui即将开源,基于animatediff-cli-prompt-travel,旨在简化配置,提升用户体验,提供更细致、灵活的关键词控制,成为简单而功能强大的动画生成工具。
【AiBase提要】:
🚀 创新工程开源: animatediff-webui基于animatediff-cli-prompt-travel,致力于简化繁琐配置,提高用户体验。
🎨 灵活关键词控制: 新一代animatediff-webui通过controlnet和提示词信息,实现更细致、灵活的关键词控制,不再局限于全画面的应用。
🤖 易用性与灵活性兼顾: animatediff-webui的开源不仅提高易用性,还注重提升生成视频的灵活性,满足用户个性化和定制化需求。
🤖📈💻💡大模型动态
Music ControlNet可精确控制音乐中的时间变化
Music ControlNet是基于扩散技术的音乐生成模型,通过多时变控制、扩散技术和部分指定控制,提供精准的音乐时间变化控制,在性能和灵活性上表现出色。
项目地址:https://musiccontrolnet.github.io/web/
【AiBase提要:】
🎶 多时变控制: Music ControlNet通过扩散技术实现对音乐谱图的条件生成,提供旋律、动态和节奏等多个时变控制,使创作者更精细操控音乐。
🌐 扩散技术优势: 采用扩散技术微调训练音频控制信息,提高生成音乐的质量和逼真度,相较于其他模型具备更短训练时间和更少参数。
🕒 部分指定控制新策略: 引入新策略,允许创作者在时间上部分指定控制,为音乐创作提供更大自由度和创造性。
北大开源Video-LLaVA大模型,搞笑视频笑点秒懂
AI视频大模型Video-LLaVA由北大团队开源,成功解决了视觉-语言理解中同时处理图像和视频的难题,实现笑点理解。模型在13个基准测试上表现出色,无需配对数据训练,且通过预先对齐视觉输入,提高了对视频问答任务的性能。
【AiBase提要】:
🎥 模型介绍: 北大团队开源Video-LLaVA大模型,通过对齐视觉输入,实现笑点理解,无需配对数据训练。
🤖 性能优越: 在13个基准测试上,Video-LLaVA在视频问答任务上超过了5.8%至18.6%。
🔗 开源资源: 详细信息和代码可在GitHub(https://github.com/PKU-YuanGroup/Video-LLaVA)获取。
- 0000
- 0001
- 0000
- 0001
- 0000