首页站长资讯AI视野：OpenAI员工集体辞职逼宫董事会；Runway正式发布运动画笔功能；animatediff-webui即将开源；北大开源Video-LLaVA大模型

AI视野：OpenAI员工集体辞职逼宫董事会；Runway正式发布运动画笔功能；animatediff-webui即将开源；北大开源Video-LLaVA大模型

站长网2023-11-21 15:26:180阅

📰🤖📢AI新鲜事

超过500名OpenAI员工集体辞职逼宫董事会

OpenAI数百名员工集体威胁辞职，指责董事会解职Altman处理不当，要求董事会辞职，或将跟随Altman加入微软。

【AiBase提要:】

😠 超过500名员工批评OpenAI董事会解职Altman不当，缺乏有效监督，威胁集体辞职。

🤝 员工信中警告，除非董事会辞职并重新任命Altman和前总裁Brockman，否则将跟随Altman加入微软。

💔 内部分歧凸显，Altman忠实追随者威胁辞职，微软保证OpenAI员工职位。

Runway正式发布运动画笔和Gen-2风格预设

Runway近日发布了一系列新功能和更新，其中包括运动画笔（Motion Brush）、Gen-2风格预设、更新的相机控制以及图像模型的改进。这些更新目前已正式上线，对所有用户开放使用。

【AiBase提要:】

🚀 创新工具发布: Runway推出运动画笔和Gen-2风格预设，为用户提供可控制的新视频生成方式。

💡 视频生成游戏规则改变: 行业专家表示，Gen-2的发布将彻底改变视频生成的游戏规则，运动画笔的加入省去了繁琐的编辑流程，提高了创作效率。

🌐 行业变革引领者: Runway在技术创新和用户体验方面展现卓越能力，发布的新功能不仅是技术突破，也是对用户体验的全面升级。

Discord宣布将于12月1日起关闭其人工智能聊天机器人Clyde

Discord宣布关闭实验性人工智能聊天机器人Clyde，原计划将其作为聊天和社区应用的基本部分，但具体原因尚未明确。

【AiBase提要:】

🤖 Clyde停用计划: Discord将于12月1日停用实验性人工智能聊天机器人Clyde，用户将无法在私聊、群聊或服务器中调用。

🔍 AI聊天机器人实验: Clyde是Discord的实验项目，使用OpenAI的模型进行测试，但具体停止服务原因未明确。

🚀 Discord的AI发展: Discord除了Clyde外，仍在尝试各种AI功能，包括生成会话摘要的AI，并努力将平台定位为AI开发者的家园。

微软调整AI图像生成工具以应对迪士尼版权问题

微软为防止迪士尼标志侵权，调整人工智能图像生成工具，禁止输入「迪士尼」，引发知识产权争议。

【AiBase提要:】

🚫 微软采取行动，阻止「迪士尼」输入到图像生成器，回应社交媒体趋势，避免侵犯迪士尼版权。

⚖️ 知识产权法律公司表示，复制迪士尼标志可能侵犯商标权，引发对 AI 处理标志的担忧。

🌐 存在疑问:迪士尼内容是否用于训练 AI 程序?微软调整政策，显示迪士尼文本和标志为混乱状态。

DeepMind推出OPRO技术，优化ChatGPT提示

Google DeepMind最新推出的OPRO技术利用大型语言模型（LLM）作为优化器，通过自然语言描述问题指导LLM生成和改进，特别适用于梯度难以获取的提示优化问题。该技术已在线性回归和数学优化问题上测试，展示了在优化LLM如ChatGPT和PaLM上的潜在效果。

【AiBase提要:】

🧠 OPRO是由Google DeepMind开发的技术，利用LLM作为自身提示的优化器，通过自然语言描述问题指导生成和改进，解决梯度难以获取的提示优化问题。

🔄 OPRO通过在元提示中包含任务的自然语言描述和示例，以自然语言方式解决问题，评估候选解决方案的结果，循环迭代直到找到最佳提示，可在数学优化问题上应用。

🌐 DeepMind测试了OPRO在线性回归和“旅行推销员问题”等数学问题上，展示了其在优化LLM如ChatGPT和PaLM上的潜在效果。

亚马逊推出全新免费AI培训课程

亚马逊宣布推出“AI Ready”计划，旨在到2025年免费培训全球200万人Generative AI职业所需技能，包含在线课程、奖学金计划和与Code.org的合作。

【AiBase提要:】

🎓 全球培训计划: 亚马逊计划通过"AI Ready"到2025年为200万人提供生成式AI职业所需技能的免费培训。

💻 免费课程与奖学金: 提供专业人士和初学者的免费Generative AI培训课程，以及面向高中和大学学生的奖学金计划。

💰 投资Udacity奖学金: 亚马逊将投资1200万美元提供5万个Udacity奖学金，支持全球高中和大学学生获取Generative AI技能，同时与Code.org合作在计算机科学教育周推出“Hour of Code”活动。

密歇根州议会采用新的 AI 技术来检测枪支

密歇根州议会将在议会大楼安装名为ZeroEyes的人工智能技术，通过分析监控录像识别枪支，提供额外安全保障。一旦有人在摄像头前拿出枪支，警报将发送到监控中心，由分析师进行审查和发送警报。

【AiBase提要:】

🔍 密歇根州议会引入ZeroEyes人工智能技术，通过监控录像识别枪支，增强议会安全。

🔍 技术特点在于只识别枪支本身，无论携带者身份，提供全面安全警报服务。

🔍 安装该技术是为应对过去几年发生的枪支进入议会大楼事件，以进一步确保公共安全。

OnePlus为用户推出人工智能驱动的音乐创作平台

一加最新推出人工智能音乐创作平台，为用户提供创意空间，标志着其从智能手机制造商转型为创新科技领域领导者。

【AiBase提要:】

🎵 创新平台推出: 一加公司推出人工智能音乐创作平台，扩展服务范围，让用户通过简单界面借助人工智能技术轻松创作个性化音乐作品。

🛠️ 强大功能支持: 新平台提供智能合成、音频处理和编曲功能，使非专业用户能轻松制作高质量音乐，同时提供丰富音频素材库。

🌐 创造力无限空间: 一加创始人表示，通过引入人工智能音乐创作平台，公司致力于让创造力成为每个人都能享受的体验，不仅局限于专业音乐人。

长虹推出基于大模型的智慧家电 AI 平台“长虹云帆”

长虹云帆是全球首个基于大模型的智慧家电AI平台，通过生成式人工智能应用于电视终端，实现电视的智能化和智能家居的全新阶段。

【AiBase提要:】

🌐 长虹云帆是全球首个大模型智慧家电AI平台。

💡 云帆具备简单易用、多维感知、多任务管理等五大能力，满足个性化需求。

📺 云帆已应用于长虹的8K系列、ARTIST星箔系列和288Hz超羽速系列电视。

🤖📱💼AI应用

vivo千询AI助手开放下载基于蓝心大模型打造

vivo在开发者大会上发布了“蓝心千询”机器人，基于蓝心大模型，可向所有手机品牌开放使用，支持自然语言对话、知识回答、文学创作、图片生成、程序编写，并提供AI灵感功能。

【AiBase提要:】

🤖 开放使用: vivo发布基于蓝心大模型的“蓝心千询”机器人，向所有手机品牌开放下载和使用。

🔍 多功能应用: 该机器人支持自然语言对话、知识回答、文学创作、图片生成、程序编写等多项功能。

✨ AI灵感功能: “蓝心千询”具备AI灵感功能，为用户提供社交媒体文案创作、PPT大纲、中英互译、生活妙招等创作灵感。

WhatsApp推出Llama2驱动的AI聊天机器人测试版

在追求提升用户体验的过程中，WhatsApp正测试推出Llama2驱动的人工智能聊天机器人，为用户带来更便捷的通讯体验。Meta公司采用先进的Llama2语言模型，与Microsoft Bing合作，为其AI聊天机器人做最后的完善工作。最新的WhatsApp测试版中出现了一个新的快捷方式，使用户能够通过AI聊天机器人执行各项任务。

【AiBase提要:】

🚀 AI技术支持: WhatsApp测试Llama2驱动的AI聊天机器人，提升通讯体验。

🌐 Meta与Microsoft合作: Meta公司采用Llama2语言模型，与Microsoft Bing合作完善AI聊天机器人。

⚙️ 便捷操作方式: WhatsApp测试版中新增快捷方式，用户可通过AI聊天机器人执行任务。

Powder利用AI为游戏主播自动剪辑

法国初创公司Powder最近发布了一款基于人工智能的视频剪辑工具，通过训练40多个游戏专用的AI模型，能够自动检测游戏直播中的重要时刻，如取胜、击杀，大大简化游戏主播的后期编辑工作。

【AiBase提要:】

🎮 AI自动剪辑: Powder利用AI训练了40多个游戏专用的模型，能自动提取游戏直播中的精彩片段，减轻主播后期编辑负担。

🔊 音频分析与功能扩展: 除了检测取胜、击杀等瞬间，Powder计划增加检测主播尖叫的功能，并推出语音转文字技术，提供更多剪辑可能性。

⏰ 剪辑时间大幅减少: Powder声称其AI助手每周可为游戏主播节省多达10小时的剪辑时间，成为内容创作者的“圣杯”。

👨‍💻💡🎯聚焦开发者

gpt crawler:从URL爬取网站生成结构化知识，创建定制GPT

gpt crawler是一强大工具，能全面爬取网站内容，生成结构化知识，为定制GPT提供支持。用户可通过灵活配置爬虫、定制化知识文件生成，轻松上传至OpenAI，支持Docker容器化执行，促进个性化ChatGPT开发。

项目地址:https://github.com/BuilderIO/gpt-crawler

【AiBase提要:】

🌐 灵活配置爬虫: 用户可通过编辑config.ts文件自定义爬虫，适应不同网站结构和需求。

🧠 定制化知识文件生成: gpt-crawler生成包含知识数据的文件，为用户提供定制GPT的基础知识。

🚀 轻松上传到OpenAI: 生成的知识文件可方便上传至OpenAI，用于创建自定义GPT或助手。

animatediff-webui即将开源简化配置，提升易用性

animatediff-webui即将开源，基于animatediff-cli-prompt-travel，旨在简化配置，提升用户体验，提供更细致、灵活的关键词控制，成为简单而功能强大的动画生成工具。

【AiBase提要】:

🚀 创新工程开源: animatediff-webui基于animatediff-cli-prompt-travel，致力于简化繁琐配置，提高用户体验。

🎨 灵活关键词控制: 新一代animatediff-webui通过controlnet和提示词信息，实现更细致、灵活的关键词控制，不再局限于全画面的应用。

🤖 易用性与灵活性兼顾: animatediff-webui的开源不仅提高易用性，还注重提升生成视频的灵活性，满足用户个性化和定制化需求。

🤖📈💻💡大模型动态

Music ControlNet可精确控制音乐中的时间变化

Music ControlNet是基于扩散技术的音乐生成模型，通过多时变控制、扩散技术和部分指定控制，提供精准的音乐时间变化控制，在性能和灵活性上表现出色。

项目地址:https://musiccontrolnet.github.io/web/

【AiBase提要:】

🎶 多时变控制: Music ControlNet通过扩散技术实现对音乐谱图的条件生成，提供旋律、动态和节奏等多个时变控制，使创作者更精细操控音乐。

🌐 扩散技术优势: 采用扩散技术微调训练音频控制信息，提高生成音乐的质量和逼真度，相较于其他模型具备更短训练时间和更少参数。

🕒 部分指定控制新策略: 引入新策略，允许创作者在时间上部分指定控制，为音乐创作提供更大自由度和创造性。

北大开源Video-LLaVA大模型，搞笑视频笑点秒懂

AI视频大模型Video-LLaVA由北大团队开源，成功解决了视觉-语言理解中同时处理图像和视频的难题，实现笑点理解。模型在13个基准测试上表现出色，无需配对数据训练，且通过预先对齐视觉输入，提高了对视频问答任务的性能。

【AiBase提要】:

🎥 模型介绍: 北大团队开源Video-LLaVA大模型，通过对齐视觉输入，实现笑点理解，无需配对数据训练。

🤖 性能优越: 在13个基准测试上，Video-LLaVA在视频问答任务上超过了5.8%至18.6%。

🔗 开源资源: 详细信息和代码可在GitHub（https://github.com/PKU-YuanGroup/Video-LLaVA）获取。

AI视野OpenAI员工集体辞职逼宫董事会Runway正式发布运动画笔功能animatediffwebui即将开源北大开源VideoLLaVA大模型

0000

评论列表

共(0)条

AI视野：OpenAI员工集体辞职逼宫董事会；Runway正式发布运动画笔功能；animatediff-webui即将开源；北大开源Video-LLaVA大模型

谷歌推出Android WebView Media Integrity API 提升App内嵌影音内容安全性

腾讯大模型，有啥不一样？

全球独一档！蔚来离车自主换电功能亮相：车辆自动排队换电

苹果或将于9月13日举行秋季发布会 iPhone15或可9月中旬预定

推理性能飙升1.5倍！微软疯狂下单GB200芯片提升其AI算力