首页站长资讯AI日报：Remini“黏土AI”攻占小红书；HeyGen推自动剪辑工具；多图漫画工具StoryDiffusion来了；AI音乐Udio可生成15分钟音频

AI日报：Remini“黏土AI”攻占小红书；HeyGen推自动剪辑工具；多图漫画工具StoryDiffusion来了；AI音乐Udio可生成15分钟音频

站长网2024-05-06 22:17:360阅

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解：https://top.aibase.com/

1、这个五一假期，小红书被Remini“黏土AI”攻占了

在五一假期里，小红书平台上出现了一种新的流行趋势——“黏土AI”滤镜，迅速占领了小红书的首页，成为用户们热议的焦点。Remini的AI黏土滤镜功能在全球范围内掀起了新一轮的热潮，展示了AI技术在图像处理领域的应用潜力。

【AiBase提要:】

📸 小红书被“黏土AI”攻占，独特的黏土风格照片走红

🔥 Remini的AI黏土滤镜功能受欢迎，用户只需上传图片即可得到黏土风格照片

🚀 Remini的成功证明了图像处理AI产品在满足用户生活和娱乐需求方面的巨大潜力

详情链接:https://top.aibase.com/tool/remini-app

2、HeyGen推自动剪辑工具Instant Highlights 1.0

HeyGen公司最近推出了Instant Highlights 1.0自动视频剪辑工具，为用户提供便捷的视频编辑体验。该工具具有多语言配音功能，简化了视频内容的多平台适配工作，提高了内容传播效率。另外，HeyGen还发布了Avatar in Motion 1.0技术，实现了虚拟角色的动作捕捉和声音克隆，拓宽了虚拟角色在多个领域的应用潜力。这两项新技术展示了HeyGen在AI领域的实力和创新精神。

【AiBase提要:】

✨ 多语言配音功能，简化视频多平台适配工作，提高内容传播效率。

🌟 Avatar in Motion 1.0技术实现虚拟角色动作捕捉和声音克隆，拓宽了应用潜力。

💡 HeyGen在AI领域展示深厚实力和创新精神，为用户带来丰富个性化体验。

详情链接:https://top.aibase.com/tool/heygen

3、StoryDiffusion：保持角色一致，可生成多图漫画和长视频

南开大学 HVision 团队开发的StoryDiffusion工具能够创造神奇故事，保持角色一致，生成多图漫画和长视频。通过实现Consistent self-attention和Motion predictor，生成连贯的图像和视频，可用于漫画生成、图像转视频等多种场景。

【AiBase提要:】

🔮 Consistent self-attention 实现角色连贯图像生成

🎥 Motion predictor 实现长视频生成

🎨 支持漫画生成、图像转视频、长短视频等多种内容生成功能

详情链接:https://top.aibase.com/tool/storydiffusion

4、AI音乐工具 Udio更新可制作长达 15 分钟音乐

我对Udio最新更新的功能感到非常兴奋。这些更新提供了更长、更连贯的音乐创作体验，为音乐制作者带来更多创作自由和可能性。

【AiBase提要:】

✨ 上下文窗口扩展，考虑前后两分钟内容，提升音乐作品连贯性

🎵 支持长达15分钟音轨制作，满足音乐创作时长需求

🌳 引入创新音轨历史组织方式，让用户清晰追溯音轨版本发展历程

详情链接:https://top.aibase.com/tool/udio

5、Adobe推3D图标工具 Project Neo 可快速2D转3D

Adobe公司最新推出的Project Neo是一项革命性的3D技术，通过整合3D元素和效果，提升传统2D图形设计的视觉效果和制作效率。该工具快速高效的插图制作功能，用户可以轻松创建独特的3D形状，极大提高工作效率。Project Neo具备强大的风格化和造型功能，增强的颜色控制功能让用户能够精细调整中间色和阴影，为设计作品增加深度和几何感。

【AiBase提要:】

✨ 3D技术革命，提升2D设计效率

🎨 快速插图制作，轻松创建独特形状

🖌️ 强大风格化功能，精细调整颜色和阴影

详情链接:https://top.aibase.com/tool/project-neo

6、苹果 AI 计划曝光：更智能的 Siri 即将到来

苹果正致力于改进 Siri，采用更小更高效的模型，并计划在未来使 Siri 无需唤醒词即可智能回应。苹果 AI 在健康、图像编辑、Memojis 等领域展现出多种潜力应用，公司的 AI 战略逐渐清晰。

【AiBase提要:】

⭐ 苹果致力于改进 Siri，采用更小更高效的模型。

⭐ Siri 的未来或许无需唤醒词即可智能回应。

⭐ 苹果 AI 在健康、图像编辑、Memojis 等领域展现出多种潜力应用。

7、VILA：能理解视频的多模态模型，支持笔记本部署

VILA是英伟达发布的视觉语言模型，具备视频理解和多图像理解功能。最新版本VILA-1.5支持多种模型规模选择，通过TinyChat和TensorRT-LLM后端在各类NVIDIA GPU上高效部署。

【AiBase提要:】

💡 VILA是在大规模交织图像文本数据预训练的视觉语言模型

💡 VILA-1.5发布，具备视频理解功能，支持多种模型规模选择

💡 VILA通过TinyChat和TensorRT-LLM后端在各类NVIDIA GPU上高效部署

详情链接:https://top.aibase.com/tool/vila

8、英伟达ChatRTX引入多种新功能

英伟达的ChatRTX最新更新引入了多种新功能，包括支持更多大型语言模型、对比语言图像预训练、Whisper语音识别系统等，显著增强了聊天机器人应用的能力。更新体现了英伟达在AI和RTX加速技术领域的持续创新，为用户带来更智能和互动的体验。

【AiBase提要:】

✨ ChatRTX支持更多大型语言模型，包括Google的Gemma和中英双语的ChatGLM3，扩展了语言处理能力。

🔍 ChatRTX支持OpenAI的对比语言图像预训练（CLIP），使用户能通过文字与本地设备上的照片和图像进行交互。

🎙 ChatRTX支持Whisper语音识别系统，用户可以通过语音与ChatRTX进行交互，提升用户体验。

详情链接:https://blogs.nvidia.com/blog/ai-decoded-chatrtx-update/

9、Brilliant Labs推出Frame：一款集成AI的开源AR眼镜

Brilliant Labs最近发布了一款名为Frame的开源AR眼镜，结合了人工智能（AI）和增强现实(AR)技术，为用户带来前所未有的交互体验。Frame眼镜具备强大的视觉能力，实时采集和分析用户所见的图像数据，通过先进的AI模型提供详细问题解答，增强用户对周围环境的理解和互动。支持多模态交互，实时翻译功能，结合云端Noa AI助手实现更强大的AR功能。