AI日报:美图发布AI视频神器MOKI;OpenAI靠ChatGPT半年赚34亿美元;斯坦福开发对口型视频模型PROTEUS
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:https://top.aibase.com/
1、美图发布王炸产品MOKI 可一键生成AI视频短片
美图公司发布了名为MOKI的AI视频制作工具,实现了一键生成AI视频短片的功能,展示了其在AI领域的深入布局和创新能力。尽管实际效果有待用户评价,但市场已经对其潜力表示关注。
【AiBase提要:】
⭐MOKI是美图公司推出的AI短片创作工具,专注于网文短剧、故事绘本、动画短片和MV四种视频形式的创作。
⭐MOKI通过内置的视频生成模型和工作流,用户输入文本提示即可同时完成脚本、角色、视频和音效配音等内容的生成
⭐高度可控,能够实现一键生成AI视频短片,该产品将于 7 月 31 日开放体验
官网地址:https://top.aibase.com/tool/moki
2、斯坦福大学开发!对口型视频模型PROTEUS可让图片开口唱歌
斯坦福大学与Apparate Labs联合推出的AI模型PROTEUS实现了通过单张照片生成逼真虚拟人物,并实时唱歌和说话的功能。该模型具有实时生成逼真人物、高帧率视频流、多模态交互等特点,可应用于个性化虚拟助理、虚拟宠物、客户服务等多个领域。PROTEUS的愿景是提供可通过语音控制的视觉化体现,为用户带来自然的虚拟人物交互体验。
【AiBase提要:】
👩💻 实时生成逼真人物,展现复杂面部表情和身体动作。
🎥 支持高帧率视频流,实现流畅的互动体验。
💬 多模态交互,适用于语音、文本和图像等多种数据形式。
详情链接:https://apparate.ai/stream.html
3、FontStudio:轻松制作各种纹理炫酷字体效果
FontStudio是一种新方法,可以帮助制作漂亮的字体效果,让作品更有趣和独特。使用扩散模型技术在不规则形状的画布上生成字体效果,引入分割掩模技术保持形状一致性。用户偏好研究显示,FontStudio受到很多人喜爱,甚至比市面上的商业产品Adobe Firefly有优势,具有美学吸引力。
【AiBase提要:】
🎨 制作漂亮字体效果
🔍 使用扩散模型技术生成不规则形状字体效果
🔗 引入分割掩模技术保持形状一致性
产品入口:https://top.aibase.com/tool/fontstudio
4、OpenAI年化营收跃升至34亿美元 订阅版ChatGPT成主要推动力
OpenAI近期年化营收达到34亿美元,增长迅速。主要得益于ChatGPT订阅版和与微软的合作,收入来源多元。最新与苹果合作,将ChatGPT接入iPhone、iPad和Mac操作系统,提升用户体验。
【AiBase提要:】
📈 OpenAI年化营收达到34亿美元,增长迅速。
💡 主要得益于ChatGPT订阅版和与微软的合作,收入来源多元。
🤝 最新与苹果合作,将ChatGPT接入iPhone、iPad和Mac操作系统,提升用户体验。
5、VideoLLaMA 2: 上传视频可根据指令实时识别解读视频内容
随着人工智能技术的发展,VideoLLaMA2项目应运而生,旨在推进视频大语言模型时空建模和音频理解能力。该项目能够帮助用户更好地理解视频内容,识别速度快且精准。
【AiBase提要:】
🚢 高级多模态语言模型,提升视频内容理解能力。
⏰ 精确的时空建模,识别视频中的动作和事件顺序。
🔊 出色的音频理解能力,分析视频中的声音内容。
详情链接:https://top.aibase.com/tool/videollama-2
6、机器人会自己开车了!东京大学开发肌骨类人机器人Musashi
Musashi是一款肌骨类人机器人,具备自主驾驶能力,展示了自动驾驶领域的潜力。尽管在转弯速度和加速控制方面存在限制,但其硬件设计和软件系统结合的方式为未来智能化驾驶体验提供了新思路。研究成果已在论文中发表,为自动驾驶技术发展打下重要基础。
【AiBase提要:】
🤖 Musashi是肌骨类人机器人,具备视觉感知和驾驶操作能力。
🚗 Musashi能够驾驶小型电动车,遵守交通规则并识别交通信号灯、行人和其他车辆。
🔬 Musashi的工作原理包括硬件设计模仿人类肌肉骨骼结构和软件系统结合多种基于学习的模块。
详情链接:https://arxiv.org/pdf/2406.05573
7、指环王 赛博朋克2077!网友用AI制作电影预告片播放破百万
我对这篇文章感到非常兴奋和惊叹。一位网友利用AI技术创作了一部名为"Cyberlord of the Chips"的电影预告片,将《指环王》与《赛博朋克2077》进行大胆融合,展现出全新的赛博朋克风格中土世界。这展示了AI技术在图像生成领域的飞速发展,引发了关于技术进步与电影艺术独特性的讨论。
【AiBase提要:】
🎥 AI技术创作电影预告片《Cyberlord of the Chips》融合了《指环王》与《赛博朋克2077》的世界观,引起广泛关注。
🌟 利用Midjourney、Runaway和Elevenlabs等工具,重新想象了摧毁魔戒之旅成为寻找致命芯片的冒险,展现出赛博朋克风格的中土世界。
🔮 预告片视觉效果惊人,将中土世界的古老城堡和广袤大地转化为赛博朋克风格的高楼大厦和霓虹灯光,展示了AI技术在电影制作中的潜力。
8、特斯拉股东起诉马斯克将资源转移到其AI公司xAI
在最近的特拉华州诉讼中,特斯拉股东指控马斯克和董事会将公司资源转移到竞争人工智能公司xAI,违反信托义务。马斯克试图将特斯拉定位为机器人和人工智能强国,股价上涨,但股东认为其行为有失公平。股东还援引马斯克转移英伟达人工智能芯片的报道。另有机构投资者指控马斯克利用内幕信息赚取数十亿美元。
【AiBase提要:】
🔍 特斯拉股东起诉马斯克及董事会将资源转移到xAI公司,违反信托义务。
💡 马斯克试图将特斯拉定位为机器人和人工智能强国,股价上涨,但股东认为其行为有失公平。
💰 股东指控马斯克转移英伟达人工智能芯片至社交媒体公司,另有机构投资者指控其利用内幕信息赚取数十亿美元。
9、Spotify成立内部创意机构,测试生成式AI配音广告
Spotify成立内部创意机构Creative Lab,旨在帮助品牌定制营销活动并测试生成式AI广告。公司正致力于开发新的AI工具“Quick Audio”,以帮助广告商创建脚本和配音。通过吸引广告商和利用AI技术,Spotify致力于提升广告营销效果。
【AiBase提要:】
✨ Spotify成立Creative Lab内部创意机构,助力品牌定制营销活动。
🤖 Spotify推出新AI工具“Quick Audio”帮助广告商创建脚本和配音。
🔗 品牌可与Creative Lab团队合作制作视频、音频广告,提升互动广告形式。
10、Mozilla Solo AI更新:无代码 AI 网络生成器
Mozilla推出全新人工智能工具Solo AI,无需编码知识即可创建网站。Solo1.0版本引入动画效果,提升网站视觉吸引力,添加欧洲用户cookie通知横幅。支持最多三个文本和图像横幅部分,字符数限制和最多上传30张自定义图像。Solo AI承诺轻松创建和发布网站,帮助发展业务。市场上已有多种AI工具可帮助用户创建网站,Solo1.0标志着无编码网站建设进入新阶段。
【AiBase提要:】
🤖 Solo1.0版本引入动画效果,提升网站视觉吸引力。
🍪 添加欧洲用户cookie通知横幅,保持固定标题在顶部。
🚀 支持最多三个文本和图像横幅部分,字符数限制和最多上传30张自定义图像。
- 0000
- 0000
- 0000
- 0000
- 0000