每日AI:Pika推出Lip Sync功能;阿里推对口型视频生成工具EMO;DomoAI推fusion style功能;GitHub上线Copilot Enterprise通用版本
欢迎来到【每日AI】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:https://top.aibase.com/
🤖📱💼AI应用
Pika推出Lip Sync功能 支持视频人物嘴部动画和音频同步
【AiBase提要:】
⭐️ Lip Sync功能帮助用户实现嘴部动画和音频同步
⭐️ Pika Pro用户可体验,订阅费每月58美元
⭐️ 用户可选择输入文字生成音频或上传自己音频
产品入口:https://top.aibase.com/tool/pika
阿里推声画同步框架EMO 1张图片加音频就可以做会说话的头像视频
【AiBase提要:】
⭐ 只需输入图片和音频即可生成具有表现力的视频
⭐ 多语言、对话、唱歌以及快速语速的适配
⭐ 重要意义,为多语言、多样化场景下的角色表现提供新可能性
项目地址:https://top.aibase.com/tool/emo
特斯拉手机应用上线AI聊天助手“特斯拉助手Beta版”
【AiBase提要:】
⭐ 特斯拉手机应用推出AI聊天助手“特斯拉助手Beta版”提供全新交互体验
⭐ 特斯拉助手Beta版回答用户关于特斯拉产品的问题,提升用户了解和使用体验
⭐ 马斯克对AI技术兴趣浓厚,特斯拉AI助手创新举措将推动AI技术在汽车行业应用
DomoAI推出全新fusion style功能 简单提示词可替换风格还可以一键换衣
【AiBase提要:】
⭐ 用户通过简单提示词改变视频风格
⭐ 视频中人物可替换小物品、换新衣服
⭐ 设定视频时长,3秒、5秒、10秒选择
产品入口:https://top.aibase.com/tool/domoai
GitHub上线Copilot Enterprise通用版本
【AiBase提要:】
🚀 基于GPT-4的代码编写工具
🔍 开发人员可通过文本提示获取、审核、扩展代码
💼 每月39美元,包含所有商业计划功能,支持大型团队
项目地址:https://top.aibase.com/tool/github-copilot-enterprise
Playground发布最新文生图模型v2.5 提升人像细节
【AiBase提要:】
⭐ 高美感图像生成,提升视觉效果和美学质量。
⭐ 改进多纵横比图像生成,灵活处理各种尺寸图像。
⭐ 人物中心细节提升,采用新对齐策略减少视觉错误。
产品入口:https://top.aibase.com/tool/playground-ai
模型:https://huggingface.co/playgroundai/playground-v2.5-1024px-aesthetic
Salesforce宣布公开测试AI助手Einstein Copilot
【AiBase提要:】
⭐️ Einstein Copilot是面向CRM的新型定制化、对话式、生成式AI助手
⭐️ 目前支持Sales Cloud和Service Cloud,其他云将在 2024 年后提供
⭐️ 客户可以使用私有数据生成响应,实现AI CRM加速增长和提高生产力
入口:https://top.aibase.com/tool/einstein-copilot
Toona:一款好用的黑白漫画上色工具
【AiBase提要:】
⭐ 可以批量给黑白漫画上色,提供“清除”和“添加颜色提示”的选项
⭐ 提供多种色彩选择,上色效果非常不错
⭐ 重绘速度较快,免费提供使用
产品入口:https://top.aibase.com/tool/toona
📰🤖📢AI新鲜事
谷歌豪掷 6000 万美元购买Reddit 数据 用来训练AI模型
【AiBase提要:】
🔍 谷歌将使用Reddit数据训练AI模型,加速AI发展步伐。
🔍 Reddit作为资源丰富社交平台,为AI提供宝贵数据。
🔍 Reddit联合创始人是第三大股东,引发讨论。
超能干!OpenAI的AI代理相当于 700 名客服的工作量
【AiBase提要:】
🚀 Klarna宣布,AI助手在一个月内处理了三分之二的客服聊天,相当于 700 名员工的工作。
📈 AI在此期间处理了 230 万次对话,客户满意度高,错误率下降25%。
💼 该AI在 23 个市场提供服务,全天候可用,支持 35 种语言,计划增加更多功能。
Midjourney可能在这个选举季禁止生成拜登和特朗普的图片
【AiBase提要:】
🚫 举措旨在避免选举季引发争议和纷争。
📵 禁止这些图片可能影响政治讨论和观点交流。
🤝 中途之旅寻找平衡言论自由和平台秩序的解决方案。
魔搭社区开源多智能体框架AgentScope
【AiBase提要:】
⭐️ AgentScope支持纯Python编程,提供灵活的应用流程编排和丰富的API服务,简化开发流程。
⭐️ AgentScope提供全面的重试机制、容错控制和异常处理,确保应用稳定高效运行。
⭐️ AgentScope提供系统性支持多模态数据的交互,设计了新的基于Actor的分布式机制,可用于游戏制作和视频生成。
项目地址:https://github.com/modelscope/agentscope
开源小型语言模型MobiLlama 手机可运行训练
【AiBase提要:】
📱 MobiLlama是为资源受限设备设计的小型语言模型。
🌐该模型旨在提供准确、轻量级的解决方案,适应设备上的处理需求和能效。
🔒 MobiLlama为移动设备提供精确且透明的选择,适用于资源有限的环境。
斯坦福大学研究人员发布新机器学习方法C3PO:根据上下文定制大型语言模型
【AiBase提要:】
⭐ C3PO 方法通过情境化批评策略微调语言模型,避免过度泛化,确保稳健性。
⭐ 采用直接偏好优化和监督微调损失来调整模型,保持性能。
⭐ 该方法为个性化和高效的人工智能工具铺平道路,增强实用性和可访问性。
项目入口:https://top.aibase.com/tool/c3po
论文入口:https://arxiv.org/abs/2402.10893
ChatMusician:一个融合了音乐天赋的开源大语言模型
【AiBase提要:】
⭐️ 利用ABC记谱法实现文本兼容的音乐符号系统
⭐️ 模型能够独立使用纯文本处理音乐,无需多模态神经网络
⭐️ ChatMusician将音乐与语言有机结合,展示了大语言模型在音乐领域的潜力
项目地址:https://top.aibase.com/tool/chatmusician
论文地址:https://arxiv.org/pdf/2402.16153.pdf
OpenDiT:一个用来加速类似Sora的DiT架构模型训练和推理项目
【AiBase提要:】
⭐ 优化内核、混合并行方法和 FastSeq 技术提高 GPU 计算速度和降低内存占用
⭐ 简单易用的接口,用户无需了解分布式训练实现细节,轻松进行文本到图像和文本到视频的生成
⭐ 核心技术包括优化内核、混合并行方法和 FastSeq,提高训练和推断效率,适用于不同场景
项目地址:https://top.aibase.com/tool/opendit
- 0000
- 0000
- 0001
- 0001
- 0001