AI视野:Stable Diffusion3发布;剪映海外版CapCut推文生视频;微软win10、win11照片应用增加AI橡皮擦功能;OpenAI更新GPT商店
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:https://top.aibase.com/
🤖📱💼AI应用
Stable Diffusion3发布 文字渲染能力超强,图像生成质量超越Midjourney
【AiBase提要:】
⭐️ Stable Diffusion3发布,具有强大的文字渲染、多主题提示和图像质量能力。
⭐️ 技术方面结合了扩散型transformer架构和flow matching技术。
⭐️ 公测开放的Stable Video提供文生视频和图生视频功能。
排队地址:https://top.aibase.com/tool/stable-diffusion-3
剪映海外版CapCut推文生视频功能 每人每天可免费生成5个视频
【AiBase提要:】
⭐ 支持AI自动转换文字描述为视频
⭐ 多镜头组合剪辑,生成丰富视频效果
⭐ 每人每天免费生成5个视频,适用人群广泛
官方入口:https://top.aibase.com/tool/capcutwenshengshipin
微软Windows10和 Windows11的照片应用增加AI橡皮擦功能
【AiBase提要:】
⚙️ Generative Erase功能类似魔术橡皮擦,为照片编辑带来全新体验。
📷 用户可轻松进行图像中的AI移除操作,提高编辑便捷性和效果。
💡 微软通过Generative Erase持续创新图像处理,提供更丰富编辑工具和体验。
创新性3D数据合成模型,微软推出EgoGen
【AiBase提要:】
⭐ EgoGen能够适用于多个自我中心感知任务,使用创新的人体运动合成模型来合成高质量数据。
⭐ 通过双阶段强化学习方案,EgoGen无缝结合自我感知视觉线索和身体运动,实现更加自然的运动。
⭐ EgoGen在人称感知任务上取得了显著成果,提升了现有算法在头戴式摄像头建图和定位等任务中的性能。
论文地址:https://arxiv.org/abs/2401.08739
即将开源地址:https://github.com/ligengen/EgoGen
智源研究院推出新一代多模态小模型Bunny-3B
【AiBase提要:】
⭐ 通过数据浓缩技术获得高质量训练数据
⭐ 将LAION-2B压缩成2M核心集
⭐ Bunny-3B小模型在多模态任务上表现优异
项目地址:https://github.com/BAAI-DCAI/Bunny
强大代码解释器OpenCodeInterpreter 可运行生成的代码
【AiBase提要:】
⭐️ 自动创建代码段,完成编程任务
⭐️ 运行生成的代码验证预期工作
⭐️ 根据执行结果和反馈生成更优质代码
项目地址:https://top.aibase.com/tool/opencodeinterpreter
模型:
https://huggingface.co/collections/m-a-p/opencodeinterpreter-65d312f6f88da990a64da456
📰🤖📢AI新鲜事
OpenAI更新GPT商店,增加用户评分和扩展构建者资料
【AiBase提要:】
⭐ 用户现在可以为第三方GPT进行评分
🤖 GPT构建者的个人资料更丰富,包括链接和评分信息
🔄 OpenAI未实现根据GPT使用频率分享收益的计划
Midjourney计划在6个月内开放API 视频功能会推迟到V7模型
【AiBase提要:】
⭐ Midjourney计划在未来六个月内开放API
⭐ V7模型将生成视频,产品即将在中国推出
⭐ Midjourney的发展前景看好,值得期待
Reddit通过与AI公司合作的数据授权收入达2.03亿美元
【AiBase提要:】
🤖 Reddit强调与AI供应商的关系,特别是与OpenAI等公司的合作对上市前景产生积极影响。
🌐 Reddit数据对AI模型培训的重要性,以及AI公司通过授权协议获取数据的焦点。
📈 Reddit通过数据授权实现巨额收入,凸显数据在AI领域的关键作用。
Chrome 获得由 Gemini 提供支持的内置 AI 写作工具
【AiBase提要:】
⭐ Chrome浏览器推出新的AI写作生成器
⭐ Gemini驱动,可帮助写各种文本内容
⭐ 实验阶段,仅在Windows、Mac、Linux提供英文版本
- 0001
- 0000
- 0001
- 0000
- 0000