今日AI:阿里欲推AI电商产品“绘蛙”;北大团队发起复现Sora计划;ComfyUI LayerDiffusion正式上线;AI工具DUSt3R GitHub爆火
欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:https://top.aibase.com/
🤖📱💼AI应用
阿里正在打造一款AI电商产品“绘蛙”
【AiBase提要:】
⭐该产品主要针对商家和达人,主要功能有AI文案生成和AI生图
⭐AI文案主要实现单商品种草、爆文改写、穿搭分享等
⭐AI生图主要将为淘宝、天猫商家和达人训练专属AI模特,打造网红同款商品图
北大团队发起复现Sora计划“OpenSora”AnimateDiff大神响应
【AiBase提要:】
🔍北大团队与兔展启动复现Sora计划,名为OpenSora,目前框架已搭建。
🌐OpenSora计划采用三部分组成的框架,包括VideoVQ-VAE、DenoisingDiffusionTransformer和ConditionEncoder。
🚀目前团队需要更多的数据和GPU进行训练,北大校友、AnimateDiff大神等积极响应。
项目地址:https://top.aibase.com/tool/open-sora-plan
ComfyUI透明图层生成插件LayerDiffusion正式上线
【AiBase提要:】
⭐不仅支持直接生成透明的图片元素,还可以在已有图片上生成与环境融合的透明图片。
⭐该插件主要包含两个节点,其中一个遮罩节点需要安装comfyui-tooling-nodes插件。
⭐目前只支持生成,图像质量可媲美真实的商业级透明素材
项目地址:https://top.aibase.com/tool/comfyui-layerdiffusion
ComfyUI-Mana-Nodes:一个好玩的ComfyUI插件可自定义字体动画
【AiBase提要:】
⭐️支持生成自定义程度极高的字体动画
⭐️用户可自定义背景颜色、字体颜色等
⭐️插件支持使用本地字体文件,提供更多创作可能性
项目地址:https://top.aibase.com/tool/comfyui-mana-nodes
D-IDAgents:1张照片 声音克隆定制数字分身
【AiBase提要:】
⭐1张照片 克隆你的声音 同步用户知识库就能定制专属数字分身
⭐数字人可以代替你进行视频对话,仅有2秒延迟,可用在视频开会等场景
⭐注册账号就可以体验,每个用户有200次免费使用的机会
体验地址:https://top.aibase.com/tool/d-id-agents
浙大&微软推出视频编辑框架UniEdit,无须训练、支持多种编辑场景
【AiBase提要:】
⭐ UniEdit在多种视频编辑场景中表现优异
⭐ UniEdit独特之处在于支持动作编辑和多种外观编辑场景
⭐ UniEdit利用时间自注意层和空间自注意层实现编辑视频动作和外观
项目主页:https://jianhongbai.github.io/UniEdit
AI漫画生成应用Dashtoon小说推文制作一大利器
【AiBase提要:】
🌟可一次性生成漫画,提供充分的编辑和自定义空间
🌟人物一致性处理成熟,具有高借鉴价值
🌟提高制作效率和质量,打开新的可能性
体验地址:https://top.aibase.com/tool/dashtoon
GitHub又火了一款AI工具 DUSt3R :2张图2秒钟3D 重建
【AiBase提要:】
⭐️ DUSt3R 在单目 / 多视图深度估计以及相对位姿估计任务上表现出色。
⭐️ 作者团队采用全新方法,无需相机校准或视点姿势先验信息,能在任意图像中完成3D 重建。
⭐️ DUSt3R 在多项任务上取得了 SOTA 的成绩,展现出其强大功能和适用性。
论文https://arxiv.org/abs/2312.14132
项目入口:https://top.aibase.com/tool/dust3r
什么值得买AI购物助手“小值”上线 提供全网购物推荐和建议
【AiBase提要:】
⭐️ 自主研发的AI购物助手“小值”在“什么值得买”App上线
⭐️ 提供实时优惠价格和商品口碑评价,帮助用户做出明智购物决策
⭐️ 通过意图识别模型推荐符合用户需求的优质商品,带来全新购物体验
📰🤖📢AI新鲜事
Meta AI提出MobileLLM:为在移动设备上部署LLM提供新思路
【AiBase提要:】
⭐️ LLM在移动设备上遇到挑战
⭐️ MobileLLM通过深窄结构设计和参数优化提高性能表现
⭐️ 打开了在资源受限环境下应用LLM的新可能性
谷歌Chrome在搜索栏中增加更多搜索功能
【AiBase提要:】
⚙️ Chrome应用中与购物相关的搜索会展示更广泛的产品和购物类别的图片缩略图。
📶 即使在网络连接较差的情况下,Chrome会通过“改进的设备端功能”提供搜索建议。
🔍 搜索框中显示基于之前搜索记录的建议查询内容,为用户提供更智能、个性化的搜索体验。
港大开发V-IRL平台:将真实世界地图纳入虚拟环境 给AI Agent完整的一生!
【AiBase提要:】
⭐ 港大和NYU的研究团队合作开发V-IRL平台,将真实世界地图等信息融入虚拟环境,提供AI Agent更真实生活体验。
⭐ V-IRL平台模拟真实环境,使智能体执行复杂任务,并可在不同任务间协作解决问题。
⭐ 研究人员基于V-IRL进行了地点识别、视觉问答和导航等测试,展示AI在现实世界的广泛应用潜力。
项目地址:https://github.com/VIRL-Platform/VIRL
清华、哈工大提出OneBit方法:可把大模型压缩到1bit 保持83% 性能
【AiBase提要:】
⭐ 清华大学和哈尔滨工业大学联合发布论文,将尝试1bit 量化,突破了2bit 的限制;
⭐ 新方法结合1bit 层结构、基于 SVID 的参数初始化和量化感知训练。
⭐1bit 量化突破了2bit 障碍,为在移动设备上高效运行大模型提供新可能性。
论文地址:https://arxiv.org/pdf/2402.11295.pdf
- 0000
- 0000
- 0000
- 0001
- 0000