AI视野:谷歌推几何模型Alpha Geometry;三星发布AI手机Galaxy S24;Runway更新运动笔刷功能;Midjourney v6下周补齐缩放平移等功能
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:https://top.aibase.com/
🤖📈💻💡大模型动态
谷歌推数学几何模型Alpha Geometry
【AiBase提要:】
🥇AlphaGeometry解决复杂几何问题
🧠语言神经模型和规则推理引擎结合
🧩运用高度并行计算寻找解决方案,实力达奥林匹克金牌得主
模型代码:https://github.com/google-deepmind/alphageometry
🤖📱💼AI应用
谷歌推AI搜索功能新功能 画个圈就能搜索
【AiBase提要:】
🔄 Google在与三星联合发布活动中宣布推出了一种名为“Circle to Search”的新搜索方式。
🌐 “Circle to Search”并非仅限于画圈手势,用户还可以通过其他手势方式启动搜索。
🔍 此功能使用户能够在任何应用中方便地进行搜索。
Runway更新Multi-Motion Brush运动笔刷功能
【AiBase提要:】
⭐️ 更新了Multi-MotionBrush运动笔刷功能
⭐️ 可同时控制5个物体运动路径
⭐️ 提供更多创作可能性,灵活控制图像动态效果
亚马逊APP测试新AI功能,不仅能解答产品问题还能逗你笑
【AiBase提要:】
💡 新AI功能能解答产品问题
🚀 功能目前处于测试阶段
🤖 也能回答更富创意的查询
Midjourney v6下周将补齐缩放平移及视频生成等功能
【AiBase提要:】
⭐ 下周将推出v6新版本
⭐ 引入缩放、平移和改变区域的能力
⭐ 风格一致性将得到提高
谷歌计划直接在 Bard 中添加 AI 图像生成器
【AiBase提要:】
🎨 Google Bard即将推出自家的图像生成器
🖼️ 用户可以通过Bard轻松创作令人惊艳的图像
🔒 图像生成器注重用户安全,配备安全功能确保使用体验
低成本AI音色克隆软件GPT-SoVITS 完美复刻HeyGen核心功能
【AiBase提要:】
⭐ 输入5秒声音样本即可转换文字为语音
⭐ 仅需1分钟训练数据实现模型微调
⭐ 支持多语言,集成多种辅助工具
项目地址:https://top.aibase.com/tool/gpt-sovits
PhotoMaker平替?一张照片InstantID几秒钟就能生成个性化图片
【AiBase提要:】
- InstantID是一项新技术
- 它可以几秒钟内生成不同风格的人物照片
- InstantID不需要复杂的训练或微调过程
项目地址:https://top.aibase.com/tool/instantid
Motion推新功能Video-to-Motion 可通过视频捕捉运动
【AiBase提要:】
⭐ 通过视频捕捉运动
⭐ 生成各种角色视频
⭐ 可以将视频中的角色替换为3D化身
体验地址:https://discord.gg/AapmuVJqxx
Whimsical:超好用的AI生成思维导图工具
【AiBase提要:】
⭐ 集白板和文档于一体的协作中心
⭐ 提供AI文本转流程图功能
⭐ 为团队会议和交流提供便利
体验地址:https://top.aibase.com/tool/whimsical
📰🤖📢AI新鲜事
三星发布AI手机Galaxy S24
【AiBase提要:】
🔄 支持谷歌"Circle to Search"功能,通过画圈即可获取图像、视频或文本信息。
🗣️支持13国语言,通话中即时翻译,解放出国语言障碍。
📝 可自动提取要点进行翻译、生成摘要,实现文件整理、思维导图制作、页面风格转化。
非营利组织计划推出Fairly Trained认证计划:确保AI模型生成内容不侵权
【AiBase提要:】
🤖 为那些证明已获得版权许可的AI模型提供认证标签,以防侵犯版权。
⚖️ 已批准并颁发了第一个名为“Licensed Model”认证的标签
🤖生成式AI版权争议一直存在,曾有艺术家和作者起诉多家AI公司侵犯版权
AI图形设计工具Recraft完成1200万美元A轮融资
【AiBase提要:】
🚀 Recraft专注于为专业人士提供图形设计生成工具
🤖 利用自有基础模型实现一致设计元素生成,已吸引30多万用户
🔧 Recraft融资支持构建自己的基础模型,旨在提供图形设计生成工具
CNET的发行商因AI丑闻而难以出售
【AiBase提要:】
🔸CNET没有充分披露AI生成文章
🔸人工智能丑闻导致网站声誉负面影响
🔸出售难题包括品牌声誉问题
👨💻💡🎯聚焦开发者
蚂蚁开源ATorch 、 Lookahead两项大模型技术
【AiBase提要:】
🔸 ATorch 是一个大模型分布式训练加速扩展库
🔸 Lookahead 是一个推理加速框架
🔸 ATorch已集成到蚂蚁集团的大模型训练开源产品 DLRover 中
开源地址:
https://github.com/intelligent-machine-learning/dlrover/atorch
https://github.com/alipay/PainlessInferenceAcceleration
LeCun曝多模态LLM重大缺陷 提出Interleaved-MoF显著增强视觉理解能力
【AiBase提要:】
💡 多模态大语言模型MLLM在视觉模式性能差距明显
💡 通过「交错特征混合」方法取得了10.7%的能力增强
💡 研究对于解决当前MLLM在视觉理解方面的缺陷问题具有重要意义
论文地址:https://arxiv.org/pdf/2401.06209.pdf
浙大提出SIFU模型 单图即可重建高质量3D人体模型
【AiBase提要:】
🧠 SIFU模型创新性使用单张图片进行3D人体模型重建
🌐 引入侧视图条件隐函数和扩散模型
💡 成功解决传统方法中的问题,提高了重建精度和效果
项目地址:https://top.aibase.com/tool/sifu
- 0000
- 0000
- 0000
- 0000
- 0002