AI日报:效果炸裂!Krea Video向所有人开放;阿里花8亿入股Kimi;Arc Search可以打电话了;腾讯智影声音大模型升级
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:https://top.aibase.com/
1、Krea AI视频生成工具向所有人开放
Krea AI最近宣布Krea Video视频生成工具已对所有人开放,进入公测阶段。该工具结合关键帧和文本提示,提供灵活视频创作方式。用户可调整关键帧、文本提示、视频持续时间和纵横比,制作多样化视频。生成过程分为预览和增强两阶段,可随时取消。Krea Video为视频创作者提供简单高效的创作工具。
【AiBase提要:】
⏳ 灵活创作:结合关键帧和文本提示,用户可调整视频外观和内容
🔄 多样化效果:调整纵横比、移动效果,制作循环播放视频
🚀 高效生成:分预览和增强阶段,随时取消生成过程
产品入口:https://top.aibase.com/tool/krea-video
详情:https://www.chinaz.com/2024/0524/1618876.shtml
2、腾讯智影宣布声音模型大升级
腾讯智影宣布声音模型大升级,新版本声音更加自然连贯,具有更丰富的语调和情感,减少了语音瑕疵的出现概率,并能更好地适应不同文本内容和语境。智影推出两款免费新音色,适用于对话闲聊场景。声音定制效果也升级,让用户在创作配音作品时体验更加优质的声音效果。
【AiBase提要:】
🔊 更自然流畅,语调情感更丰富,减少语音瑕疵
🎙️ 推出热情似火的女声和可爱亲切的女声音色
🎧 声音定制效果升级,采样率从16K升级到24K
3、Arc Search推出全新功能CALL ARC
Arc Search最近推出了一个全新的功能——CALL ARC,允许用户通过自然语言的方式随时随地获得问题的答案。这一功能极大地方便了用户在各种场景下快速获取信息的需求。用户可以通过Arc Search随时随地获取所需信息,享受科技带来的便利和乐趣。
【AiBase提要:】
🔍 Arc Search推出CALL ARC功能,用户可以通过自然语言获得问题答案,方便快捷。
📱 CALL ARC可通过Siri Ultra进行操作,适用于Apple生态系统设备,无需额外应用。
✉️ CALL ARC功能提升了灵活性和实用性,用户可保存笔记、发送消息,改变信息获取方式。
4、阿里投资Kimi AI 开发商月之暗面8亿美元 持股36%
阿里巴巴集团在2024财年投资月之暗面(Moonshot AI)约8亿美元,持股36%,强调人工智能对业务增长和变革的核心作用。公司高层表示,AI将带来前所未有的机遇和挑战,推动企业创新和价值创造。AI不是威胁,而是驱动力,未来十年将颠覆各行业,要跟上AI的进步才能不被取代。
【AiBase提要:】
🚀 阿里首次披露对月之暗面投资情况,投资约8亿美元持股36%。
💡 阿里高层认为AI是业务增长和变革的核心力量,将为企业带来机遇和挑战。
💰 AI部署将增加计算需求,推动阿里云增长,AI作为用户体验和商业模式的驱动力将带来巨大机遇。
5、AI图案生成器Ideogram Tile
Ideogram Tile是一款AI生成的图案生成器,能够从文本提示中创建无缝重复的图案,为设计师、艺术家和企业开辟了无限可能。这一新功能的推出标志着AI驱动设计行业迈出了重要一步。
【AiBase提要:】
⭐ Ideogram Tile让用户可以轻松生成复杂的墙纸、沉浸式景观和无尽的纹理,无需专业设计技能。
⭐ Ideogram Tile的推出意味着AI驱动设计行业迈出了重要一步,激发了室内设计、时尚和游戏等多个领域的新创意方向。
⭐ Ideogram Tile的推出进一步巩固了公司在生成AI领域的先驱地位,为未来的创新奠定了基础。
详情链接:https://top.aibase.com/tool/ideogram-ai
6、Pandora:根据自然语言指令生成动作和视频的通用世界模型
Pandora是通向通用世界模型(GWM)的重要一步,通过自然语言动作和视频状态的模拟生成,实现了对未来的自主控制,为交互式内容生成、强大的推理和规划能力提供了支持。
【AiBase提要:】
🔍 Pandora实现了对未来的自主控制,用户可以通过自由文本输入动作来实时控制视频内容。
🔍 Pandora能够生成多个替代未来的视频,让用户能够自主控制未来的发展方向。
🔍 Pandora在不同领域中实现迁移学习,通过高质量数据指导和训练,模型学习有效的动作控制。
详情链接:https://top.aibase.com/tool/pandora
7、AI视频编辑方法ReVideo:可局部修改视频内容和运动轨迹
本文介绍了一种名为ReVideo的AI视频编辑方法,通过指定内容和运动实现精确的视频编辑。该方法采用三阶段训练策略和时空自适应融合模块,具有出色的编辑效果。研究人员解决了内容和运动控制之间的耦合和训练不平衡问题,提出了逐步解耦的训练策略。实验证明ReVideo在准确的视频编辑应用方面性能优秀,推动了视频编辑领域的发展。
【AiBase提要:】
🔍 新颖方法实现精确视频编辑,同时指定内容和运动
🔍 三阶段训练策略和时空自适应融合模块集成内容和运动控制
🔍 逐步解耦训练策略解决内容和运动控制耦合和训练不平衡问题
详情链接:https://top.aibase.com/tool/revideo
8、每周节省7800万工时!ChatGPT等成美国降本增效利器
本文介绍了Pearson plc发布的关于生成式AI如何帮助人们提升工作效率节省时间的深度研究报告。报告分析了美国、英国、澳大利亚、巴西和印度5个国家,在2026年前,美国将节省最多时间,达每周7800万工时。生成式AI在10个领域具有显著节省时间的应用,包括维护健康记录、专业知识学习、教育课程制定等。文章还提供了使用案例和企业员工应对生成式AI的建议。
【AiBase提要:】
🔍 生成式AI可帮助节省大量工时,美国每周可节省7800万工时,印度排名第二。
💡 10个领域中,维护健康记录、专业知识学习、教育课程制定等可节省大量工时。
🚀 企业应将生成式AI视为提升员工、企业价值的常规工具,制定明确的使用规则和指南。
9、Nvidia首席执行官Jensen Huang强调GenAI初创公司激增
Nvidia首席执行官Jensen Huang在财报电话会议中指出,有20,000家GenAI初创公司正在其加速计算平台上开发,需求激增导致供应短缺,预计持续至2024年。公司积极推进以太网网络拓展人工智能计算领域,取得数据中心和游戏领域突破性增长。
【AiBase提要:】
⭐ 20,000家GenAI初创公司在Nvidia加速计算平台上开发,需求激增导致供应短缺,预计持续至2024年。
⭐ Nvidia积极推进以太网网络,拓展人工智能计算领域,以太网是进军数据中心网络的重要机遇。
⭐ 数据中心业务是Nvidia增长的主要驱动力,第一季度营收达260亿美元,同比增长262%,游戏领域营收也有18%增长。
10、研究发现 52% 的 ChatGPT 编程问题回答错误
这篇文章揭示了人工智能 ChatGPT 在生成编程问题答案中存在的严重问题,其中有52% 的答案是错误的。尽管 ChatGPT 的回答在语言上更正式和分析性更强,但却存在信息不准确、冗长和与人类答案不一致的情况。然而,令人担忧的是,许多人类程序员更偏好使用 ChatGPT 的答案,这可能是因为其礼貌和愉快的语气给人留下更好的印象。
【AiBase提要:】
🚫 52% 的 ChatGPT 编程问题回答错误
🔍 ChatGPT 的回答语言更正式和分析性更强,但存在信息不准确、冗长和与人类答案不一致的问题
👩💻 许多人类程序员更偏好使用 ChatGPT 的答案
11、FCC对电话骗子罚款600万美元,利用声音克隆技术冒充拜登总统进行非法电话骚扰
文章报道了美国FCC对一名电话骗子罚款600万美元的事件,该骗子利用声音克隆技术冒充总统拜登进行非法电话骚扰,引发了关于电话骚扰与人工智能关系的讨论。FCC强调警告其他潜在高科技诈骗者遵守电话骚扰法规,尤其是使用生成式人工智能技术。
【AiBase提要:】
⭐ FCC对电话骗子罚款600万美元,利用声音克隆技术冒充拜登总统进行非法电话骚扰
⭐ FCC强调警告其他潜在高科技诈骗者,要求遵守电话骚扰法规,尤其是使用生成式人工智能技术
⭐ 骗子利用声音克隆技术在新罕布什尔州初选期间冒充总统拜登进行电话骚扰,涉案者应对多项违规行为接受指控
- 0001
- 0000
- 0000
- 0001
- 0000