AI日报:文本转语音模型Fish Speech;Meta 3D Gen发布,1分钟快速构建3D模型;AI生成熊猫吃泡面视频刷屏抖音
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:https://top.aibase.com/
1、可以媲美GPT-SoVITS的低显存开源文本转语音模型Fish Speech
Fish Speech是一款由fishaudio开发的全新文本转语音工具,支持中英日三种语言,语音处理接近人类水平,使用Flash-Attn算法处理大规模数据,提供高效、准确、稳定的TTS体验。
【AiBase提要:】
😊 完美支持中英日三种语言,语音处理接近人类水平
😊 支持语音克隆,只需提供一段参考语音,即可迅速完成克隆
😊 对显存要求极低,仅需4GB,支持多种不同的语音生成模型
在线体验地址:https://top.aibase.com/tool/fish-audiowenbenzhuanyuyin
详情点此查看:https://www.aibase.com/news/9979
2、Meta 3D Gen发布,1分钟内快速实现从文本生成3D资产
最近研究人员发布了名为Meta3D Gen(3DGen)的全新技术,能够在不到一分钟内快速实现从文本生成3D资产,为用户带来高质量的纹理和材质体验。该技术集成了Meta3D AssetGen和Meta3D TextureGen,提供了高效的3D模型创建方式,比现有解决方案快三到十倍。
【AiBase提要:】
🚀 Meta 3D Gen系统可以在不到一分钟内创建高质量的3D资产
💡 Meta3D Gen集成了Meta3D AssetGen和Meta3DTextureGen两大核心技术
✨ AssetGen支持生成基于物理渲染的材质,具有真实的再光照效果。
详情链接:https://ai.meta.com/research/publications/meta-3d-gen/
3、微软开源GraphRAG,构建知识图谱增强大模型的问答、推理等能力
微软最新开源的GraphRAG系统利用实体知识图谱增强大模型的搜索、问答、摘要、推理等能力,特别适用于处理大规模数据集。通过构建全局性的实体知识图谱,GraphRAG能够捕捉文本中复杂联系和交互,提高检索准确性和全面性。此外,GraphRAG对tokens需求低,节省开发成本。在综合测试中表现优异,是目前最佳的RAG方法之一。
【AiBase提要:】
💡 GraphRAG通过构建实体知识图谱来增强大模型的搜索、问答、摘要、推理等能力,特别擅长处理大规模数据集。
💡 GraphRAG的核心包括构建实体知识图谱和生成社区摘要两个步骤,通过社区摘要提取数据集中相关信息,生成更全面和准确的答案。
💡 GraphRAG对tokens的需求很低,能够帮助开发者节省成本。在综合测试中表现优异,是目前最佳的RAG方法之一。
详情链接:https://top.aibase.com/tool/graphrag
4、微软推出设计工具 Designer:一句话生成个性化贺卡
微软最新推出的Microsoft Designer的"Greeting Cards"功能为用户带来前所未有的个性化贺卡制作体验,展示了AI技术在日常生活中的实际应用。
【AiBase提要:】
🎨 文字转设计:用户输入简单描述,AI转化为独特贺卡设计。
🖼️ AI生成图像:贺卡设计灵感来源用户描述,由AI生成精细图像。
✏️ 可编辑内容:贺卡内页提供可编辑文本,满足用户个性化需求。
详情链接:https://designer.microsoft.com/
5、腾讯翻译智能体公司TRANSAGENTS上线
TRANSAGENTS是腾讯AI实验室开发的专门用于进行文学翻译的多智能体虚拟翻译出版公司,通过模拟真实翻译公司的虚拟角色合作模式,实现流畅高效的文学作品翻译。使用TRANSAGENTS进行文学翻译的成本比专业人类翻译员低80倍,且在领域特定知识需求下表现超越人类翻译。该平台展示了AI技术在文学翻译领域的潜力,为文学创作和传播提供新可能性。
【AiBase提要:】
🔑 TRANSAGENTS是多智能体虚拟翻译出版公司,专为超长文学内容翻译而生,模拟真实翻译公司角色合作模式。
💰 使用TRANSAGENTS进行文学翻译的成本比专业人类翻译员低80倍,降低翻译成本,促进优秀文学作品传播。
🌟 TRANSAGENTS在领域特定知识需求下表现超越人类翻译,受到人类评估者和高级语言模型的青睐。
详情链接:https://top.aibase.com/tool/transagents
6、Suno推出iOS客户端 支持语音生成音乐
Suno公司推出的iOS应用让手机变成虚拟音乐工作室,引领音乐制作革命,可能改变数字时代下创意表达方式。面临法律挑战,但坚称技术旨在生成全新作品。Suno的iOS应用代表AI生成音乐向大众迈出的重要一步,引领音乐界未来潮流。
【AiBase提要:】
🎵 音乐工作室在手机上:用户输入文字提示或哼唱即可生成完整歌曲,满足不同音乐风格需求。
⚖️ 法律挑战与坚持立场:面临唱片公司起诉,坚称AI生成全新作品,法律斗争结果或影响AI音乐产业发展。
🔮 AI音乐未来展望:AI与人类音乐创作界限模糊,引发关于创造力、音乐产业未来等深刻问题。
7、苹果公司高管以观察员身份加入 OpenAI 董事会
我认为这篇文章报道了苹果公司高管 Phil Schiller 以观察员身份加入 OpenAI 董事会的消息。这将使苹果更了解 OpenAI 的内部运作,并有望在 iOS 和 macOS 中整合 ChatGPT,提升 Siri 的智能化水平。微软也加入了 OpenAI 董事会,使得合作关系更加复杂。
【AiBase提要:】
🍏 苹果公司高管 Phil Schiller 加入 OpenAI 董事会,担任观察员角色,有助于加深对 OpenAI 的了解。
🤖 Schiller 加入董事会将促进在 iOS 和 macOS 中整合 ChatGPT,提升 Siri 的智能化水平。
🔗 微软也以非投票观察员身份加入 OpenAI 董事会,使得 OpenAI 董事会更加复杂。
8、AI生成的熊猫吃泡面视频抖音获赞超42万 网友直呼太逼真
最近,抖音上的AI生成视频技术达到了新高度,熊猫和猫咪用筷子吃泡面的视频让人难以置信。虽有瑕疵,但未来AI视频将更逼真。
【AiBase提要:】
🐼 视频逼真程度让人叹为观止,引发网友热议。
😺 AI技术在视频制作领域应用广泛,为创作者和观众带来全新体验。
💻 国内外视频大模型竞争白热化,AI整活影视剧名场面在抖音挑战榜上位居Top26。
详细内容:https://www.aibase.com/news/9993
9、网友将GPT-4V接入家中摄像头 百万网友围观他做这事!
一位国外网友将GPT-4Vision接入家中摄像头,引发百万网友围观。这种行为展示了AI技术在日常生活中的潜力,但也引发了隐私和安全问题的讨论。随着技术发展,我们期待更多创新且安全的应用出现。
【AiBase提要:】
👀 GPT-4Vision接入家中摄像头,引发百万网友围观。
🔒 引发隐私和安全问题讨论,提醒人们关注个人信息保护。
💡 展示AI技术在日常生活中的潜力,启发人们对技术应用的思考。
详细内容:https://www.aibase.com/news/9995
10、怒了!苏格兰艺术家“自毁”作品,抗议AI对艺术的负面影响
苏格兰艺术家迈克尔・福布斯以涂抹自己的艺术作品的方式,表达对人工智能(AI)对艺术领域的负面影响的抗议。福布斯已经在四幅画作上进行了 “编辑”,其中包括约翰・列侬和美国歌手泰勒・斯威夫特的作品。他希望通过自己的举动唤起对 AI 在艺术领域侵权行为的重视。艺术家们已经无法与计算机生成的图像竞争,导致许多人放弃了艺术家的职业。
【AiBase提要:】
⭐ 苏格兰艺术家迈克尔・福布斯以涂抹自己的艺术作品的方式,表达对人工智能(AI)对艺术领域的负面影响的抗议。
⭐ 福布斯已经在四幅画作上进行了 “编辑”,其中包括约翰・列侬和美国歌手泰勒・斯威夫特的作品,他希望通过自己的举动唤起对 AI 在艺术领域侵权行为的重视。
⭐ 艺术家们已经无法与计算机生成的图像竞争,导致许多人放弃了艺术家的职业。
- 0000
- 0000
- 0004
- 0000
- 0001