今日AI:华为发布4K图像模型PixArt-Σ;这个ComfyUI插件可以还原梦境;Pika把音效视频一锅端了;公众号可以一键集成多种AI功能了
欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:https://top.aibase.com/
🤖📱💼AI应用
华为发布图像生成模型PixArt-Σ可直出4K图像
【AiBase提要:】
⭐采用DiT架构,可直接生成4K图像
⭐借助PixArt-alpha基础预训练,实现弱到强训练
⭐结合高质量训练数据和高效Token压缩,生成高分辨率图像
项目地址:https://top.aibase.com/tool/pixart
ComfyUI-Dream-Interpreter:还原梦境的ComfyUI工作流输入梦境描述生成全景图
【AiBase提要:】
⚙️可通过GitHub克隆项目进行使用
🌌项目结合了梦境解析器和ComfyUI,提供梦境输入、解析和生成功能
🖼️生成全景图像,让用户交互式探索梦境,创新结合梦境解析与交互画面。
Pika发布SoundEffects功能生成的视频可以自动配音效了
【AiBase提要:】
⭐用户可以通过描述prompt或让AI自动生成音效为视频增添氛围
⭐SoundEffects操作简单,用户只需一个prompt或简单描述就能生成音效
⭐功能目前仅对特定用户开放测试,未来将向所有用户推出
项目地址:https://github.com/pwh-pwh/aiwechat-vercel
教程:https://www.bilibili.com/video/BV1Ct421b7xz/
AIwechat-Vercel:无需服务器即可将AI功能集成到公众号中
【AiBase提要:】
⭐️集成多种AI服务(如GPT、星火、通义千问、Gemini等),允许微信公众号通过文本消息与用户进行智能对话。
⭐️支持连续问答,实现了超时回复和记忆对话内容(最长30分钟)
⭐️具备图床功能和被关注时的自定义回复功能
项目地址:https://top.aibase.com/tool/aiwechat-vercel
教程:https://www.bilibili.com/video/BV1Ct421b7xz/
OptimizerAI:可为AI视频自动配音还将支持立体声
【AiBase提要:】
⭐️通过文字提示创造适用于各种场景的声音和音效。
⭐️支持声音效果生成、变声、风格标签指定,保持生成一致性。
⭐️即将支持文本到声音效果转换、立体声、高质量音频生成。
官网地址:https://www.optimizerai.xyz/
在线体验地址:https://discord.com/invite/bgfnVaaU2n
EasyDiffusionOnline:一款免费的AI绘画工具
【AiBase提要:】
⭐用户可以免费使用图像生成器和提示生成器。
⭐EasyDiffusionOnline提供多种创作类型,适合不同用户。
⭐平台功能强大,用户可以实现创意想法并分享作品。
体验地址:https://top.aibase.com/tool/easydiffusion-online
图片编辑技术StableDrag发布拖动锚点即可编辑图像同时保持高质量
【AiBase提要:】
⭐新技术StableDrag基于Diffusion模型,拖动锚点编辑图片。
⭐提供两种类型的图像编辑模型:StableDrag-GAN和StableDrag-Diff。
⭐目前只上线了论文,试玩页面和代码暂未放出
项目地址:https://top.aibase.com/tool/stabledrag
AI实时绘图工具ImgPilot一键将草图转为艺术作品
【AiBase提要:】
⭐支持实时绘图,随手涂几笔就能变成好看的画
⭐ImgPilot项目基于LeptonAI技术开发,结合多种技术提高效果
⭐提供前后端代码,用户可自由定制部署
项目地址:https://github.com/leptonai/imgpilot
试玩页面:https://top.aibase.com/tool/imgpilot
MIT博士生用VisionPro实时训练机器狗开源项目TrackingSteamer火了
【AiBase提要:】
⭐MIT博士生开源项目VisionPro实时训练
⭐应用程序利用VisionPro追踪人类动作实时传输到其他机器人设备
⭐人类可以为机器人提供精准训练数据,促进人机交互技术的发展
项目地址:https://github.com/Improbable-AI/VisionProTeleop
📰🤖📢AI新鲜事
每年电费2亿?ChatGPT每天竟然要消耗1.7万个家庭的用电量
【AiBase提要:】
🔋OpenAI旗下ChatGPT每日消耗超过50万千瓦时电力,约为1.7万个家庭的用电量。
🔌AI数据中心用电量未来或与小国相当,谷歌等公司搜索请求也消耗大量能耗。
💡AI技术发展需节约能源,监管机构监督企业用电行为,促进可持续发展。
Nvidia因使用侵权作品训练NeMoAI平台被作者起诉
【AiBase提要:】
📚三位作者控告Nvidia未经许可使用其版权图书训练NeMoAI平台。
🚫作者指称Nvidia在NeMo训练后撤下他们的作品。
💡该案或成AI领域版权和数据使用重要先例,影响行业规范和公司行为。
新AI框架H2O:将人类动作实时转换为机器人动作可行走、后空翻、踢球等
【AiBase提要:】
🔄采用可扩展的“从模拟到实际”处理,构建大规模的重定目标运动数据集。
🔄通过训练鲁棒的全身机器人模仿者,成功实现了在真实场景中的动态全身运动遥操作。
🔄通过特权模仿者选择可行动作,确保人形机器人对人类运动高度还原。
项目入口:https://top.aibase.com/tool/human-to-humanoid-h2o-
微软AI研究推数学LLMOrca-Math:通过对Mistral-7B模型进行微调的7B参数小模型
【AiBase提要:】
⭐Orca-Math通过合成数据集和迭代学习重新定义数学问题教学方法。
⭐Orca-Math在GSM8K基准上取得显著成就,展示SLM在教育中的潜力。
⭐Orca-Math利用迭代学习机制取得成功,在解决数学问题方面取得显著进步。
论文地址:https://arxiv.org/abs/2402.14830
谷歌发布Gemini1.5Pro模型技术报告长文记忆能力惊人
【AiBase提要:】
⭐Gemini1.5Pro模型架构、训练数据与基础设施介绍
⭐长篇信息检索任务中完美的记忆回溯能力
⭐长篇信息处理任务准确率达到99%以上
论文地址:https://arxiv.org/pdf/2403.05530.pdf
全球AI人才报告曝光:清华第三,北大第六!
【AiBase提要:】
⭐中国培养出的AI人才占全球近1/2
⭐美国码农面试需12场,薪资压低,面试题难
⭐Meta压低薪资,裁员潮下AI人才需求狂涨42%
谷歌称GeminiNanoAI大模型暂不支持Pixel8手机
【AiBase提要:】
🌟GeminiNano是谷歌旗下Gemini大模型的移动版本。
🌟由于硬件限制,GeminiNano目前无法在Pixel8手机上运行。
🌟但谷歌表示未来将在其他高端设备上推出GeminiNano。
网络安全模型WhiteRabbitNeo发布可识别安全威胁和漏洞
【AiBase提要:】
⭐WhiteRabbitNeo发布了新模型,利用Transformers和PyTorch技术,专注于网络安全领域。
⭐这款模型可识别各种安全威胁和漏洞,如开放端口、未加密服务、API漏洞等。
⭐WhiteRabbitNeo模型还可应用于编程和代码生成领域,帮助解决编程问题。
————————————
今日Midjourney提示词分享:梨花树下的女孩
垫图 masterpiece,bestquality,AbeautifulChinesegirlwearingabeigesuitjacket,blackhair,shorthair,roundface,detailedfacialdetails,naturallight,glasses,solo,photobackground,outdoors,shirt,realistic,lookingatviewer,tree,atreefullofpearblossoms,teeth,crossedarms,whiteshirt,longhair,smile,roundeyewear,longsleeves,day,jacket,upperbody,highdefinitionphotography,CapturedbyCanoncamera--ar3:4--s750--styleraw--v6.0
- 0000
- 0000
- 0000
- 0000
- 0000