AI视野:Nijijourney APP正式上架App Store;微软AutoGen框架爆火;AI破译2000年前赫库兰尼姆卷轴;vivo自研AI大模型11月1日发布
🤖📱💼AI应用
Midjourney微调动漫模型Nijijourney APP正式上架App Store
Midjourney微调动漫模型Nijijourney APP正式登陆App Store,提供免费试用和实时直播功能,助力数字艺术创作的普及。目前国区无法体验,想要尝试的用户可切换美区下载。
【AiBase提要】:
🚀 Nijijourney APP基本可以使用Discord版本图片生成的所有功能;
💡 开放了免费试用功能,网页版本的图片查看和管理也被集成到了APP里面;
📺 增加了一个Live直播的功能,会实时显示后台新生成的图片;
💡图片生成功能全部UI化,不用打那些复杂的命令。
AI背景调查工具Ferret AI 可协助客户获取网络背景信息
Ferret AI是一款自动监控多个信息来源的AI工具,用于帮助审查潜在客户、投资者和商业伙伴的网络背景信息,包括报纸档案、法律记录和公司所有权记录。
Ferret A官方网址:https://www.ferret.ai/
AiBase提要:
🔍 Ferret AI自动监控多个信息来源,帮助审查潜在客户、投资者和商业伙伴。
💼 工具筛选网络中的负面故事,执行反洗钱检查,确保法律合规。
📈 提供免费和高级版本,但引发数据隐私担忧,公司强调数据都是公开可获得的。
👨💻💡🎯聚焦开发者
微软AutoGen框架爆火,智能体聊聊天就把问题解决了
微软最新发布的AutoGen框架在短短两周内吸引了成千上万的关注,并以其多智能体聊天解决任务的能力受到广泛好评。
项目地址:https://github.com/microsoft/autogen
【AiBase提要:】
🚀 AutoGen框架引起轰动,仅用两周时间从390星标增长至10K。
💬 这一框架允许多个LLM智能体通过聊天方式解决各种任务,包括程序设计和更多。
🌟 AutoGen的定制性和可对话性使其成为开发者的宝贵工具,引发广泛关注和好评。
英伟达提出爆火智能体研究Humanoid Agents 逼真还原人类情感
英伟达与华盛顿大学合作研究的Humanoid Agents能逼真模拟人类情感和行为,引入系统1和系统2思维,为深入理解人类行为提供新工具。
论文地址:https://arxiv.org/pdf/2310.05418.pdf
【AiBase提要:】
😲 Humanoid Agents逼真模拟人类情感和需求,改善智能体与人类的互动。
😀 引入系统1和系统2思维,使智能体更像人类,可根据情感和需求调整行为。
🌐 研究使用OpenAI的ChatGPT-3.5创建智能体,为未来智能体研究提供新方向。
ReCon框架帮助AI大模型识破谎言 增加AI智能体的安全性
ReCon框架通过引入「三思而后行」和「换位思考」的思维过程,提高大语言模型在欺骗性环境中的决策能力,增加AI智能体的安全性与可靠性。
论文地址:https://arxiv.org/pdf/2310.01320.pdf
【AiBase提要】:
1. ReCon框架通过构思思考和改进思考两个阶段,以及一阶和二阶视角转换,提高大语言模型对欺骗的识别和应对能力。
2. 清华大学与通用人工智能研究院测试大语言模型在充满欺骗的环境下的局限性,并提出ReCon框架来解决这些问题。
3. 研究指出ReCon框架在无需微调和额外数据的情况下显著提高大语言模型的识别和应对欺骗的能力,同时提出改进大语言模型的安全、推理、说话方式和格式等方面的建议。
T2I扩散模型PIXART-α:降低成本的高质量图像生成
PIXART-α是一款基于Transformer技术的高质量图像生成模型,显著降低了培训成本,同时保持了与最新图像生成器相匹敌的图像质量,有助于环境友好和高分辨率图像合成。
PIXART-α论文网址:https://arxiv.org/abs/2310.00426
PIXART-α项目网址:https://pixart-alpha.github.io/
【AiBase提要】
📉 低成本培训: PIXART-α显著降低了培训成本,降低了时间和经济成本。
🌆 高质量图像: 该模型能够生成高质量、高分辨率的图像,包括各种场景和控制功能。
♻️ 减少CO2排放: 低培训成本还导致较低的CO2排放,对环境友好。
POCO:用于3D人体姿势和形状估计的新型人工智能框架
POCO框架是一种创新的AI工具,用于通过2D图像估计3D人体姿态和形状,克服深度模糊、遮挡和服装等挑战,提供更准确的结果和不确定性估计。
【AiBase提要】:
1️⃣ 传统方法限制了估计不确定性,而POCO框架引入了双重条件策略和图像特征来改进基本密度函数,提高姿态重建准确性。
2️⃣ POCO框架还引入了改进的不确定性估计方法,结合图像特征和SMPL姿态,优于先进方法。
3️⃣ 这一创新框架有望推动人体行为分析和三维图形应用,提供更精确的结果。
GameGPT:一种全自动游戏开发的多代理方法
GameGPT是一种多智能体方法,旨在自动化游戏开发的核心任务,以提高效率和降低成本。
【AiBase提要:】
🎮 GameGPT采用多智能体框架,每个智能体负责不同的任务,如规划、编程和测试,以简化游戏开发。
🤖 这种方法还存在挑战,如需要更多研究和发展来解决AI创新性的问题。
🕹️ GameGPT代表了如何利用AI解决游戏开发挑战,但尚处于早期阶段,需要更多实验和研究确定可行性。
创新型生成模型CityDreamer:一键生成无边界的3D城市
南洋理工大学S-Lab的CityDreamer是一项重大突破,采用创新的方法生成无边界的3D城市,解决了3D城市生成中的结构扭曲问题,具有广泛应用前景。
论文地址:https://arxiv.org/abs/2009.00610
项目地址:https://haozhexie.com/project/city-dreamer
AiBase提要:
🏙️ CityDreamer是一项创新的生成模型,专注于生成无边界的3D城市,弥补了3D城市生成领域的研究空白。
🌆 该模型采用了鸟瞰视图和体积渲染器,将城市背景和建筑分开处理,解决了建筑外观多样性的问题。
🏗️ 实验结果表明,CityDreamer在与其他同类方法的比较中表现卓越,为虚拟城市、游戏和城市规划等领域提供了有力支持。
📰🤖📢AI新鲜事
21岁SpaceX实习生用AI干出重大考古事件,斩获40000美元!
21岁计算机少年通过AI破译了2000年前被火山掩埋的赫库兰尼姆卷轴,赢得40000美元奖金,揭示了古代希腊语文字。
【AiBase提要:】
🚀21岁的SpaceX实习生Luke Farritor使用机器学习模型成功解密了2000年前被埋藏的古卷轴,获得了40000美元奖金。
📜 赫库兰尼姆卷轴是一份特殊的古文献,因其脆弱而没有被触碰数百年,Luke的工作揭示了上面的古希腊语文字。
🔍 比赛的成功鼓励了其他参赛者,其中一名研究生也取得了类似的成果,揭示更多古文献内容。
黑鲨将推出S1Pro AI智能手表 配备百度“文心一言”技术
黑鲨将推出S1Pro和S1Classic两款智能手表,配备游戏健康监测模式,其中S1Pro还支持百度的“文心一言”技术,提供AI助手功能。
【AiBase提要】
⭐ 黑鲨宣布推出S1Pro和S1Classic两款智能手表,具备游戏健康监测功能。
⭐ S1Pro配备百度的“文心一言”技术,提供腕上AI助手,支持百度地图导航,并提供多款AI表盘。
⭐ 这些智能手表能记录游戏类型和时长,并向玩家提供健康提醒,旨在提高游戏体验和用户健康。
哈佛研究: GPT-4可将工作质量提升超过40%!
哈佛商学院的研究发现,GPT-4语言模型能显著提高员工的工作质量,提高幅度可达40%,但不熟练地使用人工智能可能导致工作绩效下降高达19%。
【AiBase提要】:
1. 哈佛研究指出,使用GPT-4的咨询师工作质量提高了40%,速度提高了25%,任务完成率提高了12%。
2. 该研究还发现,不论咨询师的技能水平如何,都能从AI中受益,但绩效较低的咨询师受益更大,工作质量提高了43%。
3. 使用AI的成功取决于任务类型,对于“技术边界内”的任务,AI表现出色,但在“技术边界外”的任务中,绩效下降高达19%,强调了专业人士需要熟练地使用AI技术。
俄罗斯AI机器人YandexGPT2成功考入大学
YandexGPT2神经网络的人工智能创建者在接受俄罗斯公报 (RG) 采访时宣布,YandexGPT2神经网络已成功通过俄罗斯统一国家考试 (EGE),并获得足够的分数进入大学。
【AiBase提要:】
🤖 YandexGPT2神经网络成功通过俄罗斯国家考试进入大学,标志着AI在教育中的潜力。
📚 这一成就展示了AI机器人可以应对复杂的文学任务,包括文学考试和创造性写作。
💡 教育界正积极探索如何整合AI技术,尽管考试仍然禁止使用人工智能帮助。
迪士尼因电影中使用的CGI生成的背景演员太假被嘲笑
迪士尼在电影《Prom Pact》中使用明显不真实的CGI生成的背景演员引发争议,引发有关电影中使用计算机生成影像和保护演员权益的辩论。
【AiBase提要】
🎬 近期,迪士尼因在电影《Prom Pact》中使用明显不真实的CGI生成的背景演员备受嘲笑。
🤖 迪士尼的这一举动引发了关于电影制作中使用计算机生成影像的争论,担心取代人类演员。
📜 演员工会SAG-AFTRA提出了“NO FAKES法案”以保护个人声音和肖像权,但是否被电影制片厂和国会接受尚未确定。
Meta承认使用用户帖子来训练其人工智能
Meta公司承认使用Facebook和Instagram用户的帖子来训练其新的人工智能助手MetaAI,引发了隐私和道德问题。
【AiBase提要】:
🔍 Meta公司正在使用社交媒体用户的帖子来训练新的人工智能助手MetaAI。
🔍 MetaAI是一款会话助手,能够从文本生成逼真图像,目前在WhatsApp、Messenger和Instagram测试中。
🔍用户担忧隐私和道德问题,认为Meta未获得明确同意,还质疑AI是否会生成有害或侵犯知识产权的内容。
Google AI推出SANPO多属性视频数据集
Google AI最近发布的SANPO数据集旨在帮助AI理解户外人类主观场景,包含真实和合成数据、丰富注释和多属性,对视觉场景理解领域具有重要意义。
【AiBase提要】
📊 SANPO数据集支持户外人类主观场景理解,包括多属性特征和丰富注释。
🌆 数据集包括真实世界和合成数据,支持视觉导航系统和视障人士的开发。
🔒 遵循隐私法律,删除个人信息,合成数据用于克服真实数据的不完美。
🤖📈💻💡大模型动态
vivo自研AI大模型11月1日发布 将在OriginOS4中首次应用
vivo自研AI大模型将于11月1日首次应用于OriginOS4系统,包括不同参数量级的5款大模型,标志着vivo在AI技术领域的最新突破。
AiBase提要:
🚀 vivo AI大模型发布:11月1日,OriginOS4系统首次应用。
🔍5款不同参数量级的自研大模型,全面覆盖核心应用场景。
📈 C-Eval评测榜单显示,vivo自研大模型在全球中文榜单中排名第一。
阿里魔搭社区开源知识检索模型Ziya-Reader
阿里魔搭社区宣布开源Ziya-Reader,一款出色的知识检索模型,在多文档任务、中文多文档问答和合成任务中表现卓越。
AiBase提要:
🔍 模型介绍: 阿里魔搭社区发布Ziya-Reader,解决多文档任务中正确答案位置的问题,在评测中取得优秀成绩。
📈 性能突出: Ziya-Reader在多文档问答任务中超越其他大型模型,达到最高的RougeL45.1%。
🔗 开源链接: Ziya-Reader已开源,可在指定链接获取。
Ziya-Reader-13B-v1.0开源地址:
https://modelscope.cn/models/Fengshenbang/Ziya-Reader-13B-v1.0/
Ziya2-13B-Base
模型链接:https://modelscope.cn/models/Fengshenbang/Ziya2-13B-Base/summary
Ziya2-13B-Chat
模型链接:https://modelscope.cn/models/Fengshenbang/Ziya2-13B-Chat/summary
商汤升级发布医疗健康大模型“大医” 支持高质量训练低门槛部署
商汤科技发布了升级版医疗健康大语言模型“大医”,支持13个预设场景、个性化功能、高质量训练和低门槛部署,服务医疗健康产业。
【AiBase提要】:
🏥 "大医"是商汤科技的医疗健康大语言模型,支持13个预设场景,满足医疗健康需求。
💡 该模型基于千亿参数规模的大语言模型,利用高质量医学知识数据进行训练,确保可靠性和准确性。
💼 商汤提供多个版本的“大医”,可根据需求部署,降低医疗健康大模型的部署门槛,促进业务流程优化。
- 0000
- 0000
- 0000
- 0000
- 0000