AI视野:OpenAI官宣奥特曼回归;元象推出3D拍摄与混合编辑插件工具;百度灵医大模型将接入孚宝机器人;together.ai融资7.3亿元
📰🤖📢AI新鲜事
OpenAI官宣Sam Altman回归担任CEO
OpenAI正式宣布Sam Altman回归担任CEO,Mira Murati将回到CTO职位,新的董事会由Bret Taylor、Larry Summers和Adam D'Angelo组成。Altman表示对公司使命成功的乐观,并强调未来将专注于推进研究计划和安全工作,改进产品,为客户提供服务,并建立多元化董事会。
【AiBase提要:】
👉 Altman回归CEO职位: OpenAI宣布共同创始人Sam Altman回归担任CEO一职。
👉 新董事会成员揭晓: 新董事会由Bret Taylor(董事长)、Larry Summers和Adam D'Angelo组成。
👉 未来发展重心: 公司将专注于推进研究计划、安全工作,改进产品,服务客户,并构建多元化董事会。
亚马逊推出 Titan 图像生成器:内置保护机制
亚马逊在re:Invent大会上发布了Titan图像生成器,作为AWS Bedrock AI服务的一部分,专注于企业市场,具备内置保护机制,提供法律保护选择。
【AiBase提要:】
💡 亚马逊推出Titan图像生成器,突显人工智能图像生成领域进展,着重于为企业市场提供原创图像生成和编辑服务。
🏢 Titan定位为开发者工具,与消费者导向图像生成器不同,内置保护机制防范潜在偏见,为所有图像加入不可见水印以标识其为人工智能生成。
⚙️ 除图像生成器外,亚马逊还推出其他Titan模型,涵盖轻量级文本生成到支持对话式聊天应用的各类任务。
百度灵医大模型将接入孚宝机器人
百度灵医智惠与孚宝智能合作,将全面接入孚宝机器人产品,推动医疗康养机器人的技术创新和服务升级,为智慧康养产业注入创新动能。
【AiBase提要:】
🤖 技术融合服务升级: 百度灵医大模型将全面接入孚宝机器人,为医疗康养服务机器人提供技术支持,推动服务升级。
🏥 解决方案联合落地: 双方将在医院、政府、药械、居家等场景中实现解决方案的联合落地,推动行业创新。
🚀 大模型应用拓展: 百度灵医大模型的全面接入将为孚宝机器人用户带来更便捷的服务,促进智慧康养产业创新。
Phind发布V7版本,性能超越GPT-4
Phind最新V7版本在性能上超越GPT-4,运行效率提升5倍,支持中文和16K超长上下文,是一款笑脸排名第一的纯代码模型。
【AiBase提要:】
🚀 Phind V7性能超越GPT-4,运行效率提升5倍,支持中文和16K超长上下文。
💻 基于开源代码模型CodeLlama-34B V2,击败GPT-4,笑脸排名第一。
⚡ Phind V7运行速度快5倍,每秒处理100tokens,支持多轮深度对话。
DeepMind发现ChatGPT存在重大安全漏洞
Google DeepMind的研究团队发现,通过简单的查询攻击方法,可以从ChatGPT中泄露大约几MB的训练数据,成本仅约200美元,引发社交网络哗然。
【AiBase提要:】
😱 简单的查询攻击可导致ChatGPT泄露数MB训练数据,成本仅200美元。
🕵️♂️ 研究团队成功攻击生产级模型,即使对齐设定也无法阻止训练数据泄露。
🛡️ 开发者被警示加强模型隐私性和防护,进行全面测试以确保安全性。
可口可乐将继续推AI生成定制节日贺卡服务
可口可乐计划在假期季通过其AI平台“Create Real Magic”推出定制化节日贺卡,强调互动性,同时探索多元体验以连接品牌与文化。
【AiBase提要:】
🖼️ 创新AI平台: 可口可乐通过"Create Real Magic"平台推出定制化假日贺卡,吸引年轻科技爱好者,注重互动性。
🌐 多元体验: 公司除了专注于AI,还通过Sphere、游戏和音乐等体验超越传统广告,连接品牌与文化。
🚀 品牌建设: 通过提供免费工具,并以用户创作登上广告牌为奖励,可口可乐致力于加强与消费者的关系,塑造品牌情感。
苹果前员工创立新AI公司
三位曾在苹果工作的前员工成立了名为“软件应用有限公司”的新创企业,旨在通过生成式人工智能重新定义桌面计算机的使用体验,计划在未来一年内招聘多达10名员工,并已从投资方筹集了650万美元。
【AiBase提要:】
🖥️ 三位前苹果员工创立新公司,名为“软件应用有限公司”,计划通过生成式人工智能改变桌面计算机的使用方式。
💡 公司首席执行官 Ari Weinstein 表示,他们的目标是通过语言模型和人工智能创建新型软件,让普通用户能够更灵活地使用计算机解决问题。
💰 在尚未推出产品之前,该创业团队已经从投资方筹集了650万美元,计划在未来一年内招聘多达10名员工,包括设计师和机器学习专家。
DeepMind通过深度学习框架GNoME成功发现220万种新材料
通过GNoME框架,Google DeepMind的科学家们成功预测和发现了超过220万种新材料,拓展了人类技术可行材料的范围,展示了深度学习在材料科学中的潜力。
【AiBase提要:】
🧠 深度学习创新: Google DeepMind的GNoME框架结合图神经网络和主动学习方法,成功预测并发现了220万种新材料。
💡 技术进步关键: 这一发现不仅拓展了已知材料的前沿,还展示了机器学习在材料科学中解决重大挑战的可能性。
🌐 潜在影响: 新材料的发现不仅为技术创新提供原料,还推动了对材料行为的进一步理解,有望解决能源存储等领域的社会挑战。
开源生成式AI初创平台together.ai融资7.3亿元
生成式AI初创平台Together AI融资7.3亿元,强调开源在大模型领域的重要性,发布备受好评的开源产品,与多家公司合作在欧美地区运营云计算中心,取得令人瞩目的发展成就。
【AiBase提要:】
🚀 融资成就:Together AI成功在A轮融资中募集7.3亿元人民币,由凯鹏华盈领投,英伟达等多家公司跟投。
🌐 开源推动:平台强调开源在大模型领域的重要性,发布类ChatGPT模型和大语言模型训练加速器等备受好评的开源产品。
☁️ 生态合作扩展:除了融资和开源产品,Together AI还与英伟达、Crusoe Cloud、Vultr等合作,在欧美地区运营云计算中心,为生成式AI初创企业提供服务,取得显著成绩。
🤖📱💼AI应用
元象推出3D拍摄与混合编辑插件工具
元象发布全新免费插件XVERSE3D-GS UE Plugin,可通过手机拍摄生成高清3D空间,并在虚幻引擎中进行混合编辑,开创全新3D体验。
下载地址:
github.com/xverse-engine/XV3DGS-UEPlugin
在线体验地址:
uat-h5.xverse.cn/3DGS/dev/3DGS/check.html
【AiBase提要:】
🚀 全新插件发布: 元象推出XVERSE3D-GS UE Plugin,支持手机拍摄生成高清3D空间,免费提供给所有用户使用。
🌐 多端呈现与互动: 插件具备多端实时浏览和分享功能,支持漫游、俯瞰等多种交互方式,丰富用户体验。
🎨 虚实融合编辑: 创作者可在虚幻引擎中进行混合编辑,添加虚拟角色、动画、灯光等元素,创造虚实融合的全新3D体验。
微软Paint新增Cocreator按钮,基于DALL-E文字转图片技术
微软在Windows11的Paint应用中引入了Cocreator图像生成AI功能,使用OpenAI的DALL-E3模型,不再限于Windows Insider用户。用户可以通过输入描述并选择生成的图像,该功能不仅在Paint中可用,还整合到Bing搜索聊天机器人和Copilot AI助手中。
【AiBase提要:】
🖌 微软Paint新增Cocreator按钮,使用DALL-E3模型为用户提供文字转图功能。
🤖 Cocreator按钮不再仅限于Windows Insider,所有用户都能在Microsoft Paint中使用这一AI生成技术。
🚀 微软整合DALL-E3的文图生成功能,不仅应用于Paint,还包括Bing搜索聊天机器人和Copilot AI助手。
即时音频转录工具InsanelyFastWhisper 支持人声分割
InsanelyFastWhisper是一款命令行音频转录工具,声称在100秒内可转录2.5小时音频,具备自动转录和说话人分割功能,提高转录效率。
项目地址:https://github.com/Vaibhavs10/insanely-fast-whisper
【AiBase提要:】
🚀 InsanelyFastWhisper是音频转录工具,声称在100秒内可转录2.5小时音频。
🎙️ 工具具备自动转录和说话人分割功能,可识别不同说话人,提高工作效率。
⚡️ 高效且强大,适用于处理大量音频文件,节省时间和劳动力。
🤖📈💻💡大模型动态
Perplexity AI 发布 PPLX 在线语言模型
Perplexity AI发布PPLX在线语言模型,结合网络索引和实时信息,可能颠覆谷歌搜索领域,提供更准确、实用、和最新的搜索结果。
【AiBase提要:】
🚀 技术突破: Perplexity发布PPLX在线语言模型,与传统搜索引擎不同,结合网络索引和实时信息,提供更强大的搜索能力。
🔄 超越竞争对手: 与ChatGPT等模型相比,Perplexity的PPLX在线语言模型在准确性和新鲜度方面表现更优,可能改变搜索引擎的使用体验。
💻 商业模式: Perplexity提供API,个人和组织可通过其网站使用新的PPLX在线语言模型,但需要支付费用,展望未来AI助手与用户实时对话成为搜索主流。
深度求索开源DeepSeek LLM67B大模型
深度求索发布了完全开源的67B大模型DeepSeek LLM67B,在公开评测中表现良好,尤其在推理、数学和编程能力方面脱颖而出。
Hugging Face 首页:https://huggingface.co/deepseek-ai
GitHub 仓库:https://github.com/deepseek-ai/DeepSeek-LLM
【AiBase提要:】
🚀 开源大模型: DeepSeek发布全开源67B模型,无需申请,可免费商用,展现出在数学、编程等方面的卓越表现。
📊 多规模模型: 提供7B和67B两种规模的模型,并提供9个训练中途的模型checkpoints的下载,支持广泛应用。
🔗 资源链接: DeepSeek模型可通过chat.deepseek.com使用,同时在Hugging Face和GitHub上提供相关资源。
Hugging Face发布高度优化的Zephyr-7B迷你语言模型
Hugging Face推出经过蒸馏监督微调的Zephyr-7B迷你语言模型,基于Mistral7B开源模型,采用蒸馏直接偏好优化方法,在基准测试中超越Mistral7B,与拥有70亿参数的Llama-2媲美。
模型网址:https://huggingface.co/HuggingFaceH4/zephyr-7b-beta
【AiBase提要:】
🌐 Hugging Face发布Zephyr-7B,通过蒸馏监督微调方法,优化Mistral7B开源模型,取得显著性能提升。
⚙️ Zephyr-7B采用蒸馏直接偏好优化方法,利用教师模型输出作为偏好数据,极大缩短训练时间,降低资源需求。
🌐在基准测试中,Zephyr-7B超越Mistral7B,甚至可以与拥有70亿参数的Llama-2模型相媲美,标志着Hugging Face在迷你语言模型领域的技术进步。
👨💻💡🎯聚焦开发者
360度全景成像混合技术实现开源
360度全景图像技术难题迎来突破,研究人员设计出圆形混合技术,通过开源项目成功生成无缝全景图像,为旅游、房地产等领域带来新的可能性。
项目地址:https://github.com/archerfmy/sd-t2i-360panoimage
【AiBase提要:】
🌐 创新技术突破: 研究人员设计圆形混合技术,成功实现从文本和单张图像生成无缝360度全景图像。
🔄 无缝全景效果优势: 圆形混合方法整合零散信息,以更简单高效的方式生成全景图像,避免拼接处的不连贯和缺陷。
🌍 广泛应用前景: 技术在旅游、房地产、虚拟现实等领域具有重要应用价值,提供更全面的地点了解,帮助用户做出更准确的决策。
- 0000
- 0000
- 0001
- 0000
- 0001