每周AI大事件 | 苹果下多款AI应用、黑客版ChatGPT风靡暗网、通义千问70亿参数模型开源
欢迎来到站长之家的[每周AI大事件],这里记录了过去一周值得关注的AI领域热点内容,帮助大家更好地了解人工智能领域的动态和发展风向。
Part1动态
[国内要闻]
1.腾讯混元大模型开始应用内测 多个业务线已接入
腾讯自研的“腾讯混元大模型”已经进入应用内测阶段。多位腾讯员工表示,他们最近收到了内部邮件邀请,可以通过网页或小程序体验混元大模型。腾讯内部多个业务也已经接入混元大模型进行测试。
2.美图自研视觉大模型MiracleVision已迭代至1.5版本
吴欣鸿透露,目前美图自研视觉大模型已迭代到1.5版本,并应用于美图旗下多款产品。目前,美图在AI层面有多个成功实践案例。“AI绘画”系列涵盖文生图、文字融合、图生图、涂鸦生图、线稿上色、头像制作、宠物头像等功能。
3.北大团队提出Dragon Diffusion,可一键拖拽编辑图像
DragonDiffusion 是一款基于扩散模型的图像编辑工具,旨在实现对图像进行精细化编辑。通过设计分类器引导的方法,DragonDiffusion 能够将编辑信号转化为梯度,通过特征对齐损失修改扩散模型的中间表示。
4.余承东“剧透”鸿蒙4.0:或搭载AI大模型
余承东在社交平台展示了一项新技术:他利用华为手机内置的小艺语音助手,写了一段发布会宣传文案。从该视频可以看出,小艺可以根据用户需求,自动生成文案等内容。而在小艺的回答下方有一行提示——“数据来源:由AI模型自动生成,可能存在疏漏,仅供参考”。华为鸿蒙4.0或将融入AI大模型的能力,使得小艺语音助手具备生成式AI的功能。
5.阿里云开源通义千问70亿参数模型
阿里云宣布开源通义千问70亿参数模型,包括通用模型Qwen-7B和对话模型Qwen-7B-Chat,两款模型均已上线魔搭社区,开源、免费、可商用。
6.多个AIGC应用在苹果应用商店下架
多个AI相关App在苹果应用商店下架。据七麦监控数据显示,本次共有658款应用被下架,其中包含 Chat、AI、GPT 等关键词的应用较多。根据苹果官方通知,中国区的苹果应用商店不允许提供 ChatGPT 相关的服务。同时,相关开发者需提供专门的许可证,且需要向监管部门申请。
7.百度文心千帆大模型平台接入LLaMA2等33个模型
百度智能云千帆大模型平台已经完成了新一轮的升级,全面接入了包括LLaMA2全系列、ChatGLM2、RWKV、MPT、Dolly、OpenLLaMA、Falcon等33个大模型,成为了国内拥有大模型最多的平台。
8.百度Apollo官宣文心大模型首批智舱应用伙伴
百度Apollo宣布长城汽车、亿咖通科技成为首批文心大模型智舱应用探索伙伴。百度Apollo已分别与长城汽车、亿咖通科技基于大模型能力围绕车载交互场景开展探索和实践,完成多项创新功能在量产车型平台上的验证,部分功能有望在长城、领克、smart等量产车型上率先落地。
9.百度将大型语言模型ERNIE应用于汽车,实现文字转图像功能
互联网大厂百度已经实现了将其大型语言模型 ERNIE 应用于汽车领域的承诺,并与汽车制造商长城汽车和数字驾驶舱创造者 ECARX 展开合作。
10.淘宝AI装修功能“真能造”将全面上线
淘宝于7月下旬内测的AI装修功能“真能造”将于8月14日的家装家居生态峰会上正式对外发布,届时功能将更加完善,并且在样板间UGC分享和用户交互功能等方面进一步迭代升级。
11.阿里云通义听悟上线三大新功能
阿里云通义听悟近期上线了三大新功能,其中包括视频自动提取PPT、浏览器插件、钉钉和微信小程序。这些功能旨在帮助用户在PC和移动端随时随地听懂、理解、阅读各类音视频内容,从而提高职场人士和学生的工作学习效率。
12.讯飞星火APP重新上架 将发布星火认知大模型2.0版本
:科大讯飞在投资者平台回应称,讯飞星火认知大模型V2.0升级发布会将于8月15日举办,届时会发布多模态生成、代码生成能力及行业产品等多项能力及应用。
13. 8月AI新规将施行:使用AI生成内容不得侵害他人肖像权
《生成式人工智能服务管理暂行办法》将在8月15日起施行,《办法》明确,提供和使用生成式人工智能服务应当尊重他人合法权益,不得危害他人身心健康,不得侵害他人肖像权、名誉权、荣誉权、隐私权和个人信息权益。
14.AI游戏教育与产业联盟专委会正式成立
AI游戏教育与产业联盟专委会正式成立。浦东将在产业政策、运营规范、国际交流等方面,为AI和游戏产业的发展提供大力支持。
[国际要闻]
1. 苹果已研究生成式AI多年
苹果公司在2023年度的研发上花费了226.1亿美元,首席执行官蒂姆·库克明确表示其中一部分支出是因为该公司正在开发生成式人工智能。库克表示:「多年来,我们一直在进行广泛的人工智能技术研究,包括生成式人工智能。我们将继续投资、创新,并以负责任的方式推进这些技术,以帮助丰富人们的生活。显然,我们在大量投资,并且这一点在你所看到的研发支出中得到了体现。」
2. Medium禁止完全由AI生成的内容 需标记AI生成部分
国外知名博客门户网站Medium.com 最近宣布,他们将禁止100% 由人工智能(AI)生成内容的发布,坚称平台为 “人类写作的家园”。Medium要求所有 AI 生成的文本都必须在 Medium 上进行标注,否则将不会被展示
3.马斯克疑似从OpenAI手中买下域名Ai.com
Elon Musk 疑似已经从 OpenAI 手中购买了域名 AI.com,将其用于他即将成立的 AI 公司 xAI。分析认为,此举可能是为了让自己的公司成为 AI 领域的中心,与 OpenAI 竞争。
4.澳大利亚新闻集团利用AI每周生成3000篇当地新闻报道
澳大利亚新闻集团(News Corp Australia)执行主席Michael Miller透露,该公司每周使用生成式人工智能制作3000篇文章,生成数千个有关天气、燃油价格和交通状况的当地报道。最近,该新闻集团发布公告招聘生成式AI数据记者,要求会使用AI自动创建新闻内容。这在新闻领域属于比较新鲜的职位,同时新闻媒体的内容创作将迎来转型时期。
5. OpenAI提交GPT-5商标申请 此前称目前没有训练GPT-5计划
ChatGPT的开发者OpenAI已经向美国专利商标局(USPTO)提交了“GPT-5”的商标申请。这一消息是由商标律师Josh Gerben在推特上分享的。GPT-5被推测是OpenAI高级语言模型的下一个迭代,可能会代表自然语言处理和人工智能能力的重大进步。但是,GPT-5的具体功能和改进尚未得到OpenAI的正式确认。
6.YouTube在最新测试中使用人工智能总结视频
谷歌正在尝试使用人工智能自动生成 YouTube 视频摘要。这些摘要只会出现在有限数量的英语视频旁边,并且只能由有限数量的用户观看。它们将出现在 YouTube 的观看和搜索页面上,旨在简要概述视频内容,而不取代人工编写的现有描述。
7.消息称OpenAI测试DALL-E3.0版本
OpenAI 可能正在准备下一版本的 DALL-E AI 文本到图像生成器(称为 DALL-E3),并进行一系列 alpha 测试,这些测试现已向公众泄露 。虽然测试版本显示了模型的潜力,但也暴露了一些潜在的问题,例如生成不适宜内容的风险。然而,这些问题有望在正式发布之前得到解决。
8.硅谷知名风投公司发布创建人工智能女友的说明
硅谷风投公司 Andreessen Horowitz 最近在开发者网站 GitHub 上发布了一份详细的指南,教人们如何从零开始构建一个 AI 伴侣机器人。Andreessen Horowitz在描述中写道:这些伴侣有很多可能的用例——浪漫(人工智能女朋友/男朋友)、友谊、娱乐、辅导等。该项目纯粹是为了成为开发者教程和入门堆栈那些对聊天机器人是如何构建感到好奇的人。
9.众筹网站Kickstarter要求生成式AI项目披露更多信息
Kickstarter 近日宣布,对于使用生成式人工智能(AI)工具创作图像、文本或其他作品的项目,将要求其在项目页面上披露更多与 AI 相关的信息。
10.韩国AI大模型Upstage的LLM击败ChatGPT
韩国人工智能创业公司 Upstage 的最新人工智能模型Upstage在一项全球认可的开源语言模型评估中超过了全球知名的 AI 巨头 OpenAI 的 ChatGPT。Upstage 的其采用 Meta 的 LLaMA270B 模型训练的新 AI 模型在最新的 HuggingFace Open LLM Leaderboard 排行榜上获得了平均得分72.3。
11. AI打败AI!谷歌科学家用GPT-4击败AI防篡改系统
谷歌科学家使用 GPT-4聊天机器人来欺骗 AI-Guardian 图像分类器的防御措施,并提供了相应的代码。GPT-4成功击败了 AI-Guardian 的防御,并降低了其稳健性从98% 到8%。
12. Instagram 开发新的 AI 功能,包括 AI 生成的图像检测器
Instagram正在开发新的AI功能,包括一个AI生成的图像检测器。这些新的生成式AI功能不仅可以提升用户在 Instagram 上的体验,还可以帮助打击虚假信息。
13.Stack Overflow 推出 OverflowAI
Stack Overflow 在开发者社区和人工智能之间进行了整合,推出了 OverflowAI。OverflowAI 引入了语义搜索,通过矢量数据库提供智能的响应,为开发者提供准确的问题解决方案。
14.英语的人工智能使用费比其他语言便宜15倍
研究表明,对于类似 OpenAI 的服务,由于计算成本的计量和计费方式,英语输入和输出比其他语言要便宜得多,其中简体中文的成本约为英语的两倍,西班牙语为英语的1.5倍,而掸语则要贵15倍。
15.谷歌推AI控制机器人 RT-2模型:将文本和图像转化为机器人动作
谷歌推出了 Robotics Transformer2(RT2),这是一个视觉-语言-动作(VLA)模型,可以将文本和图像输出为机器人动作。谷歌表示,RT-2「让我们更接近机器人的未来。」「就像语言模型通过从网络上的文本进行训练来学习一般的思想和概念一样,RT-2通过从网络数据中传输知识,以指导机器人行为,」谷歌 DeepMind 的机器人主管 Vincent Vanhoucke 在一篇博文中解释道。「换句话说,RT-2能够与机器人交流。」
16. Photoshop beta 版添加Firefly驱动的AI画布扩展功能
Adobe 正在构建 Firefly,其生成式 AI 模型系列,在 Photoshop 中加入了一个功能,正如该公司所描述的:「将图像扩展到原始边界之外」。这个名为「生成式扩展(Generative Expand)」的功能,在 Photoshop 的 beta 版本中可用,用户可以通过单击和拖动裁剪工具来扩展和调整图像,从而扩展画布。
Part2产品
1. Meta发布AudioCraft,可帮助用户创作音乐和音频
Meta发布了一款开源人工智能(AI)工具AudioCraft(直译为音频技艺),该工具可以帮助用户根据文本提示创作音乐和音频。Meta表示,这款人工智能工具将AudioGen、EnCodec和MusicGen三种模型或技术融为一炉,可用文本内容生成高质量、逼真的音频和音乐。
2.图像编辑工具EditAnything:可编辑图像中的任何元素
EditAnything 是一款基于 Segment-Anything、ControlNet、StableDiffusion 等技术的图像编辑工具。它能够编辑和生成图像中的任何内容,包括对图像中的物体进行修改、添加、删除等操作,通过调整细节和布局来生成不同风格的图像。
3.Faceswap.dev:一个免费开源的AI换脸工具 高效且安全
Faceswap.dev 是一个免费开源的AI 换脸软件,可以在视频或图片中进行人脸替换。该软件旨在提供易于使用、高效、安全的 Deepfakes 工具,并致力于提高用户的道德和法律意识,防止滥用 AI 换脸技术。
4.给自动驾驶AI上“外挂”!港大&TCL开源轻量级模型MarS3D
香港大学计算机视觉与机器智能实验室(CVMI Lab)和 TCL AI Lab 的研究人员共同开发了一种名为 MarS3D 的轻量级模型,可以显著提升自动驾驶 AI 的物体运动状态判别能力。
5.英伟达新AI图像生成器Perfusion :大小仅100KB、训练只需4分钟
Nvidia 研究人员推出了一种创新的文本到图像个性化方法,称为Perfusion。与大AI图片生成模型不同的是,Perfusion 只有100KB大小,训练时间短,只需要4分钟。
6.Deep Nostalgia:通过AI技术让老照片动起来
Deep Nostalgia 是一项使用机器学习来动画静态图像的技术,能够给照片中的人脸添加动画效果,让家族历史更生动。用户只需上传照片,Deep Nostalgia 就会应用预设的动作模板,创建高质量逼真的视频。目前该工具已完成超过1.06亿个动画,并持续增加。
7.免费在线AI绘画工具Playground AI 无需注册
Playground AI 是一款免费在线的绘画工具,不需要注册。用户可以每天绘制1000张作品。
8.Skybox AI:随手涂鸦即可一键生成360度全景图像
Skybox AI 是一款由 Blockade Labs 开发的免费工具,可以一键生成360度全景图像。用户可以通过关键词描述来生成完整的3D 场景,包括建筑物、天空、地面、植被等。生成的场景逼真,并且用户可以通过手势工具在360度内切换视角,并免费下载图片到本地。
9.开发恶意软件、伪造信用卡,AI机器人FraudGPT在暗网风靡
FraudGPT 是一种不受监管的聊天机器人,在暗网上流通,并被犯罪分子用来编写网络钓鱼电子邮件和开发恶意软件。这个软件是由名为 "CanadianKingpin" 的开发者提供,在多个暗网市场上销售。它的定价为每月200美元,但购买三个或六个月的订阅可以获得折扣,购买一年的访问权限需要1700美元。据称,称其已在地下平台上处理了3000多笔销售。
10. AI律师“Do Not Pay” 帮用户推翻了16万多张停车罚单
Do Not Pay 是由 GPT4支持的人工智能律师机器人,可以通过为停车罚单辩解、协商交易退款和分析财务交易来帮助用户节省金钱。其接受了西方主要国家消费者法律和法规的培训,可以撰写引用具体立法的有说服力的信件,并代表用户通过电子邮件发送给公司,从而为他们节省金钱。该机器人已在纽约和伦敦推翻了16万多张停车罚单。
11. 80%代码秒生成!AI神器Copilot大升级
Github官宣,Copilot模型升级,5年内80%的代码将自动生成。GitHub Copilot发布还不到两年, 就已经为100多万的开发者,编写了46%的代码,并提高了55%的编码速度。
Part3观点
1.尽管巴菲特对ChatGPT感到惊叹,但他对AI投资仍持谨慎态度
沃伦·巴菲特在接受 CNBC 采访时表达了对人工智能和 ChatGPT 的谨慎而又惊叹的态度。他承认自己对人工智能的了解还不足以对其进行投资,但他仍然看到了它在日常应用中的潜力。
2.调查:63%的人担心使用生成式AI导致侵版问题
根据调查,63% 的人担心使用生成式人工智能时侵犯版权问题,而41% 的人担心这些工具存在固有偏见。另外,83% 的人对需要跟上的工具数量感到困惑,92% 的人不相信科技公司能够进行自我监管。
3.郭明錤:苹果的生成式AI技术明年也不会推出
苹果分析师郭明錤在新报告中指出,目前没有任何迹象显示苹果会在2024年推出生成式AI技术或将其结合至硬件。郭明錤预测,苹果不会在即将到来的财报电话会议上花太多时间去讨论 AI 相关事项。苹果内部已经在做类似GPT的产品,但对于如何将生成式AI技术应用至消费者产品,苹果仍未有清晰的策略。
4.IBM报告:证明投资人工智能可降低数据泄露成本
IBM安全部门的2023年数据泄露成本报告提供了有力证据,证明投资人工智能、自动化和威胁情报可以缩短数据泄露的生命周期,降低数据泄露的成本,并在整个公司范围内建立更强大、更有韧性的安全姿态。
5.皮尤研究中心:人工智能可能取代旧岗位 也能带来新职业
皮尤研究中心的一项发现显示,19% 的美国工人从事与人工智能高度「暴露」的工作,该研究使用了暴露一词,因为尚不清楚人工智能的影响是积极的还是消极的。最受影响的群体包括预算分析师、数据录入员、税务编制员、技术作家和网络开发人员等职业。但23% 的美国工人却几乎不受影响,这些岗位是人工智能无法轻易复制的一般体力劳动,比如理发师、洗碗工、消防员、管道工、保姆等。
6.超过75% 的投资者因人工智能而热捧科技股
在最新的 Markets Live Pulse 调查中,514位受访者中的77% 计划在未来六个月内增加对科技股的投资或保持现状。与此同时,不到10% 的人认为科技领域的泡沫很快就会破裂。一半的人不愿意自掏腰包购买 AI 工具来帮助他们的个人或业务生活,而大多数公司也没有计划在交易或投资中使用这些工具。
7.Gartner:对话式 AI功能将推动全球客服中心市场在2023年增长16%
Gartner 最新的报告,2023年全球在客服中心技术、对话式人工智能和虚拟助手方面的支出预计将达到186亿美元,这与上一年相比的大幅增长16.2%。
8.研究显示:全球AI芯片组市场规模预计将超过7000亿美元
研究显示,2021年全球人工智能芯片组市场估值约为455亿美元,该市场2022年至2031年,复合年增长率可能高达31.8%,到2031年,市场规模可能达到7174亿美元。
Part4深度
1.每月200美元便可 AI“刀”人?无技术门槛的黑客版 ChatGPT 风靡暗网
近日,一款名为 FraudGPT 的恶意 AI 工具在暗网上流通,被黑客用于编写钓鱼邮件和开发恶意软件。与传统黑客工具相比,FraudGPT 更简单、直接、高效,无论专业开发人员还是小白都能使用。它可以生成看似真实的钓鱼邮件和网站,诱骗用户泄露敏感信息,还能模仿人类对话,与用户建立信任,引诱他们泄露信息或执行有害操作。FraudGPT 基于 GPT-3的大型语言模型,在训练后可以生成合乎逻辑且与事实相符的欺诈性文本。
2.被AI大牛押注的智能体,国内发展得怎样了?
前特斯拉总监、OpenAI 大牛 Karpathy 表示,AI 智能体是未来发展的方向。智能体是大模型的 "身体",能在各个领域施展身手。国内团队也在发展智能体,联汇科技推出了基于大模型自主智能体 OmBot。智慧店长、文档处理、视频剪辑是智能体的主要应用场景。然而,智能体的商业化落地仍面临挑战,包括技术壁垒和 “松耦合” 路线。国内团队需要攻克这些难题,才能实现真正意义上的智能体。
3.被卖家追着跑,这一波AI商拍真香了?
2022年年末,OpenAI 推出 ChatGPT,引爆了 AI 商拍领域的热潮。AI 商拍工具通过利用 AI 技术帮助品牌生成高质量产品图片,节省了拍摄成本和时间。在静态产品图生成功能上,各产品的使用路径和功能相似,但还需在细节上做更多优化。AI 商拍工具的技术壁垒并不高,不同厂商采用不同的底层模型,如 WeShop 采用了开源的 Stable Diffusion。目前主要用户是中小卖家和档口卖家,大企业在融合 AI 产品方面还面临一些难题。
4. 9.9元的AI芭比写真,会抢走摄影师的饭碗?
电影《芭比》票房飙升后,“芭比 AI 写真” 成为热门周边。通过名为 “45AI” 的小程序,用户上传照片后,花9.9元即可得到金发芭比写真。虽然有排队时间和成片效果等问题,但仍有很多人追捧。AI 写真小程序在社交媒体迅速走红,但也引发了争议,如用户隐私等问题。AI 写真被称为抢走摄影师饭碗,但摄影师认为 AI 写真还不能威胁到他们的生意,因为 AI 只能修图,而摄影师还有沟通和引导客人等重要环节。
5.AI生成视频有哪些新玩法?
AI初创公司Runway宣布,AI视频生成产品Gen-1和Gen-2已全面开放,任何人都可以注册一个账号免费尝试。通过使用 Gen-2和 Midjourney,创作者可以快速生成各种类型的短片,包括科幻、恐怖、以及对热门 IP 的二创等。具体玩法可阅读原文。
6.硅谷“砸钱”造神,中国式AI能复制么?
硅谷在人工智能领域获得了大量融资,但与中国的 AI 创业环境存在差异。硅谷重视技术创新和大模型能力,而中国更注重商业模式。目前硅谷投资热点主要集中在基础大模型层、中间层和垂直应用层。然而,硅谷的大模型公司主要以 OpenAI 为首,其他创业公司很少涉足该领域。相比之下,中国的 AI 创业者和投资人面临迷茫,且 “Copy to China” 的策略逐渐失灵。硅谷投资人更注重 OpenAI 和 B 端行业整合的 AI 公司,而中国的创业者和投资人应该注重发展中间层和独特的商业模式。
7.大模型狂飙半年:第一波裁员潮来了,AI「大饼」要提前结束了?
上半年市场热炒的人工智能主题受到怀疑,大模型的炒作势头或将结束。国内外初代 AIGC 企业开始裁员,部分公司经营不善导致停摆。虽然市面上推出了超过100款大模型产品,但行业泡沫混杂,未来只有少数企业能够成为市场赢家。
- 0001
- 0001
- 0000
- 0000
- 0000