首页站长资讯清北爸爸辅导数学崩溃瞬间，这个国产大模型有解！AI启发问答关键情绪稳定

清北爸爸辅导数学崩溃瞬间，这个国产大模型有解！AI启发问答关键情绪稳定

站长网2024-06-06 21:01:221阅

【新智元导读】辅导孩子写作业这件事，竟难倒了一众清北爸爸、海淀妈妈。不过，最近爆火的这个国产大模型，让无数家长疯狂冲进视频留言，直接把它评为国内家长最想要的AI!

前几天，微博热搜上的这个话题，可以说是让家长们哭笑不得。

既然补习老师不靠谱，那亲自上阵辅导孩子写作业呢?

让清北毕业的爸爸都崩溃的这个难题，恐怕没有这么简单。毕竟，自己会做一道题和能把孩子教会，是完全不同的两件事。

好在，最近一个忽然爆火的神秘国产大模型，或许能解决这个难题!

在评论区，家长们纷纷直呼「好想要」，直接把它评为国内家长最想要的AI。

无数家长疯狂冲进留言区，发出呐喊:赶快让我从给孩子辅导作业的噩梦中解脱出来吧!😂

苏格拉底式启发学

给孩子辅导作业，是不少家长最难渡的「劫」。

因为给孩子辅导作业崩溃大哭的娃爸娃妈，时不时就上了微博热搜。每晚都和孩子斗智斗勇，不写作业母慈子孝，一写作业鸡飞狗跳。

刚刚教会的题，换个题型立马又不会了?让无数家长开始怀疑人生。

都说科技改变教育，真的有产品可以为中国家长分忧么?

今天，这位爸爸就带着女儿小美，来亲测了一番。

平时，每天给女儿检查作业，是这位爸爸的例行功课。但是今天，这项重任，就被交给AI了!

第一步，小美的作业，被平板拍了下来。

AI看完小美的作业，开始总结这些习题的要点——重点练习了商是两位数的除法，和含余数除法，考察了各部分之间关系的知识点。

那么，小美完成得怎么样呢?

AI是这样「判卷」的:填空和计算题，你完成得很好。不过，在应用题中，AI发现了一处有点问题，希望小美能自己检查一下，然后告诉它是哪道题错了。

小美检查了一会儿，实在发现不了错在哪里。最终，父女二人选择求助AI:「小美没有发现她应用题的错误，请你给她做一下分析，但不要直接告诉她答案。最好是能让她下次避免这类的错误。」

这个要求，细看其实并不简单，AI能完成吗?

AI说道「没关系」，然后在屏幕上放大了小美做错的题目。小美看到时有些惊讶，实在想不出自己到底错在哪了。

AI开始循循善诱，从小美和爸爸妈妈一起逛超市的日常生活案例讲起:这是一个常见的「买赠优惠」问题，如果要用数学方法解决，就是这样的——

第一步，酸奶12元一盒，买3盒送1盒，因此，可以把4盒看做1份，而且1份只需要付3盒的钱。说到这里，AI对小美发出提问:买1份需要多少钱呢?

小美回答:36元。

AI表扬说，你计算得很准确，然后接着引导说:我们用妈妈带的120元，除以每1份酸奶的价格，得到的商是几，就可以买几份这样的酸奶了。

在AI的引导下，小美提出了这个除法运算的答案——3份余12元。AI继续提问，每份有4盒，一共有几盒?

小美顺利地给出了正确答案:一共有12 1=13盒。

AI称赞说「你真是个数学小能手」，并且总结了这类除法题的「黄金规律」:类似买几赠几的问题，可以把买的数量和赠的数量看作1份，而1份数量相加时，一定记得加括号，再乘以份数。

飞象星球官方帐号，赞887

小美点头表示理解，爸爸也在旁边巩固了这个计算中的要点:下次面对1份的时候，一定要记得加括号。

而看完全程的家长们，除了称赞AI引导孩子时循循善诱的耐心态度外，更是盛赞这个AI实在情绪稳定，应该能挽救不少因为给娃讲题崩溃的暴躁家长。

值得一提的是，上面这段猿辅导大模型场景内测，已经达到了国内顶级的AI教育水平。

视频一经放出，立刻引得家长激动地奔走相告，在各个群里引发强烈反响，

所以，垂直的教育大模型究竟比一般的通用大模型强在哪里?

小编决定来一番实测，把小美的解题过程，发给当今最强的多模态大模型GPT-4o试试。

GPT-4o的回答，乍一看是没问题的，它的答案和看云大模型的一样:只有酸奶促销这道题算错了，其他都正确。

但仔细对了一遍后，小编发现了不少翻车之处。

比如，第3题的识别，显然是有问题的。

不过，既然这次比拼的是互动启发式问答能力，GPT-4o的这个疏漏我们暂且按下不表。

我们也像视频中一样，向GPT-4o发问，让它帮忙分析一下，但不要直接告诉答案，而且最好帮忙在下次避免这样的错误。

GPT-4o给出的解析过程，直接一下子就把整个的过程写了出来，并没有和小编通过一次次的对话来完成交互。

小编再次强调，希望GPT-4o能进行循循善诱的引导，每次只引导一步。

可以看出，GPT-4o已经在尽力满足我们的要求了，但整体的感觉，仍然是传统教育中老师或家长的主导式讲解。

如果学生本身对于题目概念理解得很模糊，这样一股脑式的灌输，并不能让学生对于自己理解的薄弱点产生醍醐灌顶的理解。

上下滑动查看

而小编从这番亲身尝试中，也细致入微地体验到了教育大模型和一般通用大模型的能力差异。

在实际使用中，大模型的输出往往给人「听君一席话如听一席话」的感觉。但猿辅导大模型的启发式互动，真正实践了传说中的「苏格拉底提问法」。

去年，冲上微博热榜的一个话题「0.999无限循环和1到底哪个大」，竟难倒一大片家长。

主打「智能学习」的海豚AI学，会给出怎样的答案呢?小编立马来了一波实测。

在输入问题后，AI并没有直接给出答案，而是让小编在两种解决方式先做选择。

一是，通过提问，引导我独立解决;二是直接告诉我答案。

不如，这两种方式都看看，AI就这道题的辅导有何不同?

首先是，直接告诉我答案。

原本，还以为AI立刻简明扼要地给出答案，但它还是先进行了题目、以及解决步骤的分析。

如下所示，它给出了4个解决步骤，而且点击「步骤区域」，即可对「该步骤」进行追问。

就以第2步为例，在没有理解的前提下，AI便开启了「苏格拉底式」的提问法。

它会首先询问0.111...和1/9的关系，以确定小编是否真的理解这一步。

不过，当我说「没有关系」时，AI便开始耐心地讲解，帮助小编去探寻0.111...和1/9的关系。

值得一提的是，当最终理解答对的时候，AI甚至会给出语言激励——太棒了，让小编更有动力去完成接下来的问题。

那么，选择「通过提问引导，我独立解决」又有何不同呢?

通过如下的解题过程，让小编深深地感受到「引导」这一词，真正的含义。

AI通过不断提问，启发引导，一步一步去破解这个难题。

在海豚AI学里，除了可以直接问「小白」外，还可以和经过深度训练的「爱因斯坦」、「高斯」、「鲁迅」等大佬对话。

接下来，是由小编本色出演的一个不爱学习的学生。

可以看到，即便面如此没有兴趣的孩子，「超时空对话」里的AI高斯依然会非常耐心地讲解，并在最后给出一个富有启发性地提问。

背后大模型

在猿辅导看来，LLM才是教育未来发展的最大的变量。

半个月前，北京网信办最新公布了一批已完成备案的大模型。其中，猿辅导旗下的看云大模型（简称猿辅导大模型）正式通过了大模型备案。

它并不是一款产品，而是技术底座。

在LLM增速放缓的当下，如何去弥合技术和场景需求之间的鸿沟，成为至关重要的一个因素。

而做大模型应用最困难的是，找到一个对用户有价值，且LLM可以实现的场景。

凭借12年积累的庞大学习数据优势，猿辅导由此打造出了这款专注与教育领域的垂类教育大模型。

据介绍，猿辅导大模型参数有700亿，在10亿道题目上完成了训练。

与通用大模型不同的是，教育的生长是不可逆的，猿辅导不会允许科技AI产品一本正经的胡说八道。

何谓真正的教育?

这里就再次提到了苏格拉底式提问。这种以苏格拉底命名的教育方法，侧重于向学生提出问题，来发现答案。

这种有纪律的提问形式，可以在多个方向上启发思考，比如探索复杂的想法、了解事物的真相、提出问题、揭示假设、分析概念，区分我们所知的和我们所不知的，遵循思想的逻辑结果等等。

比如，想让学生理清思维，探究思维根源，可以问「你为什么这么说?」、「你能进一步解释一下吗?」 ;挑战学生的假设，可以问「情况总是如此吗?」、「你为什么认为这个假设在这里成立?」

在传统的「教与学场景」中，我们太习惯于老师、父母主导式讲解、学生被动式学习的模式。

而恰恰是垂直的教育大模型，能打破这种几千年传统的被动式学习。

在这个过程中，不仅重塑了父母、老师和孩子的交互，让孩子习惯探究式引导学习的模式，拥有一个属于自己的AI伴学老师。

而且，通过孩子过往学习过程的分析和提问，垂直教育大模型还能建立一个学习者大数据库，开启真正的个性化学习时代。

上文中「飞象星球」教小美除法的视频，就为我们形象地展示了，如何通过互动启发式问答，引导小美一步步地洞察到背后的知识点，搭建起底层能力，通过自己的思考，真正学习「一道题是怎样做出来的」。

从此每一个学生都可以拥有属于自己的AI伴学老师，随时可用。而且，猿辅导大模型也将真正推动教育平权。

经过了团队的长期关注、认知、不断验证，这种数据优势隐藏着产品交互背后，提供了服务和支持。

可以说，正是大模型这个变量，给了猿辅导一次重塑教育产品的机会。

搞教育的猿辅导，内核全是AI

在AI教育领域，从不缺重量级玩家。

那么，为什么猿辅导可以在这个领域不断推陈出新，收获孩子家长们好评与认可?

其实，这背后离不开研发团队的创新和投入，以及多年来的经验积累。

早在2012年成立之初，猿辅导开始投入大量资源去做「猿题库」，并希望能用科技改变教育。

也就是从一开始，他们便设定了实现「自适应学习」的目标，并推出了首款线上教育产品。

其中，针对一个「推题」的功能，猿辅导曾尝试利用现有研究成果，比如项目反应理论等与教育质量相关的技术去实现，却发现在实际应用中的效果并不明显。

后来，他们通过不断实践发现，利用深度学习优化「推题」算法，可能会实现更好的效果。

CTO杨元祖曾在采访中表示，「猿辅导技术发展的时间节点有很多，最关键的节点是，做出了一个决策而非产品」。

而这个决策需要团队不断去探索，然后开始筹备团队，在2014年成立了首个AI Lab。

GPT-4发布之后，猿辅导决定去自研LLM。由此，才有了现在的AI场景测试。

旗下大模型已经形成多种参数规模和形态的模型矩阵，具备学情分析、作文辅导、阅读对话、计算解题等十几种核心教育能力。

除了以上提到的飞象星球、海豚AI学、猿辅导素养课，整个集团旗下，LLM还在斑马App、小猿学练机等教育类软硬件产品实现全面落地。

而下一步，猿辅导希望补齐教育大模型最后一块「拼图」——自研多模态大模型。

我们已经看到了，多模态GPT-4o在教育应用中的强大力量。发布当天，可汗学院的创始人父子，演示了GPT-4o如何像真人老师一步一步启发、鼓励，帮助男孩完成数学题。几天前，OpenAI还发布了专为大学打造的教育版「ChatGPT Edu」，也得到了GTP-4o的加持。

足见，多模态模型对教育领域的重要性远超其他领域。CTO杨元祖也表示，猿辅导对多模态的期待和投入非常大。

不得不承认，教育领域的大模型，还处于发展的早期阶段，未来还有很长的一段路要走。这次的演示，也只是在测试阶段。他们还将继续探索在不同场景中的落地应用。

科技是否真的能改变中国2000多年的教育方式，或许还会面对更巨大的挑战。

清北爸爸辅导数学崩溃瞬间这个国产大模型有解AI启发问答关键情绪稳定

0001

评论列表

共(0)条

清北爸爸辅导数学崩溃瞬间，这个国产大模型有解！AI启发问答关键情绪稳定

上传速率可达273Mbps！小米与高通等联合测试5G新上行技术

英特尔为 Arrow Lake-S 和 Lunar Lake CPU 添加人工智能和机器学习指令集

Hugging Face AI 平台中发现100个恶意代码执行模型

Google 悄然放弃面向 Z 世代的基于人工智能的聊天机器人应用

UC伯克利团队用ChatGPT做研究一个小时就能完成学生多年的工作

清北爸爸辅导数学崩溃瞬间，这个国产大模型有解！AI启发问答关键情绪稳定

上传速率可达273Mbps！小米与高通等联合测试5G新上行技术

英特尔为 Arrow Lake-S 和 Lunar Lake CPU 添加人工智能和机器学习指令集

Hugging Face AI 平台中发现100个恶意代码执行模型

Google 悄然放弃面向 Z 世代的基于人工智能的聊天机器人应用

UC伯克利团队用ChatGPT做研究 一个小时就能完成学生多年的工作

UC伯克利团队用ChatGPT做研究一个小时就能完成学生多年的工作