研究表明:在会计方面,ChatGPT 仍然无法与人类相提并论
上个月,OpenAI 推出了其最新的人工智能聊天机器人产品 GPT-4。据 OpenAI 的人员称,这个使用机器学习生成自然语言文本的机器人以90% 的分数通过了律师考试,通过了15门 AP 考试(美国大学先修课程)中的13门,并在 GRE 语言考试中获得了近乎完美的分数.
最近,来自14个国家/地区的186个机构的327位共同作者进行研究,测试了AI聊天机器人ChatGPT在会计考试中的表现,他们对原始版本 ChatGPT 进行了测试。
ChatGPT取得了不俗的成绩,相比之下学生的成绩更好。这有望改变教育方式,提高教学水平和学生成绩。这项研究涉及25,181道教室会计考试题和2,268道教科书测试题,涵盖了会计信息系统、审计、财务会计、管理会计和税务分类。
虽然 ChatGPT 的表现令人印象深刻,但学生们的表现更好。学生的总体平均得分为76.7%,而 ChatGPT 的得分为47.4%。在11.3% 的问题上,ChatGPT 得分高于学生平均水平,在 AIS 和审计方面表现尤为出色。但人工智能机器人在税务、财务和管理评估方面表现更差,这可能是因为 ChatGPT 难以处理后一种类型所需的数学过程。
在问题类型方面,ChatGPT 在判断题(68.7% 正确)和多项选择题(59.5%)上表现更好,但在简答题(28.7% 到39.1% 之间)上表现不佳。一般来说,ChatGPT 更难回答高阶问题。事实上,有时 ChatGPT 会为错误的答案提供权威的书面描述,或者以不同的方式回答同一个问题。
ChatGPT的测试结果为未来的教育领域带来了启示。这些结果表明,聊天机器人可以帮助改善教学和学习,包括设计和测试作业,或者用于草拟项目的部分内容。此外,在聊天机器人的帮助下,教育者可以更好地满足学生的需求,提高教学效果。
- 0001
- 0001
- 0000
- 0001
- 0000