Workflow
教育公平与伦理
icon
搜索文档
用搭载GPT-5.2的眼镜做题,是一种什么体验?
观察者网· 2025-12-27 05:21
技术表现与产品测试 - 搭载GPT-5.2模型的Rokid智能眼镜在香港科技大学《计算机网络原理》期末考试中得分92.5分(满分100分),高于72分的班级平均分,但低于学生最高分97.5分 [1][2] - AI系统在30分钟内完成考试,而学生考试时长为3小时 [1][2] - 在具体题型上,AI在选择题和单页解答题上获得满分(分别为29分和18分),但在跨页解答题上失分较多,得分为45.5分(满分为53分)[4][5] - 当前大语言模型在处理需要跨页面整合信息、建立长程逻辑联系的任务时存在局限,缺乏全局认知与工作记忆机制 [5] - 测试过程中,Rokid智能眼镜通过Wi-Fi传输高分辨率照片时耗电显著,答题30分钟电量从100%降至58% [6] 教育评估体系影响 - 实验引发对传统教育评估方式的反思,传统考试侧重于检验学生对已知知识的复现能力,而这正是AI的优势领域 [7][8] - 专家建议教育评估体系需重构,重点应从知识复现转向问题定义、创新解决方案设计、过程思维展现以及人机协作能力的培养 [8] - 在AI冲击下,教师角色需从知识传授者转型为学生成长的引导者、学习过程的设计者和思维发展的催化者 [8] 行业与社会挑战 - AI辅助学习工具的普及可能加剧教育不公平,优质AI资源可能首先惠及资源丰富的学校和学生 [9] - 学术诚信体系面临重建,多所高校已开始修订学术规范,明确界定AI使用场景,例如清华大学要求师生必须依规披露人工智能使用情况,并严禁代写、剽窃等行为 [9] - 研究团队强调需通过制定政策法规、技术监控、教育与宣传等综合监管措施,在保护学术诚信的同时推动教育技术创新 [11]
用搭载GPT-5.2的AI眼镜做题,是一种什么体验?
观察者网· 2025-12-27 05:20
(文/观察者网 张志峰) 戴着搭载了OpenAI最新发布的GPT-5.2模型的AI眼镜,参加香港科技大学本科期末考试,能考出什么水平? 答案是:AI系统得分92.5(满分100分),虽不及学生最高得分97.5分,但也远高于72分的班级平均分,且3小时的考试仅用了30分钟。 | 测试对象 | 分数(满分100) | 答题时间 | | --- | --- | --- | | Rokid Glasses + GPT-5. വ | 92.5 | 30分钟 | | 学生最高分 | 97.5 | 3小时 | | 学生平均分 | 72 | 3小时 | 近日,香港科技大学张军教授和孟子立教授团队主导了一场实验,测试搭载GPT-5.2模型的Rokid智能眼镜在香港科技大学大三专业课《计算机网络原理》 本科期末考试中的表现。 除了测试结果本身之外,这一实验引发了更多行业人士关于人工智能能力边界与教育评估方式的讨论。 技术表现:优势与局限并存 在实验条件下,GPT-5.2模型展示了对专业知识的理解与应用能力。值得注意的是,这一表现并未达到满分,主要失分点集中在需要跨页面整合信息的解 答题上。 | 题型 | 得分 | 满分 | | ...