样题和正式试卷差距大吗

样题和正式试卷差距大吗

首页技巧更新时间:2025-04-05 06:41:25

许多人工智能初学者对大模型训练感到莫测高深,尤其是对数据集的划分感到迷茫。训练集还好说,验证集和测试集是什么鬼?字面上看,没啥区别啊?

一、以高考为例说一下

参加过高考的小伙伴们都有一份痛苦又绝望的回忆!题海战术轮番轰炸,目的是通过无数次训练,能够在最后一个决定命运的考试中取得好成绩。同样是试卷,平时练习的试卷可以看做是训练集;学校阶段性统一组织的模拟测试,可以看做是验证集;而最后一次全国统一时间的高考试卷,可以看做是测试集。

说详细点儿,如果把试卷看做是数据集,那么训练集就是你可以反复练习、训练的试卷集合,例如历年高考真题;而验证集,就是学校找来了一些你平时接触不到的模拟试卷,用来检验你平时训练的成果,但不能最终决定你的命运,你可以根据验证集调整你的学习和训练方法;最后的测试集,则是一锤子买卖,每年6月7、8、9日三天的高考试卷,真正决定你命运的时刻!

这么比较,你明白了吗?

二、回到大模型再说一下

通常,大模型在某一个数据集上训练时,要把数据集(Data Set)分成两部分,大部分用于训练模型参数,称为训练集(Training Set);小部分用于验证训练成果,并根据训练结果调整模型参数,称为验证集(Validation Set)。训练好了,验证完了,模型就成了。

模型好不好,关键还要看其在未知数据上的表现。这些用于测试模型泛化能力(精准预测未知数据的能力)的新数据,称为测试集(Test Set)。测试集仅在模型训练完成并且所有调参工作结束后使用一次,它不参与模型的开发和训练过程,确保评估结果的公正性和客观性。

为了便于操作,许多时候会把一个数据集分为三部分,训练集、验证集和测试集。测试集自始至终作为未知数据,只在模型训练好以后用于最后一次测试,训练和验证时你可以当他不存在。

三、灵魂小结

验证集和测试集看似一家人,实则两家人;本是同根生,相煎何太急?呵呵

,
大家还看了
也许喜欢
更多栏目

© 1998-2024 shitiku.com.cn,All Rights Reserved.