编纂:蛋酱
岂非 Transformer 确定无奈处置「磨炼数据」之外的指出质疑新下场?
提及狂语言模子所揭示的使人印象深入的能耐 ,其中之一便是奈逾经由提供高下文中的样本,要求模子凭证最终提供的越预输入天生一个照应,从而实现少样本学习的磨炼能耐。这一点依靠的数据实现是底层机械学习技术「Transformer 模子」 ,而且它们也能在语言之外的泛化规模实施高下文学习使命 。
以往的人投履历表明,对于在预磨炼混合体中患上到短缺展现的指出质疑使命族或者函数类,抉择适量函数类妨碍高下文学习的奈逾老本简直为零。因此有钻研者以为,越预Transformer 能很好地泛化与磨炼数据相同扩散的磨炼使命 / 函数。可是数据实现,一个普遍的泛化悬而未决的下场是:在与磨炼数据扩散不不同的样本上 ,这些模子展现若何 ?
在最近的人投一项钻研中 ,来自 DeepMind 的指出质疑钻研者借助实证钻研,对于这个下场妨碍了品评辩说