Om lenkefeil og ekvivaleringsmetoder på nasjonale prøver: Evaluering av endring over tid

Q4 Social Sciences
J. K. Björnsson
{"title":"Om lenkefeil og ekvivaleringsmetoder på nasjonale prøver: Evaluering av endring over tid","authors":"J. K. Björnsson","doi":"10.5617/ADNO.6273","DOIUrl":null,"url":null,"abstract":"Nasjonale prøver i nåværende form, hvor Item Response Theory (IRT) benyttes for å bestemme oppgavenes egenskaper og hvor man måler utvikling over tid, har vært gjennomført siden 2014. Prøvene har vist seg å være stabile over tid, og en lenking og ekvivalering er blitt gjort siden 2014 for å gjøre sammenlik-ninger over tid mulige. For å kunne avgjøre om endringer over tid er signifikante, er det nødvendig å kvantifisere den usikkerheten som er knyttet til prosedyren for lenking fra år til år. Denne usikkerheten betegnes som lenkefeilen. Denne artikkelen gjør rede for ulike måter å gjøre dette på, og med bakgrunn i dette beregnes størrelsen av den lenkefeilen som er til stede i regning og engelsk for 5. og 8. trinn. I tillegg presenteres resultater fra en undersøkelse av mulig bias i lenkingen. Konklusjonen er at lenkefeilen er akseptabel, men likevel såpass stor at evaluering av endring over tid må ta hensyn til den. Det blir derfor viktig å ha et prøvedesign og bruke metoder som gir riktige (unbiased) estimater og som bidrar til å minimere lenkefeilen.Nøkkelord: IRT, nasjonale prøver, ekvivalering, lenkefeilLinking error and equating methods on the national tests:Estimating change over timeAbstractThe Norwegian national tests, utilizing Item Response Theory (IRT) to determine item characteristics and measure changes over time, have been administered since 2014. The tests have turned out to be stable over time, and linking and equating has been done each year to make comparisons over time possible. Central for these methods is to quantify the uncertainty in the linking from year to year, as this must be known to determine whether a change from year to year is significant or not. This article presents some often-used methods to estimate the linking error. Based on this, the size of the error due to linking is estimated for English and Numeracy for the 5th and 8th grades. The article also presents an examination of possible bias in the linking. The main conclusion is that the linking error is acceptable, but nevertheless so large that a determination of changes over time must take it into account. It remains important to make use of a test design and methods that result in an appropriately small and unbiased estimate of the linking error.Keywords: IRT, national tests, equating, linking error","PeriodicalId":36494,"journal":{"name":"Acta Didactica Norge","volume":" ","pages":""},"PeriodicalIF":0.0000,"publicationDate":"2018-11-22","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"2","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Acta Didactica Norge","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.5617/ADNO.6273","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"Q4","JCRName":"Social Sciences","Score":null,"Total":0}
引用次数: 2

Abstract

Nasjonale prøver i nåværende form, hvor Item Response Theory (IRT) benyttes for å bestemme oppgavenes egenskaper og hvor man måler utvikling over tid, har vært gjennomført siden 2014. Prøvene har vist seg å være stabile over tid, og en lenking og ekvivalering er blitt gjort siden 2014 for å gjøre sammenlik-ninger over tid mulige. For å kunne avgjøre om endringer over tid er signifikante, er det nødvendig å kvantifisere den usikkerheten som er knyttet til prosedyren for lenking fra år til år. Denne usikkerheten betegnes som lenkefeilen. Denne artikkelen gjør rede for ulike måter å gjøre dette på, og med bakgrunn i dette beregnes størrelsen av den lenkefeilen som er til stede i regning og engelsk for 5. og 8. trinn. I tillegg presenteres resultater fra en undersøkelse av mulig bias i lenkingen. Konklusjonen er at lenkefeilen er akseptabel, men likevel såpass stor at evaluering av endring over tid må ta hensyn til den. Det blir derfor viktig å ha et prøvedesign og bruke metoder som gir riktige (unbiased) estimater og som bidrar til å minimere lenkefeilen.Nøkkelord: IRT, nasjonale prøver, ekvivalering, lenkefeilLinking error and equating methods on the national tests:Estimating change over timeAbstractThe Norwegian national tests, utilizing Item Response Theory (IRT) to determine item characteristics and measure changes over time, have been administered since 2014. The tests have turned out to be stable over time, and linking and equating has been done each year to make comparisons over time possible. Central for these methods is to quantify the uncertainty in the linking from year to year, as this must be known to determine whether a change from year to year is significant or not. This article presents some often-used methods to estimate the linking error. Based on this, the size of the error due to linking is estimated for English and Numeracy for the 5th and 8th grades. The article also presents an examination of possible bias in the linking. The main conclusion is that the linking error is acceptable, but nevertheless so large that a determination of changes over time must take it into account. It remains important to make use of a test design and methods that result in an appropriately small and unbiased estimate of the linking error.Keywords: IRT, national tests, equating, linking error
关于国家测试中的链式误差和平等方法:随时间变化的评估
自2014年以来,已经进行了目前形式的国家测试,其中项目反应理论(IRT)用于确定任务的性质,以及在哪里衡量随着时间的推移的发展。随着时间的推移,试验一直是稳定的,自2014年以来,已经建立了一个链和等价物,以使随着时间的变化进行比较成为可能。为了确定随时间的变化是否显著,需要量化每年与长度程序相关的安全性。这种安全性被认为是连锁错误。本文准备了不同的方法来实现这一点,因此,计算了5的账单和英语中出现的连锁误差的大小。和8。步此外,还提供了对链中可能存在的偏差进行检查的结果。结论是,链误差是可以接受的,但仍然很大,必须考虑对随时间变化的评估。因此,重要的是要有一个测试设计和使用的方法,提供正确的(无偏的)估计,并有助于最大限度地减少链误差。关键词:IRT,国家测试,等价物,lenkeerror国家测试的误差和等式方法:估计随时间的变化摘要挪威国家测试自2014年开始实施,使用项目反应理论(IRT)来确定项目特征并测量随时间的变化。事实证明,随着时间的推移,测试是稳定的,每年都会进行联系和等值,以使随时间的推移进行比较成为可能。这些方法的核心是量化每年联系的不确定性,因为必须知道这一点才能确定每年的变化是否显著。本文介绍了一些常用的连接误差估计方法。基于此,估计了五年级和八年级英语和算术因链接而产生的误差大小。文章还对链接中可能存在的偏见进行了审查。主要结论是,连接误差是可以接受的,但无论误差多大,在确定随时间变化时都必须将其考虑在内。利用测试设计和方法对连接误差进行适当的小而无偏的估计仍然很重要。IRT、国家测试、等式、链接错误
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 求助全文
来源期刊
Acta Didactica Norge
Acta Didactica Norge Social Sciences-Education
CiteScore
0.50
自引率
0.00%
发文量
0
审稿时长
16 weeks
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术官方微信