当前位置:首页 >> >>

体育测量评价科学性


体 育 测 量 的 科学性
北京体育大学
统计测量教研室
任 弘 博士、副教授

本科程主要内容: 1 体育测量的科学性理论 2 评价理论与方法 3 人体形态测量 4、体质研究

体育测量内容 —— 身体综合能力
形态结构 心理素质

生理机能
身体素质及基础运动能力

智力水平
专项技术水平

专项战术水平

形态结构 是身体各种能力的基础
体格:身体各环节的长度、宽度、围度和厚度
体型:对人体某个阶段形态结构及组成成分的描述 身体成分:身体中的脂肪含量 体姿:身体各部在空间的相对位置 骨龄:人体的生理年龄 生长发育成熟度:第二性征发育水平

生理机能:是指人的整体及其组成的各器
官、系统所表现的生命活力
呼吸机能:肺活量、最大摄氧量 、 循环机能:安静状态、定量负荷状态、最大负 荷状态下心血管系统的机能反应 代谢机能:有氧代谢和无氧代谢

感觉机能:肌肉用力感觉
平衡机能:静态平衡和动态平衡

身体素质:人体在运动中所表现出的速度、 力量、耐力、灵敏及柔韧等方 面的机能能力
速度:位移速度、动作速度和反应速度 力量:等张性力量和等长性力量

耐力:一般耐力、速度耐力、力量耐力
和静力性耐力 柔韧:关节活动范围,受关节结构、跨过关节的肌肉、肌 腱和韧带等因素的影响 灵敏:人体在各种复杂条件下快速、准确、协调地改变身

体姿势、运动方向和随机应变的能力

精神、心理因素
认识:包括感觉、知觉、记忆、想象及思维; 情感:是满意、愉快、愤怒及烦恼等态度体验 意志:在认识和情感体验的基础上,人类为了满
足某种需要,自觉地确定目的,指定计划,克服 困难而努力达到目的,这是人类的意志过程。

智力
智力是各种认识能力的总和。是获得知 识的能力,是认识、理解事物和运用知识与

经验解决问题的能力 。
包括:观察力、注意力、记忆力、想象力、

思维力、创造力。

运动技术
——与专项密切结合 运动技术测量内容:技术容量 技术全面性 技术效果 运动技术测量方法:

技术测量(直观测量和仪器设备测量)
理论测量

战术水平
理论测验 教练员评定 比赛观察

测量与评价的关系

身体综合 能力

测量 收集信息

数值 记号

评价 处理信息 结果

解释与反馈

测量的可能性
只有当某种特征能够清楚地加以确定,

并对拟测个体的特性加以明确辨别,以至
足以观测出其间差异时,才具有测量的意

义和现实性。

体育测量评价的发展趋势: 1、多学科、多部门协作; 2、与运动专项紧密结合; 3、应用领域广泛
运动员竞技能力评定

运动员选材
体质研究

测量的科学性—可靠性、有效性、客观性
( 三性理论 )

信度:可靠性 客观性 测量值 指标真值 效度:有效性 属性真值

测量三性的讲解内容

定义 分类 估价方法 影响因素

测量的可靠性(信度—Reliability)
一、可靠性的定义: 1、狭义的操作定义:在相同条件下对同一批受 试对象使用相同的测量手段,重复测量结果的一 致程度。用可靠性系数 r 表示。(r值越接近1,

越可靠)
2、一般定义:测验结果的一贯性、一致性、再

现性、稳定性。(张力为)

3、理论定义:真实值方差与实测值方差的比值。 X=T+E ?2T ? 2X - ?2E ? 2E

r=

? 2X

=

? 2X

=1-

?2x

可靠与不可靠?
信度反映的是测量结果受到随机误差影响的
程度,是评价测量质量的最基本的指标。它

是一个相对概念,并非绝对的有无,而是一
个程度上或多或少的问题。没有一个测量是

绝对可靠的,只有测量结果可信程度的高和
低。

可靠性(信度)分类

重测信度 分半信度 内部一致性信度 同质性信度 测量的信度 评分者信度 复本信度

二、可靠性的分类:

1、稳定可靠性 (重测信度) :间隔一定时间,使 用相同测量手段,对同一批受试者重复测量,结 果的一致性程度。是估价可靠性最简单的方法。
注意事项(1)信度系数受测验间隔时间影响:

(2)不适用于考察难度的测验
(3)被试在第二次测试时容易觉得枯燥 (4)费时、费力

2、等价可靠性 (复本信度):

当同一测验的一种形式不适合实施两次时,就需要采用该 测验的另一平行测验(复本)。复本在测量内容、难度、

平均数、标准差等方面应与原测验一样,否则估计的可靠
性系数就会出现较大误差。 注意事项 (1)两次测验的题目要基本等值——同质测验 (2)两次测验要尽可能在较短时间内进行 (3)实际工作中,完全等值的测验很难找到

同质测验、复本(问卷调查) 测验的目的相同 难度相似

方式(题目)不同

3、内部一致可靠性 (内部一致信度 ) :

前两种信度都需要两次测验,较烦琐。根据

一次测验估价测验的信度称为内部一致信度。
(1)裂半法—分半信度

(2)克隆巴赫? 系数法—同质性信度

4、评分者信度—客观性

定义:多个评分者给同一批受试者评分 时结果的一致程度。对于无法定量测量 只能定性评分的项目来说,评定结果的 信度受评价者主观因素的影响,故也称 测量的客观性。

5、同质性信度

定义:测验内部所有测题之间的一致程度。 并非所有的测验都要求有较高的同质性信度。

分半信度与同质性信度有时也和称为内部一致性信度

三、可靠性的估价方法:

1 Pearson 积差相关法:重测信度和复本信度的 估价可以使用本方法。 积差相关法适用于: (1)适用于两组变量可靠性的计算 (2)无系统误差

补充知识:

系统误差:由于测量工具不准确,或测试人员

知识技术水平不同,致使测量结
果呈规律性偏大或偏小。 重复测量时任何一次测量中有系统误差,都会 使估价出来的信度系数偏高。

例1:对10名学生实施间隔一周的两次跳高测量, 结果如下,试估价测量的可靠性。

编号

1

2

3

4

5

6

7

8

9

10

X1 1.49 1.41 1.60 1.40 1.42 1.51 1.58 1.43 1.53 1.48

X2 1.51 1.48 1.64 1.39 1.47 1.55 1.61 1.41 1.57 1.54
r = 0.938 可靠吗?

如何判断两次测验中有无系统误差?

成对数据T检验 如果t ? t?(n?)则两组数据间无显著性差异

无系统误差 计算信度系数

2、 裂半法(分半信度)

将一个测验分成奇数题与偶数题两半,两

部分结果的一致程度。
适用于没有复本且只能进行一次测验的情

况下。

例:对五名受试者进行四个问题的测验, 估价测试数据可靠性。 受试者
N=4 A B 1 10 12 2 12 13

测量题目
3 12 11 4 13 10

成绩总和
奇数次 偶数次 22 23 25 23

C
D E

12
18 16

13
12 15

12
13 17

11
12 15

24
19 33

24
22 30

分半后计算相关系数的测量次数(题目数)只有实 际的一半,这就降低了信度,为了得到整个测验的 信度系数,需要用斯皮尔曼-布朗公式修正。

r?

2 r1 ?1

2 2

1 ? r1?1

r

2 2

r

11 ? 22

:两半测验之间的相关系数 :整个测验的信度系数

3、 抽样复测法 — 适用于大样本群体测量
步骤:1、确定抽样比例及人数; 2、随机抽样,做好标记;

3、发给参加复测的受试对象测试卡片;
4、请受试者返回原测地点,在相同条件下重测; 5、对比原测卡片和复测卡片,计算超出允许误差范围 的误差次数N; 6、计算误差发生率 P。P = N/测量次数?100%

如果P? 5% ,可靠性较差

4、 方差分析法(评分者信度)

r

MSB ? MSW MSW ? ? 1? MSB MSB
MSW — 组内方差

MSB — 组间方差

例:2000年奥运会男子10米跳台决
赛裁判员评分一致性检验

5、Spearman 等级相关—两组变量 (重测信度、复本信度、评分者信度)
如果测量数据不精准,只是定性评分或排名,可使用等级 相关。

实际上等级相关对于定量测量的数据或定性评分的数据都
可以使用,但对于定量数据计算结果不如积差相关法准确。

遗憾的是Excel中不能直接计算等级相关,需要用Rank函
数先对数据进行排名,然后再用积差相关法计算

例:两名教师给10名学生的考试卷进行 评分,估价其评分者信度

6、肯德尔和谐系数法—多人评分信度 由多人进行评分时评分者信度的估价方法 适用于:多组顺序型数据 缺点:Excel、SPSS中没有现成计算公式

12 S ?? 2 3 m n ? n) (

较少使用

7、克隆巴赫?系数——内部一致性信度 (同质性信度)

用于估价多个项目或多个分测验所构成的测验合成
得分的信度系数。需用SPSS统计软件计算

Analyze

Scale

Reliability Analysis

Reliability Coefficients 10 items

Alpha = .7205

Standardized item alpha = .7377

信度估价方法总结

重测信度:积差相关法、等级相关法、方差分析法、 抽样复测法 复本信度:积差相关法、等级相关法、方差分析法 评分者信度:等级相关法、方差分析法、和谐系数法

分半信度:裂半法
同质性信度:克隆巴赫?系数

可靠性程度的判断标准:

0.95 ~ 0.99 0.90 ~ 0.94 0.80 ~ 0.89

非常可靠 可靠 可靠性可以接受

0.70 ~ 0.79
0.70 以下

可靠性较差
一般认为不能使用

四、影响可靠性的因素: 1 、测量误差 (1)测试者 (2)受试者

(3)测试仪器 (4)测试方法
(5)测试环境

(6)抽样误差:
抽样方法、样本量、样本代表性

2、受试者个体差异

同一种测量手段,用于个体差异不同的群体时, 个体差异较大的群体,估价出的信度系数较高, 个体差异较小的群体信度系数较低。

? ? ?? ? r? ? ? 1? 2 ? ?X ?
2 T 2 X 2 X 2 E

2 E 2 X

3、受试群体的能力水平

在某种能力水平上信度高的测验,对于其它能力

水平的群体信度未必就高。
例如:适应能力问卷在本科文化程度人群中使用 重测信度可以,但用于小学文化程度的人群信度 未必够

3 重复测量的间隔时间

重测信度、复本信度中,重复 测量间隔时间越长,估价出的信 度系数越低

4 测量的长度

重测信度、复本信度中重复测量的次数,评分

者信度中的评分者人数,内部一致性信度中的
题目数统称为测验的长度,长度越长信度越高, 但长度增加的同时测量工作量增加,其它影响 影响测量结果的因素也增加。

5 测量指标的类型

稳定性高、不易变化的指标重测信度高;

定性评分项目中,受主观因素影响小的指
标评分者信度高;

6、测试细则

测试细则详细准确的测量重测信度高;

评分规则详细准确的评分者信度高

7 估价可靠性时使用的方法

如果同时可以使用几种方法估价信度

系数,可能计算结果会稍有不同。

8、测试人员的人数、水平、责任心等

对评分者信度影响较大

五、提高可靠性的方法:

(一)严格实施标准化的测量程序。包括测量仪器设备
的标准化,测量方法的标准化,测量实施的标准化。这 样可以减少随机误差和系统误差。

(二)适当增加测量的长度。在运动技术测量当中,增
加测量或测验的次数,在体育社会、教育心理测量中,

适当增加题目的数量。
(三)适当地增加平行测验项目,可以增加对信度的检

验,获得更丰富的信息。

(四)适当增加样本含量,并提高抽样的科学性(使样 本具有代表性),这样可以减少抽样误差。

(五)测验的难度要适中,使受试者表现出应有的成绩
差异。

(六)在选取受试者群体时,要兼顾他们的水平差异(
最好接近正态)。

(七)提高测试人员的责任心、业务素质和测量技巧,
以减少过失误差、系统误差和随机误差。

(八)在有些测量中,要对受试者进行必要的宣传鼓动 ,诱发其正确的动机和兴趣,使之事先对测量方法、要

求有所了解,更好地配合测试。尤其在机能测验和运动
能力测验中,以及在量表测试过程中,正确的动机、认 真的态度、全力以赴的作风将直接关系到测量结果的准 确与可靠。 (九)重复测量时要考虑间隔时间的长短,以及要保证 两次测验的独立性(完整性)。 (十)要注意测量时间和环境的选择。如不要在大型赛 事(如校运会)和重大节日(如国庆节)前后安排测试

(十)要注意测量时间和环境的选择。如不要在大型赛事
(如校运会)和重大节日(如国庆节)前后安排测试;测

试要求适当充裕的时间;要注意考试环境的选择和控制(
如噪音太大、考场纪律混乱等)。 (十一)除了对可靠性进行定量的检验外,还可以通过其 它途径对信度检验进行补充和修正,例如:受试者的平时 表现、出勤、作业、回答问题等是否与测试结果有特别大 的出入等等。

测量的有效性(效度—Validity)
一、有效性的概念 1、操作定义:指所选择的测量手段在测量欲测 属性时的准确程度,即能测量的属性和要测量的 属性之间的一致程度。效度有两曾含义:1、测 量值与欲测属性之间的一致性;2、测量值的可 靠性 有效性用效度系数 r 表示,-1? r ? 1

2、有效性的理论定义 效度是在一组测量中,与测量目 的有关的真实变异数与总变异数 的比值。
2 ?X

? rXY ? ?
X= V + I + E

2 V 2 X

2 V

?
? T2

? I2

2 ?E

2 V

? 由所要测量的变因引起的有效变异

T
2 I 2 X

rXY

? ?? ? ? ? ? ? ? ? rXX ? 2 ?X ? ? ?
2 T 2 I 2 T 2 X 2 I 2 X

二、有效性与可靠性的关系:

可靠性是有效性的必要条件,即要想有效 性高,可靠性必需高;有效性是可靠性的 充分条件,即有效性高,可靠性一定高。

同一测验的信度系数高于其效度系数。

三、有效性的分类:

1、内容效度(Content Validity):

(1) 所选择的测量内容反映总体属性的准确
程度。常用于理论知识的测验。

(2)考察内容效度的前提是:要有定义较完整
的总体属性的内容范围。

(3)确定内容效度的方法

A 专家调查:一定数量专家逻辑分析的结果, 也称逻辑效度。 B 统计分析—相关计算:一项测验与公认有较好

内容效度的测验的相关越高,说明内容效度越好。
如高中毕业前的摸底测验,其内容效度可与高考

成绩比较

2、构想效度(Construct Validity):

(1)一组测量所包含的各种属性与总体属性的

各种拟测成分在结构上的一致性程度。即可以实
际操作的测验与理论上的构想的符合程度。常用

于心理与运动能力的成套测验。

(2)确定构想效度的方法

A 因素分析:探索性和实证性因素分析

B 相关计算:与已有的构想效度较好的
测验的相关 C 聚合效度和区分效度

3、效标效度(Criterion Related Validity): (实证效度) (1)所选择的测量与效标之间的关联一致性程度。

(2)效标:即检验效度的标准,已被检验证明能
够作为参照标准,是一项有效性高的测量。

(3)体育测量中常用的效标:
A 可定量测量的专项成绩:如100米、跳远的成绩; B 比赛的名次或运动等级; C 具有数量特征的量:100米跑的步频和步幅,

跳远的助跑速度;

D 合成效标:如体质评价总分、成套测验总分。

E 标准的实验室结果:如水下称重法测得的身体成
分、用气体分析仪和电动跑台测得的最大吸氧量。

三、有效性的估价方法
1 逻辑分析法:——— 专家调查法 2 积差相关法(等级相关法): 3 因子分析(主成分分析)法: 4 逐步回归法: 5 指标鉴别力分析

例:为检验小腿长度能否反映短跑运动员的运动成 绩,抽取14名运动员进行测试,结果如下,请检验 小腿长度反映运动员的短跑运动成绩的有效性。

编号 小腿长 1 32.5

100m 跑 13.2

编号 小腿长 8 33.9

100m 跑 12.3

2
3 4

27.9
29.7 31.1

13.8
13.1 12.6

9
10 11

31.4
30.5 30.8

12.1
13.2 12.6

5
6

28.7
29.8

13.9
14.2

12
13

33.1
28.8

11.8
13.6

7

32.2

11.9

14

31.1

12.2

例:以1987年全国地掷球男子单打决赛资料为例,计算
以滚靠技术成功率判断地掷球运动技术水平的有效性。 比赛名次 成功率 成功率排序 序差(d) d?

1 2 3 4 5 6 7 8

29.2 26.3 31.2 19.4 25.7 21.7 19.3 16.9

2 3 1 6 4 5 7 8

-1 -1 2 2 1 1 0 0

1 1 4 4 1 1 0 0

等级相关

rs ? 1 ?

n(n ? 1)
2

6? d 2

d 2 — 两组数据之间的序差

rs

— 等级相关系数

例:因子分析法进行效度检验

体质四因素模型因子分析各指标因子载荷(40岁以下)

指标
仰卧起坐(俯卧撑) 纵跳 抗病均分 自然均分 社会均分 坐位体前屈 肺活量 握力

因 1 .966 .962 .811 .801 .759 2

子 3



荷 4 5

.733 .675 .544

单脚站立
选择反应时 台阶指数

.719
.707 .689

体重/身高

.608

体质四因素模型因子分析(40岁以下) 因子 1 特征值 1.991 贡献率 16.595 累计贡献率 16.595 因子权重 0.25

2
3 4 5

1.934
1.527 1.219 1.189

16.119
12.729 10.155 9.911

32.714
45.443 55.598 65.509

0.246
0.194 0.155 0.151

例:羽毛球选材研究:
第一轮初测指标体系(共 5类23项指标) (1)机能指标:上、下肢无氧功率。 (2)素质指标:20米跑、400米×5,1分钟跳绳,四角跑, 上肢对墙击球力度、立定跳远、纵跳。 (3)技能指标:运动中持拍动作控制能力、用力感、关节 方向感。 (4)心理指标:战术分析与决策,河内塔测试,:意志, 注意,动机,气质、个性稳定性、有恒性。 (5)形态指标:克托莱指数、上肢比例、下肢比例。

筛选指标的依据
① 专项理论:与制胜规律密切相关的指标。 ② 方差分析:具有显著性差异的指标。

③ 因子分析:类指标中因子载荷较大的指标
④ 综合评估:有差异但没有到达0.05显著性水平,而从专 项理论角度分析该指标具有较强的代表性,也可考虑入选。

例:射箭选材研究
指标筛选过程 1、初选指标:最初经专家调查,咨询和资料分析确定了 65个课题测试指标,测试中由于准确性原因,或难度大 (如内分泌指标儿茶酚胺)剔除了13个,确定了52个研 究指标 2、测试指标:对52个指标采集后,经过专家分析和初步 的数据统计处理,又淘汰了与成绩相关度非常低的指标, (男:18个;女:14个)。 3、选材指标:经过分类逐步回归,确定:心理8个,技术 4个,机能5个,素质2个,男:13个;女:12个。5大类 19项指标。

素质指标筛选
Unstandardized Coefficients B (Constant) 1306.821 49.441 26.432 .000 Std. Error Standardized Coefficients Beta t Sig.

平衡能力
上肢耐力

-40.623 .778

13.951 .428

-.314 .196

-2.912 1.820

.005 .073

筛选结果
(1)体能指标 ① 形态:克托莱指数,身高 ② 机能:上肢无氧功率,下肢5秒峰值功率, 下肢30秒平均功率 ③ 素质:立定跳远,专项跑动时

(2)技战术能力:① 拍数/回合 ② 主动失误次数/总拍数
(3)心理能力:① 翻转反应时 ③ 意志力 ② 操作思维步数

指标鉴别性检验 不同水平羽毛球男子运动员运动素质指标比较
立定跳远(m) 优秀组 一般组 2.61±0.14 2.48±0.24 纵跳(cm) 48.64±4.72 46.83±6.71 20米×5(s) 19.11±0.60 19.32±0.86 1分钟跳绳(次) 123.75±9.24 121.63±9.42

协方差 年龄 P 值 组别

0.01** 0.05*

0.001** 0.596

0.001** 0.676

0.666 0.432

四、影响有效性的因素

1、受试群体特征:年龄、性别、能力的个体差异等; 2、样本含量及其代表性:扩大样本含量,测量的可 靠性提高,有效性也随之提高。应坚持随机抽样

原则,以提高样本的代表性;

3、测量的可靠性:可靠性是有效性的必要前提 4、效标的选择:对于同一项测量手段,选择不同

的效标,计算出来的效标有效性就不相同:
5、测量的难度与区分度:测量难度适中时,区分

度最高,有效性也会提高。

测量的科学性专题作业

1、归纳总结信度、效度的种类与估价方法

2、查阅有信度、效度检验的文献5篇
要求(1)写明文章题目、作者、出处、时间

(2)估价信、效度的方法
(3)存在问题

雷同作业无成绩


相关文章:
体育测量与评价练习题
项目的区分度:也叫鉴别力,是指测验项目对被试的心理特性的区分能力 测量:用一定的法则给事物属性指派数字或符号的过程即为测量。 成套测验:由多项指标来测量某个...
体育测量与评价教案
影响体育活动的体系制度 (二)体育测量评价的意义和功能 1,体育评价的意义 (1) 有利于体育决策的科学性和正确性 (2) 推进管理工作的规范化和科学化 (3) 提高...
体育测量与评价(2)(1)
20. 体育测量编制的基本原则:科学性原则;可比性原则;适用性原则;相关、独立性原则。 21. 体育评价的三种基本形式:诊断性评价、形成性评价、终结性评价。 22. ...
体育测量评价复习资料
l,体育测量评价:是对体育范畴内的现 (身体综合能力)以及关因素进 断的一门应用...7、体育测验编制的基本原则:科学性原则、可比性原则、适用性原则:相关、独立性...
体育测量评价的意义与局限13
wei 摘要通过讨论体育测量评价的作用与发展、发展特点以及局限, 作者认为: 体育...但是必须慎重对待其 方法的局限性及其与其它学科的相关关系, 使用时要以科学的方法...
体育测量与评价练习题与试题
体育测量评价练习题与试题_教育学_高等教育_教育专区。项目的区分度:也叫鉴别...11、测量过程分解为三个过程 12、体育测验的科学性为:客观性、可靠性、有效性...
体育测量与评价
体育测量评价:是利用科学的方法对体育范畴中的人或现象的某种属性或特 征进行...*简述体育评价三种基本形式的特点: (49) ①诊断性评价特点:又称初始评价,在...
体育测量与评价第一章
第三节 体育测量评价的主要内容 1、体育测量的基础理论 2、体育测量科学性 3、体育测验的编制与组织 4、体育评价的基础理论 5、人体形态测评 6、身体机能...
体育测量与评价
体育测量评价_其它_高等教育_教育专区。体育测量评价 一、名词解释 1、体育...进步度评价 13、体育测验编制的基本原则:科学性,可比性,适用性,相关性,独立性...
体育测量与评价练习题
体育测量评价练习题_教育学_高等教育_教育专区。体育教育 项目的区分度:也叫...科学性为: 、体育测验的科学性为 客观性、可靠性、有效性。 13、裂半相关法...
更多相关标签: