高三数学一些记号、概念的补充(2021届):
1.导数概念
“当时,”,记作□□ = A
2.存在性命题
含有存在量词的命题,叫做特称命题,也称为存在性命题。
3.投影的概念(还是现行教材,2020届、2021届不改)
在 中,叫作向量在方向上(在方向上)的投影。
4.概率统计中几个概念表示:
随机变量X的均值(数学期望)表示:E(X),
随机变量X的方差记为V(X),或D(X)
随机变量X的标准差记为 :或
独立性检验中,统计量可以表示为
或
5.利用直方图、表计算中位数、众数
例1 根据频率分布直方图估计众数、中位数
对某小区100户居民月均用水量进行统计,得到样本的频率分布直方图如图,则估计此样本的众数、中位数分别为
A.2.25,2.5 B.2.25,2.02 C.2,2.5 D.2.5,2.25
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5
用水量(吨)
0.08
0.16
0.30
0.44
0.50
解 由图可知,前五组的频率依次为0.04,0.08,0.15,0.22,0.25,因此,前5组的频次依次为4,8,15,22,25,而以后的各组的频数均低于25,根据众数的定义,众数应该在频数最多的数,在第5组中用组中值表示该组的值,故估计此样本的众数为2.25.
根据中位数的定义,在样本中有50%个体小于或等于中位数,也有50%的个体大于或等于中位数.因此,在频率直方图中,中位数左边和右边的直方图的面积应该相等,也即位于中位数两侧的数据的频率之和均为0.5.因为前4组的频率之和0.04+0.08+0.15+0.22=0.49<0.5,前5组的频率之和大于0.5,所以中位数应该在第5组内.
在直方图中,无法知道每个组内的数据是如何分布的,我们通常假设它们在组内是均匀分布的,故若设中位数为x,则
0.49+(x-2)´0.5=0.5,
解得
x=2.02.
所以,估计中位数为2.02,故选B.
练习
一组数据的频率分布表如下
分组 | 频数 | 频率 |
[80,85) | 1 | 0.01 |
[85,90) | 2 | 0.02 |
[90,95) | 4 | 0.04 |
[95,100) | 14 | 0.14 |
[100,105) | 24 | 0.24 |
[105,110) | 15 | 0.15 |
[110,115) | 12 | 0.12 |
[115,120) | 9 | 0.09 |
[120,125) | 11 | 0.11 |
[125,130) | 6 | 0.06 |
[130,135) | 2 | 0.02 |
合计 | 100 | 1 |
试估计这组数据的众数和中位数。
6.残差分析
对于数据组(xi,yi)(i=1,2,3,…,n),如果由线性回归方程得到的对应于自变量xi的估计值是i ,那么我们将
yi - i (i=1,2,3,…,n)
称为相应于点(xi,yi)的残差(residual),记为i.以自变量xi或因变量yi为横坐标,对应的残差i为纵坐标作点,我们将由此所作的图形称为残差图.
通常情况下,残差图中的点列集中于靠近横轴的较为狭窄的区域内,且横轴上下分布比较均匀时,这种模型的拟合效果较好.
题目 下面给出了根据我国2012年~2018年水果人均占有量y(单位:kg)和年份代码x绘制的散点图和线性回归方程的残差图(2012年~2018年的年份代码x分别为1~7)
(1)根据散点图分析y与x之间的相关关系;
(2)根据散点图相应数据计算得=1074,=4517,求y关于x的线性回归方程;
(3)根据线性回归方程的残差图,分析线性回归方程的拟合效果。
解 (1)根据散点图可知,y与x具有线性相关关系,而是正相关关系。
(2)由所级数据计算得 = = 4 ,=28,==4517-4´1074=221,==»7.89,=-=-7.89´4»121.87,所以,所求线性回归方程为=7.89x+121.87.
(3)由题中所给的残差图知历年数据的残差均在-2到2之间,说明线性回归方程的拟合效果较好。
1