高中數(shù)學必修3知識點總結(jié):第二章 統(tǒng)計
歸海木心QQ:634102564
高中數(shù)學必修3知識點總結(jié)
第二章統(tǒng)計
2.簡單隨機抽樣,也叫純隨機抽樣。就是從總體中不加任何分組、劃類、排隊等,完全隨
機地抽取調(diào)查單位。特點是:每個樣本單位被抽中的可能性相同(概率相等),樣本的每個單位完全獨立,彼此間無一定的關聯(lián)性和排斥性。簡單隨機抽樣是其它各種抽樣形式的基礎。通常只是在總體單位之間差異程度較小和數(shù)目較少時,才采用這種方法。
3.簡單隨機抽樣常用的方法:
(1)抽簽法;⑵隨機數(shù)表法;⑶計算機模擬法;⑷使用統(tǒng)計軟件直接抽取。
在簡單隨機抽樣的樣本容量設計中,主要考慮:①總體變異情況;②允許誤差范圍;③概率保證程度。
4.抽簽法:
(1)給調(diào)查對象群體中的每一個對象編號;(2)準備抽簽的工具,實施抽簽
(3)對樣本中的每一個個體進行測量或調(diào)查
例:請調(diào)查你所在的學校的學生做喜歡的體育活動情況。5.隨機數(shù)表法:
例:利用隨機數(shù)表在所在的班級中抽取10位同學參加某項活動。
2.1.2系統(tǒng)抽樣
1.系統(tǒng)抽樣(等距抽樣或機械抽樣):
把總體的單位進行排序,再計算出抽樣距離,然后按照這一固定的抽樣距離抽取樣本。第一個樣本采用簡單隨機抽樣的辦法抽取。
K(抽樣距離)=N(總體規(guī)模)/n(樣本規(guī)模)
前提條件:總體中個體的排列對于研究的變量來說,應是隨機的,即不存在某種與研究變量相關的規(guī)則分布。可以在調(diào)查允許的條件下,從不同的樣本開始抽樣,對比幾次樣本的特點。如果有明顯差別,說明樣本在總體中的分布承某種循環(huán)性規(guī)律,且這種循環(huán)和抽樣距離重合。
2.系統(tǒng)抽樣,即等距抽樣是實際中最為常用的抽樣方法之一。因為它對抽樣框的要求較低,實施也比較簡單。更為重要的是,如果有某種與調(diào)查指標相關的輔助變量可供使用,總體單元按輔助變量的大小順序排隊的話,使用系統(tǒng)抽樣可以大大提高估計精度。
2.1.3分層抽樣
1.分層抽樣(類型抽樣):歸海木心QQ:6341025歸海木心QQ:634102564
先將總體中的所有單位按照某種特征或標志(性別、年齡等)劃分成若干類型或?qū)哟危缓笤僭诟鱾類型或?qū)哟沃胁捎煤唵坞S機抽樣或系用抽樣的辦法抽取一個子樣本,最后,將這些子樣本合起來構(gòu)成總體的樣本。
兩種方法:
1.先以分層變量將總體劃分為若干層,再按照各層在總體中的比例從各層中抽取。
2.先以分層變量將總體劃分為若干層,再將各層中的元素按分層的順序整齊排列,最后用系統(tǒng)抽樣的方法抽取樣本。2.分層抽樣是把異質(zhì)性較強的總體分成一個個同質(zhì)性較強的子總體,再抽取不同的子總體中的樣本分別代表該子總體,所有的樣本進而代表總體。
分層標準:
(1)以調(diào)查所要分析和研究的主要變量或相關的變量作為分層的標準。
(2)以保證各層內(nèi)部同質(zhì)性強、各層之間異質(zhì)性強、突出總體內(nèi)在結(jié)構(gòu)的變量作為分層變量。(3)以那些有明顯分層區(qū)分的變量作為分層變量。3.分層的比例問題:
(1)按比例分層抽樣:根據(jù)各種類型或?qū)哟沃械膯挝粩?shù)目占總體單位數(shù)目的比重來抽取子樣本的方法。
(2)不按比例分層抽樣:有的層次在總體中的比重太小,其樣本量就會非常少,此時采用該方法,主要是便于對不同層次的子總體進行專門研究或進行相互比較。如果要用樣本資料推斷總體時,則需要先對各層的數(shù)據(jù)資料進行加權處理,調(diào)整樣本中各層的比例,使數(shù)據(jù)恢復到總體中各層實際的比例結(jié)構(gòu)。
2.2.2用樣本的數(shù)字特征估計總體的數(shù)字特征
1、本均值:xx1x2xnn
2、.樣本標準差:ss2(x1x)(x2x)(xnx)n222
3.用樣本估計總體時,如果抽樣的方法比較合理,那么樣本可以反映總體的信息,但從樣本得到的信息會有偏差。在隨機抽樣中,這種偏差是不可避免的。
雖然我們用樣本數(shù)據(jù)得到的分布、均值和標準差并不是總體的真正的分布、均值和標準差,而只是一個估
計,但這種估計是合理的,特別是當樣本量很大時,它們確實反映了總體的信息。
4.(1)如果把一組數(shù)據(jù)中的每一個數(shù)據(jù)都加上或減去同一個共同的常數(shù),標準差不變(2)如果把一組數(shù)據(jù)中的每一個數(shù)據(jù)乘以一個共同的常數(shù)k,標準差變?yōu)樵瓉淼膋倍(3)一組數(shù)據(jù)中的最大值和最小值對標準差的影響,區(qū)間(x3s,x3s)的應用;“去掉一個最高分,去掉一個最低分”中的科學道理歸海木心QQ:6341025歸海木心QQ:634102564
2.3.2兩個變量的線性相關
1、概念:
(1)回歸直線方程(2)回歸系數(shù)2.最小二乘法
3.直線回歸方程的應用
(1)描述兩變量之間的依存關系;利用直線回歸方程即可定量描述兩個變量間依存的數(shù)量關系
(2)利用回歸方程進行預測;把預報因子(即自變量x)代入回歸方程對預報量(即因變量Y)進行估計,即可得到
個體Y值的容許區(qū)間。
(3)利用回歸方程進行統(tǒng)計控制規(guī)定Y值的變化,通過控制x的范圍來實現(xiàn)統(tǒng)計控制的目標。如已經(jīng)得到了空氣中
NO2的濃度和汽車流量間的回歸方程,即可通過控制汽車流量來控制空氣中NO2的濃度。
4.應用直線回歸的注意事項
(1)做回歸分析要有實際意義;(2)回歸分析前,最好先作出散點圖;(3)回歸直線不要外延。
歸海木心QQ:6341025
擴展閱讀:高中數(shù)學必修3_第二章_統(tǒng)計_總結(jié)學生版
第二章統(tǒng)計
一、隨機抽樣三種常用抽樣方法:
1.簡單隨機抽樣:
設一個總體的個數(shù)為N。如果通過逐個抽取的方法從中抽取一個樣本,且每次抽取時各個個體被抽到的概率相等,就稱這樣的抽樣為簡單隨機抽樣。實現(xiàn)簡單隨機抽樣,常用抽簽法和隨機數(shù)表法。(1)抽簽法
制簽:先將總體中的所有個體編號(號碼可以從1到N),并把號碼寫在形狀、大小相同的號簽上,號簽可以用小球、卡片、紙條等制作,然后將這些號簽放在同一個箱子里,進行均勻攪拌;
抽簽:抽簽時,每次從中抽出1個號簽,連續(xù)抽取n次;成樣:對應號簽就得到一個容量為n的樣本。
抽簽法簡便易行,當總體的個體數(shù)不多時,適宜采用這種方法。(2)隨機數(shù)表法
編號:對總體進行編號,保證位數(shù)一致;
數(shù)數(shù):當隨機地選定開始讀數(shù)的數(shù)后,讀數(shù)的方向可以向右,也可以向左、向上、向下等等。在讀數(shù)過程中,得到一串數(shù)字號碼,在去掉其中不合要求和與前面重復的號碼后,其中依次出現(xiàn)的號碼可以看成是依次從總體中抽取的各個個體的號碼。
成樣:對應號簽就得到一個容量為n的樣本。
結(jié)論:①用簡單隨機抽樣,從含有N個個體的總體中抽取一個容量為n的樣本時,每次抽取一個個體時任一個體被抽到的概率為1/N;在整個抽樣過程中各個個體被抽到的概率為n/N;
②基于此,簡單隨機抽樣體現(xiàn)了抽樣的客觀性與公平性;
③簡單隨機抽樣的特點:它是不放回抽樣;它是逐個地進行抽。凰且环N等概率抽樣。2.系統(tǒng)抽樣:
當總體中的個數(shù)較多時,可將總體分成均衡的幾個部分,然后按照預先定出的規(guī)則,從每一部分抽取1個個體,得到所需要的樣本,這種抽樣叫做系統(tǒng)抽樣(也稱為機械抽樣)。
系統(tǒng)抽樣的步驟可概括為:
(1)將總體中的個體編號。采用隨機的方式將總體中的個體編號;(2)將整個的編號進行分段。為將整個的編號進行分段,要確定分段的間隔k.當N/n是整數(shù)時,k=n/N;當N/n不是整數(shù)時,通過從總體中剔除一些個體使剩下的個體數(shù)N能被n整除,這時k=N’/n;
(3)確定起始的個體編號。在第1段用簡單隨機抽樣確定起始的個體邊號l;(4)抽取樣本。按照先確定的規(guī)則(常將l加上間隔k)抽取樣本:
l,lk,l2k,,l(n1)k。
3.分層抽樣:
當已知總體由差異明顯的幾部分組成時,常將總體分成幾部分,然后按照各部分所占的比進行抽樣,這種抽樣叫做分層抽樣,其中所分成的各部分叫做層。
結(jié)論:
(1)分層抽樣是等概率抽樣,它也是公平的。用分層抽樣從個體數(shù)為N的總體中抽取一個容量為n的樣本時,在整個抽樣過程中每個個體被抽到的概率相等,都等于n/N;
(2)分層抽樣是建立在簡單隨機抽樣或系統(tǒng)抽樣的基礎上的,由于它充分利用了已知信息,因此利用它獲取的樣本更具有代表性,在實踐的應用更為廣泛。
例題:
【例1】某政府機關在編人員共100人,其中副處級以上干部10人,一般干部70人,工人20人,上級部門為了了解該機關對政府機構(gòu)改革的意見,要從中抽取20
人,用下列哪種方法最合適
A.系統(tǒng)抽樣B.簡單隨機抽樣C.分層抽樣D.隨機數(shù)表法【例2】為了解1200名學生對學校教改試驗的意見,打算從中抽取一個容量為30的樣本,考慮采用系統(tǒng)抽樣,則分段的間隔k為
A.40B.30C.20D.12
【例3】從N個編號中要抽取n個號碼入樣,若采用系統(tǒng)抽樣方法抽取,則分段間隔應為
A.Nn④整個抽樣過程中,每個個體被抽取的機率相等(有剔除時例外)A.1B.2C.3D.4
【例6】一批燈泡400只,其中20W、40W、60W的數(shù)目之比為4∶3∶1,現(xiàn)用分層抽樣的方法產(chǎn)生一個容量為40的樣本,三種燈泡依次抽取的個數(shù)為______________.答案:20、15、5
【例7】從總體為.的一批零件中用分層抽樣抽取一個容量為30的樣本,若每個零件被抽取的機率為0.25,則N等于
B.nC.[
Nn]D.[
Nn]+1
A.150B.200C.120D.100
【例4】系統(tǒng)抽樣適用的總體應是
A.容量較少的總體B.總體容量較多C.個體數(shù)較多但均衡的總體D.任何總體【例5】下列說法正確的個數(shù)是
①總體的個體數(shù)不多時宜用簡單隨機抽樣法
②在總體均分后的每一部分進行抽樣時,采用的是簡單隨機抽樣③百貨商場的抓獎活動是抽簽法
【例8】一個總體的60個個體的編號為0,1,2,…,59,現(xiàn)要從中抽取一個容量為10的樣本,請根據(jù)編號按被6除余3的方法,取足樣本,則抽取的樣本號碼是______________
【例9】體育彩票000001~100000編號中,凡彩票號碼最后三位數(shù)為345的中一等獎,采用的是系統(tǒng)抽樣法嗎?為什么?
【例10】某電視臺在因特網(wǎng)上就觀眾對其某一節(jié)目的喜愛程度進行調(diào)查,參加調(diào)查的總?cè)藬?shù)為1201*人,其中持各種態(tài)度的人數(shù)如下表所示.
很喜愛喜愛一般不喜愛2435456739261072體數(shù)據(jù)信息就被抹掉了。
〈三〉頻率分布折線圖、總體密度曲線1.頻率分布折線圖的定義:
連接頻率分布直方圖中各小長方形上端的中點,就得到頻率分布折線圖。2.總體密度曲線的定義:
電視臺為了了解觀眾的具體想法和意見,打算從中抽選出60人進行更為詳細的調(diào)查,為此要進行分層抽樣,那么在分層抽樣時,每類人中各應抽選出多少人?
二、用樣本估計總體
〈一〉頻率分布的概念:
在樣本頻率分布直方圖中,相應的頻率折線圖會越來越接近于一條光滑曲線,
頻率分布是指一個樣本數(shù)據(jù)在各個小范圍內(nèi)所占比例的大小。一般用頻率分布
統(tǒng)計中稱這條光滑曲線為總體密度曲線。它能夠精確地反映了總體在各個范圍內(nèi)取
直方圖反映樣本的頻率分布。其一般步驟為:
值的百分比,它能給我們提供更加精細的信息。
計算一組數(shù)據(jù)中最大值與最小值的差,即求極差
根據(jù)這條曲線,可求出總體在區(qū)間(a,b)內(nèi)取值的概率等于該區(qū)間上總體密
1、決定組距與組數(shù)2、將數(shù)據(jù)分組3、列頻率分布表4、畫頻率分布直方圖
〈二〉頻率分布直方圖的特征:
1、從頻率分布直方圖可以清楚的看出數(shù)據(jù)分布的總體趨勢。
2、從頻率分布直方圖得不出原始的數(shù)據(jù)內(nèi)容,把數(shù)據(jù)表示成直方圖后,原有的具
度曲線與x軸、直線x=a、x=b所圍成曲邊梯形的面積。
總體分布密度密度曲線函數(shù)y=f(x)的兩條基本性質(zhì):①f(x)≥0(x∈R);②由曲線y=f(x)與x軸圍成面積為1。莖葉圖
莖葉圖又稱“枝葉圖”,與頻率分布直方圖一樣,都是用來表示樣本數(shù)據(jù)的一種統(tǒng)計圖。通常我們將數(shù)的大小基本不變或者變化不大的位作為“莖”,將變化大的位作為“葉”。
1.莖葉圖的書寫規(guī)則:書寫規(guī)則是:“莖”一般要求按照從小到大的順序從上到下列出。公用“莖”的“葉”一般也按照從小到大的順序同行列出,注意重復的項也必須寫上。
2.特點:圖形形狀的特點:(1)若圖形扁而寬,則說明整體的樣本數(shù)據(jù)集中,樣本數(shù)據(jù)的差異性不大。(2)若圖形長而窄,則說明樣本數(shù)據(jù)比較分散,標準差較大,距組較大。
3.優(yōu)缺點:同頻率分布直方圖比較,莖葉圖中所有的原始數(shù)據(jù)都可以得到。并且在以后新增加數(shù)據(jù)的時候容易修改,但直方圖這樣操作起來就很困難了。莖葉圖也有其缺點,就是當樣本數(shù)據(jù)比較多的時候,很難進行此操作。如果我們將莖葉圖的莖和葉按逆時針方向旋轉(zhuǎn)90度,得到的是一個沒有坐標的直方圖。通過此操作,很容易求出各個數(shù)據(jù)段的頻率分布或頻率百分比。下面我們通過幾個例子來闡述上述問題。
1、眾數(shù):在一組數(shù)據(jù)中,出現(xiàn)次數(shù)最多的數(shù)據(jù)叫做這組數(shù)據(jù)的眾數(shù)。中位數(shù):將一組數(shù)據(jù)按大小依次排列,處在最中間位置的一個數(shù)據(jù)(或最
1平均數(shù):一組數(shù)據(jù)的算術平均數(shù),即x=
2從頻率分布直方圖中估計眾數(shù)、中位數(shù)、平均數(shù):
眾數(shù)在樣本數(shù)據(jù)的頻率分布直方圖中,就是最高矩形的中點的橫坐標。例如,(1)課本中調(diào)查的100位居民的月均用水量的問題中,從這些樣本數(shù)據(jù)的頻率分布直方圖可以看出,月均用水量的眾數(shù)是2.25t.如上圖(較細的虛線)所示;
(2)在樣本中,有50%的個體小于或等于中位數(shù),也有50%的個體大于或等于中位數(shù),因此,在頻率分布直方圖中,中位數(shù)左邊和右邊的直方圖的面積應該相等,由此可以估計中位數(shù)的值。此數(shù)據(jù)值為2.02t。
(3)平均數(shù)是頻率分布直方圖的“重心”,等于頻率分布直方圖中每個小矩形的面積乘以小矩形底邊中點的橫坐標之和。由圖估計平均數(shù)為2.02t。(較粗的虛線);
3三種數(shù)字特征的優(yōu)缺點:
(1)、眾數(shù)體現(xiàn)了樣本數(shù)據(jù)的最大集中點,但它對其它數(shù)據(jù)信息的忽視使得無法客觀地反映總體特征。
(2)、中位數(shù)是樣本數(shù)據(jù)所占頻率的等分線,它不受少數(shù)幾個極端值的影響。
中間兩個數(shù)據(jù)的平均數(shù))叫做這組數(shù)據(jù)的中位數(shù)。n
(x1x2xn)(3)、平均數(shù)可以反映出更多的關于樣本數(shù)據(jù)全體的信息,但平均數(shù)受數(shù)據(jù)中的極端值的影響較大。
4:方差、標準差(1)方差的計算公式:(2)若次數(shù)在110以上(含110次)為達標,試估計該學校全體高一學生的達標率是多少?(2)標準差的計算公式:
(3)方差和標準差的意義:用于考察樣本數(shù)據(jù)的分散程度的大小,標準差越大,數(shù)據(jù)的離散程度越大;標準差越小,數(shù)據(jù)的離散程度越小。
例題:
頻率0.036/組距【例1】為了了解高一學生的體0.032能情況,某校抽取部分學生進行0.0280.024一分鐘跳繩次數(shù)次測試,將所得0.0200.016數(shù)據(jù)整理后,畫出頻率分布直方0.012圖(如圖),圖中從左到右各小長方0.0080.004形面積之比為2:4:17:15:9:
次數(shù)
o901001101201*01401503,第二小組頻數(shù)為12.
(1)第二小組的頻率是多少?樣本容量是多少?
52】某校為了了解學生的課外閱讀情況,隨機調(diào)查了50名學生,得到他們在某一天各自課外閱讀所用時間的數(shù)據(jù),結(jié)果用下面的條形圖表示,根據(jù)條形圖可得這50名學生這一天平均每人的課外閱讀時間為A.0.6hB.0.9hC.1.0hD.1.5h
【例3】把容量為100的某個樣本數(shù)據(jù)分為10組,并填寫頻率分布表,若前七組的累積頻率為0.79,而剩下三組的頻數(shù)成公比大于2的整數(shù)等比數(shù)列,則剩下三組中頻數(shù)最高的一組的頻數(shù)為___________.
【例4】某班學生在一次數(shù)學考試中成績分布如下表:
【例分數(shù)段人數(shù)分數(shù)段人數(shù)分數(shù)段人數(shù)[0,80)2[100,110)8[130,140)4[80,90)5[90,100)6[120,130)6(3)估計電子元件壽命在100~400h以內(nèi)的概率;(4)估計電子元件壽命在400h以上的概率.
)[110,1201*[140,150)2例38從甲、乙兩品種的棉花中各抽測了25根棉花的纖維長度(單位:mm)設計了如下莖葉圖:甲7785539573543454102103122728293031323335424201*563237526乙54767898那么分數(shù)在[100,110)中的頻率和分數(shù)不滿110分的累積頻率分別是_____、_______(精確到0.01).
【例5】對某電子元件進行壽命追蹤調(diào)查,情況如下:壽命(h)100~200個數(shù)20201*00~300~400400~500500~600根據(jù)以上莖葉圖,對甲乙兩品種棉花的纖維長度作比較,寫出兩個統(tǒng)計結(jié)論:
①_______________________________________________________________________________②________________________________________________________________________________
30804030
(1)列出頻率分布表;
三、變量間的相關關系
(2)畫出頻率分布直方圖和累積頻率分布圖;
1、相關關系的概念:
自變量取值一定時,因變量的取值帶有一定的隨機性,則兩個變量之間的關系
數(shù)a、b叫做相關關系.
2、ATTENTION
數(shù)關系不同.因為函數(shù)關系是一種非常確定的關系,而相關關系是一種非確定
的公式:bnni(xi1nx)(yiy)ixi1ni1iyinxy2i(xi1x)2xnx2,
aybx⊙求回歸直線方程的步驟:
(1)將已知的數(shù)據(jù)列表,列出x,y,并求出x2,y2,xy.
性關系,即相關關系是非隨機變量與隨機變量之間的關系.而函數(shù)關系可以看成是
n(2)利用公式b=xiyinxyi1,a=y-bx,計算回歸系數(shù)b,a.
兩個非隨機變量之間的關系.因此,不能把相關關系等同于函數(shù)關系,
(二)函數(shù)關系是一種因果關系,而相關關系不一定是因果關系,也可能是伴隨關系.例如,有人發(fā)現(xiàn),對于在校兒童,鞋的大小與閱讀能力有很強的相關關系.然而,學會新詞并不能使腳變大,而是涉及到第三個因素年齡.當兒童長大一些,他們的閱讀能力會提高而且由于長大腳也變大.
(三)在現(xiàn)實生活中存在著大量的相關關系,如何判斷和描述相關關系,統(tǒng)計學發(fā)揮著非常重要的作用.變量之間的相關關系帶有不確定性,這需要通過收集大
ni1xinx22(3)寫出回歸直線方程y=bx+a.例題:
【例1】有關線性回歸的說法,不正確的是
A.相關關系的兩個變量不是因果關系B.散點圖能直觀地反映數(shù)據(jù)的相關程度C.回歸直線最能代表線性相關的兩個變量之間的關系D.任一組數(shù)據(jù)都有回歸方程
量的數(shù)據(jù),對數(shù)據(jù)進行統(tǒng)計分析,發(fā)現(xiàn)規(guī)律,才能作出科學的判斷.
【例2】下面哪些變量是相關關系
3、最小二乘法:
A.出租車費與行駛的里程B.房屋面積與房屋價格C.身高與體重D.鐵的大小與質(zhì)
回歸直線的定義,使離差的平方和Q=(yiabxi)2最小的那條直線,這種使
i1n量
=1.5x-15,則【例3】回歸方程y“離差的平方和為最小”的方法叫做最小二乘法,要掌握用最小二乘法求回歸直線系
A.y=1.5x-15B.15是回歸系數(shù)aC.1.5是回歸系數(shù)aD.x=10時,y=0【例4】r是相關系數(shù),則結(jié)論正確的個數(shù)為
①r∈[-1,-0.75]時,兩變量負相關很強②r∈[0.75,1]時,兩變量正相關很強
③r∈(-0.75,-0.3]或[0.3,0.75)時,兩變量相關性一般④r=0.1時,兩變量相關很弱
A.1B.2C.3D.4
=bx+a過定點________.【例5】線性回歸方程y
【例8】某市近10年的煤氣消耗量與使用煤氣戶數(shù)的歷史資料如下:
年份1993199419951996199719981999201*201*201*x用戶(萬戶)11.21.61.822.53.244.24.5y(百萬立方米)679.81212.114.5202425.427.5(1)檢驗是否線性相關;(2)求回歸方程;
(3)若市政府下一步再擴大5千煤氣用戶,試預測該市煤氣消耗量將達到多少.
=4.4x+838.19,則可估計x與y的增長速度之比約為:【例6】已知回歸方程y【例7】為研究某市家庭平均收入與月平均生活支出的關系,該市統(tǒng)計調(diào)查隊隨機調(diào)查10個家庭,得數(shù)據(jù)如下:家庭編號12345678910
【例9】有一個同學家開了一個小賣部,他為了研究氣溫對熱飲銷售的影響,經(jīng)過
xi(收入)千元0.81.11.31.51.51.82.02.22.42.8y(千元0.71.01.21.01.31.51.31.72.02.5i支出)求回歸直線方程.
統(tǒng)計,得到一個賣出的飲料杯數(shù)與當天氣溫的對比表:
攝氏溫-5度熱飲杯15615013212813011610489數(shù)(1)畫出散點圖;
(2)從散點圖中發(fā)現(xiàn)氣溫與熱飲杯數(shù)之間關系的一般規(guī)律;(3)求回歸方程;
(4)如果某天的氣溫是2℃,預測這天賣出的熱飲杯數(shù)。
【例10】一個單位的職工有500人,其中不到35歲的有125人,35~49歲的有280人,50歲以上的有95人.為了了解該單位職工年齡與身體狀況的有關指標,從中抽取100名職工作為樣本,應該怎樣抽?
93765404712151923273136【例11】某校500名學生中,O型血有200人,A型血有125人,B型血有125人,AB型血有50人,為了研究血型與色弱的關系,需從中抽取一個容量為20的樣本.按照分層抽樣方法抽取樣本,各種血型的人分別多少?寫出抽樣過程.
【例12】一個車間為了規(guī)定工時定額,需要確定加工零件所花費的時間,為此進行了10次實驗,收集數(shù)據(jù)如下:
零件數(shù)x(個)加工時間y(分鐘)(1)畫出散點圖;(2)求回歸方程;
(3)關于加工零件的個數(shù)與加工時間,你能得出什么結(jié)論?
1062206830754081508960957080102108
《統(tǒng)計》單元測試題
一、選擇題:(本題共14小題,每小題4分,共56分,在每小題給出的四個選項
中,只有一項是符合題目要求的)1、抽樣調(diào)查在抽取調(diào)查對象時
A、按一定的方法抽取B、隨意抽取
C、全部抽取D、根據(jù)個人的愛好抽取2、對于簡單隨機抽樣,下列說法中正確的命題為
①它要求被抽取樣本的總體的個數(shù)有限,以便對其中各個個體被抽取的概率進行分析;②它是從總體中逐個地進行抽取,以便在抽取實踐中進行操作;③它是一種不放回抽樣;④它是一種等概率抽樣,不僅每次從總體中抽取一個個體時,各個個體被抽取的概率相等,而且在整個抽樣過程中,各個個體被抽取的概率也相等,從而保證了這種方法抽樣的公平性。
A、①②③B、①②④C、①③④D、①②③④3、某公司在甲、乙、丙、丁四個地區(qū)分別有150個、120個、180個、150個銷售點,公司為了調(diào)查產(chǎn)品銷售的情況,需從這600個銷售點中抽取一個容量為100的樣本,記這項調(diào)查為(1);在丙地區(qū)中有20個特大型銷售點,要從中抽取7個調(diào)查其銷售收入和售后服務情況,記這項調(diào)查為(2)。則完成(1)、(2)這兩項調(diào)查宜采用的抽樣方法依次是
A、分層抽樣法,系統(tǒng)抽樣法B、分層抽樣法,簡單隨機抽樣法C、系統(tǒng)抽樣法,分層抽樣法D、簡單隨機抽樣法,分層抽樣法4、某小禮堂有25排座位,每排有20個座位。一次心理講座時禮堂中坐滿了學生,會后為了了解有關情況,留下了座位號是15的所有的25名學生測試。這里運用的抽樣方法是
A、抽簽法B、隨機數(shù)表法C、系統(tǒng)抽樣法D、分層抽樣法
5、我校高中生共有2700人,其中高一年級900人,高二年級1200人,高三年級600人,現(xiàn)采取分層抽樣法抽取容量為135的樣本,那么高一、高二、高三各年級抽取的人數(shù)分別為
A、45,75,15B、45,45,45C、30,90,15D、45,60,30
6、中央電視臺動畫城節(jié)目為了對本周的熱心小觀眾給予獎勵,要從已確定編號的一萬名小觀眾中抽出十名幸運小觀眾,F(xiàn)采用系統(tǒng)抽樣方法抽取,其組容量為A、10B、100C、1000D、100007、對總數(shù)為N的一批零件抽取一個容量為30的樣本,若每個零件被抽取的可能
性為25%,則N為
A、150B、200C、100D、1208、某中學有高級教師28人,中級教師54人,初級教師81人,為了調(diào)查他們的身體狀況,從他們中抽取容量為36的樣本,最適合抽取樣本的方法是A、簡單隨機抽樣B、系統(tǒng)抽樣
C、分層抽樣D、先從高級教師中隨機剔除1人,再用分層抽樣9、一個容量為35的樣本數(shù)據(jù),分組后,組距與頻數(shù)如下:5,105個;10,1512個;則樣本在區(qū)間20,15,207個;20,255個;25,304個;30,352個。上的頻率為
A、20%B、69%C、31%D、27%10、在用樣本估計總體分布的過程中,下列說法正確的是
A、總體容量越大,估計越精確B、總體容量越小,估計越精確C、樣本容量越大,估計越精確D、樣本容量越小,估計越精確11、下列對一組數(shù)據(jù)的分析,不正確的說法是A、數(shù)據(jù)極差越小,樣本數(shù)據(jù)分布越集中、穩(wěn)定B、數(shù)據(jù)平均數(shù)越小,樣本數(shù)據(jù)分布越集中、穩(wěn)定
C、數(shù)據(jù)標準差越小,樣本數(shù)據(jù)分布越集中、穩(wěn)定D、數(shù)據(jù)方差越小,樣本數(shù)據(jù)分布越集中、穩(wěn)定12、下列兩個變量之間的關系是相關關系的是
A、正方體的棱長和體積B、單位圓中角的度數(shù)和所對弧長C、單產(chǎn)為常數(shù)時,土地面積和總產(chǎn)量D、日照時間與水稻的畝產(chǎn)量13、對于給定的兩個變量的統(tǒng)計數(shù)據(jù),下列說法正確的是
A、都可以分析出兩個變量的關系B、都可以用一條直線近似地表示兩者的關系C、都可以作出散點圖D、都可以用確定的表達式表示兩者的關系14、觀察新生嬰兒的體重,其頻率分布直方圖如圖所示,則新生嬰兒體重在
2700,3000的頻率為
頻率/組距0.0010240027003000330036003900體重A、0.001B、0.1C、0.2D、0.3
二、填空題:(本題共6小題,每小題4分,共24分,請把答案填寫在橫線上)15、若總體中含有1650個個體,現(xiàn)在要采用系統(tǒng)抽樣,從中抽取一個容量為35
條魚。
20、200輛汽車通過某一段公路時的時速頻率分布直方圖如圖所示,則時速在
60的樣本,分段時應從總體中隨機剔除個個體,編號后應均分為50,的汽車大約有輛。
段,每段有個個體。
16、某工廠生產(chǎn)的產(chǎn)品用傳送帶將其送入包裝車間之前,質(zhì)檢員每隔5分鐘從傳送帶某一位置取一件產(chǎn)品檢測,則這種抽樣方法是。17、某工廠生產(chǎn)A、B、C三種不同型號的產(chǎn)品,產(chǎn)品數(shù)量之比依次為2:3:5,F(xiàn)用分層抽樣的方法抽出一個容量為n的樣本,樣本中A種型號的產(chǎn)品共有16件,那么此樣本的容量n件。
18、數(shù)據(jù)x1,x2,,x8平均數(shù)為6,標準差為2,則數(shù)據(jù)
2x16,2x26,,2x86的平均數(shù)為,方差為。
三、解答題:(本題20分,解答應寫出文字說明或演算步驟.)
21、為了檢測某種產(chǎn)品的質(zhì)量,抽取了一個容量為100的樣本,數(shù)據(jù)的分組數(shù)如下:
10.75,10.853;10.85,10.959;10.95,11.0513;11.05,11.1516;;11.25,11.3520;11.35,11.457;11.45,11.554;
11.15,11.252611.55,11.652;
(1)列出頻率分布表(含累積頻率);
(2)畫出頻率分布直方圖以及頻率分布折線圖;
(3)據(jù)上述圖表,估計數(shù)據(jù)落在10.95,11.35范圍內(nèi)的可能性是百分之幾?(4)數(shù)據(jù)小于11.20的可能性是百分之幾?
19、管理人員從一池塘內(nèi)撈出30
0.4條魚,做上標記后放回池塘。10
0.3天后,又從池塘內(nèi)撈出50條魚,其中有標記的有2條。根據(jù)以上
0.20.1頻率
4050607080時速0數(shù)據(jù)可以估計該池塘內(nèi)共有
高考真題體驗:樣本數(shù)字特征專項
一、選擇題
1.為了了解某地區(qū)高三學生的身體發(fā)育情況,抽查了該地區(qū)100名年齡為17.5歲~
106],樣本數(shù)據(jù)分組為[96,98),[98,100),[100,102),[102,104),[104,106],已知樣本中產(chǎn)品凈重小于100克的個數(shù)是36,則樣本中凈重大于或等于98克并且小于104克的產(chǎn)品的個數(shù)是()A.90B.75C.60D.45
3.根據(jù)某水文觀測點的歷史統(tǒng)計數(shù)據(jù),得到某條河流水位的頻率分布直方圖(如圖2).從圖2中可以看出,該水文觀測點平均至少一百年才遇到一次的洪水的最低水位是()A.48米B.49米C.50米D.51米
4.一個容量100的樣本,其數(shù)據(jù)的分組與各組的頻數(shù)如下:組別(0,10]頻數(shù)12
18歲的男生體重(kg),得到頻率分布直方圖如下:
頻率
組距0.070.05
0.03(10,20](20,30](30,40](40,50](50,60](60,70]13241516137則樣本數(shù)據(jù)落在(10,40]上的頻率為()
A.0.13
B.0.39
C.0.52
D.0.64
體重(kg)
54.556.558.560.562.564.566.568.570.572.574.576.564.5的學生人數(shù)是()根據(jù)上圖可得這100名學生中體重在56.5,A.20
B.30
C.40D.50
頻率組距5.若某校高一年級8個班參加合唱比賽的得分如莖葉圖所示,則這組數(shù)據(jù)的中位數(shù)和平均數(shù)分別是()
A.91.5和91.5B.91.5和92C.91和91.5D.92和92
897
9316402
頻率/組距0.1500.1250.1000.0750.050O9698100102104106克
6.樣本中共有五個個體,其值分別為a,0,1,2,3,若該樣本的平均值為1,則樣本方差為()(A)
2某工廠對一批產(chǎn)品進行了抽樣檢測.右圖是根據(jù)抽樣檢測后的產(chǎn)品凈重(單位:克)數(shù)據(jù)繪制的頻率分布直方圖,其中產(chǎn)品
65(B)
65(C)2(D)2
7.從某項綜合能力測試中抽取100人的成績,統(tǒng)計如表,則這100人成績的標準差為()
分數(shù)人數(shù)520410330230102%1%凈重的范圍是[96,0.5%30313233
圖2
48495051
水位(米)
D.兩個批次總體平均數(shù)與標準值接近程度不能確定
A.3B.
2105C.3D.
85二、填空題
12下圖是樣本容量為200的頻率分布直方圖.根據(jù)樣本的頻率分布直方圖估計,樣本數(shù)據(jù)落在[6,10)內(nèi)的頻數(shù)為,數(shù)據(jù)落在[2,10)內(nèi)的概率約為
13.為了調(diào)查某廠工人生產(chǎn)某種產(chǎn)品的能力,隨機抽查了20位工人某天生產(chǎn)該產(chǎn)品的數(shù)量,產(chǎn)品數(shù)量的分組區(qū)間為[45,55),[55,65),[65,75),[75,85),[85,95),由此得到頻率分布直方圖如圖3,則這20名工人中一天生產(chǎn)該產(chǎn)品數(shù)量
8.在某項體育比賽中,七位裁判為一選手打出的分數(shù)如下:
90899095939493
去掉一個最高分和一個最低分后,所剩數(shù)據(jù)的平均值和方差分別為()(A)92,2(B)92,2.8(C)93,2(D)93,2.8
9.在發(fā)生某公共衛(wèi)生事件期間,有專業(yè)機構(gòu)認為該事件在一段時間內(nèi)沒有發(fā)生大規(guī)模群體感染的標志為“連續(xù)10天,每天新增疑似病例不超過7人”.根據(jù)過去10天甲、乙、丙、丁四地新增疑似病例數(shù)據(jù),一定符合該標志的是()A.甲地:總體均值為3,中位數(shù)為4B.乙地:總體均值為1,總體方差大于0C.丙地:中位數(shù)為2,眾數(shù)為3D.丁地:總體均值為2,總體方差為3
10.某人5次上班途中所花的時間(單位:分鐘)分別為x,y,10,11,9.已知這組數(shù)據(jù)的平均數(shù)為10,方差為2,則xy的值為()A.1
B.2
C.3
D.4
頻率/組距0.0400.035在[55,75)的人數(shù)是.
0.03014.某個容量為100的樣本的頻率分0.0255上的數(shù)0.020布直方圖如下,則在區(qū)間4,0.015據(jù)的頻數(shù)0.010..為.
0.0050455565758595圖3
產(chǎn)品數(shù)量
11.設矩形的長為a,寬為b,其比滿足b:a512≈0.618,這種矩形給人以美
感,稱為黃金矩形.黃金矩形常用于工藝品設計中.下面是某工藝品廠隨機抽取兩個批次的初加工矩形寬度與長度的比值樣本:甲批次:0.5980.6250.6280.5950.639乙批次:0.6180.6130.5920.6220.620根據(jù)上述兩個樣本來估計兩個批次的總體平均數(shù),與標準值0.618比較,正確結(jié)論是()
B.乙批次的總體平均數(shù)與標準值更接近C.兩個批次總體平均數(shù)與標準值接近程度相同
頻數(shù)123101A.甲批次的總體平均數(shù)與標準值更接近頻率組距
15.從一堆蘋果中任取了20只,并得到它們的質(zhì)量(單位:克)數(shù)據(jù)分布表如下:
100分組90,0.090.08110110,1201*0,130100,140130,150140,0.030.022610141822樣本數(shù)據(jù)
則這堆蘋果中,質(zhì)量不小于...120克的蘋果數(shù)約占蘋果總數(shù)的%.16.某棉紡廠為了解一批棉花的質(zhì)量,從中頻率隨機抽測了100根棉花纖維的長度(棉花
組距甲3755548733948557427282930313233342351021031424201*6乙0.060.05數(shù)據(jù)均在區(qū)間[5,40]中,其頻率分布直方
0.04圖如圖所示,則在抽樣的100根中,有0.03棉花纖維的長度小于20mm.0.0217.某校開展“愛我海西、愛我家鄉(xiāng)”攝0.01纖維的長度是棉花質(zhì)量的重要指標).所得影比賽,9位評委為參賽作品A給出的分數(shù)如莖葉圖所示.記分員在去掉一個最高分和一個最低分后,算得平均分為91,復核員在復核時,發(fā)現(xiàn)有一個數(shù)字(莖葉圖中的
563237556882479670510152025303540長度(mm)作品A89923x214甲乙9819710132021424115302089根據(jù)以上莖葉圖,對甲、乙兩品種棉花的纖維長度作比較,寫出兩個統(tǒng)計結(jié)論:①;②20.某高校有甲、乙兩個數(shù)學建模興趣班,其中甲班40人,乙班50人,現(xiàn)分析兩個班的一次考試成績,算得甲班的平均成績是90分,乙班的平均成績是81分,則該校數(shù)學建模興趣班的平均成績是分21從一堆蘋果中任取5只,稱得它們的質(zhì)量如下(單位:克):125124121123127則該樣本標準差s(克)(用數(shù)字作答).22.已知總體的各個體的值由小到大依次為2,3,3,7,a,b,12,13.7,18.3,20,且總體的中位數(shù)為10.5.若要使該總體的方差最小,則a、b的取值分別是.23.某校甲、乙兩個班級各有5名編號為1,2,3,4,5的學生進行投籃練習,每人投10次,投中的次數(shù)如下表:學生甲班乙班1號662號772x)無法看清.若記分員計算無誤,則數(shù)字x應該是
18.甲、乙兩人在10天中每天加工零件的個數(shù)用莖葉圖表示如下圖,中間一列的數(shù)字表示零件個數(shù)的十位數(shù),兩邊的數(shù)字表示零件個數(shù)的個位數(shù).則這10天甲、乙兩和.
人日加工零件的平均數(shù)分別為19.從甲、乙兩品種的棉花中各抽測了25根棉花的纖維長度(單位:mm),結(jié)果如下:甲品種:271273280285285287292294295301303303307308310314319323325325328331334337352乙品種:284292295304306307312313315315316318318320322322324327329331333336337343356由以上數(shù)據(jù)設計了如下莖葉圖
3號764號875號79則以上兩組數(shù)據(jù)的方差中較小的一個為s.三、解答題
24.(本小題滿分12分)
某公司在過去幾年內(nèi)使用某種型號的燈管1000支,該公司對這些燈管的使用壽命(單位:小時)進行了統(tǒng)計,統(tǒng)計結(jié)果如下表所示:分組頻數(shù)頻率[500,900)48[900,1100)121[1100,1300)208[1300,1500)223[1500,1700)193[1700,1900)165[1900,25.(本小題滿分12分)
某良種培育基地正在培育一種小麥新品種A.將其與原有的一個優(yōu)良品種B進行對照試驗,兩種小麥各種植了25畝,所得畝產(chǎn)數(shù)據(jù)(單位:千克)如下:品種A:357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434,443,445,445,451,454品種B:363,371,374,383,385,386,391,392,394,394,395,397397,400,401,401,403,406,407,410,412,415,416,422,430(I)完成所附的莖葉圖;(II)用莖葉圖處理現(xiàn)有的數(shù)據(jù),有什么優(yōu)點?
(III)通過觀察莖葉圖,對品種A與B的畝產(chǎn)量及其穩(wěn)定性進行比較,寫出統(tǒng)計結(jié)論.12分
)42(I)將各組的頻率填入表中;
(II)根據(jù)上述統(tǒng)計結(jié)果,計算燈管使用壽命不足1500小時的頻率;
(III)該公司某辦公室新安裝了這種型號的燈管3支,若將上述頻率作為概率,試求至少有2支燈管的使用壽命不足1500小時的概率.
26.隨機抽取某中學甲、乙兩班各10名同學,測量他們的身高(單位:cm),獲得身高數(shù)據(jù)的莖葉圖如圖.
(1)根據(jù)莖葉圖判斷哪個班的平均身高較高;(2)計算甲班的樣本方差;
(3)現(xiàn)從乙班這10名同學中隨機抽取兩名身高不低于173cm的同學,求身高為176cm的同學被抽中的概甲班
2181
乙班
99101703689率.
883216258
8159
友情提示:本文中關于《高中數(shù)學必修3知識點總結(jié):第二章 統(tǒng)計》給出的范例僅供您參考拓展思維使用,高中數(shù)學必修3知識點總結(jié):第二章 統(tǒng)計:該篇文章建議您自主創(chuàng)作。
來源:網(wǎng)絡整理 免責聲明:本文僅限學習分享,如產(chǎn)生版權問題,請聯(lián)系我們及時刪除。