江蘇省錫東高級中學 顧珊嵐
回歸方程是利用數理統計中的回歸分析,來確定兩種或兩種以上變數間相互依賴的定量關系的一種統計分析方法,運用十分廣泛。近幾年高考所涉及的題目愈發凸顯其應用性,以及問題設計的新穎性、創造性。同學們只有充分理解回歸方程,冷靜分析問題的本質,才能以不變應萬變。下面我們對近幾年回歸方程考題的變化及趨勢作歸納與梳理。
例1某科技公司研發了一項新產品A,經過市場調研,對公司1月份至6月份銷售量及銷售單價進行統計,銷售單價x(千元)和銷售量y(千件)之間的一組數據如表1所示:
表1
(1)試根據1至5月份的數據,建立y關于x的回歸直線方程;
(2)若由回歸直線方程得到的估計數據與剩下的檢驗數據的誤差不超過0.65千件,則認為所得到的回歸直線方程是理想的,試問(1)中所得到的回歸直線方程是否理想?
例2人工智能教育是將人工智能與傳統教育相結合,借助人工智能和大數據技術打造的智能化教育生態。為了解我國人工智能教育發展狀況,通過中國互聯網數據平臺得到我國2017年至2022年人工智能教育市場規模統計圖,如圖1所示,若用x表示年份代碼(2017年用1表示,2018年用2表示,依此類推),用y表示市場規模(單位:億元),試回答:
(1)根據條形統計圖中的數據,計算變量y與x的相關系數r,并用r判斷兩個變量y與x相關程度的強弱(精確到0.01)(若,則相關程度很高);
圖1
(2)若y與x的相關關系擬用線性回歸模型表示,試求y關于x的線性回歸方程,并據此預測2024 年中國人工智能教育市場規模(精確到1億元)。
點評:此類考題難度偏小,線性回歸方程的求解直接利用題中公式及數據計算即可,再利用線性回歸方程進行數據估計。
例3某印刷企業為了研究某種圖書每冊的成本費y(單位:元)與印刷數量x(單位:千冊)的關系,收集了一些數據并進行了初步整理,得到了如圖2所示的散點圖及一些統計量的值(表2)。
圖2
表2
(1)根據散點圖判斷:y=a+bx與y=哪一個模型更適合作為該圖書每冊的成本費y與印刷數量x的回歸方程? (只要求給出判斷,不必說明理由)
(2)根據(1)的判斷結果及表中數據建立y關于x的回歸方程(結果精確到0.1)。
(3)若該圖書每冊的定價為9元,求至少應該印刷多少冊,才能使銷售利潤不低于80 000元(假設能夠全部售出)。
附:對于一組數據(ω1,v1)(ω2,v2),…(ωn,vn),其回歸直線的斜率和截距的最小二乘估計公式分別為
解析:(1)由散點圖判斷更適合作為該圖書每冊的成本費y與印刷數量x的回歸方程。
例4學生的學習除了在課堂上認真聽講,還有一個重要環節就是課后的“自主學習”,包括預習,復習,歸納,整理等,現在人們普遍認為課后花的時間越多越好,某研究機構抽查了部分高中學生,對學生花在課后的學習時間(設為x分鐘)和他們的數學平均成績(設為y)進行了統計,得到表3中的數據,請根據表格回答問題:
表3
(1)請根據所給數據繪制散點圖,并且從以下三個函數:①y=bx+a;②y=m·xk(m>0,k>0);③y=cx2+dx+e中選擇一個作為學習時間x和平均成績y的回歸類型,判斷哪個類型更加符合(不必說明理由)。
(2)根據(1)中選擇的回歸類型,求出y與x的回歸方程。
解析:(1)根據所給數據畫得散點圖,如圖3所示。
根據散點圖判斷y=m·xk(m>0,k>0)更符合學習時間x和平均成績y的回歸方程類型。
圖3
故回歸方程為y=25.79x0.33。
點評:對于給出多個模擬函數類型的非線性回歸,我們可以根據數據的散點圖,將它與學過的各種函數的圖像進行比較,選擇一種跟散點擬合得最好的函數,然后采取適當的變量代換,將非線性回歸方程轉化為線性回歸方程。
回歸方程一直是高考數學的熱點,在高考備考時,要重視閱讀理解,注重體驗回歸方程的思維分析過程,根據散點圖判斷回歸模型是線性還是非線性。如果是線性則直接套公式;如果是非線性,則要通過數學變換將非線性轉化為線性關系,利用最小二乘法求出線性回歸方程系數,進而求出線性回歸方程,最后通過數學變換還原求出非線性回歸方程。