開心生活站

位置:首頁 > 綜合知識 > 

非線性迴歸方程經過平均值嗎

非線性迴歸方程經過平均值嗎

非線性迴歸方程不一定經過平均值。線性迴歸中,迴歸方程通常經過自變量和因變量的平均值,但是在非線性迴歸中,迴歸方程的形式不再是簡單的一次函數,因此不一定滿足經過平均值的條件。

非線性迴歸方程不一定經過平均值。線性迴歸中,迴歸方程通常經過自變量和因變量的平均值,但是在非線性迴歸中,迴歸方程的形式不再是簡單的一次函數,因此不一定滿足經過平均值的條件。

非線性迴歸方程不一定經過平均值。線性迴歸中,迴歸方程通常經過自變量和因變量的平均值,但是在非線性迴歸中,迴歸方程的形式不再是簡單的一次函數,因此不一定滿足經過平均值的條件。

小編還爲您整理了以下內容,可能對您也有幫助:

非線性迴歸方程公式

非線性迴歸方程公式如下:

線性迴歸方程公式:b=(x1y1+x2y2+...xnyn-nXY)/(x1+x2+...xn-nX)。線性迴歸方程是利用數理統計中的迴歸分析,來確定兩種或兩種以上變數間相互依賴的定量關係的一種統計分析方法之一,應用十分廣泛。

一、概念

線性迴歸方程中變量的相關關係最爲簡單的是線性相關關係,設隨機變量與變量之間存在線性相關關係,則由試驗數據得到的點,將散佈在某一直線周圍。因此,可以認爲關於的迴歸函數的類型爲線性函數。

分析按照自變量和因變量之間的關係類型,可分爲線性迴歸分析和非線性迴歸分析。如果在迴歸分析中,只包括一個自變量和一個因變量,且二者的關係可用一條直線近似表示,這種迴歸分析稱爲一元線性迴歸分析。如果迴歸分析中包括兩個或兩個以上的自變量,且因變量和自變量之間是線性關係,則稱爲多元線性迴歸分析。

二、計算方法

線性迴歸方程公式求法:

第一:用所給樣本求出兩個相關變量的(算術)平均值:

x_=(x1+x2+x3+...+xn)/n

y_=(y1+y2+y3+...+yn)/n

第二:分別計算分子和分母:(兩個公式任選其一)

分子=(x1y1+x2y2+x3y3+...+xnyn)-nx_Y_

分母=(x1^2+x2^2+x3^2+...+xn^2)-n*x_^2

第三:計算b:b=分子/分母

用最小二乘法估計參數b,設服從正態分佈,分別求對a、b的偏導數並令它們等於零,得方程組解爲

其中,且爲觀測值的樣本方差.線性方程稱爲關於的線性迴歸方程,稱爲迴歸係數,對應的直線稱爲迴歸直線.順便指出,將來還需用到,其中爲觀測值的樣本方差。

先求x,y的平均值X,Y

再用公式代入求解:b=(x1y1+x2y2+...xnyn-nXY)/(x1+x2+...xn-nX)

後把x,y的平均數X,Y代入a=Y-bX

求出a並代入總的公式y=bx+a得到線性迴歸方程

(X爲xi的平均數,Y爲yi的平均數)

非線性迴歸方程爲什麼不過樣本中心?

非線性迴歸是指在因變量與一系列自變量之間建立非線性模型。線性與非線性並不是說因變量與自變量間是直線或曲線關係,而是說因變量是否能用自變量的線性組合來表示。如果經過變量轉換,兩個變量可以用線性來表達去關係,那麼可以用之前章節中介紹的方法進行擬合迴歸方程。但經過變量變化後,兩個變量關係仍然不能用線性形式來表達,則就會用到本節介紹的非線性迴歸分析方法。

非線性迴歸模型一般可以表示爲:

其中:f(x, θ)爲期望函數。該模型結構和線性迴歸函數非常相似,所不同的是期望函數可能爲任意形式,甚至在有的情況下沒有顯式關係式,迴歸方程中的參數估計是通過迭代方法獲得的。

SPSS採用兩種迭代方法:Levenberg-Marquardt法和序列二次規劃法。

Levenberg-Marquardt法又叫做阻尼最小二乘法,是對Gauss-Newton法的改進。它有一個阻尼因子λ,用λ可以控制搜索步長和方向。當λ=0時,即爲Gauss-Newton法;當λ--∞,趨於零向量,即爲最速下降法。Levenberg-Marquardt法的優勢在於對影響Gausss-Newton法有效性的病態二次項,也可以通過阻尼因子來控制。

序列二次規劃法主要思路是:形成基於拉格朗日函數二次近似的二次規劃子問題,而這些問題可以用任意一種二次規劃算法求解,求得的解用來形成新的迭代公式,作爲下一次搜索的依據。用序列二次迴歸算法求解非線性有約束問題時的迭代次數常比求解無約束問題時少,因爲在搜索區域內,序列二次規劃算法可以獲得最大的搜索步長和方向信息

迴歸直線方程必過定點爲什麼是x和y的平均數?

呵呵!計算【b】和【a】的時候怎麼計算的?忘了沒有?重視了沒有?

用那個【複雜的】公式算出 b 後,計算a時,是這樣計算的:a=y平均-b*x平均

這樣,那個《迴歸方程》自然是 y^=b*x^+(y平均-b*x平均) 了

所以,在這個式子中,若 x^=x平均 的時候,一定有 y^=b*x平均+y平均-b*x平均=y平均

即,迴歸方程一定過 (x平均 , y平均)點。

【至於 爲什麼 必須那樣計算《迴歸方程》,那涉及到《高等數學》中的《偏導數》分析 最小誤差理論,不是應用者必須掌握的知識。勸你還是不要太執着。(當然,將來若你有機會步入數學專業的理科學習,這也只是“小菜一碟”了!)】

怎麼用平均值法求工作曲線的迴歸方程?

算數平均值法求工作曲線,方法簡單、實用。

方法是:

1、設定:迴歸方程 Y = a X + b;

2、分別將工作曲線的自變量X、因變量Y的數據,代入迴歸方程式,可以得到多個方程;

3、將多個方程分爲兩組,分別加和,成爲兩組方程,在聯立,就可以求出a、b值;

4、將求出的 a、b值,代入 Y = a X + b,就得到算數平均值法求工作曲線的迴歸方程。

能不能告訴我 爲什麼迴歸直線必經過點(x的平均值,y的平均值) 拜託>_<~

因爲平均值點是作爲唯一的準點 其他點都基本是散落在迴歸直線的兩側

非線性迴歸方程怎麼進行檢驗

比較簡單的方法,加入方程是y=ax^3+bx^2+cx+d,使用變量替換x3=x^3,x2=x^2轉換爲線性方程,就可以通過R的平方以及F值來檢驗迴歸方程的整體解釋力和顯著程度了。

爲什麼迴歸方程必過平均數點

因爲在計算迴歸方程的時候用平均數點算了參數K和B.不懂再問,希望採納。

spss非線性迴歸分析步驟

概述

按照自變量和因變量之間的關係類型,迴歸分析可分爲線性迴歸分析和非線性迴歸分析。非線性迴歸的迴歸參數不是線性的,也不能通過轉換的方法將其變爲線性。

原理

非線性迴歸是用來建立因變量與一系列自變量之間的非線性關係,與估計線性模型的線性迴歸不同,通過使用迭代估計算法,非線性迴歸可估計自變量和因變量之間具有任意關係的模型。

對於看起來是非線性的模型,但是可以通過變量轉換化成線性的模型,稱之爲本質線性模型。

操作方法

01

本節內容主要介紹如何確定並建立線性迴歸方程。包括只有一個自變量的一元線性迴歸和和含有多個自變量的多元線性迴歸。爲了確保所建立的迴歸方程符合線性標準,在進行迴歸分析之前,我們往往需要對因變量與自變量進行線性檢驗。也就是類似於相關分析一章中講過的藉助於散點圖對變量間的關係進行粗略的線性檢驗,這裏不再重複。另外,通過散點圖還可以發現數據中的奇異值,對散點圖中表示的可能的奇異值需要認真檢查這一數據的合理性。

一、一元線性迴歸分析

用SPSS進行迴歸分析,實例操作如下:

02

單擊主菜單Analyze / Regression / Linear…,進入設置對話框如圖7-9所示。從左邊變量表列中把因變量y選入到因變量(Dependent)框中,把自變量x選入到自變量(Independent)框中。在方法即Method一項上請注意保持系統默認的選項Enter,選擇該項表示要求系統在建立迴歸方程時把所選中的全部自變量都保留在方程中。所以該方法可命名爲強制進入法(在多元迴歸分析中再具體介紹這一選項的應用)。具體如下圖所示:

03

請單擊Statistics…按鈕,可以選擇需要輸出的一些統計量。如Regression Coefficients(迴歸係數)中的Estimates,可以輸出迴歸係數及相關統計量,包括迴歸係數B、標準誤、標準化迴歸係數BETA、T值及顯著性水平等。Model fit項可輸出相關係數R,測定係數R2,調整係數、估計標準誤及方差分析表。上述兩項爲默認選項,請注意保持選中。設置如圖7-10所示。設置完成後點擊Continue返回主對話框。

迴歸方程建立後,除了需要對方程的顯著性進行檢驗外,還需要檢驗所建立的方程是否違反迴歸分析的假定,爲此需進行多項殘差分析。由於此部分內容較複雜而且理論性較強,所以不在此詳細介紹,讀者如有興趣,可參閱有關資料。

04

用戶在進行迴歸分析時,還可以選擇是否輸出方程常數。單擊Options…按鈕,打開它的對話框,可以看到中間有一項Include constant in equation可選項。選中該項可輸出對常數的檢驗。在Options對話框中,還可以定義處理缺失值的方法和設置多元逐步迴歸中變量進入和排除方程的準則,這裏我們採用系統的默認設置,如圖7-11所示。設置完成後點擊Continue返回主對話框。

非線性迴歸的應用

對實際科學研究中常遇到不可線性處理的非線性迴歸問題,提出了一種新的解決方法。該方法是基於迴歸問題的最小二乘法,在求誤差平方和最小的極值問題上,應用了最優化方法中對無約束極值問題的一種數學解法——單純形法。應用結果證明,這種非線性迴歸的方法算法比較簡單,收斂效果和收斂速度都比較理想。

迴歸方程的建立

對於上述這些可化爲線性模型的迴歸問題,一般先將其化爲線性模型,然後再用最小二乘法求出參數的估計值,最後再經過適當的變換,得到所求迴歸曲線。

在熟練掌握最小二乘法的情況下,解決上述問題的關鍵是確定曲線類型和怎樣將其轉化爲線性模型。確定曲線類型一般從兩個方面考慮:一是根據專業知識,從理論上推導或憑經驗推測、二是在專業知識爲力的情況下,通過繪製和觀測散點圖確定曲線大體類型。

舉例:

1 1790-1960某國人口變化數據:注意:即便線性方程對對觀測數據擬合相當好,但有關誤差項的性和方差假設有可能被破壞。原因是時間序列的數據誤差項往往不,誤差項大小有可能根據數據總體的大小而變化,意思就是,即便適合這個樣本的觀測量的方程,但是,不適合總體。根據經驗,人口增長模型不能被轉化爲線性模型,所以,可以利用曲線迴歸或者非線性迴歸。進一步比較究竟是曲線迴歸好還是非線性迴歸好,需要建立新的殘差變量,這一步並不難,就是在spss中,相應分析的保存子對話框中建立新的對應模型的變量。其實,有一個萬能公式:spss中,所有的“保存”對話框的功能都是,在二維表窗口也就是spss的盛放數據窗口中建立新變量,這個新變量有默認名,是相應分析的重要結果。保存新變量以後,需要根據殘差的序列圖進行判斷:最平穩的就是最合適的。

例2:血中藥物濃度和時間曲線呈非線性關係。

這個是根據專業背景知識而判斷。藥物不可能馬上見效,也許在血液中逐步或者突然見效。

例3:身高和體重,在青少年中,是呈直線關係,因爲,青少年在不斷成長,但是,對於整個人的生命週期,確是曲線關係 因爲,成年人的身高一般是確定的。

像這樣的例子根本用直線迴歸擬合不了,也稱爲非本質線性模型。對於這種實際情況,可以使用非線性迴歸的分段模型。最終目的是使殘差平方和最小。也就是在圖形中跟大多數散點接近。

spss操作注意:

1 初始值確定:

①利用簡單假設確定,例如,如果在所有變量中最大的一個個案值爲178萬,就需要選擇200爲初始值,再根據方程估計參數值。

②利用圖形或者圖形輔助,數據轉換

如果參數沒有初始值,也不能簡單的設置爲0,最好是將它們設置爲預計要改變的值大小。總之,就是想辦法找到一個比較合適的值,多設幾個,然後比較。也可以根據專業背景和重點,來設值。這個還可以根據數學計算,例如,方程二邊同時取對數。需要具體問題具體分析。

2 迭代和收斂:迭代是計算機自動計算的,例如將迭代設置爲1000,意思就是計算機算了1000次,每一次都是根據上一次的結果的基礎進行再運算。當然,人工筆算需要算1000年。迭代不會永無止境的計算下去,而是收斂標準或者稱作最大迭代的設置後,不論得沒有得到結果,是否達到目標,都會停止。在結果輸出表格中有迭代的歷史記錄。這個表格就是過程表,每一步怎樣算的,都可以找到。因爲迭代是計算機自動計算,例如,燒水,如果開了不斷電,水燒乾了就會起火,所以,機器需要人控制,它本身沒有情感。

spss操作:不論“計算變量”對話框或者“非線性迴歸”,和非線性迴歸的“損失函數”對話框都是很像的,有一個計算器算盤,函數組,函數和特殊變量。各種元素組合在一起,構成一個表達式,這個表達式構成一個新變量。只要用鼠標將對應的元素加入到表達式中,然後檢查,或者事先在本上寫有表達式,對應好,基本就沒有問題。其實,spss許多操作根據文字可以猜出個大概。

3 損失函數:“非線性迴歸”對話框是對整個因變量的運算法則,但是,損失函數是對某一個統計量的運算法則,spss默認是使用最小殘差平方和找出非線性模型,也可以自己設置。在相應對話框中都有設置。可以這樣以爲:損失函數就是估計誤差的函數,它是一個負面指標,越小越好。

4 參數約束:多數非線性模型中,參數必須在有意義的區間內。指的是在迭代過程中對參數的。分爲線性約束和非線性約束。線性約束中將參數乘以常數 但這個常數不能爲其他參數或者自身。非線性約束中至少有一個參數和其他參數相乘或者相除或者進行冪運算。

結果:

1 估計參數的漸進相關矩陣:如果出現非常大的正值或者負值,可能因爲模型中參數過多,也說明觀測量數目不足,但是不說明模型不擬合。

2 95%置信區間:如果95%置信區間不包括零,表明這個參數具有統計學意義。如果離零比較接近,下結論時候應慎重。

3 曲線擬合中計算出來的決定係數實際上是曲線直線化直線方程的決定係數,不一定代表變換前的變異解釋程度。也就是說二個模型的決定係數有可能不具有可比性。

引申:

1 曲線迴歸最好的模型和非線性迴歸最好的模型進行比較。從中挑選最合適的模型。通過保存殘差變量然後繪製序列圖實現。

2 有很多時候,線性模型根本解決不了問題,因爲,即便費了很大力氣轉化爲線性模型,但是,卻扭曲了數據。例如不僅改變原來數據的正態性,還改變數據的方差齊性,性。並且,在精度要求比較高或者模型比較複雜時候,曲線迴歸也不能應用。所以這時候最好應用非線性迴歸模型。

爲什麼線性迴歸方程必經(x的平均值,y的平

線性迴歸方程 ^Y=bx+a 必過 (X的平均值,Y的平均值) 爲什麼啊?????

因爲算得的迴歸直線結果中,y=bx+a

b的分子爲:(x1y1+x2y2+...xnyn)-nx'y' , x', y'分別爲xi, yi的平均值

b的分母爲:(x1^2+x2^2+...xn^2)-n(x')^2

a=y'-bx'

即得到的a, b滿足方程y'=bx'+a, 這裏x', y'分別爲平均值。也即(x',y')滿足直線y=bx+a, 所以是迴歸直線上的一點。