bilgiz.org

Araştirma makalesi MÜhendiSLİkte regresyon çÖZÜmlemesi pratik bir yaklaşIM

  • Geliş Tarihi: 03.10.1996
  • KAYNAKLAR



  • Tarih27.12.2017
    Büyüklüğü106.97 Kb.

    Indir 106.97 Kb.

    YTÜD 2001/4

    ARAŞTIRMA MAKALESİ

    MÜHENDİSLİKTE REGRESYON ÇÖZÜMLEMESİ - PRATİK BİR YAKLAŞIM

    Sema Noyan ALACALI



    Yıldız Teknik Üniversitesi, İnşaat Fakültesi, İnşaat Mühendisliği Bölümü, Yıldız-İstanbul.

    Geliş Tarihi: 03.10.1996




    REGRESSION ANALYSIS IN ENGINEERING - A PRACTICAL APPROACH


    SUMMARY

    In engineering sometimes the necessary relationship between two variables cannot be derived on the basis of theoretical considerations, in these cases the required relationship may be determined emprically on the basis of experimental observations. For this purpose, at present, regression analysis techniques are being used widely in all branches of engineering for obtaining the underlying relationships among the random variables. In this paper a practical approach has been presented for the evaluation of above mentioned relationships and a computer program has been developed.



    ÖZET

    Mühendislikte iki değişken arasındaki gereksenen ilişkiler kimi zaman kuramsal temellere göre türetilemez. Bu gibi olgularda gereksenen ilişki deneysel gözlemlere dayanılarak olgusal şekilde belirlenebilir. Bu amaçla günümüzde, rasgele değişkenler arasındaki temel ilişkilerin elde edilmesinde regresyon çözümleme teknikleri geniş ölçüde kullanılmaktadır. Bu makalede sözkonusu ilişkilerin değerlendirilmesiyle ilgili pratik bir yaklaşım sunulmuş ve bir bilgisayar programı geliştirilmiştir.



    1. GİRİŞ

    Bir rasgele değişkenin ortalama değerinin ve varyansının öteki değişken değerlerinin bir fonksiyonu olarak elde edilmesini sağlayan sürece regresyon çözümlemesi denir. Çözümleme en küçük kareler ölçütüne göre geliştirilebilir. Regresyon, doğrusal olabilir ya da olmayabilir; iki değişkenli ya da çok değişkenli olabilir (1-11). Makalede, yalnızca iki değişkenli doğrusal regresyon irdelenecektir. Çözümleme için gerekli bağıntılar kaynak gösterilerek verilecektir. Bu bağıntıların kapsamlı türetilişleri belli başlı istatistik kitaplarında verilmiştir (1-11). Bu bağlamda, değişkenler arasındaki istatistiksel ilişki derecesinin belirlenmesi işlemine korelasyon çözümlemesi adı verilir. Bu çözümleme makalenin kapsamına alınmamıştır.



    2. DOĞRUSAL REGRESYON

    Bir sanayi işletmesinde bir kimyasal maddenin özgül ısısının sıcaklıkla değişiminin araştırılması olgusunu ele alalım ve çeşitli sıcaklık dereceleri için özgül ısıların belirlenmesiyle ilgilenelim. Herhangi bir sıcaklık derecesi için genelde farklı özgül ısılar bulunur. Bu, özgül ısının rasgele değişken olduğunu belirtir. Deney sürecinde araştırmacı tarafından seçilen ve duyarlılıkla kontrol edilebilen sıcaklık derecesi deterministik -istatistiksel yönden dağılımsal özelliği olmayan değişken kabul edilebilir. Kısaca, denetlenebilen sıcaklık bağımsız değişken, rasgele değişken özgül ısı ise bağımlı değişken olur (1,2,4,5,7-9,11).


    İki değişkenli bir olguda, değişkenlerden biri bağımsız değişken (X ya da x simgesiyle gösterilebilir), öteki bağımlı değişken (Y) ise bunların değerleri arasında "bir-tek" ilişki oluşmaz. Bağımsız değişkenin herhangi bir değeri için bağımlı değişkenin bir "olabilir değerler aralığı" bulunur. X bağımsız ve Y bağımlı değişkenlerine ilişkin (, i = 1, 2,...n) ikili verilerin iki-boyutlu bir eksen takımı üzerinde işaretlenmesiyle elde edilen grafiğe serpilme diyagramı ya da dağılma diyagramı denir. Diyagramdaki veri noktaları doğrusal yörünge izliyorsa Y nin X e göre doğrusal regresyonu sözkonusudur. Y nin ortalamasının ve varyansının X in fonksiyonu olarak belirlenmesini sağlayan işleme regresyon çözümlemesi ve doğrusal ortalama değer fonksiyonuyla sınırlandırılmış işleme de doğrusal regresyon adı verilir (1-11).

    2.1 Sabit varyanslı doğrusal regresyon

    sabit değeri için Y rasgele değişkenini ve Y’nin koşullu yoğunluk dağılımını ile gösterelim. Örnekse, için , rasgele değişkenini belirtir (Şekil 1). Bu bağlamda doğrusal regresyon terimi, x ile nin ortalaması arasındaki ilişkinin doğrusal olduğunu ve aşağıdaki bağıntıyla gösterilebileceğini belirtir (1,2,4,9,11).
    (1)
    E ve m, beklenen değeri ve ortalamayı, özdeş değerleri belirtir. Bağıntının temsil ettiği doğru çizgi, Y’ nin x’ e göre regresyonunu ifade eder ve şeklinde yazılabilir (Şekil 1).  ve parametrelerinin değerleri örnek verileriyle tahmin edilir ve bu tahminler ve ile gösterilebilir. Regresyon doğrusunun tahmini de olur (Şekil 2).

    Şekil 1. Regresyon doğrusu Şekil 2. Bir örnekten sağlanan

    Y dağılımları ortalamasının verilere göre en küçük

    konumu. kareler regresyon doğrusu.

    Örnek verilerinin serpilme diyagramındaki konumlarına göre çeşitli ve tahminleri yapılabilir. Bu yüzden Y nin ortalama değer fonksiyonuna ilişkin çok sayıda doğru çizgi tahmin edilebilir. Öyleyse sorun, verilere en yakın biçimde uyum sağlayan doğru çizginin, dolayısıyla ve nın tahmin edilmesidir. Bu tahmini değerler kalıcı hataların (sapmaların, residual errors) karelerinin toplamı minimumlaştırılarak elde edilebilir. Sözkonusu yaklaşıma en küçük kareler yöntemi denildiği bilinmektedir. Anılan toplam (Şekil 2);



    (2)
    ve tahminleri (2) bağıntısının ve ’ya göre alınan kısmi türevlerinin sıfıra eşitlenmesiyle bulunan denklemlerin ardışık çözülmesiyle elde edilebilir:
    (3)
    (4)
    n, örnek büyüklüğü. örnek ortalamaları.

    En küçük kareler regresyon doğrusu, ve nın (3) ve (4) bağıntılarından elde edilen en küçük kareler tahminleriyle belirlenir:


    (5)

    Bağıntıdaki , regresyon doğrusunun orijindeki ordinatını ve da doğrunun eğimini belirtir. Bağıntı, yalnızca örnek noktalarının bulunduğu aralık için geçerlidir; ekstrapolasyon hatalı sonuç verebilir.



    En küçük kareler regresyon doğrusunun koşullu varyansı ilgilenilen dağılmanın ölçüsü kabul edilebilir (1,2,4,5,6-9,11). in ilgili x aralığında sabit kabul edilmesi durumunda eğilimsiz tahmini aşağıdaki bağıntıyla belirlenebilir (1,2,4,5,6-9,11):
    (6)
    , örneğin koşullu varyansı. ve , örnek verileriyle tahmin edilen değerler olduğu için iki serbestlik derecesi yitirilmiştir. Bağıntıdaki bu olguyu belirtir. Koşullu standart sapma, , (6) bağıntısıyla hesaplanır.

    ve , büyüklükleri n olan örneklerden sağlanabilecekleri, dolayısıyla farklı değerler alabilecekleri için rasgele değişkenlerdir. Bu nedenle ortalamaları ve varyansları ile tanımlanırlar (1,4,8,9,11).

    2.2 Güven aralıkları

    ve ,  ve  parametrelerinin nokta tahminleridir. “Tahmin Kuramı” nda bu tekil değerlerin duyarlılık dereceleri, bilinmeyen ilgili toplum parametrelerini içermesi beklenen ve onların nokta tahminleriyle merkezlendirilmiş güven aralıkları ile belirtilebilir (1,2,4,7-9,11). Bu bağlamda, örnek verilerine dayanılarak ,  ve için güven aralıkları belirlenebilir. Belirlemede sabit değerleri için değerleri dağılımlarının, regresyon doğrusuna göre, normal, , olduğu kabul edilebilir. Dolayısıyla , ve tahminleri de normal dağılımlı olur. Bununla birlikte daha güvenilir bir yaklaşım olması nedeniyle ,  ve için güven aralıklarının t-dağılımı’na göre tahmin edilmesi yeğlenmektedir (1,4,7,9,11).

    t-dağılımına göre, x’in gibi bir değeri için Y’nin ortalamasına ilişkin güven aralığı (Şekil 3) aşağıdaki bağıntıyla tahmin edilebilir (1,4,8,9,11):



    (7)
    ; t-dağılımı rasgele değişkeninin, T, birikimli olasılığı karşılığı değeri. , t-dağılımına ilişkin alanları belirten simge, , serbestlik derecesi, (f; serbestlik derecesi) değerleri belli başlı istatistik kitaplarındaki tablolarda verilmiştir (1,2,4,9,11).

    2.3 Öndeyi aralıkları

    Mühendisler ve bilimsel araştırma yapanlar için çoğu kez, bağımlı değişkenin gelecekte gözlenecek değerini içermesi beklenen aralığın tahmin edilmesi de önemli olabilir. Bu aralık öndeyi aralığı (prediction interval) terimiyle adlandırılmaktadır (8,9,11). Örnekse, bir sanayi işletmesinde gerçekleştirilen bir kimyasal süreçte, kontrol edilebilen giriş sıcaklığı ile çıkıştaki katran içeriğinin, belirli bir sıcaklık derecesi için gelecekteki gerçek miktarının bulunması olası aralık öndeyi aralığı olur. Bu bağlamda x’ in gibi bir değeri için Y’ nin düzeyindeki öndeyi aralığı şu bağıntıyla tahmin edilebilir (4,8,9,11):

    (8)
    En dar güven ve öndeyi aralıkları için oluşur.


    Şekil 3. Güven ve öndeyi aralıkları.

    3. UYGULAMA

    Doğrusal regresyona örnek olarak aşağıdaki tablodaki deneysel verileri gözönüne alalım (x = bağımsız değişken, y = bağımlı değişken). Verilerin serpilme diyagramındaki konumu doğrusallık kabülünün geçerli olduğunu göstermektedir (Şekil 4). Bu kabule göre en küçük kareler regresyon doğrusunu ve için Y nin % 95’lik güven ve öndeyi aralıklarını tahmin edelim.



    i

    1

    2

    3

    4

    5

    6

    7

    8

    9



    1.5

    1.8

    2.4

    3.0

    3.5

    3.9

    4.4

    4.8

    5.0



    4.8

    5.7

    7.0

    8.3

    10.9

    12.4

    13.1

    13.6

    15.3




    Şu halde Y’nin x’e göre tahmini regresyon çizgisi;

    için tahmini değer;

    Güven aralığı: Önce regresyon çizgisinin varyansını belirleyelim.



    i











    1

    1.5

    4.8

    4.652364

    0.147636

    21796.3885

    2

    1.8

    5.7

    5.531448

    0.168552

    28409.7767

    3

    2.4

    7.0

    7.289616

     0.289616

    83877.42746

    4

    3.0

    8.3

    9.047785

     0.747785

    559182.4062

    5

    3.5

    10.9

    10.512926

    0.387074

    149826.2815

    6

    3.9

    12.4

    11.685038

    0.714962

    511170.6614

    7

    4.4

    13.1

    13.150178

     0.050178

    2517.831684

    8

    4.8

    13.6

    14.322291

     0.722291

    521704.2887

    9

    5.0

    15.3

    14.908347

    0.391653

    153392.0724







    için % 95’lik güven aralığı, (7) bağıntısıyla belirlenir.
    , ve

    için Tablo EC5’ten(*) (11).





    Öndeyi aralığı: için % 95’lik ön-deyi aralığı (8) bağıntısıyla belirlenir:




    Şekil 4. Uygulamaya ilişkin serpilme diyagramı, güven ve öndeyi aralıkları.

    4. BİLGİSAYAR İLE ÇÖZÜM

    10 PRINT "DOĞRUSAL REGRESYON ÇİZGİSİ, GÜVEN VE ÖNDEYİ ARALIKLARI"

    20 CLEAR

    30 INPUT "n, örnek büyüklüğü ="; N

    40 INPUT "tahmini bulunacak x sabit değeri ="; X

    50 INPUT "t /2,f ="; T

    60 DIM X(N), Y(N)

    70 XORT = 0

    80 YORT = 0

    90 RT = 0

    100 YT = 0

    110 DELTA = 0

    120 FARK = 0

    130 FOR I = 1 TO N

    140 INPUT "X(I)"; X(I)

    150 INPUT "Y(I)"; Y(I)

    160 XORT = XORT + X(I) / N

    170 YORT = YORT + Y(I) / N

    180 RT = RT + X(I) * Y(I)

    190 YT = YT + (X(I) ^ 2)

    200 NEXT I

    210 BETA = (RT - N * XORT * YORT) / (YT - N * (XORT ^ 2))

    220 ALFA = YORT - (BETA * XORT)

    230 YREG = ALFA + BETA * X


    240 FOR I = 1 TO N

    250 YREG(I) = ALFA + BETA * X(I)

    260 DELTA = DELTA +(Y(I) - YREG(I)) ^ 2

    270 FARK = FARK + (X(I) - XORT) ^ 2

    280 NEXT I

    290 SYX = (DELTA / (N - 2)) ^ (1 / 2)

    300 S1 = (ALFA + BETA * X) - T * SYX * ((1 / N) + (X - XORT) ^ 2 / FARK) ^ (1 / 2)

    310 S2 = (ALFA + BETA * X) +T * SYX * ((1 / N) + (X - XORT) ^ 2 / FARK) ^ (1 / 2)

    320 S3 = (ALFA + BETA * X) - T * SYX * (1 + (1 / N) + (X - XORT) ^ 2 / FARK) ^ (1 / 2)

    330 S4 = (ALFA + BETA * X) +T * SYX * (1 + (1 / N) + (X - XORT) ^ 2 / FARK) ^ (1 / 2)

    340 PRINT ", x sabit değeri için tahmini değer ="; YREG

    350 PRINT "Koşullu standart sapma sY/x ="; SYX

    360 PRINT "="; ALFA

    370 PRINT "="; BETA

    380 PRINT "Doğrusal regresyon çizgisi yi =+*xi "

    390 PRINT "Güven aralığı (alt sınır;)"; S1

    400 PRINT "Güven aralığı (üst sınır;)"; S2

    410 PRINT "Öndeyi aralığı (alt sınır;)"; S3

    420 PRINT "Öndeyi aralığı (üst sınır;)"; S4

    430 GOTO 10


    5. UYGULAMANIN BİLGİSAYARLA ÇÖZÜMÜ

    Giriş bilgileri: n, örnek büyüklüğü = 9

    tahmini bulunacak x sabit değeri =4

    t /2,f = 2.365

    Çıkış bilgileri: , x sabit değeri için tahmini değer = 11.97807

    Koşullu standart sapma sY/x =0.538765



    =0.256942

    =2.930281

    Doğrusal regresyon çizgisi yi =+*xi

    Güven aralığı (alt sınır;) 11.498375

    Güven aralığı (üst sınır;) 12.457757

    Öndeyi aralığı (alt sınır;) 10.616583

    Öndeyi aralığı (üst sınır;) 13.339549


    6. SONUÇ VE ÖNERİLER

    Mühendislik alanında çoğu zaman aralarında istatistiksel ilişki bulunan iki değişkenli olgularla karşılaşılır. Gene çoğu kez, bu değişkenlerden biri kontrol edilebilen değişken, öteki rasgele değişken olur. Örnekse, derinlik ile zeminin basınç mukavemeti arasındaki ilişkide derinlik deterministik değişken, mukavemet rasgele değişkendir. Bu bağlamda regresyon çözümlemesi, rasgele değişkenin ortalamasının ve varyansının bağımsız değişkenin fonksiyonu olarak belirlenmesi işlemi olur. Anılan koşullu ortalama

    değer bağımsız değişkenin doğrusal fonksiyonu ise doğrusal regresyon sözkonusudur.

    İlgili serpilme/dağılma diyagramındaki veri noktalarının doğrusal yörüngeli olması, doğrusal regresyon yapılabileceğini belirtir.

    Doğrusal regresyonda bağımlı değişkenin koşullu ortalama değer fonksiyonunun parametreleri örnek verilerinden elde edilen en küçük kareler tahminleriyle belirlenir. Böylece, doğrusal regresyon doğrusu, en küçük-kareler regresyon doğrusuyla tahmin edilir. Anılan parametrelere ilişkin tahminler nokta tahminleri olduğu için bu tahminlerin duyarlılık dereceleri güven aralıklarıyla güvence altına alınır. Mühendisleri ilgilendiren bir başka önemli aralık da, bağımsız değişkenin belirli bir değeri için, bağımlı değişkenin gelecekte gözlenecek değerini içermesi beklenen öndeyi aralığıdır.

    Makalede, doğrusal regresyon çözümlemesi için gerekli tüm bağıntılar verilmiştir. Çözümleme, hesap makinesiyle ya da makalede geliştirilen bilgisayar programıyla çok kısa sürede gerçekleştirilebilir.

    Algoritma bağıntılarının tümü örnek verilerini içeren aralık için geçerlidir. Ekstrapolasyon yapılmamalıdır. Koşullu olasılık ortalama değer fonksiyonuna ilişkin güven ve öndeyi aralıkları da duyarlı dağılım uyumu sağlaması bakımından t-dağılımına göre tahmin edilmelidir.

    KAYNAKLAR

    [1] BENJAMIN, J.R., and CORNELL, C.A., Probability, Statistics and Decision for Civil Engineers, First Edition, McGraw-Hill, New York, 1970, 419-440, 662-664.

    [2] ANG,A.H-S., and TANG, W.H., Probability Concepts in Engineering Planning and Design, V.I, Basic Principles, First Edition, Wiley, New York. 1975, 286-319, 383.


    [3] KICIMAN, M.,Mühendisler İçin İhtimaller Hesabı ve İstatistiğe Başlangıç, 1.Basım, ODTÜ, Yayın No.46, Ankara, 1975, 121-133.
    [4] WALPOLE, R.E., and MYERS, R.H., Probability and Statistics for Engineers and Scientists, First Edition, McMillan, New York, 1978, 280-358, 514.
    [5] HOEL, P.G., Introduction to Mathematical Statistics, Fifth Edition, Wiley, New York, 1984, 192-210, 420.
    [6] BAYAZIT, M., ve OĞUZ, B., 1.Basım, Mühendisler için İstatistik, 1.Basım, Birsen Yayınevi, İstanbul 1985, 155-179, 182.
    [7] SPIEGEL, M.R., Theory and Problems of Statistics, Second Edition, McGraw-Hill, London, 1992, 264-290, 488.
    [8] CHATFIELD, C., Statistics for Technology, Third Edition, Chapman and Hall, London, 1994, 166-199, 342,343.
    [9] METCALFE, A.V., Statistics in Engineering, First Edition, Chapman and Hall, London, 1994, 208-224, 426.
    [10] SEZGİNMAN, İ., Olasılık-Teori ve Problemleri, 1.Basım, Eğitim yayınları A.Ş. matbaası, İstanbul, 1995, 221-234.
    [11] GÜNDÜZ, A., Mühendislikte Olasılık, İstatistik, Risk ve Güvenilirlik, 1.Basım, Küre Basım Yayım Ltd.Şti., İstanbul, 1996, 206-226, 373.

    Ek-Bilgisayar programı


    INPUT N, X, T:

    DIM X(N),Y(N)

    XORT=0

    YORT=0


    RT=0

    YT=0


    DELTA=0

    FARK=0




    I=1

    1

    N

    BETA=

    (RT-N*XORT*YORT)

    (YT-N*(XORT^2))

    ALFA=YORT-BETA*XORT

    YREG=ALFA+BETA*X

    X(I),Y(I)

    1

    SYX=(DELTA/(N-2))^(1/2)

    S2=(ALFA+BETA*X)+T*SYX*((1/N)+(X-XORT)^2/FARK)^(1/2)

    S3=(ALFA+BETA*X)-T*SYX*(1+(1/N)+(X- XORT)^2/FARK)^(1/2)

    S4=(ALFA+BETA*X)+T*SYX*(1+(1/N)+(X-XORT)^2/FARK)^(1/2)

    YREG(I)=ALFA+BETA*X(I)

    DELTA=DELTA+(Y(I)-YREG(I))^2

    FARK=FARK+(X(I)-XORT)^2

    XORT=XORT+X(I)/N

    YORT=YORT+Y(I)/N

    RT=RT+X(I)*Y(I)

    YT=YT+(X(I))^2

    PRINT "Y(X) x için tahmini değer="; YREG

    PRINT "Koşullu standart sapma sY/x="; SYX

    PRINT "ALFA="; ALFA

    PRINT "BETA="; BETA

    STOP

    RUN

    I=1

    N

    11

    S1=(ALFA+BETA*X)-T*SYX*((1/N)+(X-XORT)^2/FARK)^(1/2)


    PRINT "Güven aralığı (üst sınır;)"; S2

    PRINT "Ön-deyi aralığı (alt sınır;)"; S3

    PRINT "Ön-deyi aralığı (üst sınır;)"; S4

    PRINT "Güven aralığı (alt sınır;)"; S1

    PRINT "Regresyon çizgisi”



    (*) t-dağılımı, T rasgele değişkeninin birikimli olasılığı karşılığı değeri ile gösterilirse, farklı serbestlik dereceleri ve çeşitli olasılık düzeylerine ilişkin değerleri gösterilmiştir.









        Ana sayfa


    Araştirma makalesi MÜhendiSLİkte regresyon çÖZÜmlemesi pratik bir yaklaşIM

    Indir 106.97 Kb.