Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
лек стат каз_2014.doc
Скачиваний:
20
Добавлен:
15.02.2016
Размер:
560.64 Кб
Скачать

10 Тақырып. Құбылыстардың өзара байланысын статистикалық зерттеу. Статистикалық мәлiметтердi талдау - статистикалық зерттеудiң соңғы кезеңi

  1. Статистикалық және корреляциялық байланыс туралы түсiнiк

  2. Моделдеу және корреляциялық- регрессиялық талдау есептерi

  3. Жұптық сызықты корреляцияның параметрлерiн есептеу және интерпретациясы.

Қазiргi кезде ғылым табиғат пен қоғамның барлық құбылыстарының өзара байланыстарынан туындайды. Кәсiпорынның өнiм көлемi қызметкерлер саны, қозғалтқыштар қуаты, өндiрiс қорының құны және тағы басқа көптеген белгiлерге тiкелей байланысты.

Байланыстардың сипаты, күшi және тағы басқа ерекшелiктерiн зерттеп алмай, құбылыстарды басқару және олардың дамуын болжау мүмкiн емес. Сондықтан, байланыстарды анықтау, зерттеу әдiстерi ғылыми зерттеудiң, соның iшiнде статистикалық әдiстеменiң де маңызды бөлiгiн құрайды.

Түрлi құбылыстар мен олардың белгiлерi арасындағы байланыс екi түрге бөлiнедi: бiрiншi жағынан – функционалдық немесе қатаң детерминирленген, екiншi жағынан – статистикалық немесе стохастикалық детерминирленген. Байланыстың бұл түрлерiнiң ерекшелiктерiн математикалық қойылымын құрғанда ғана анықтауға болады. Дербес жағдайда, екi айнымалының математикалық түрде бейнеленген байланыс теңдеуi түрiндегi, екi құбылыс немесе екi белгi арасындағы байланыс жайлы сөз қозғайық .

Егер айнымалылардың бiрiнiң өзгеруi екiншiнiң де қатаң анықталған түрде өзгеруiне әкелсе, яғни бiр айнымалының мәнiне мiндеттi түрде екiншi айнымалының дәл анықталған бiр немесе бiрнеше мәнi сәйкес келсе, олардың арасындағы байланыс функционалды деп аталады.

Айнымалылардың бiрiнiң өзгеруiне екiншiсiнiң тек бiр ғана мәнiнiң қатаң сәйкестiгi жайлы жиi айтылып жүр. Мысалы, егер y2=x теңдеуiн қарастырсақ, х=4 мәнiне бiр емес, екi мән- сәйкес келетiнiне қарамастан y пен х айнымалыларының арасындағы байланыс функционалды. Бұдан да жоғарғы реттi теңдеудiң көп түбiрi болуы мүмкiн, ал байланыс функционалды болып қала бередi.

Екi айнымалы арасындағы функционалдық байланыс олардың бiреуiнiң, басқа емес, тек қана екiншiсiне байланысты болған кезiнде ғана орын алады. Нақты табиғатта (сонымен қатар қоғамда да) ондай байланыстар жоқ; олар шындықты жеңiлдетедi, сонымен қатар құбылыстарды талдауға пайдалы және қажеттi абстракциялар ғана болып табылады. Берiлген y шамасының көптеген факторларына функционалдық тәуелдiлiгi y шамасының, басқа факторларға тәуелдi емес, тек қана аталған факторларының жиынына үнемi байланысты болғанда ғана мүмкiн болады. Сонымен қатар шексiз шынайы әлемнiң барлық құбылыстары мен үрдiстерi өзара байланысты, және тәуелдi у шамасын абсолюттi толық анықтайтындай ақырлы k айнымалы жоқ. Демек, айнымалылар арасындағы көптiк функционалдық байланыс та шындықты жеңiлдететiн абстракциялар.

Бiрақ механика, электротехника, акустика, саяси экономия және басқа ғылымдар функционалдық байланысты құруды, тек қана талдау мақсатында емес, көбiне болжау мақсатында да табысты қолдануда. Бұл, қарапайым жүйеде бiздi қызықтыратын айнымалы шама негiзiнен (99% немесе тiптi 99,99%) бiрнеше айнымалыға немесе тек бiр айнымалыға тәуелдi болғандықтан, мүмкiн болады. Яғни, осындай күрделi емес жүйеде байланыс абсолюттi функционалдық болмаса да, практика жүзiнде оған өте жақын. Мысалы, жыл ұзақтығы (Жердiң Күндi айналу периоды) тек Күн массасы мен оның Жерден қашықтығына тәуелдi. Ал негiзiнде ол өте елеусiз деңгейде басқа да планеталардың массасы мен Жерден қашықтығына байланысты, бiрақ олардың (соның iшiнде миллион есе алыс жұлдыздардың) функционалдық байланысқа келтiретiн бұлмалауы, космонавтикадан басқа барлық практикалық мақсаттарда өте елеусiз.

Стохастикалық детерминирленген байланыстарда функционалдық байланысқа тән шектеулер мен шарттар болмайды. Егер бiр айнымалының мәнi өзгерген кезде, екiншiсi белгiлi бiр ықтималдықпен анықталған аралықтағы кез-келген мәндi қабылдай алса, бiрақ оның орташа мәндерi мен басқа статистикалық (жалпы) сипаттамалары белгiлi бiр заңға бағынса – байланыс статистикалық болады. Басқаша айтқанда, статистикалық байланыс кезiнде бiр айнымалының түрлi мәндерiне басқа айнымалы мәндерiнiң түрлi үлестiрiлуi сәйкес келедi.

Қазiргi кездегi ғылым байланыстың кең анықтамасын бiлмейдi. Сандық түрде өлшенетiн және бейнеленетiн барлық байланыстар, функционалдықты қоса алғанда, "статистикалық байланыстар" анықтамасына келедi. Функционалдық байланыс, бiр айнымалының мәнiне, бiр немесе бiрнеше мәндерден тұратын және бiрге тең ықтималдыққа ие, екiншiсi мәнiнiң “үлестiрiлуi” сәйкес келетiн, статистикалық байланыстардың дербес түрi. Әрине бiрге тең ықтималдыққа ие (ақиқат) жеке мәндер мен нақты ықтималдық үлестiру арасындағы сапалық айырмашылық өте үлкен болғанмен, функционалдық байланыс кең мағынада статистикалық байланыстар анықтамасына келгенмен, толық негiзде байланыстың екi түрi туралы айтуға болады.

Корреляциялық байланыс деп бiр айнымалының түрлi мәндерiне екiншiсiнiң түрлi орташа мәндерi сәйкес келетiн статистикалық байланыстың маңызды дербес жағдайын айтады. х белгiсiнiң мәнi өзгергенде, y белгiсiң орташа мәндерi заңдылық негiзiнде өзгередi; яғни әрбiр жеке жағдайда y белгiсiң мәндерi (түрлi ықтималдықтармен) түрлi мәндердiң жиынын қабылдай алады.

Егер х белгiсiнiң мәнi өзгергенде, y белгiсiң орташа мәндерi заңдылық негiзiнде өзгермесе, бiрақ басқа статистикалық сипаттамалар (өзгерме, асимметрия, эксцесс көрсеткiштерi және т.б.) заңдылықпен өзгерсе, байланыс корреляциялық емес, статистикалық болып табылады.

Екi белгi (екi айнымалы) арасындағы статистикалық байланыс олардың әрқайсысы орташа шамаға қатысты жеке мәндердiң кездейсоқ өзгермесiне ие болатынын көрсетедi. Егер мұндай өзгерменi тек бiр белгi иеленсе, ал екiншiсiнiң мәнi қатаң детерминирленген болса, онда статистикалық байланыстар (корреляциялық та емес) емес, тек регрессия жайында сөз болады. Мысалы, динамикалық қатарларды талдау кезiнде егiн түсiмдiлiгiнiң (кездейсоқ тербелiске ие) қатар деңгейiнiң регрессиясын жыл нөмiрi бойынша есептеуге болады. Бiрақ олардың арасындағы корреляция жайлы сөз қозғауға және сәйкес интерпретациямен корреляция көрсеткiшiн қолдануға болмайды.

Корреляция сөзiн ағылшын биологi және статистигi Френсис Гальтон XIX ғасырдың соңында қолдануға енгiзген. Ол кезде корреляция жай ғана "байланыс" (relation) емес "correlation" (сәйкестiк) деп жазылды және сол кездегi белгiсiз болған функционалдық формадағы байланыс, яғни "байланыс тәрiздi" болды. Ғылымда, дәлiрек айтқанда палеонтологияда, "корреляция" терминiн француз палеонтологы (өткен дәуiрлердiң өсiмдiктерi мен жануарларының қазылған сүйектерi бойынша маман) Жорж Кювье, ертерек, XVIII ғасырдың соңында қолданды. Ол тiптi жануар органдары мен бөлiктерiнiң "корреляция заңын" енгiздi. "Корреляция заңы" табылған бас сүйегi мен басқа да сүйектер бойынша жануардың жалпы денесi мен оның жүйедегi орнын қалпына келтiруге көмектеседi: егер мүйiзi бар бас сүйегi кездессе, онда жануар – шөп қоректi және оның тұяғы, ал егер тырнағы бар болса - жыртқыш жануардың мүйiзi жоқ, бiрақ iрi азу тiстерi бар болады.

"Корреляция заңы" және Кювье жайлы келесi әңгiме айтылуда. Университеттегi мейрам кезiнде студенттер профессор Кювьемен қалжыңдаспақ болады. Олар бiр студентке мүйiзi мен тұяғы бар ешкiнiң терiсiн кигiзiп, Кювьенiң жататын бөлмесiнiң терезесiнiң алдына отырғызады. Ешкi тұяқтарын сартылдатып, "Мен сенi жеймiн!" деп ақырады. Кювье ұйқысынан ойанып, мүйiздi бейненi көредi де, "Егер сенiң мүйiзiң мен тұяғың бар болса корреляция заңы бойынша сен шөп қоректi жануарсың, яғни сен менi жей алмайсың. Ал корреляция заңын бiлмегендiктен екi аласың!" деп сабырмен жауап берген екен.

Белгiлердiң арасындағы корреляциялық байланыс түрлi жолдармен пайда болады. Маңызды жолы – нәтижелiк белгiнiң (оның өзгермесiнiң) факторлық белгi өзгермесiне себептi тәуелдiлiгi. Мысалы, х белгiсi - топырақтың құндылығын бағалау баллы болса, y белгiсi – ауыл шаруашылық өнiмiнiң түсiмдiлiгi. Бұл жерде х - тәуелсiз айнымалы (фактор), ал y - тәуелдi айнымалы (нәтиже) екенi айдан анық.

Жалпы себептiң екi салдарларының арасындағы корреляциялық байланысты зерттегенде ерекше интерпретация қажет. XX ғасырдың басында орыстың iрi статистигi Чупров А.А. келтiрген классикалық мысал кеңiнен тараған: егер х ретiнде қаладағы өрт сөндiрушi командалардың санын, ал y ретiнде қаладағы бiр жылда болған өрттен түскен шығын сомасын алсақ, онда қалалар жиынтығында х пен y арасында елеулi тура байланыс бар болады; яғни, орташа есеппен, қалада өрт көп болған сайын, өрт салдарынан түскен шығын көбейе түседi! Жұмыстан айрылып қалудан қорыққандықтан өрт сөндiрушiлер объектiлерге өрт қоюмен айланыспайды ма екен? Бiрақ мәселе басқада. Бұл корреляцияны себеп пен салдардың байланысы ретiнде түсiндiруге болмайды; екi белгi де бiр ғана себептiң (яғни қаланың мөлшерi) салдары болып табылады. Шағын қалаларға қарағанда iрi қалалардағы өрт бөлiмдерiнiң саны өте көп, сонымен қатар, бiр жылдағы өрт саны мен олардан түскен шығындар да көбiрек болатыны анық.

Корреляцияның пайда болуының үшiншi жолы - әрқайсысы себеп те, салдар да болатын белгiлердiң өзара байланысы. Жұмысшылардың еңбек өнiмдiлiгiнiң деңгейi мен 1 сағаттық еңбекке төленетiн ақы (тарифтiк қойылым) деңгейiнiң арасындағы корреляция осыған мысал бола алады. Бiр жағынан жалақы деңгейi - еңбек өнiмдiлiгiнiң салдары, яғни өнiмдiлiк жоғары болған сайын, еңбек ақы да көбейе түседi. Бiрақ екiншi жағынан, бекiтiлген тарифтiк қойылым мен бағалаулар ынталандырушы рөл атқарады: ақы төлеудiң дұрыс жүйесi кезiнде олар еңбек өнiмдiлiгi тәуелдi болатын фактор ретiнде алынады. Белгiлердiң мұндай жүйесiнде есептiң екi қойылымы да жеткiлiктi болады; әрбiр белгiнi х тәуелсiз айнымалы ретiнде де немесе y тәуелдi айнымалы ретiнде де қарастыруға болады,

Корреляциялық байланысты зерттеу өзiнiң мағынасына сай екi мақсатқа ие: 1) тәуелдi айнымалының орташа мәндерiнiң тәуелсiз айнымалыға байланысын (нәтижелiк белгiнiң орташа мәндерiнiң бiр немесе бiрнеше белгiлерге тәуелдiлiгi) көрсететiн теңдеудiң параметрлерiн есептеу; 2) екi (немесе одан да көп) белгiлердiң арасындағы байланыс тығыздығын анықтау. Екiншi мәселе статистикалық байланысқа тән, ал бiрiншiсi функционалдық байланысқа арнап шығарылған, және екеуiне де ортақ қолданылады. Сонымен қатар ресми математикалық емес, мазмұндық сипат алатын корреляциялы-регрессиялық әдiстердi қолданудың басқа да есептерi жайлы айта кету қажет:

  1. Нәтижелiк белгiге (яғни, жиынтықтағы оның мәнiнiң өзгермесiне) әсер ететiн маңызды факторларды бөлiп қарастыру есебi. Бұндай есептер нәтижелiк белгiнiң факторларға байланыстылық тығыздығын анықтау негiзiнде шешiледi.

  2. Өндiрiсте бар факторларды пайдалану тиiмдiлiгi бойынша шаруашылық қызметiн бағалау есебi. Мұндай есептер факторларды қолдану тиiмдiлiгiнiң жиынтығы бойынша орташасының көмегiмен алынған нәтижелiк белгi шамаларының әрбiр жиынтық бiрлiгi үшiн есептеу және оларды өндiрiстiң нақты нәтижелерiмен салыстыру жолымен жүзеге асады.

  3. Берiлген факторлық белгi мәндерi бойынша нәтижелiк белгiнiң мүмкiн болатын мәндерiн болжау есептерi. Бұндай есеп факторлық белгiнiң күтiлетiн, болжанған немесе мүмкiн болатын мәндерiн байланыс теңдеуiне қою және нәтижелiк белгiнiң күтiлетiн мәнiн есептеу жолымен шешiледi.

Кейде керi есептi де шешуге тура келедi: нәтижелiк белгiнiң қалаулы және жоспарлы жиынтық бойынша орташа мәнiн қамтамасыз ету үшiн факторлық белгiнiң қажеттi мәндерiн есептеу. Әдетте, мұндай есептiң шешiмi жазғыз емес және оның шешiмдерiнiң мүмкiн болатын варианттарының ең жақсысын табу үшiн (мысалы, өте аз шығынмен қажеттi нәтижеге қол жеткiзуге мүмкiндiк беретiн вариант) қажеттi оптимизациялық есептердiң қойылуы мен шешiлуiмен толықтырылуы керек.

4. Оптимизациялық есептердi шешу үшiн қажеттi бастапқы мәлiметтердi дайындау есебi. Мысалы, аудан бойынша өндiрiстiң болашақтағы оптималдық құрылымын анықтау үшiн бастапқы қажеттi ақпарат түрлi меншiк формаларына ие және түрлi салалы кәсiпорындардың өнiмдiлiк көрсеткiштерiн қамту керек. Өз кезегiнде, бұл көрсеткiштер корреляциялы-регрессиялық модельдер мен динамикалық қатар трендiнiң (тренд те регрессия теңдеуi) негiзiнде алынуы мүмкiн .

Жоғарыда айтылған есептердi шешу барысында корреляциялы-регрессиялық әдiстiң ерекшелiктерi мен шектеулерiн ескеру керек. Әр кез, нәтиже мен фактор өзгермесi арасындағы түсiндiрушi байланыс ретiнде, теңдеудiң себептi интерпретациясының мүмкiндiгiн арнайы негiздеу қажет. Әр фактордың әсерiн жеке бағалауды қамтамасыз ету өте қиын. Бұл жағдайға қатысты корреляциялық әдiстер қарама-қайшылықта болады. Бiр жағынан, олардың мiндетi - әр фактордың таза ықпалының өлшемiн анықтау болса, екiншi жағынан, ондай өлшем байланыс болмаған кезде ғана мүмкiн.

Корреляциялық байланыс теңдеуi нәтижелiк белгi өзгермесi мен факторлық белгi (белгiлер) өзгермесi арасындағы тәуелдiлiктi анықтайды. Байланыс тығыздығының өлшемдерi факторлық белгi (белгiлер) өзгермесiмен корреляциялық байланыста болатын нәтижелiк белгi өзгермесiнiң үлесiн көрсетедi.

Корреляциялық көрсеткiштердi орташа мәннен ауытқу өзгермесi (кеңiстiктегi айырмашылығы) терминiне сүйене отырып түсiндiруге болады. Егер зерттеу есебi жиынтықтағы екi белгi өзгермесiнiң арасындағы байланыс емес, объект белгiлерiнiң уақыт бойынша өзгерулерiн анықтайтын болса, корреляциялы-регрессиялық талдау әдiсi елеулi өзгерiстi қажет етедi.

Корреляциялық байланыстың қарапайым жүйесi екi белгi арасындағы сызықтық байланыс, яғни жұптық сызықты корреляция, болып табылады.

Оның практикалық мәнi нәтижелiк белгiге әсер ететiн барлық факторлардың iшiнен, негiзiнен нәтижелiк белгi өзгермесiн анықтайтын, бiр ғана маңызды факторды бөлiп алуға болатын жүйелердiң бар болуында. Жұптық корреляцияны табу күрделi, көп факторлы байланыстарды зерттеуде қажеттi кезеңдi құрайды. Кейбiр байланыс жүйелерiн зерттеу кезiнде жұптық корреляцияны қарастырған жөн. Сызықтық байланысқа көңiл қою айнымалылардың шектелген өзгермесiмен және көп жағдайда есептеулер жүргiзу үшiн сызықтық емес байланыстар сызықтық формаға түрлендiрiлетiнiмен түсiндiрiледi.

Корреляциялық байланыстың жұптық сызықты теңдеуi жұптық регрессиялық теңдеу деп аталады да келесi түрде жазылады:

мұндағы y х факторлық белгiнiң белгiлi мәнiне сәйкес нәтижелiк белгiнiң орташа мәнi ;

а — теңдеудiң бос мүшесi;

Ь — х факторлық белгiнiң оның орташа мәнiнен бiр бiрлiкке ауытқуы нәтижесiнде у нәтижелiк белгiнiң оның орташа мәнiнен орташа есеппен қанша бiрлiкке ауытқуын анықтайтын регрессия коэффициентi.