You are on page 1of 10

Teori statistik

Teori statistik menyediakan dasar bagi seluruh jajaran teknik, baik dalam desain penelitian dan analisis data , yang digunakan dalam aplikasi dari statistik . [1] [2] Teori ini mencakup pendekatan statistik-keputusan masalah dan statistik inferensi , dan tindakan dan pengurangan yang memenuhi prinsip-prinsip dasar yang dinyatakan untuk pendekatanpendekatan yang berbeda. Dalam pendekatan yang diberikan, teori statistik memberikan cara membandingkan prosedur statistik;. Dapat menemukan prosedur yang terbaik mungkin dalam konteks yang diberikan untuk masalah statistik tertentu, atau dapat memberikan panduan tentang pilihan antara prosedur alternatif Terlepas dari pertimbangan filosofis tentang bagaimana membuat kesimpulan statistik dan keputusan, banyak dari teori statistik terdiri dari statistik matematika , dan erat terkait dengan teori probabilitas , untuk teori utilitas , dan optimasi .

Ruang Lingkup
Teori statistik menyediakan alasan yang mendasari dan memberikan dasar yang konsisten untuk pilihan metodologi yang digunakan dalam statistik diterapkan Pemodelan

Model statistik menggambarkan sumber data dan dapat memiliki berbagai jenis formulasi sesuai dengan sumber-sumber dan untuk masalah yang sedang dipelajari. Masalah tersebut dapat berbagai macam:

Sampling dari suatu populasi finit Mengukur kesalahan pengamatan dan pemurnian prosedur Mempelajari statistik hubungan

Model statistik, sekali ditetapkan, dapat diuji untuk melihat apakah mereka menyediakan kesimpulan yang berguna untuk set data baru. Pengujian hipotesis dengan menggunakan data yang digunakan untuk menentukan model adalah suatu kesalahan, menurut ilmu alam dari Bacon dan metode ilmiah Peirce.
Pengumpulan data

Teori statistik menyediakan panduan untuk membandingkan metode pengumpulan data , di mana masalah ini adalah untuk menghasilkan data informatif menggunakan optimasi dan pengacakan sementara mengukur dan mengendalikan kesalahan pengamatan .Optimasi pengumpulan data mengurangi biaya data sementara memuaskan tujuan statistik, sedangkan pengacakan memungkinkan kesimpulan yang dapat diandalkan. Teori statistik menyediakan dasar untuk pengumpulan data yang baik dan penataan penyelidikan dalam topik:

Desain eksperimen untuk memperkirakan efek pengobatan, untuk menguji hipotesis, dan untuk mengoptimalkan respon. Survei sampel untuk menggambarkan populasi

Data Ringkasnya

Tugas meringkas data statistik dalam bentuk konvensional (juga dikenal sebagai statistik deskriptif ) dianggap dalam statistik teoritis sebagai masalah mendefinisikan apa aspek sampel statistik perlu dijelaskan dan seberapa baik mereka dapat digambarkan dari sampel biasanya terbatas data. Jadi masalah statistik teoritis mempertimbangkan meliputi:

Memilih ringkasan statistik untuk menggambarkan sampel Ringkasnya distribusi probabilitas data sampel sementara membuat asumsi terbatas tentang bentuk distribusi yang dapat dipenuhi Ringkasnya hubungan antara jumlah yang berbeda diukur pada item yang sama dengan sampel

Data Interpeting

Selain filosofi dasar inferensi statistik , teori statistik memiliki tugas mempertimbangkan jenis pertanyaan yang analis data mungkin ingin bertanya tentang masalah yang mereka sedang mempelajari dan menyediakan data teknik analitik untuk menjawab mereka. Beberapa tugas-tugas ini:

Ringkasnya populasi dalam bentuk distribusi dipasang atau fungsi probabilitas kepadatan Ringkasnya hubungan antara variabel menggunakan beberapa jenis analisis regresi Menyediakan cara memprediksi hasil dari suatu kuantitas acak diberikan variabel terkait lainnya Meneliti kemungkinan mengurangi jumlah variabel yang dipertimbangkan dalam masalah (tugas pengurangan Dimensi )

Ketika suatu prosedur statistik telah ditentukan dalam protokol penelitian, maka teori probabilitas statistik memberikan pernyataan didefinisikan dengan baik untuk metode saat diterapkan pada semua populasi yang bisa timbul dari pengacakan yang digunakan untuk menghasilkan data. Ini menyediakan cara yang obyektif parameter memperkirakan, memperkirakan interval keyakinan, pengujian hipotesis, dan memilih yang terbaik. Bahkan untuk data pengamatan, teori statistik memberikan cara untuk menghitung nilai yang dapat digunakan untuk menafsirkan data sampel dari suatu populasi, dapat menyediakan sarana untuk menunjukkan seberapa baik nilai yang ditentukan oleh sampel, dan dengan demikian sarana nilai-nilai yang sesuai mengatakan diturunkan untuk populasi yang berbeda adalah sebagai berbeda karena mereka mungkin tampak, namun keandalan kesimpulan dari post-hoc data pengamatan seringkali lebih buruk daripada yang direncanakan untuk generasi acak data. Terapan statistik inferensi Teori statistik menyediakan dasar untuk sejumlah metode data analitis yang umum di penelitian ilmiah dan sosial. Beberapa ini adalah: Data Menafsirkan merupakan tujuan penting dari penelitian statistik:

Memperkirakan parameter Pengujian hipotesis statistik Menyediakan berbagai nilai-nilai bukan sebuah estimasi titik Analisis regresi

Banyak metode standar untuk tugas-tugas tertentu bergantung pada asumsi statistik (dibuat dalam derivasi metodologi) benar-benar memegang dalam praktek. Teori statistik mempelajari konsekuensi dari keberangkatan dari asumsi ini. Selain itu menyediakan berbagai teknik statistik yang kuat yang kurang tergantung pada asumsi-asumsi, dan menyediakan metode memeriksa apakah asumsi-asumsi tertentu yang masuk akal untuk memberikan data-set.

Matematika statistik
Statistik matematika adalah studi tentang statistik dari sudut pandang matematika, dengan menggunakan teori probabilitas serta cabang lain dari matematika seperti aljabar linear dan analisis . Istilah "statistik matematika" berkaitan erat dengan istilah " teori statistik "tetapi juga mencakup pemodelan untuk ilmu aktuaria dan non-statistik teori probabilitas , terutama di Skandinavia . Statistik berhubungan dengan memperoleh informasi dari data. Dalam prakteknya, data yang sering mengandung beberapa keacakan atau ketidakpastian . Statistik menangani data tersebut dengan menggunakan metode teori probabilitas . Ilmu statistik berkaitan dengan perencanaan studi, terutama dengan desain eksperimen acak dan dengan perencanaan survei menggunakan random sampling . Analisis awal data dari penelitian benar acak sering mengikuti protokol penelitian. Tentu saja, data dari penelitian secara acak dapat dianalisis untuk mempertimbangkan hipotesis sekunder atau untuk menyarankan ide-ide baru. Sebuah analisis data sekunder dari studi yang direncanakan menggunakan alat-alat dari analisis data. Analisis data dibagi menjadi:

statistik deskriptif - bagian dari statistik yang menggambarkan data, yaitu merangkum data dan sifat khas mereka. statistik inferensial - bagian dari statistik yang menarik kesimpulan dari data (menggunakan beberapa model untuk data): Sebagai contoh, statistik inferensial melibatkan memilih model untuk data, memeriksa apakah data memenuhi kondisi model tertentu, dan dengan mengukur melibatkan ketidakpastian (misalnya menggunakan interval keyakinan ).

Sementara alat analisis data bekerja terbaik pada data dari studi acak, mereka juga diterapkan untuk data jenis lain --- misalnya, dari eksperimen alam dan studi observasi , dalam hal inferensi tergantung pada model yang dipilih oleh ahli statistik , dan sangat subjektif. [1] Statistik matematika telah terinspirasi oleh dan telah diperpanjang banyak prosedur dalam statistik diterapkan .

Statistik, matematika, dan statistik matematika


Statistik matematika telah tumpang tindih substansial dengan disiplin statistik . teori statistik belajar dan meningkatkan prosedur statistik dengan matematika, dan penelitian statistik seringkali menimbulkan pertanyaan matematika. Teori statistik bergantung pada probabilitas

dan teori keputusan . Matematikawan dan statistik seperti Gauss , Laplace , dan CS Peirce digunakan teori keputusan dengan distribusi probabilitas dan fungsi kerugian (atau fungsi utilitas ). Pendekatan teori keputusan untuk inferensi statistik adalah kebangkitan oleh Abraham Wald dan para penerusnya, dan membuat ekstensif menggunakan komputasi ilmiah , analisis , dan optimasi , karena desain eksperimen , statistik menggunakan aljabar dan kombinatorik .

Teori probabilitas
Teori probabilitas adalah cabang matematika yang berkaitan dengan probabilitas , analisis acak fenomena. Objek utama teori probabilitas adalah variabel acak , proses stokastik , dan peristiwa : abstraksi matematis non-deterministik peristiwa atau kuantitas terukur yang dapat berupa kejadian tunggal atau berkembang dari waktu ke waktu dalam mode tampaknya acak. Jika sebuah koin individu atau melemparkan gulungan dadu dianggap peristiwa acak, kemudian jika berkali-kali mengulangi urutan kejadian acak akan menunjukkan pola-pola tertentu, yang dapat dipelajari dan diprediksi. Dua hasil matematis representatif menggambarkan pola tersebut adalah hukum bilangan besar dan teorema limit sentral . Sebagai dasar matematika untuk statistik , teori probabilitas adalah penting untuk kegiatan manusia banyak yang melibatkan analisis kuantitatif set besar data. Metode teori probabilitas juga berlaku untuk deskripsi sistem yang kompleks hanya diberikan pengetahuan parsial negara mereka, seperti dalam mekanika statistik . Sebuah penemuan besar abad kedua puluh fisika adalah sifat probabilistik fenomena fisik pada skala atom, dijelaskan dalam mekanika kuantum .

Sejarah
Teori matematika probabilitas memiliki akar dalam upaya untuk menganalisis permainan kesempatan oleh Gerolamo Cardano pada abad keenam belas, dan dengan Pierre de Fermat dan Blaise Pascal pada abad ketujuh belas (misalnya " masalah poin "). Christiaan Huygens menerbitkan buku tentang subjek di 1657. Awalnya, teori probabilitas terutama dianggap peristiwa diskrit, dan metode terutama kombinatorial . Akhirnya, analitis pertimbangan memaksa penggabungan variabel kontinu menjadi teori. Hal ini memuncak dalam teori probabilitas modern, pada pondasi diletakkan oleh Andrey Nikolaevich Kolmogorov . Kolmogorov gabungan gagasan ruang sampel , diperkenalkan oleh Richard von Mises , dan mengukur teori dan disajikan nya sistem aksioma untuk teori probabilitas pada tahun 1933. Cukup cepat ini menjadi sebagian besar tak terbantahkan aksiomatik dasar bagi teori probabilitas modern, tetapi alternatif yang ada, khususnya penerapan terbatas daripada aditivitas dihitung oleh Bruno de Finetti .
Motivasi

Pertimbangkan sebuah eksperimen yang dapat menghasilkan sejumlah hasil. Pengumpulan dari semua hasil disebut ruang sampel percobaan. Para mengatur daya dari ruang sampel dibentuk dengan mempertimbangkan semua koleksi yang berbeda dari hasil yang mungkin. Sebagai contoh, rolling mati menghasilkan salah satu dari enam hasil yang mungkin. Salah

satu koleksi hasil yang mungkin sesuai untuk mendapatkan jumlah ganjil. Dengan demikian, subset {1,3,5} adalah elemen dari kekuatan set ruang sampel gulungan mati. Koleksi-koleksi ini disebut peristiwa. Dalam hal ini, {1,3,5} adalah peristiwa yang mati jatuh pada beberapa nomor ganjil. Jika hasil yang sebenarnya terjadi jatuh dalam acara tertentu, acara yang dikatakan telah terjadi. Probabilitas adalah cara menetapkan setiap "event" nilai antara nol dan satu, dengan syarat bahwa acara terdiri dari semua hasil yang mungkin (dalam contoh kita, peristiwa {1,2,3,4,5,6}) diberi nilai satu. Untuk memenuhi syarat sebagai distribusi probabilitas , penugasan nilai harus memenuhi persyaratan bahwa jika Anda melihat koleksi peristiwa saling eksklusif (peristiwa yang tidak mengandung hasil umum, misalnya, peristiwa {1,6}, {3}, dan { 2,4} semua saling eksklusif), probabilitas bahwa setidaknya salah satu peristiwa akan terjadi diberikan oleh jumlah probabilitas dari semua peristiwa individu. [4] Probabilitas bahwa salah satu dari peristiwa {1,6}, {3}, atau {2,4} akan terjadi adalah 5 / 6. Ini adalah sama dengan mengatakan bahwa probabilitas dari peristiwa {1,2,3,4,6} adalah 5 / 6. Acara ini meliputi kemungkinan setiap nomor kecuali lima sebagai digulung. Acara saling eksklusif {5} memiliki probabilitas 1 / 6, dan acara {1,2,3,4,5,6} memiliki probabilitas dari 1 - kepastian yang mutlak. Demi kenyamanan, kami mengabaikan kemungkinan bahwa mati, setelah digulung, akan dilenyapkan sebelum dapat memukul meja. Teori probabilitas diskrit kesepakatan dengan peristiwa-peristiwa yang terjadi pada dihitung ruang sampel. Contoh: Membuang dadu , percobaan dengan deck kartu , dan berjalan secara acak . Definisi klasik: Awalnya probabilitas dari suatu peristiwa terjadi didefinisikan sebagai jumlah kasus yang menguntungkan untuk acara tersebut, atas jumlah total yang mungkin hasil dalam ruang sampel equiprobable: lihat definisi probabilitas klasik . Sebagai contoh, jika acara ini "terjadinya angka bahkan ketika mati adalah digulung", probabilitasnya diberikan oleh , Sejak 3 wajah dari 6 bahkan angka dan wajah masing-masing memiliki probabilitas yang sama untuk tampil. Definisi modern: definisi modern dimulai dengan himpunan berhingga atau dihitung disebut ruang sampel , yang berhubungan dengan himpunan semua hasil yang mungkin dalam arti klasik, dinotasikan dengan . Hal ini kemudian diasumsikan bahwa untuk setiap elemen , Sebuah intrinsik "probabilitas" nilai berikut:
1. 2.

terpasang, yang memenuhi sifat-sifat

Artinya, fungsi probabilitas f (x) terletak antara nol dan satu untuk setiap nilai x dalam ruang sampel , dan jumlah dari f (x) atas seluruh nilai x dalam ruang sampel adalah sama dengan 1. Sebuah acara didefinisikan sebagai subset dari ruang sampel . Probabilitas acara didefinisikan sebagai

Jadi, probabilitas dari ruang sampel keseluruhan adalah 1, dan probabilitas dari peristiwa nol 0. Fungsi pemetaan titik dalam ruang sampel dengan nilai "probabilitas" disebut fungsi massa probabilitas disingkat sebagai PMF. Definisi modern tidak mencoba untuk menjawab bagaimana fungsi massa probabilitas diperoleh, melainkan membangun sebuah teori yang mengasumsikan keberadaan mereka.
distribusi probabilitas kontinyu Artikel utama: distribusi probabilitas kontinu

Teori probabilitas kontinu berhubungan dengan peristiwa yang terjadi dalam ruang sampel kontinu. Definisi klasik: Definisi klasik rusak ketika dihadapkan dengan kasus kontinu. Lihat paradoks Bertrand . Definisi modern: Jika ruang hasil dari suatu variabel acak X adalah himpunan bilangan real ( ) Atau subset darinya, maka fungsi yang disebut fungsi distribusi kumulatif (CDF atau) ada, ditetapkan oleh . Yaitu, F (x) mengembalikan probabilitas bahwa X akan kurang dari atau sama dengan x. CDF harus memenuhi sifat-sifat berikut.
1. 2. 3. adalah monoton non-menurun , kanan terus menerus fungsi;

Jika adalah benar-benar berkelanjutan , yaitu, turunannya ada dan mengintegrasikan derivatif memberi kita cdf kembali lagi, maka variabel acak X dikatakan memiliki fungsi probabilitas densitas atau kepadatan pdf atau hanya Untuk menetapkan , Probabilitas dari variabel acak X berada di adalah

Dalam hal fungsi kepadatan probabilitas ada, ini dapat ditulis sebagai

Sedangkan pdf hanya ada untuk variabel acak kontinu, CDF ada untuk semua variabel acak (termasuk variabel acak diskrit) yang mengambil nilai-nilai dalam Konsep-konsep ini dapat digeneralisasi untuk multidimensi kasus pada kontinu.
Mengukur-teori teori probabilitas

dan ruang sampel

Raison d'etre dari perlakuan ukuran-teori probabilitas adalah bahwa ia menyatukan diskrit dan kasus terus menerus, dan membuat perbedaan pertanyaan yang mengukur digunakan. Selain itu, mencakup distribusi yang diskrit maupun kontinu baik atau campuran dari keduanya. Sebuah contoh dari distribusi tersebut dapat campuran distribusi diskrit dan kontinumisalnya, variabel acak yang adalah 0 dengan probabilitas 1 / 2, dan mengambil nilai acak dari distribusi normal dengan probabilitas 1 / 2. Hal ini masih dapat dipelajari sampai batas tertentu dengan mempertimbangkan untuk memiliki pdf dari ( [x] + (x)) / 2, dimana [x] adalah fungsi delta Dirac . Distro lain bahkan mungkin tidak campuran, misalnya, distribusi penyanyi tidak memiliki probabilitas positif untuk setiap titik tunggal, juga tidak memiliki kepadatan. Pendekatan modern untuk teori probabilitas memecahkan masalah ini menggunakan mengukur teori untuk mendefinisikan ruang probabilitas : Mengingat mengatur didefinisikan pada , (Juga disebut ruang sampel) dan -aljabar disebut ukuran probabilitas jika di atasnya, ukuran

Jika adalah -aljabar Borel pada set bilangan real, maka ada ukuran probabilitas yang unik pada untuk setiap cdf, dan sebaliknya. Ukuran sesuai dengan cdf dikatakan disebabkan oleh CDF. Langkah ini bertepatan dengan PMF untuk variabel diskrit, dan pdf untuk variabel kontinyu, membuat pendekatan teori pengukuran bebas dari kekeliruan. Probabilitas dari suatu himpunan dalam aljabar didefinisikan sebagai

di mana integrasi ini dengan hormat untuk mengukur

diinduksi oleh

Seiring dengan menyediakan pemahaman yang lebih baik dan penyatuan probabilitas diskrit dan kontinu, mengukur-teori pengobatan juga memungkinkan kita untuk bekerja pada probabilitas luar , Seperti dalam teori proses stokastik . Sebagai contoh untuk mempelajari gerak Brown , probabilitas didefinisikan pada ruang fungsi. Probabilitas distribusi Variabel acak tertentu terjadi sangat sering dalam teori probabilitas karena mereka juga menjelaskan proses alam atau fisik banyak. Distribusi mereka karena telah mendapatkan kepentingan khusus dalam teori probabilitas. Beberapa distribusi diskrit mendasar adalah

seragam diskrit , Bernoulli , binomial , binomial negatif , Poisson dan distribusi geometrik . Distribusi kontinu penting adalah seragam kontinyu , yang normal , eksponensial , gamma dan distribusi beta .

Konvergensi variabel acak


Artikel utama: Konvergensi variabel acak

Dalam teori probabilitas, ada beberapa pengertian konvergensi untuk variabel acak . Mereka terdaftar di bawah ini dalam urutan kekuatan, yaitu, setiap gagasan berikutnya konvergensi dalam daftar menyiratkan konvergensi sesuai dengan semua gagasan sebelumnya.
Lemah konvergensi: Sebuah urutan variabel acak konvergen lemah untuk

variabel acak jika fungsinya masing-masing distribusi kumulatif konvergen ke fungsi distribusi kumulatif dari , Dimanapun yang terus menerus . Konvergensi lemah juga disebut konvergensi dalam distribusi. Notasi paling umum tangan pendek: Konvergensi dalam probabilitas: Urutan variabel acak menuju variabel acak untuk setiap > 0. kemungkinan besar jika dikatakan konvergen

Notasi paling umum tangan pendek: Kuat konvergensi: Urutan variabel acak variabel acak kuat jika dikenal sebagai konvergensi hampir yakin. Notasi paling umum tangan pendek: dikatakan konvergen menuju . Konvergensi yang kuat juga

Sebagai nama menunjukkan, konvergensi lemah lebih lemah dari konvergensi yang kuat. Bahkan, konvergensi yang kuat menyiratkan konvergensi dalam probabilitas, dan konvergensi dalam probabilitas menunjukkan konvergensi lemah. Pernyataan sebaliknya tidak selalu benar.

Hukum jumlah besar


Intuisi umum menunjukkan bahwa jika sebuah koin yang adil dilempar berkali-kali, maka kira-kira setengah dari waktu itu akan muncul kepala, dan setengah lainnya itu akan menghasilkan ekor. Selanjutnya, lebih sering koin dilempar, semakin besar kemungkinan itu harus bahwa rasio jumlah kepala dengan jumlah ekor akan mendekati persatuan. Probabilitas modern menyediakan versi resmi dari ide intuitif, yang dikenal sebagai hukum jumlah besar. Hukum ini luar biasa karena itu adalah tempat yang diasumsikan dalam teori dasar probabilitas, melainkan muncul dari dasar-dasar sebagai sebuah teorema. Karena link probabilitas secara teoritis turunan untuk frekuensi kejadian aktual mereka di dunia nyata, hukum jumlah besar dianggap sebagai pilar dalam sejarah teori statistik. [5]

Hukum jumlah besar (LLN) menyatakan bahwa rata-rata sampel

dari urutan independen dan terdistribusi secara identik variabel acak X k konvergen menuju harapan bersama mereka, asalkan harapan | X k | adalah terbatas. Hal ini dalam berbagai bentuk konvergensi dari variabel acak yang memisahkan lemah dan hukum yang kuat jumlah besar

Ini mengikuti dari LLN bahwa jika suatu peristiwa probabilitas p diamati berulang kali selama percobaan independen, rasio frekuensi yang diamati dari peristiwa itu untuk jumlah pengulangan terhadap p konvergen. Misalnya, jika adalah independen variabel acak Bernoulli mengambil nilai 1 dengan probabilitas p dan 0 dengan probabilitas 1 - p, maka E (Y i) = p untuk semua i, sehingga konvergen untuk p hampir pasti .

Teorema limit Tengah


"Teorema limit sentral (CLT) adalah salah satu hasil besar matematika." Ini menjelaskan terjadinya mana-mana dari distribusi normal di alam. Teorema menyatakan bahwa rata-rata dari banyak variabel acak independen dan terdistribusi secara identik dengan varians yang terbatas cenderung ke arah distribusi normal terlepas dari distribusi diikuti oleh variabel acak asli. Secara formal, biarkan variabelvariabel acak independen dengan maksud dan varians Kemudian urutan variabel acak

konvergen dalam distribusi ke standar normal variabel acak.

TOKOH RISET STATISTIK Erich Leo Lehmann (20 November 1917-12 September 2009) adalah seorang Amerika statistik , yang memberikan kontribusi untuk statistik dan nonparametrik pengujian hipotesis . Dia adalah salah satu eponyms dari teorema Lehmann-Scheffe dan dari penaksir HodgesLehmann dari median dari populasi.

Lehmann memperoleh gelar MA pada tahun 1942 dan gelar PhD pada tahun 1946, di University of California , di mana dia diajarkan dari 1942. Selama 1944-1945 ia bekerja sebagai analis untuk Amerika Serikat Angkatan Udara . Ia mengajar di Columbia University dan di Princeton University selama 1950-1951, dan kemudian selama 1951-1952 ia menjadi profesor tamu di Universitas Stanford . Dia adalah editor dari "The Annals of Statistics matematika" dan presiden Institute of Statistics matematika , dan anggota American Academy of Arts dan Ilmu Pengetahuan dan National Academy of Science . Pada tahun 1997, pada kesempatan ulang tahun kedelapan puluh, departemen statistik di University of California di Berkeley menciptakan Erich Lehmann Dana dalam Statistik untuk mendukung mahasiswa departemen.

You might also like