6 Agustus 2013

SEJARAH STATISTIKA

A.           Awal Mula Istilah Statistika
Istilah “Statistika” sebenarnya berasal dari bahasa Latin modern, statisticum collegium, yang berarti “dewan negara”, dan dari bahasa Italia, statista, yang berarti “negarawan” atau “politikus”. Gottfried Achenwall yang disebut-sebut sebagai orang pertama yang menggunakan istilah tersebut. Ia, pada tahun 1749, menggunakan istilah “Statistik” dalam bahasa Jerman dalam tulisannya yang berjudul Staatsverfassung der heutigen vornehmsten Europäischen Reiche und Völker im Grundrisse. Dalam tulisannya tersebut ia memberi nama “Statistik” sebagai nama bagi kegiatan analisis data kenegaraan, dengan mengartikannya sebagai “ilmu tentang negara (state)”. Para ekonom Jerman menyebut dia sebagai “Bapak Statistika”. Namun para penulis Inggris tidak setuju dengan hal ini. Di Inggris sendiri, terdapat Sir John Sinclair yang merupakan orang pertama yang menggunakan istilah “Statistics” dalam bahasa Inggris. Ia memperkenalkan istilah “Statistics” dalam tulisannya, Statistical Account of Scotland, yang diterbitkan dalam 21 volume (1791-1799). Pada volume XX, halaman xiii, Sir John Sinclair menulis, “Many people were at first surprised at my using the words “statistical” and “statistics”, as it was supposed that some in our own language might have expressed the same meaning. But in the course of a very extensive tour through the northern parts of Europe, which I happened to take in 1786, I found that in Germany they were engaged in a species of political enquiry to which they had given the name “statistics,” and though I apply a different meaning to that word—for by “statistical” is meant in Germany an inquiry for the purposes of ascertaining the political strength of a country or questions respecting matters of state—whereas the idea I annex to the term is an inquiry into the state of a country, for the purpose of ascertaining the quantum of happiness enjoyed by its inhabitants, and the means of its future improvement; but as I thought that a new word might attract more public attention, I resolved on adopting it, and I hope it is now completely naturalised and incorporated with our language.” Dari tulisannya tersebut, terbukti kalau Sir John Sinclair mengadopsi kata “Statistics” yang dia ketahui ketika melakukan perjalanan ke Jerman. Namun terdapat perbedaan antara keduanya. Di Jerman, istilah itu merujuk kepada suatu metode yang digunakan dalam hal politik dan kenegaraan, seperti misalnya untuk mengukur kekuatan politik dan menganalisis data-data kenegaraan. Sir John Sinclair menggunakan istilah ini (statistics) sebagai suatu metode untuk mengumpulkan data atau fakta di lapangan yang bersifat numerik. Jadi awalnya, statistika digunakan dalam ranah perpolitikan untuk menganalisis data kenegaraan dan menjadi bergeser artinya sebagai metode untuk mengumpulkan data lapangan yang bersifat numerik.

B.            Awal Mula Perkembangan Statistika
Perkembangan statistika diawali sebagai suatu ilmu yang membahas cara-cara mengumpulkan angka sebagai hasil pengamatan menjadi bentuk yang lebih mudah dipahami. Contoh tertua mengenai hal ini dapat diambil dari zaman Kaisar Agustus yang membuat pernyataan bahwa seluruh dunia harus dikenai pajak, sehingga setiap orang harus melapor kepada statistikawan terdekat, yang saat itu disebut sebagai pengumpul pajak. Peristiwa lain di dalam sejarah yang dapat dikemukakan ialah sewaktu William I dari Inggris memerintahkan mengadakan pencacahan jiwa dan kekayaan di seluruh wilayah Inggris dan Wales untuk pengumpulan pajak dan tugas militer. Semua pengamatan dicatat di dalam sebuah buku yang dikenal dengan Domesday Book. Dari keperluan semacam ini timbullah teknik pencatatan angka-angka pengamatan dalam bentuk daftar dan grafik. Bagian statistika yang membicarakan cara mengumpulkan dan menyederhanakan angka-angka pengamatan ini dikenal sebagai statistika deskriptif. Statistika deskriptif dapat berkembang tanpa memerlukan dasar matematika yang kuat, selain kecermatan dalam teknik berhitung. Sejak tahun 1700-an analisis data yang dilakukan secara deskriptif berdasarkan tabel-tabel frekuensi, rataan, dan ragam untuk sampel (contoh) ukuran besar. Kemudian pada tahun 1800-an merupakan awal penggunaan grafik-grafik untuk penyajian data, seperti histogram, sejalan dengan penemuan sebaran (kurva) Normal. Florence Nightingale adalah seorang perawat yang terkenal dengan inovasi di bidang ilmu keperawatan dan merupakan pelopor dalam penyajian data secara grafik. Selama perang Krimea, Nightingale mengumpulkan data dan membuat sistem pencatatan. Dari data tersebut dapat ditentukan tingkat mortalitas yang dapat menunjukkan hasil perbaikan kondisi kesehatan yang cenderung menurunkan tingkat kematian. Selanjutnya data-data tersebut disajikan dalam bentuk grafik yang merupakan suatu inovasi statistika (deskriptif) di masa tersebut. Dalam statistika deskriptif tidak ada perbedaan antara data yang diperoleh dari sampel dengan populasinya, kemudian apa yang dihitung dari sampel digunakan untuk menandai populasi. Pada taraf selanjutnya orang tidak puas hanya mengumpulkan angka-angka pengamatan saja. Mereka juga tidak puas bahwa yang diperoleh dari sampel digunakan untuk mencirikan populasi. Timbullah usaha-usaha untuk memperbaiki kesimpulan dalam melakukan ramalan-ramalan populasi berdasarkan angka-angka statistik yang dikumpulkan dari sampel tersebut. Bagian ilmu yang membahas cara-cara mengambil kesimpulan berdasarkan angka-angka pengamatan dinamakan statistik induktif.

C.           Sejarah Perkembangan Statistika Induktif
Awal perkembangan statistik induktif terjadi pada peralihan abad ke 19 ke abad 20 dengan Karl Pearson (1857 – 1936) sebagai pelopornya. Masa ini merupakan titik awal perkembangan statistika modern. Pada abad ke 19 Karl Pearson menerapkan statistika pada biologi yang diterbitkan dalam jurnal Biometrika. Dari tahun 1893 sampai 1912 Karl Pearson telah menulis 18 paper yang berjudul konstribusi matematika ke teori evolusi yang berbasiskan analisis regresi dan koefisien korelasi. Pearson menciptakan istilah standard deviation (simpangan baku) pada tahun 1893. Dalam statistika deskriptif Pearson juga memperkenalkan ukuran penyimpangan terhadap distribusi data yang simetrik yang disebut koefisien kemiringan dan kurtosis. Pada tahun 1900 Karl Pearson menemukan uji Khi-Kuadrat untuk tabel kontigensi 2 arah. Dalam menarik kesimpulan tentang korelasi dan uji khi-kuadrat. Pearson menggunakan sampel besar (n>1000). Analisis data yang digunakan Pearson mengasumsikan data menyebar Normal. Sehingga pada Biometrika vol. 1 yang terbit tahun 1901 sebagian besar penelitiannya menggunakan ukuran contoh besar.
Sebelum tahun 1912 sedikit sekali penemuan dibidang pengujian hipotesis sampai akhirnya W.S. Gosset (1876 – 1937) memperkenalkan uji t-student untuk sampel kecil. Gosset adalah seorang mahasiswa dari Karl Pearson pada awalnya adalah seorang ahli kimia yang bekerja di perusahaan bir Guinness di Dublin. Gosset menemukan uji-t untuk menangani sampel-sampel kecil untuk quality control di perusahaan bir tersebut. Dia menerbitkan papernya dengan nama student pada jurnak Biometrika 1908 untuk menghindari larangan dari perusahaan bagi karyawannya yang menulis didalam sebuah jurnal. Bentuk sebaran secara matematis yang digunakan Gosset tersebut sebenarnya telah ditemukan oleh astronom Jerman Jakob Luroth pada tahun 1875. Gosset menggunakan data hasil pengukuran terhadap tinggi dan jari tengah tangan kiri 3000 narapidana yang dipublikasikan pada volume pertama Biometrika. Dengan metode Monte carlo dipilih 750 sampel yang berukuran 4 dan diperoleh distribusi data yang mendekati distribusi teotriknya. Sebaran t-student banyak dipakai sebagai acuan dalam menduga parameter rataan ukuran contoh kecil (n < 30).
Metode estimasi parameter populasi yang digunakan sebelum tahun 1912 adalah metode kuadrat terkecil yang dikemukakan oleh Gauss dan metode deviasi mutlak terkecil yang dikemukakan Laplace. Kedua metode ini digunakan untuk mengestimasi parameter dalam model linier. Kemudian karl Pearson memperkenalkan metode momen untuk estimasi parameter pada tabel frekuensi. Statistik induktif mulai berkembang pesat setelah R.A Fisher (1890 – 1962) menulis paper yang sangat terkenal pada tahun 1922 yaitu On the Mathematical Foundation of theoritical Statistics (Mallows, 1998). Fisher memperkenalkan istilah specification untuk mengidentifikasi 3 problem yang muncul pada reduksi data, yaitu:

1. Spesifikasi dari jenis populasi, yaitu bentuk matematis dari populasi yang mencakup parameter yang tidak
   diketahui,
2. Estimasi, yaitu pemilihan metode statistik untuk mengestimasi parameter dari populasi, dan
3. Sebaran, yaitu sebaran statistik dari contoh atau sampel.

Tulisan tersebut memperkenalkan suatu metode yang tekenal dengan nama Maximum Likelihood yang digunakan untuk estimasi dan pengujian hipotesis. Pada tahun 1925 terbit buku Statistical methods for Research Workers karangan Fisher yang berisi rancangan percobaan dan anilisis varians di bidang biologi. Fisher yang cara berfikirnya dipengaruhi aliran statistika yang dianut Karl Pearson, yaitu penarikan kesimpulan didasarkan pada model peluang (model-driven) merupakan promotor penggunaan cara-cara statistika di dalam bidang-bidang ilmu pertanian, biologi dan genetika. Untuk jasanya ini Fisher dianugerahi gelar Baronet oleh Ratu Inggris, sehingga ia berhak menggunakan nama Sir Ronald Fisher. Konstribusi Fisher membuat cakupan metode pengembangan yang sesuai untuk sampel kecil, seperti Gosset, penemuan presisi sebaran dari beberapa statistik sampel dan penemuan analisis varians. Fisher merekomendasikan maksimun likelihood, yang digunakan untuk estimasi dan pengujian hipotesis. Fisher dianggap penemu statistika modern karena konstribusinya yang sangat penting dan dianggap sebagai pemikir ulung tempaaan abad kedua puluh. Para era Fisher, seorang pemikir Rusia Jerzy Neyman (1894 – 1981) juga dipandang sebagai penemu besar dari statistika modern karena konstribusinya dalam mengembangkan teori peluang, uji hipotesis, selang kepercayaan, dan matematika statistik. Neyman bekerjasama dengan Egon Pearson (anak Karl Pearson) mengembangkan teori-teorinya yang terkenal adalah Teorema Neyman-Pearson (1936). Selain itu Neyman juga mengembangkan teori sampling survey pada tahun 1934. Pada tulisan Fisher (1915) mengemukakan representasi geometrik data peubah-ganda dua (bivariat) untuk menurunkan distribusi sampling bersama dari penduga matriks varians-kovarians. Pada tahun 1928 Wishart menggunakan metode yang sama untuk menurunkan distribusi bersama dari penduga matriks varians-kovarians untuk sebaran normal ganda (Multivariat Normal) yang akhirnya populer dengan distribusi Wishart. Pada tahun 1836, Fisher membuka area baru penelitian yang disebut fungsi diskriminan yang pada awalnya untuk menjawab pertanyaan yang diajukan oleh ahli antropologi yaitu untuk menentukan jenis kelamin dari pemilik tengkorak yang mempunyai ukuran-ukuran tertentu. Fungsi diskriminan untuk membedakan kedua jenis kelamin ini populer dengan nama fungsi linear diskriminan Fisher (LDF) untuk 2 grup dan merupakan salah satu metode pada analisis peubah ganda. Calyampudi Radhakrishnan Rao (1920 – ) adalah mahasiswa bimbingan dari Fisher. Rao bekerja di mesium antropolgi sambil menyelesaikan Ph.D tahun 1948. Tahun 1946 Rao mengembangkan fungsi diskriminan linear Fisher untuk klasifikasi dengan banyak grup. Selain itu Rao juga berkonstribusi dalam mengembangkan matematika statistik dengan teorinya yang terkenal pertidaksamaan Rao-Cramer dan teorema Rao-Blackwell yang dikemukakan secara terpisah oleh Rao pada tahun 1945 dan Blackwell pada tahun 1947. Salah satu buku karangan Rao yang tekenal adalah Linear Statistical Inference yang telah diterjemahkan ke dalam 6 bahasa. Prasantha Chandra Mahalanobis (1893 – 1972) berkonstribusi dalam mengembangkan analisis peubah-ganda. Salah satu kontribusinya yang besar adalah jarak Mahalanobis (D-statistik) yang merupakan ukuran jarak untuk data dengan variabel banyak yang digunakan dalam analisis klasifikasi. Mahalanobis juga pendiri jurnal statistik India yang sangat terkenal bernama Sankya. Pada tahun 1931 Mahalanobis mendirikan Indian Statistical India dengan salah satu divisinya bernama National Sample Survey (NSS) yang bertugas mengumpulkan data sosioekonomik dan demografi di seluruh India. Divisi ini membuat Mahalanobis mempunyai peranan penting dalam perencanaan ekonomi di India dan akhirnya NSS sekarang berfungsi sebagai bagian penting dari Ministry of Planing. Pada tahun 1931 Hoteling memperkenalkan statistik T2 yang merupakan generalisasi dari statistik t-student untuk menguji hipotesis nilai tengah pada data peubah-ganda. Distribusi tak nol dari T2 adalah sama dengan Mahalanobis-Distance yang mempunyai tujuan berbeda ditemukan oleh Bose dan Roy pada tahun 1938.
Seperti telah disebutkan bahwa aliran yang dianut Karl Pearson, Gosset dan R.A Fisher mendasarkan kesimpulan pada jenis sebaran populasi tidak dipenuhi maka perlu dilakukan transformasi data, salah satunya adalah transformasi pangkat yang ditemukan oleh Box dan Cox tahun 1964, sehingga dikenal dengan nama transformasi Box-Cox. Dilain pihak pada tahun 1945 Frank Wilcoxon memperkenalkan metode statistik non parametrik yang bebas dari sebaran populasi yang sekarang dikenal dengan Uji Tanda Peringkat. Seperti tahun 1952 W.H. Kruskal dan W.A Wallis memperkenalkan uji non parametrik yang berpadanan dengan uji kesamaan mean pada analisis varians yang dikenal dengan nama Uji Kruskal-Wallis. Pada tahun 1958 Kaplan menggunakan metode non parametrik untuk pendugaan sekuensial.
Pada akhirnya dengan adanya perkembangan teknologi komputer metode eksplorasi data berkembang pesat sekitar tahun 1970. J.W. Tukey (1915 – ) mempunyai konstribusi besar dalam pengembangan metode eksplorasi baik secara grafis maupun numerik. Beberapa penemuannya adalah diagram dahan-daun dan diagram kotak garis. Pada pertengahan 1970 Elfron memperkenalkan Metode Bootstrap untuk menduga parameter dari sebaran yang tidak diketahui bentuknya. Bootstrafing ini merupakan teknik modifikasi dari Jacknife yang diperkenalkan oleh Queneuille pada tahun 1948. Berhubung metode ini pada awalnya tidak membobotkan model peluang, tetapi berbasis pada data, bootstrap dikenal sebagai data driven approach. Pada dekade 80-an perkembangan metode non parametrik mulai sering digunakan seperti pada regresi non paramametrik, estimasi distribusi dengan kernel, dan neural network.

D.           Perkembangan Statistika Di Abad 21
Karl Pearson, Fisher, Neyman dan Wald selama setengah abad telah meletakkan dasar statistika yang berbasis matematika, sehingga penelitian-penelitian dan kuliah-kuliah statistika di Perguruan Tinggi umumnya didasarkan pada beberapa pedoman atau dasar yang ditemukan oleh tokoh-tokoh tersebut. Penggunaan statistika secara luas, terkadang timbul kontroversi diantara para ahli tentang pemilihan model data, penggunakan prior probability dan interpretasi hasil. Hasil analisis terhadap data yang sama dengan lain konsultan statistika dimungkinkan terjadi perbedaan kesimpulan. Statistika induktif dapat dipakai untuk menangani masalah dimana perolehan data dirasakan perlu efesiensi atau perlu biaya mahal., sehingga umumnya dapat diatasi dengan analisis dengan sampel-sampel ukuran kecil.
Di era millenium dengan dominasi teknologi informasi, data base yang besar, interaksi dengan komputer dan informasi yang kompleks, maka menurut C.R. rao dalam tulisannya 14 Nopember 2001 (berjudul Has Statistics a future? If So in What Form?) statistika yang didasarkan pada model-model probabilistik tidak mencukupi, sehingga metode-metode yang akan muncul diarahkan untuk menjawab tantangan zaman yang diberi nama data mining. Istilah data mining (penambangan data) ini menurut Nasoetion (2002) awalnya berasal dari para ahli ilmu komputer yang dalam sehari-harinya bekerja dalam dunia kecerdasan buatan. Untuk pekerjaan ini mereka membangkitkan dan mengumpulkan data dalam ukuran sangat besar dan mencoba menemukan pola-pola keteraturan data yang dapat diterangkan. Pada abad 21 diperkirakan metode data mining merupakan metode yang akan banyak digunakan dalam berbagai bidang terapan. Pada metode data mining spesifikasi permasalahan didasarkan pada bidang ilmunya lebih diutamakan daripada pendugaan parameter sehingga masalah tersebut dapat diformulasikan dengan benar untuk memperoleh solusi yang tepat melalui eksplorasi data. Hal ini berbeda dengan periode Fisher yang lebih mementingkan mencari metode pendugaan dan pendekatan sebaran yang tepat, sehingga spesifikasi permasalahan lebih diutamakan pada pendugaan parameter dan asumsi sebaran. Jadi Fisherian Statistic itu sebenarnya model driven yang agak beda dengan data mining yang lebih bersifat data driven. Akan tetapi pada pelaksanaannya, kedua “driven” tersebut harus dikuasai ini akan berpengaruh terhadap model pendidikan dan pengajaran statistika dewasa ini. Emanuel Parzen (Departement of statistics Texas A & M University College) baru-baru ini menulis tentang “Data Mining, Statistical Methods Mining and History of Statistics”. Dalam tulisannya tersebut dibahas juga masalah pendidikan statistika menghadapi masa depan dimana data mining akan berkembang, seperti bagaimana cara mengajar matematik statistik untuk non matematik statistik, materi yang berhubungan dengan komputer seperti teknik simulasi, analisis numerik, analisis data struktur data perlu ditingkatkan bagi para mahasiswa. Belum adanya standard analisis untuk eksplorasi data dalam data ukuran besar inilah diperkirakan, metode data mining akan banyak dikembangkan dan diteliti oleh para pakar statistika.

E.            Sejarah Statistik Di Indonesia
Gottfried Achenwall (1749) menggunakan Statistik dalam bahasa Jerman untuk pertama kalinya sebagai nama bagi kegiatan analisis data kenegaraan, dengan mengartikannya sebagai “ilmu tentang negara (state)”. Pada awal abad ke-19 telah terjadi pergeseran arti menjadi “ilmu mengenai pengumpulan dan klasifikasi data”. Sir John Sinclair memperkenalkan nama (Statistics) dan pengertian ini ke dalam bahasa Inggris. Jadi, statistika secara prinsip mula-mula hanya mengurus data yang dipakai lembaga-lembaga administratif dan pemerintahan. Pengumpulan data terus berlanjut, khususnya melalui sensus yang dilakukan secara teratur untuk memberi informasi kependudukan yang berubah setiap saat. Di Indonesia statistic lahir sejak zamna penjajahan. Sesuai dengan tujuannya pada zaman penjajahan statistic di Indonesia di arahkan untuk perdagangan denga tujuan untuk mencari keuntungan yang sebesar-besar nya bagi penjajah. Keberadaan VOC di Indonsia boleh di anggap sebagai printis statistic colonial yang selanjutnya diteruskan oleh Belanda. Pada tahun 1864 pemerintahan Belanda mendirikan kantor statistic yang pertama di Indonesia . kantor ini adalah bagian dari kantor Algemene Secretarie yang berpusat di Nederland. Selanjutnya pada tahun 1870 , bagian tersebut dipindahkan pada Dapartemen Algemeen Beustuur. Pengumuman – pengumuman statistic dimuat dalam buku tahunan ketatanegaraan dan perekonomian yang dikeluarkan oleh Lembaga Statistik di Belanda. Pada tahun 1920 berdirilah kantor cacah jiwa. Kantor ini bertugas menghitung jumlah warga (sensus). Bersamaan dengan itu pula berdirilah kantor statistic pertanian , kerajinan dan perdagangan termasuk dalam statistic ekspor dan impor. Kantor statistic pertanian , perdagangan , dan kerajinan berdiri di Bogor , namun pada tahun 1925 dupindahkan ke Jakarta. Sejak saat itu resmi menjadi Kantor Pusat Statistikdan sampai sekarang disebut Badan Pusat Statistik. Distikan dengan penyempurnaan pada perstatistik yang sudah ada , system prastatistikan di Indonesia saat ini disusun berdasarkan Undang-Undang Statistik No. 7 Tahun 1960 , dari Peraturan Pemerintah Republik Indonesia No. 6 tahun 1980 tentang organisasi Biro Pusat Statistik.

0 komentar:

Posting Komentar