Istilah
“Statistika” sebenarnya berasal dari bahasa Latin modern, statisticum
collegium, yang berarti “dewan negara”, dan dari bahasa Italia, statista, yang
berarti “negarawan” atau “politikus”. Gottfried Achenwall yang disebut-sebut
sebagai orang pertama yang menggunakan istilah tersebut. Ia, pada tahun 1749,
menggunakan istilah “Statistik” dalam bahasa Jerman dalam tulisannya yang
berjudul Staatsverfassung der heutigen vornehmsten Europäischen Reiche und
Völker im Grundrisse. Dalam tulisannya tersebut ia memberi nama “Statistik”
sebagai nama bagi kegiatan analisis data kenegaraan, dengan mengartikannya
sebagai “ilmu tentang negara (state)”. Para ekonom Jerman menyebut dia sebagai
“Bapak Statistika”. Namun para penulis Inggris tidak setuju dengan hal ini. Di
Inggris sendiri, terdapat Sir John Sinclair yang merupakan orang pertama yang
menggunakan istilah “Statistics” dalam bahasa Inggris. Ia memperkenalkan
istilah “Statistics” dalam tulisannya, Statistical Account of Scotland, yang
diterbitkan dalam 21 volume (1791-1799). Pada volume XX, halaman xiii, Sir John
Sinclair menulis, “Many people were at first surprised at my using the words
“statistical” and “statistics”, as it was supposed that some in our own
language might have expressed the same meaning. But in the course of a very
extensive tour through the northern parts of Europe, which I happened to take
in 1786, I found that in Germany they were engaged in a species of political
enquiry to which they had given the name “statistics,” and though I apply a
different meaning to that word—for by “statistical” is meant in Germany an
inquiry for the purposes of ascertaining the political strength of a country or
questions respecting matters of state—whereas the idea I annex to the term is
an inquiry into the state of a country, for the purpose of ascertaining the
quantum of happiness enjoyed by its inhabitants, and the means of its future
improvement; but as I thought that a new word might attract more public
attention, I resolved on adopting it, and I hope it is now completely
naturalised and incorporated with our language.” Dari tulisannya tersebut,
terbukti kalau Sir John Sinclair mengadopsi kata “Statistics” yang dia ketahui
ketika melakukan perjalanan ke Jerman. Namun terdapat perbedaan antara
keduanya. Di Jerman, istilah itu merujuk kepada suatu metode yang digunakan
dalam hal politik dan kenegaraan, seperti misalnya untuk mengukur kekuatan
politik dan menganalisis data-data kenegaraan. Sir John Sinclair menggunakan
istilah ini (statistics) sebagai suatu metode untuk mengumpulkan data atau
fakta di lapangan yang bersifat numerik. Jadi awalnya, statistika digunakan
dalam ranah perpolitikan untuk menganalisis data kenegaraan dan menjadi
bergeser artinya sebagai metode untuk mengumpulkan data lapangan yang bersifat
numerik.
B.
Awal Mula Perkembangan Statistika
Perkembangan
statistika diawali sebagai suatu ilmu yang membahas cara-cara mengumpulkan
angka sebagai hasil pengamatan menjadi bentuk yang lebih mudah dipahami. Contoh
tertua mengenai hal ini dapat diambil dari zaman Kaisar Agustus yang membuat
pernyataan bahwa seluruh dunia harus dikenai pajak, sehingga setiap orang harus
melapor kepada statistikawan terdekat, yang saat itu disebut sebagai pengumpul
pajak. Peristiwa lain di dalam sejarah yang dapat dikemukakan ialah sewaktu
William I dari Inggris memerintahkan mengadakan pencacahan jiwa dan kekayaan di
seluruh wilayah Inggris dan Wales untuk pengumpulan pajak dan tugas militer.
Semua pengamatan dicatat di dalam sebuah buku yang dikenal dengan Domesday
Book. Dari keperluan semacam ini timbullah teknik pencatatan angka-angka pengamatan
dalam bentuk daftar dan grafik. Bagian statistika yang membicarakan cara
mengumpulkan dan menyederhanakan angka-angka pengamatan ini dikenal sebagai
statistika deskriptif. Statistika deskriptif dapat berkembang tanpa memerlukan
dasar matematika yang kuat, selain kecermatan dalam teknik berhitung. Sejak
tahun 1700-an analisis data yang dilakukan secara deskriptif berdasarkan
tabel-tabel frekuensi, rataan, dan ragam untuk sampel (contoh) ukuran besar.
Kemudian pada tahun 1800-an merupakan awal penggunaan grafik-grafik untuk
penyajian data, seperti histogram, sejalan dengan penemuan sebaran (kurva)
Normal. Florence Nightingale adalah seorang perawat yang terkenal dengan
inovasi di bidang ilmu keperawatan dan merupakan pelopor dalam penyajian data
secara grafik. Selama perang Krimea, Nightingale mengumpulkan data dan membuat
sistem pencatatan. Dari data tersebut dapat ditentukan tingkat mortalitas yang
dapat menunjukkan hasil perbaikan kondisi kesehatan yang cenderung menurunkan
tingkat kematian. Selanjutnya data-data tersebut disajikan dalam bentuk grafik
yang merupakan suatu inovasi statistika (deskriptif) di masa tersebut. Dalam
statistika deskriptif tidak ada perbedaan antara data yang diperoleh dari
sampel dengan populasinya, kemudian apa yang dihitung dari sampel digunakan
untuk menandai populasi. Pada taraf selanjutnya orang tidak puas hanya
mengumpulkan angka-angka pengamatan saja. Mereka juga tidak puas bahwa yang
diperoleh dari sampel digunakan untuk mencirikan populasi. Timbullah
usaha-usaha untuk memperbaiki kesimpulan dalam melakukan ramalan-ramalan
populasi berdasarkan angka-angka statistik yang dikumpulkan dari sampel
tersebut. Bagian ilmu yang membahas cara-cara mengambil kesimpulan berdasarkan
angka-angka pengamatan dinamakan statistik induktif.
C.
Sejarah Perkembangan Statistika
Induktif
Awal
perkembangan statistik induktif terjadi pada peralihan abad ke 19 ke abad 20
dengan Karl Pearson (1857 – 1936) sebagai pelopornya. Masa ini merupakan titik
awal perkembangan statistika modern. Pada abad ke 19 Karl Pearson menerapkan
statistika pada biologi yang diterbitkan dalam jurnal Biometrika. Dari tahun
1893 sampai 1912 Karl Pearson telah menulis 18 paper yang berjudul konstribusi
matematika ke teori evolusi yang berbasiskan analisis regresi dan koefisien
korelasi. Pearson menciptakan istilah standard deviation (simpangan baku) pada
tahun 1893. Dalam statistika deskriptif Pearson juga memperkenalkan ukuran
penyimpangan terhadap distribusi data yang simetrik yang disebut koefisien
kemiringan dan kurtosis. Pada tahun 1900 Karl Pearson menemukan uji Khi-Kuadrat
untuk tabel kontigensi 2 arah. Dalam menarik kesimpulan tentang korelasi dan
uji khi-kuadrat. Pearson menggunakan sampel besar (n>1000). Analisis data
yang digunakan Pearson mengasumsikan data menyebar Normal. Sehingga pada
Biometrika vol. 1 yang terbit tahun 1901 sebagian besar penelitiannya
menggunakan ukuran contoh besar.
Sebelum tahun 1912 sedikit sekali penemuan dibidang pengujian hipotesis sampai akhirnya W.S. Gosset (1876 – 1937) memperkenalkan uji t-student untuk sampel kecil. Gosset adalah seorang mahasiswa dari Karl Pearson pada awalnya adalah seorang ahli kimia yang bekerja di perusahaan bir Guinness di Dublin. Gosset menemukan uji-t untuk menangani sampel-sampel kecil untuk quality control di perusahaan bir tersebut. Dia menerbitkan papernya dengan nama student pada jurnak Biometrika 1908 untuk menghindari larangan dari perusahaan bagi karyawannya yang menulis didalam sebuah jurnal. Bentuk sebaran secara matematis yang digunakan Gosset tersebut sebenarnya telah ditemukan oleh astronom Jerman Jakob Luroth pada tahun 1875. Gosset menggunakan data hasil pengukuran terhadap tinggi dan jari tengah tangan kiri 3000 narapidana yang dipublikasikan pada volume pertama Biometrika. Dengan metode Monte carlo dipilih 750 sampel yang berukuran 4 dan diperoleh distribusi data yang mendekati distribusi teotriknya. Sebaran t-student banyak dipakai sebagai acuan dalam menduga parameter rataan ukuran contoh kecil (n < 30).
Metode estimasi parameter populasi yang digunakan sebelum tahun 1912 adalah metode kuadrat terkecil yang dikemukakan oleh Gauss dan metode deviasi mutlak terkecil yang dikemukakan Laplace. Kedua metode ini digunakan untuk mengestimasi parameter dalam model linier. Kemudian karl Pearson memperkenalkan metode momen untuk estimasi parameter pada tabel frekuensi. Statistik induktif mulai berkembang pesat setelah R.A Fisher (1890 – 1962) menulis paper yang sangat terkenal pada tahun 1922 yaitu On the Mathematical Foundation of theoritical Statistics (Mallows, 1998). Fisher memperkenalkan istilah specification untuk mengidentifikasi 3 problem yang muncul pada reduksi data, yaitu:
Sebelum tahun 1912 sedikit sekali penemuan dibidang pengujian hipotesis sampai akhirnya W.S. Gosset (1876 – 1937) memperkenalkan uji t-student untuk sampel kecil. Gosset adalah seorang mahasiswa dari Karl Pearson pada awalnya adalah seorang ahli kimia yang bekerja di perusahaan bir Guinness di Dublin. Gosset menemukan uji-t untuk menangani sampel-sampel kecil untuk quality control di perusahaan bir tersebut. Dia menerbitkan papernya dengan nama student pada jurnak Biometrika 1908 untuk menghindari larangan dari perusahaan bagi karyawannya yang menulis didalam sebuah jurnal. Bentuk sebaran secara matematis yang digunakan Gosset tersebut sebenarnya telah ditemukan oleh astronom Jerman Jakob Luroth pada tahun 1875. Gosset menggunakan data hasil pengukuran terhadap tinggi dan jari tengah tangan kiri 3000 narapidana yang dipublikasikan pada volume pertama Biometrika. Dengan metode Monte carlo dipilih 750 sampel yang berukuran 4 dan diperoleh distribusi data yang mendekati distribusi teotriknya. Sebaran t-student banyak dipakai sebagai acuan dalam menduga parameter rataan ukuran contoh kecil (n < 30).
Metode estimasi parameter populasi yang digunakan sebelum tahun 1912 adalah metode kuadrat terkecil yang dikemukakan oleh Gauss dan metode deviasi mutlak terkecil yang dikemukakan Laplace. Kedua metode ini digunakan untuk mengestimasi parameter dalam model linier. Kemudian karl Pearson memperkenalkan metode momen untuk estimasi parameter pada tabel frekuensi. Statistik induktif mulai berkembang pesat setelah R.A Fisher (1890 – 1962) menulis paper yang sangat terkenal pada tahun 1922 yaitu On the Mathematical Foundation of theoritical Statistics (Mallows, 1998). Fisher memperkenalkan istilah specification untuk mengidentifikasi 3 problem yang muncul pada reduksi data, yaitu:
1. Spesifikasi
dari jenis populasi, yaitu bentuk matematis dari populasi yang mencakup parameter
yang tidak
diketahui,
diketahui,
2. Estimasi,
yaitu pemilihan metode statistik untuk mengestimasi parameter dari populasi,
dan
3. Sebaran,
yaitu sebaran statistik dari contoh atau sampel.
Tulisan
tersebut memperkenalkan suatu metode yang tekenal dengan nama Maximum
Likelihood yang digunakan untuk estimasi dan pengujian hipotesis. Pada tahun
1925 terbit buku Statistical methods for Research Workers karangan Fisher yang
berisi rancangan percobaan dan anilisis varians di bidang biologi. Fisher yang
cara berfikirnya dipengaruhi aliran statistika yang dianut Karl Pearson, yaitu
penarikan kesimpulan didasarkan pada model peluang (model-driven) merupakan
promotor penggunaan cara-cara statistika di dalam bidang-bidang ilmu pertanian,
biologi dan genetika. Untuk jasanya ini Fisher dianugerahi gelar Baronet oleh
Ratu Inggris, sehingga ia berhak menggunakan nama Sir Ronald Fisher.
Konstribusi Fisher membuat cakupan metode pengembangan yang sesuai untuk sampel
kecil, seperti Gosset, penemuan presisi sebaran dari beberapa statistik sampel
dan penemuan analisis varians. Fisher merekomendasikan maksimun likelihood,
yang digunakan untuk estimasi dan pengujian hipotesis. Fisher dianggap penemu
statistika modern karena konstribusinya yang sangat penting dan dianggap
sebagai pemikir ulung tempaaan abad kedua puluh. Para era Fisher, seorang
pemikir Rusia Jerzy Neyman (1894 – 1981) juga dipandang sebagai penemu besar
dari statistika modern karena konstribusinya dalam mengembangkan teori peluang,
uji hipotesis, selang kepercayaan, dan matematika statistik. Neyman bekerjasama
dengan Egon Pearson (anak Karl Pearson) mengembangkan teori-teorinya yang
terkenal adalah Teorema Neyman-Pearson (1936). Selain itu Neyman juga
mengembangkan teori sampling survey pada tahun 1934. Pada tulisan Fisher (1915)
mengemukakan representasi geometrik data peubah-ganda dua (bivariat) untuk
menurunkan distribusi sampling bersama dari penduga matriks varians-kovarians.
Pada tahun 1928 Wishart menggunakan metode yang sama untuk menurunkan
distribusi bersama dari penduga matriks varians-kovarians untuk sebaran normal
ganda (Multivariat Normal) yang akhirnya populer dengan distribusi Wishart. Pada
tahun 1836, Fisher membuka area baru penelitian yang disebut fungsi diskriminan
yang pada awalnya untuk menjawab pertanyaan yang diajukan oleh ahli antropologi
yaitu untuk menentukan jenis kelamin dari pemilik tengkorak yang mempunyai
ukuran-ukuran tertentu. Fungsi diskriminan untuk membedakan kedua jenis kelamin
ini populer dengan nama fungsi linear diskriminan Fisher (LDF) untuk 2 grup dan
merupakan salah satu metode pada analisis peubah ganda. Calyampudi
Radhakrishnan Rao (1920 – ) adalah mahasiswa bimbingan dari Fisher. Rao bekerja
di mesium antropolgi sambil menyelesaikan Ph.D tahun 1948. Tahun 1946 Rao
mengembangkan fungsi diskriminan linear Fisher untuk klasifikasi dengan banyak
grup. Selain itu Rao juga berkonstribusi dalam mengembangkan matematika
statistik dengan teorinya yang terkenal pertidaksamaan Rao-Cramer dan teorema
Rao-Blackwell yang dikemukakan secara terpisah oleh Rao pada tahun 1945 dan
Blackwell pada tahun 1947. Salah satu buku karangan Rao yang tekenal adalah
Linear Statistical Inference yang telah diterjemahkan ke dalam 6 bahasa. Prasantha
Chandra Mahalanobis (1893 – 1972) berkonstribusi dalam mengembangkan analisis
peubah-ganda. Salah satu kontribusinya yang besar adalah jarak Mahalanobis
(D-statistik) yang merupakan ukuran jarak untuk data dengan variabel banyak
yang digunakan dalam analisis klasifikasi. Mahalanobis juga pendiri jurnal
statistik India yang sangat terkenal bernama Sankya. Pada tahun 1931
Mahalanobis mendirikan Indian Statistical India dengan salah satu divisinya
bernama National Sample Survey (NSS) yang bertugas mengumpulkan data
sosioekonomik dan demografi di seluruh India. Divisi ini membuat Mahalanobis
mempunyai peranan penting dalam perencanaan ekonomi di India dan akhirnya NSS
sekarang berfungsi sebagai bagian penting dari Ministry of Planing. Pada tahun
1931 Hoteling memperkenalkan statistik T2 yang merupakan generalisasi dari
statistik t-student untuk menguji hipotesis nilai tengah pada data
peubah-ganda. Distribusi tak nol dari T2 adalah sama dengan
Mahalanobis-Distance yang mempunyai tujuan berbeda ditemukan oleh Bose dan Roy
pada tahun 1938.
Seperti telah disebutkan bahwa aliran yang dianut Karl Pearson, Gosset dan R.A Fisher mendasarkan kesimpulan pada jenis sebaran populasi tidak dipenuhi maka perlu dilakukan transformasi data, salah satunya adalah transformasi pangkat yang ditemukan oleh Box dan Cox tahun 1964, sehingga dikenal dengan nama transformasi Box-Cox. Dilain pihak pada tahun 1945 Frank Wilcoxon memperkenalkan metode statistik non parametrik yang bebas dari sebaran populasi yang sekarang dikenal dengan Uji Tanda Peringkat. Seperti tahun 1952 W.H. Kruskal dan W.A Wallis memperkenalkan uji non parametrik yang berpadanan dengan uji kesamaan mean pada analisis varians yang dikenal dengan nama Uji Kruskal-Wallis. Pada tahun 1958 Kaplan menggunakan metode non parametrik untuk pendugaan sekuensial.
Pada akhirnya dengan adanya perkembangan teknologi komputer metode eksplorasi data berkembang pesat sekitar tahun 1970. J.W. Tukey (1915 – ) mempunyai konstribusi besar dalam pengembangan metode eksplorasi baik secara grafis maupun numerik. Beberapa penemuannya adalah diagram dahan-daun dan diagram kotak garis. Pada pertengahan 1970 Elfron memperkenalkan Metode Bootstrap untuk menduga parameter dari sebaran yang tidak diketahui bentuknya. Bootstrafing ini merupakan teknik modifikasi dari Jacknife yang diperkenalkan oleh Queneuille pada tahun 1948. Berhubung metode ini pada awalnya tidak membobotkan model peluang, tetapi berbasis pada data, bootstrap dikenal sebagai data driven approach. Pada dekade 80-an perkembangan metode non parametrik mulai sering digunakan seperti pada regresi non paramametrik, estimasi distribusi dengan kernel, dan neural network.
Seperti telah disebutkan bahwa aliran yang dianut Karl Pearson, Gosset dan R.A Fisher mendasarkan kesimpulan pada jenis sebaran populasi tidak dipenuhi maka perlu dilakukan transformasi data, salah satunya adalah transformasi pangkat yang ditemukan oleh Box dan Cox tahun 1964, sehingga dikenal dengan nama transformasi Box-Cox. Dilain pihak pada tahun 1945 Frank Wilcoxon memperkenalkan metode statistik non parametrik yang bebas dari sebaran populasi yang sekarang dikenal dengan Uji Tanda Peringkat. Seperti tahun 1952 W.H. Kruskal dan W.A Wallis memperkenalkan uji non parametrik yang berpadanan dengan uji kesamaan mean pada analisis varians yang dikenal dengan nama Uji Kruskal-Wallis. Pada tahun 1958 Kaplan menggunakan metode non parametrik untuk pendugaan sekuensial.
Pada akhirnya dengan adanya perkembangan teknologi komputer metode eksplorasi data berkembang pesat sekitar tahun 1970. J.W. Tukey (1915 – ) mempunyai konstribusi besar dalam pengembangan metode eksplorasi baik secara grafis maupun numerik. Beberapa penemuannya adalah diagram dahan-daun dan diagram kotak garis. Pada pertengahan 1970 Elfron memperkenalkan Metode Bootstrap untuk menduga parameter dari sebaran yang tidak diketahui bentuknya. Bootstrafing ini merupakan teknik modifikasi dari Jacknife yang diperkenalkan oleh Queneuille pada tahun 1948. Berhubung metode ini pada awalnya tidak membobotkan model peluang, tetapi berbasis pada data, bootstrap dikenal sebagai data driven approach. Pada dekade 80-an perkembangan metode non parametrik mulai sering digunakan seperti pada regresi non paramametrik, estimasi distribusi dengan kernel, dan neural network.
D.
Perkembangan Statistika Di Abad 21
Karl
Pearson, Fisher, Neyman dan Wald selama setengah abad telah meletakkan dasar
statistika yang berbasis matematika, sehingga penelitian-penelitian dan
kuliah-kuliah statistika di Perguruan Tinggi umumnya didasarkan pada beberapa
pedoman atau dasar yang ditemukan oleh tokoh-tokoh tersebut. Penggunaan
statistika secara luas, terkadang timbul kontroversi diantara para ahli tentang
pemilihan model data, penggunakan prior probability dan interpretasi hasil.
Hasil analisis terhadap data yang sama dengan lain konsultan statistika
dimungkinkan terjadi perbedaan kesimpulan. Statistika induktif dapat dipakai
untuk menangani masalah dimana perolehan data dirasakan perlu efesiensi atau perlu
biaya mahal., sehingga umumnya dapat diatasi dengan analisis dengan
sampel-sampel ukuran kecil.
Di era millenium dengan dominasi teknologi informasi, data base yang besar, interaksi dengan komputer dan informasi yang kompleks, maka menurut C.R. rao dalam tulisannya 14 Nopember 2001 (berjudul Has Statistics a future? If So in What Form?) statistika yang didasarkan pada model-model probabilistik tidak mencukupi, sehingga metode-metode yang akan muncul diarahkan untuk menjawab tantangan zaman yang diberi nama data mining. Istilah data mining (penambangan data) ini menurut Nasoetion (2002) awalnya berasal dari para ahli ilmu komputer yang dalam sehari-harinya bekerja dalam dunia kecerdasan buatan. Untuk pekerjaan ini mereka membangkitkan dan mengumpulkan data dalam ukuran sangat besar dan mencoba menemukan pola-pola keteraturan data yang dapat diterangkan. Pada abad 21 diperkirakan metode data mining merupakan metode yang akan banyak digunakan dalam berbagai bidang terapan. Pada metode data mining spesifikasi permasalahan didasarkan pada bidang ilmunya lebih diutamakan daripada pendugaan parameter sehingga masalah tersebut dapat diformulasikan dengan benar untuk memperoleh solusi yang tepat melalui eksplorasi data. Hal ini berbeda dengan periode Fisher yang lebih mementingkan mencari metode pendugaan dan pendekatan sebaran yang tepat, sehingga spesifikasi permasalahan lebih diutamakan pada pendugaan parameter dan asumsi sebaran. Jadi Fisherian Statistic itu sebenarnya model driven yang agak beda dengan data mining yang lebih bersifat data driven. Akan tetapi pada pelaksanaannya, kedua “driven” tersebut harus dikuasai ini akan berpengaruh terhadap model pendidikan dan pengajaran statistika dewasa ini. Emanuel Parzen (Departement of statistics Texas A & M University College) baru-baru ini menulis tentang “Data Mining, Statistical Methods Mining and History of Statistics”. Dalam tulisannya tersebut dibahas juga masalah pendidikan statistika menghadapi masa depan dimana data mining akan berkembang, seperti bagaimana cara mengajar matematik statistik untuk non matematik statistik, materi yang berhubungan dengan komputer seperti teknik simulasi, analisis numerik, analisis data struktur data perlu ditingkatkan bagi para mahasiswa. Belum adanya standard analisis untuk eksplorasi data dalam data ukuran besar inilah diperkirakan, metode data mining akan banyak dikembangkan dan diteliti oleh para pakar statistika.
Di era millenium dengan dominasi teknologi informasi, data base yang besar, interaksi dengan komputer dan informasi yang kompleks, maka menurut C.R. rao dalam tulisannya 14 Nopember 2001 (berjudul Has Statistics a future? If So in What Form?) statistika yang didasarkan pada model-model probabilistik tidak mencukupi, sehingga metode-metode yang akan muncul diarahkan untuk menjawab tantangan zaman yang diberi nama data mining. Istilah data mining (penambangan data) ini menurut Nasoetion (2002) awalnya berasal dari para ahli ilmu komputer yang dalam sehari-harinya bekerja dalam dunia kecerdasan buatan. Untuk pekerjaan ini mereka membangkitkan dan mengumpulkan data dalam ukuran sangat besar dan mencoba menemukan pola-pola keteraturan data yang dapat diterangkan. Pada abad 21 diperkirakan metode data mining merupakan metode yang akan banyak digunakan dalam berbagai bidang terapan. Pada metode data mining spesifikasi permasalahan didasarkan pada bidang ilmunya lebih diutamakan daripada pendugaan parameter sehingga masalah tersebut dapat diformulasikan dengan benar untuk memperoleh solusi yang tepat melalui eksplorasi data. Hal ini berbeda dengan periode Fisher yang lebih mementingkan mencari metode pendugaan dan pendekatan sebaran yang tepat, sehingga spesifikasi permasalahan lebih diutamakan pada pendugaan parameter dan asumsi sebaran. Jadi Fisherian Statistic itu sebenarnya model driven yang agak beda dengan data mining yang lebih bersifat data driven. Akan tetapi pada pelaksanaannya, kedua “driven” tersebut harus dikuasai ini akan berpengaruh terhadap model pendidikan dan pengajaran statistika dewasa ini. Emanuel Parzen (Departement of statistics Texas A & M University College) baru-baru ini menulis tentang “Data Mining, Statistical Methods Mining and History of Statistics”. Dalam tulisannya tersebut dibahas juga masalah pendidikan statistika menghadapi masa depan dimana data mining akan berkembang, seperti bagaimana cara mengajar matematik statistik untuk non matematik statistik, materi yang berhubungan dengan komputer seperti teknik simulasi, analisis numerik, analisis data struktur data perlu ditingkatkan bagi para mahasiswa. Belum adanya standard analisis untuk eksplorasi data dalam data ukuran besar inilah diperkirakan, metode data mining akan banyak dikembangkan dan diteliti oleh para pakar statistika.
Gottfried
Achenwall (1749) menggunakan Statistik dalam bahasa Jerman untuk pertama
kalinya sebagai nama bagi kegiatan analisis data kenegaraan, dengan
mengartikannya sebagai “ilmu tentang negara (state)”. Pada awal abad ke-19
telah terjadi pergeseran arti menjadi “ilmu mengenai pengumpulan dan
klasifikasi data”. Sir John Sinclair memperkenalkan nama (Statistics) dan
pengertian ini ke dalam bahasa Inggris. Jadi, statistika secara prinsip
mula-mula hanya mengurus data yang dipakai lembaga-lembaga administratif dan
pemerintahan. Pengumpulan data terus berlanjut, khususnya melalui sensus yang
dilakukan secara teratur untuk memberi informasi kependudukan yang berubah
setiap saat. Di Indonesia statistic lahir sejak zamna penjajahan. Sesuai dengan
tujuannya pada zaman penjajahan statistic di Indonesia di arahkan untuk
perdagangan denga tujuan untuk mencari keuntungan yang sebesar-besar nya bagi
penjajah. Keberadaan VOC di Indonsia boleh di anggap sebagai printis statistic
colonial yang selanjutnya diteruskan oleh Belanda. Pada tahun 1864 pemerintahan
Belanda mendirikan kantor statistic yang pertama di Indonesia . kantor ini
adalah bagian dari kantor Algemene Secretarie yang berpusat di Nederland.
Selanjutnya pada tahun 1870 , bagian tersebut dipindahkan pada Dapartemen
Algemeen Beustuur. Pengumuman – pengumuman statistic dimuat dalam buku tahunan ketatanegaraan
dan perekonomian yang dikeluarkan oleh Lembaga Statistik di Belanda. Pada tahun
1920 berdirilah kantor cacah jiwa. Kantor ini bertugas menghitung jumlah warga
(sensus). Bersamaan dengan itu pula berdirilah kantor statistic pertanian ,
kerajinan dan perdagangan termasuk dalam statistic ekspor dan impor. Kantor
statistic pertanian , perdagangan , dan kerajinan berdiri di Bogor , namun pada
tahun 1925 dupindahkan ke Jakarta. Sejak saat itu resmi menjadi Kantor Pusat
Statistikdan sampai sekarang disebut Badan Pusat Statistik. Distikan dengan
penyempurnaan pada perstatistik yang sudah ada , system prastatistikan di
Indonesia saat ini disusun berdasarkan Undang-Undang Statistik No. 7 Tahun 1960
, dari Peraturan Pemerintah Republik Indonesia No. 6 tahun 1980 tentang
organisasi Biro Pusat Statistik.
0 komentar:
Posting Komentar