Rabu, 20 Maret 2024

Sumber dataset untuk keperluan data mining

Berkut ini  beberapa sumber dataset yang sering dimanfaatkan oleh peneliti dalam bidang data mining adalah:

Kaggle

Kaggle merupakan salah satu platform pembelajaran terkemuka di dunia untuk ilmu Data Science dan Machine Learning. Platform ini menyediakan akses ke lebih dari 6000 kumpulan data yang dapat diunduh dalam format CSV. Data-data ini sangat bermanfaat bagi peneliti di berbagai belahan dunia dalam mengembangkan model-model analisis. Kaggle tidak hanya sekadar menyediakan kumpulan data, tetapi juga menjadi rumah bagi komunitas ilmuwan data terbesar. Di sini, tersedia berbagai kompetisi yang membantu para pemula untuk menunjukkan keahlian mereka. Untuk mengunduh data dari Kaggle, kunjungi situs resminya di https://www.kaggle.com/

Repositori Pembelajaran Mesin UCI (UCI Machine Learning Repository)

Repositori Pembelajaran Mesin UCI adalah sumber data publik yang menyediakan akses gratis kepada 427 kumpulan data. Repositori ini didedikasikan untuk mendukung komunitas Pembelajaran Mesin dengan menyediakan data-data yang terstruktur dan dapat disaring sesuai kebutuhan. Untuk mengunduh data dari Repositori Pembelajaran Mesin UCI, silakan kunjungi situs resminya di: https://archive.ics.uci.edu/ml/index.php

Zdataset

Zdataset adalah kumpulan data dari berbagai sumber dan negara, mirip dengan Repositori Pembelajaran Mesin UCI. Namun, Zdataset cenderung memiliki lebih banyak data dengan kapasitas besar, termasuk data dalam bentuk teks, gambar, maupun video. Untuk mengunduh data dari Zdataset, kunjungi situs resminya di https://zdataset.com/


Data.gov

data.gov adalah portal data terbuka dari Pemerintah Amerika Serikat yang mencakup berbagai kategori dan topik seperti Pertanian, Iklim, Konsumen, Ekosistem, Pendidikan, Energi, Keuangan, Sains, dan Penelitian. Situs ini dikelola oleh Administrasi Layanan Umum Amerika Serikat. Untuk mengunduh data dari data.gov, kunjungi situs resminya di https://data.gov/
 

Google Dataset Search

Diluncurkan pada tahun 2018, inisiatif Google Dataset Search membuatnya memungkinkan untuk mengakses dan mengunduh dataset publik secara gratis. Anda dapat memilih dari berbagai topik dan format termasuk ‘.pdf’, '.csv’, '.jpg’, ‘.txt’, dan lainnya.

Menggunakannya sama mudahnya seperti menjalankan pencarian Google biasa: cukup tuliskan nama atau topik yang Anda cari di bilah. Saat Anda mengetik, akan terus menyarankan dataset yang memiliki kata kunci spesifik yang Anda cari, sehingga Anda mungkin menemukan sesuatu yang benar-benar baru dan menarik.

World Bank Open Data

World Bank Open Data dianggap sebagai salah satu sumber daya statistik dan kumpulan data publik paling kaya dan beragam. Anda dapat mencari berdasarkan kategori seperti "negara" atau "indikator" untuk menemukan informasi demografis seperti:  Populasi, Tingkat pendapatan, Status kesehatan, Pendidikan, Ekonomi.

Yang benar-benar menarik tentang situs web World Bank Open Data adalah bahwa ia menawarkan sumber daya dan alat gratis bagi masyarakat, seperti Data Bank - alat yang membantu untuk menganalisis dan memvisualisasikan kumpulan data besar.

Satu Data Indonesia

Satu Data Indonesia (SDI) merupakan kebijakan tata kelola data pemerintah yang bertujuan untuk menciptakan data berkualitas, mudah diakses, dan dapat dibagipakaikan antar Instansi Pusat serta Daerah. Kebijakan ini tertuang dalam Peraturan Presiden no. 39 tahun 2019 tentang Satu Data Indonesia. Melalui SDI, seluruh data pemerintah dan data instansi lain yang terkait dapat bermuara di Portal Satu Data Indonesia (data.go.id).

Portal Satu Data Indonesia merupakan portal resmi data terbuka Indonesia yang dikelola oleh Sekretariat Satu Data Indonesia tingkat Pusat, Kementerian Perencanaan Pembangunan Nasional / Bappenas. Melalui Portal Satu Data Indonesia, kami berupaya penuh untuk memperbaiki tata kelola data demi terwujudnya transparansi dan akuntabilitas pemerintah, serta mendukung pembangunan nasional.

 

 

 

0 comments:

Posting Komentar