Pendahuluan
Data Science menjadi salah satu bidang yang paling diminati di era digital. Seorang Associate Data Scientist harus memahami konsep dasar Data Science, teknik analisis data, serta dasar-dasar pemrograman Python untuk mengolah dan mengekstrak wawasan dari data.
Pelatihan ini dirancang sebagai langkah awal bagi mereka yang ingin memulai karier di bidang Data Science, dengan fokus pada pengolahan data, eksplorasi data, serta dasar-dasar machine learning. Selain itu, peserta akan dipersiapkan untuk mengikuti sertifikasi Associate Data Scientist BNSP secara online.
Unit Kompetensi
- Dasar-Dasar Data Science – Konsep, manfaat, dan penerapan Data Science.
- Pengolahan dan Manipulasi Data – Menggunakan Pandas dan NumPy untuk eksplorasi data.
- Visualisasi Data – Teknik penyajian data menggunakan Matplotlib dan Seaborn.
- Dasar Pemodelan Machine Learning – Pengantar supervised dan unsupervised learning.
- Evaluasi Model Data Science – Menggunakan metrik akurasi, precision, dan recall.
- Pemrograman Python untuk Data Science – Dasar-dasar Python, library, dan teknik pemrograman.
Silabus Pelatihan (2 Hari)
Hari | Materi | Deskripsi |
---|---|---|
Hari 1 | Pengenalan Data Science & Python | Dasar-dasar Data Science dan pengenalan Python |
Eksplorasi Data dengan Pandas & NumPy | Teknik pengolahan dan analisis dataset | |
Visualisasi Data dengan Matplotlib & Seaborn | Membuat grafik dan dashboard sederhana | |
Hari 2 | Pengantar Machine Learning | Konsep supervised dan unsupervised learning |
Evaluasi Model & Metrik Akurasi | Menganalisis performa model ML | |
Studi Kasus & Sertifikasi BNSP | Simulasi analisis data dan persiapan sertifikasi BNSP |
Contoh Kasus dan Penyelesaiannya
Kasus: Mengidentifikasi faktor yang mempengaruhi harga rumah menggunakan regresi linier.
Penyelesaian dengan Python:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_absolute_error, mean_squared_error
# Contoh dataset
data = {
'Luas_Tanah': [100, 200, 150, 300, 250],
'Jumlah_Kamar': [2, 3, 3, 4, 4],
'Harga': [500, 800, 700, 1200, 1100]
}
df = pd.DataFrame(data)
# Memisahkan fitur dan target
X = df[['Luas_Tanah', 'Jumlah_Kamar']]
y = df['Harga']
# Split data
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# Membuat model regresi linier
model = LinearRegression()
model.fit(X_train, y_train)
# Prediksi
y_pred = model.predict(X_test)
# Evaluasi
mae = mean_absolute_error(y_test, y_pred)
mse = mean_squared_error(y_test, y_pred)
rmse = np.sqrt(mse)
print(f"Mean Absolute Error: {mae}")
print(f"Root Mean Squared Error: {rmse}")
Model ini dapat digunakan untuk memprediksi harga rumah berdasarkan luas tanah dan jumlah kamar.
Kesimpulan
Pelatihan Associate Data Scientist BNSP Online memberikan pemahaman dasar tentang analisis data, pemrograman Python, dan machine learning. Dengan pendekatan berbasis praktik, peserta akan memperoleh keterampilan yang dapat diterapkan di industri Data Science. Kami memiliki pelatihan dan sertifikasi BNSP Online, termasuk Sertifikasi BNSP Associate Data Scientist Online, Sertifikasi BNSP Python untuk Data Science Online, dan Sertifikasi BNSP Visualisasi Data Online.