Algoritma Apriori: Panduan Lengkap, Cara Kerja, dan Contoh Python untuk Pemula
Algoritma Apriori: Pengertian, Cara Kerja, dan Implementasi Python (Update 2026)
Algoritma Apriori adalah teknik dalam data mining untuk menemukan hubungan antar item dalam data transaksi. Algoritma ini banyak digunakan dalam market basket analysis untuk memahami pola pembelian pelanggan.
Contohnya, pelanggan yang membeli roti sering juga membeli mentega. Pola seperti ini digunakan dalam sistem rekomendasi modern seperti e-commerce, AI, dan analisis perilaku pengguna.
Artikel ini membahas konsep Apriori, istilah penting, cara kerja, hingga implementasi menggunakan Python.
Apa Itu Algoritma Apriori?
Algoritma Apriori adalah metode untuk menemukan frequent itemset dan membentuk association rules dari data transaksi.
Jika suatu kombinasi item sering muncul, maka subset dari item tersebut juga sering muncul.
Algoritma ini digunakan di:
- E-commerce (rekomendasi produk)
- Retail analysis
- Data mining bisnis
- Cross-selling produk
Istilah Penting
Itemset
Kombinasi item dalam transaksi, misalnya {roti, susu}.
Support
Persentase transaksi yang mengandung item tertentu.
Confidence
Probabilitas item B dibeli jika item A dibeli.
Lift
Mengukur kekuatan hubungan antar item. Lift > 1 berarti hubungan kuat.
Cara Kerja Apriori
- Tentukan minimum support dan confidence
- Cari item yang sering muncul
- Buat kombinasi item
- Hitung support dan confidence
- Buat aturan asosiasi
Contoh Dataset
- Transaksi 1: susu, roti, mentega
- Transaksi 2: susu, roti
- Transaksi 3: roti, mentega
- Transaksi 4: susu, mentega
- Transaksi 5: susu, roti, mentega
Implementasi Python
Install Library
pip install mlxtend
Import Library
import pandas as pd
from mlxtend.preprocessing import TransactionEncoder
from mlxtend.frequent_patterns import apriori, association_rules
Dataset
dataset = [
['susu', 'roti', 'mentega'],
['susu', 'roti'],
['roti', 'mentega'],
['susu', 'mentega'],
['susu', 'roti', 'mentega']
]
Konversi Data
te = TransactionEncoder()
te_ary = te.fit(dataset).transform(dataset)
df = pd.DataFrame(te_ary, columns=te.columns_)
Frequent Itemsets
frequent_itemsets = apriori(df, min_support=0.6, use_colnames=True)
print(frequent_itemsets)
Association Rules
rules = association_rules(frequent_itemsets, metric="confidence", min_threshold=0.7)
print(rules[['antecedents','consequents','support','confidence','lift']])
Contoh Output
{susu, roti} → {mentega}
Support = 0.6
Confidence = 0.75
Lift = 1.25
Artinya:
- 60% transaksi mengandung kombinasi tersebut
- 75% pembeli susu dan roti juga membeli mentega
- Lift > 1 berarti hubungan kuat
Kelebihan
- Mudah dipahami
- Cocok untuk pemula
- Berguna untuk bisnis retail
Kekurangan
- Lambat untuk data besar
- Banyak kombinasi item
- Tidak cocok real-time
Kesimpulan
Algoritma Apriori masih relevan di era modern (2026), terutama dalam data science, AI, dan sistem rekomendasi.
Algoritma ini menjadi dasar penting sebelum masuk ke machine learning dan sistem rekomendasi berbasis AI.
Komentar
Posting Komentar