Konunun duayenlerinden ve Stanford Üniversitesi'nde dersler vermiş Andrew Ng, makine öğrenmesi kavramını açık bir şekilde programlanmadan bilgisayarların davranmasını sağlayan bir bilim olarak tanımlıyor. Makine öğrenmesi eldeki veri seti ve deneyimlerden öğrenme kabiliyetine sahip. Bu anlamda veri seti ve deneyimler arttıkça makine daha iyi öğrenmektedir.
Makinenin öğrenmesini sağlayan farklı metotlar var. Bu bazen doğrusal regresyon veya lojistik regresyon şeklinde bilindik yöntemler olurken, bazen de sinirsel ağlar şeklinde daha kompleks teknikler olabilmektedir. Gözetimli öğrenme (supervised learning) ve gözetimsiz öğrenme (unsupervised learning) olmak üzere makine öğrenmesi problemleri iki ana kümeye ayrılmaktadır. Gözetimli öğrenmede belirli bir çıktı tahmin edilmeye çalışılırken, gözetimsiz öğrenmede çıktıdan bağımsız olarak benzer özelliğe sahip segmentlerin tespit edilmesi amaçlanmaktadır.
Modelleme ve geleceği tahmin etme noktasında veri bilimcinin ana amacı belli örüntüleri yakalamaktır. Bu örüntüler yakalandığı an problemi çözme noktasında büyük bir aşama kaydedilir. Örüntüleri yakalama noktasında da ana kaynak veri olmaktadır. Dijitalleşmenin getirdiği güç ile şirketler daha fazla veri setine kolaylıkla ulaşabilir hale geldi. Makine öğrenmesi için de elimizde geçmiş, tarihsel bir veri seti olması gerekiyor. Öğrenmenin temelinde geçmişin geleceği yansıtacağı kabulüyle hareket edilmektedir. Özlü sözümüzle benzer olarak tarih tekerrürden ibarettir.
İşin teknik detaylarına girildiği zaman konu işin doğası gereği karmaşık hale gelebiliyor. Konuyu strateji tarafına indirgediğimiz zaman ilk aşamada şirketlerin veri odaklı karar alma yapısını merkeze alması gerekiyor. Bunun için de dijitalleşmeye yatırım yapması ve elindeki verileri analiz edilebilir formatta tutması işin olmazsa olmazı. Kurumlar, verileri incelemek için kendi içinde bir ekip kurmayı veya dışarıdan destek almayı tercih edebilir. Veriler incelenerek mevcut iş problemlerini çözmeye yönelik modeller ortaya konduğu zaman şirketler ölçülebilir finansal faydalar elde etmeye başlamaktadır. Gelir artışı, alacak ve kredi riskinin azalışı, operasyonel verimliliğin yükselmesi ve müşteri memnuniyetinin iyileşmesi faydalardan birkaçı olarak özetlenebilir.
Sahada uygulama kısmında gözlemlediğimiz temel kaygılardan biri veri paylaşımı konusu olmaktadır. Yaptığımız çalışmalarda verileri belli bir örneklem halinde alıyor ve müşterinin ayırt edilmesini sağlayacak değişkenleri (adres, isim, kimlik no v.b.) veri kümesine dahil etmiyoruz. Verinizden değer üretmek ve iş problemlerinizi çözmekte yardımcı arıyorsanız kısa bir sohbetle yapabileceklerimiz noktasında fikir alışverişinde bulunmaktan memnuniyet duyarız.