×

Veri Bilimi


Veri biliminin basit bir tanımı şudur:


Veri bilimi, verilerden değer elde etmek için istatistik, bilimsel yöntemler ve veri analizi de dâhil olmak üzere birçok alanı bir araya getirir.


Veri bilimiyle uğraşan kişilere veri bilimci denir. Bu kişiler web, akıllı telefonlar, müşteriler, sensörler ve diğer kaynaklardan toplanan verileri analiz etmek üzere bir dizi beceriyi bir araya getirir.


Veri bilimi, yapay zekâ ve makine öğrenimi arasındaki fark nedir?


Veri bilimini ve ondan nasıl yararlanacağınızı daha iyi anlamak için yapay zekâ (AI) ve makine öğrenimi gibi bu alanla ilgili diğer kavramları bilmek bir o kadar önemlidir. Çoğu zaman bu terimlerin birbirinin yerine kullanıldığını göreceksiniz, ancak bazı farklar vardır.


Şöyle özetleyebiliriz:


Yapay zekâ bilgisayarın insan davranışını bir biçimde taklit etmesini sağlamak anlamına gelir.

Veri bilimi yapay zekânın bir alt kümesidir. Daha çok istatistik, bilimsel yöntemler ve veri analizinin örtüşen alanlarını ifade eder. Bunların tümü verilerden anlam çıkarmak ve içgörü elde etmek için kullanılır.

Makine öğrenimi yapay zekânın bir diğer alt kümesidir. Bilgisayarların verilerden bir şeyler anlamasını ve yapay zekâ uygulama yazılımları sunmayı sağlayan tekniklerden oluşur.

Ve yararlı bulduğumuz başka bir tanım ekleyelim:


Derin öğrenme, makine öğreniminin bir alt kümesidir ve bilgisayarların daha karmaşık sorunları çözmesini sağlar


Veri bilimi iş dünyasını nasıl dönüştürüyor ?


Kurumlar, ürünleri ve servisleri geliştirerek verileri rekabet avantajına dönüştürmek üzere veri biliminden yararlanır. Veri bilimi ve makine öğrenimi kullanım örnekleri şunları içerir:


Çağrı merkezlerinden toplanan verileri analiz ederek müşteri kaybını belirleme, böylece pazarlama ekibi bu müşterileri korumak için harekete geçebilir

Lojistik şirketlerinin teslimat hızlarını iyileştirmek ve maliyetleri azaltmak için trafik modellerini, hava koşullarını ve diğer faktörleri analiz ederek verimliliği artırması

Doktorların hastalıkları daha erken teşhis edip daha etkili tedavi edebilmesi için tıbbi test verilerini ve bildirilen semptomları analiz ederek hasta teşhislerini daha iyi hâle getirme

Ekipmanın ne zaman bozulacağını tahmin ederek tedarik zincirini optimize etme

Kuşku uyandıran davranışları ve anormal eylemleri tanıyarak finans servislerinde dolandırıcılığı tespit etme

Önceki satın alımlara dayalı olarak müşteriler için öneriler oluşturma ve satışları artırma

Pek çok şirket veri bilimine öncelik veriyor ve buna ciddi yatırımlar yapıyor. Gartner'ın kısa süre önce 3.000'den fazla CIO ile birlikte gerçekleştirdiği bir ankete göre katılımcılar, analitik ve iş zekâsını kurumları için en çok farklılık yaratan teknoloji olarak nitelendirdi. Ankete katılan CIO'lar, bu teknolojileri şirketleri için en stratejik unsurlar olarak görüyor ve buna göre yatırım yapıyor.



Veri bilimi nasıl yapılır ?


Verileri analiz etme ve bu temelde hareket etme süreci doğrusal değil, kademeli ilerleyen bir süreçtir. Ancak bir veri modelleme projesi için veri bilimi yaşam döngüsü akışı tipik olarak şu şekildedir:


Planlama: Bir projeyi ve potansiyel sonuçlarını tanımlayın.

Veri modeli oluşturma: Veri bilimcileri, makine öğrenimi modelleri oluşturmak için genellikle çeşitli açık kaynak kitaplıkları veya veritabanı içi araçları kullanır. Kullanıcılar genellikle API'lerin veri alımı, veri profili oluşturma ve görselleştirme veya özellik mühendisliğine yardımcı olmasını isterler. Doğru verilere ve bilgi işlem gücü gibi diğer kaynaklara erişimin yanı sıra doğru araçlara da ihtiyaçları olur.

Bir modeli değerlendirme: Veri bilimcilerinin, kendilerinden emin biçimde konuşlandırmadan önce modelleri için yüksek bir doğruluk yüzdesi elde etmeleri gerekir. Model değerlendirmesi, model performansını yeni verilere göre ölçmek için genellikle kapsamlı bir değerlendirme metrikleri ve görselleştirme seti oluşturur. Ayrıca üretimde optimum davranışı sağlamak için bunları zaman içinde sıralar. Model değerlendirmesi, beklenen temel davranışı hesaba katmak için ham performansın ötesine geçer.

Modelleri açıklama: Makine öğrenimi modellerini ürettiği sonuçların iç mekaniklerini açıklamak her zaman mümkün olmadı ama giderek daha önemli hâle geliyor. Veri bilimcileri, tahmin oluşturmakta rol oynayan faktörlerin göreli ağırlığı ve önemi hakkında otomatik açıklamaların yanı sıra model tahminleriyle ilgili modele özgü açıklayıcı ayrıntılar istiyor.

Bir modeli konuşlandırma: Eğitilmiş bir makine öğrenimi modelini alıp doğru sistemlere yerleştirmek genellikle zor ve zahmetli bir süreçtir. Bu, modelleri ölçeklenebilir ve güvenli API'ler olarak çalıştırarak veya veritabanı içi makine öğrenimi modelleri kullanarak daha kolay hâle getirilebilir.

Modelleri izleme: Ne yazık ki, bir modeli konuşlandırmak işin tamamlandığı anlamına gelmiyor. Düzgün çalıştıklarından emin olmak için, modellerin konuşlandırmadan sonra sürekli izlenmeleri gerekir. Modelin eğitiminde kullanılan veriler, belirli bir süre sonra gelecekteki tahminler için geçerli olmayabilir. Örneğin, dolandırıcılık tespiti alanında suçlular hesapları ele geçirmek için her zaman yeni yollar buluyor.


Veri bilimi platformunun avantajları nelerdir ?


Veri bilimi platformu, ekiplerin kodu, sonuçları ve raporları paylaşmasına olanak tanıyarak bazı işlemlerin tekrar edilmesini azaltır ve inovasyonu destekler. Yönetimi kolaylaştırarak ve en iyi uygulamaları dâhil ederek iş akışındaki darboğazları ortadan kaldırır.


Genel olarak, en iyi veri bilimi platformları şunları hedefler:


Modelleri daha hızlı ve daha az hatayla hızlandırıp ve teslim etmelerine yardımcı olarak veri bilimcilerini daha üretken hâle getirme

Veri bilimcilerin büyük hacimli ve çeşitli verilerle çalışmasını kolaylaştırma

Önyargısız, denetlenebilir ve yeniden üretilebilir, güvenilir, kurumsal düzeyde yapay zekâ sağlama

Veri bilimi platformları uzman veri bilimcileri, vatandaş veri bilimcileri, veri mühendisleri ve makine öğrenimi mühendisleri ya da uzmanları da dâhil olmak üzere çeşitli kullanıcıların iş birliği ile geliştiriliyor. Örneğin, bir veri bilimi platformu veri bilimcilerin modelleri API'ler olarak konuşlandırmasına olanak tanıyarak farklı uygulama yazılımlarına kolayca entegre etmelerini sağlayabilir. Veri uzmanları BT'yi beklemek zorunda kalmadan araçlara, verilere ve altyapıya erişebilir.


Pazarda veri bilimi platformlarına büyük bir rağbet gösteriliyor. Hatta, gelecek yıllarda yüzde 39'dan yüksek bir bileşik yıllık oranla platform pazarının büyümesi ve 2025 yılına dek 385 milyar ABD Doları düzeyine ulaşması bekleniyor.


×