Veri Madenciliği
Bilkent Üniversitesi Bilgisayar Mühendisliği Bölümü’nden Prof. Dr. Fazlı Can ile bilgi erişimi ve veri madenciliği üzerine konuştuk.
Bilkent Üniversitesi'ndeki araştırma grubunun ilk öğrencileriyle birlikte (soldan sağa): Onur M. Özsavaş, Cihan Kaynak, Fazlı Can, Erman Balçık ve H. Çağdaş Öcalan.
Bir olayla ilgili farklı kaynaklardan gelen haberler zaman içinde doğal bir haber zinciri oluşturur. Bu haber zincirinde birçok tekrar eden bilgi yer alır. Peki, bu tekrarlanmış bilgileri bir bilgisayar programı yardımıyla eleyebilmek mümkün müdür? Bu sorunun cevabının ipuçlarını Bilkent Üniversitesi Bilgisayar Mühendisliği Bölümü’nden Prof. Dr. Fazlı Can ile yaptığımız söyleşide bulabilirsiniz.
TÜBİTAK Bilim Genç: Kendinizi kısaca tanıtır mısınız?
Prof. Dr. Fazlı Can: Lisans eğitimimi 1976 yılında Orta Doğu Teknik Üniversitesi Elektrik Mühendisliği Bölümü’nde tamamladım. 1979 yılında Bilgisayar Mühendisliği Bölümü’nden yüksek lisans ve 1985 yılında da doktora derecelerimi aldım. Doktora çalışmalarımın önemli kısmını Arizona State Üniversitesi (ASU) Bilgisayar Bilimi Bölümü’nde ve Intel-Arizona'da çalıştığım sırada (1982-1983) doktora tez hocam Prof. Esen A. Özkarahan'ın ASU ve Intel’de yönetmekte olduğu RAP Veri Tabanı Makinesi Projesi çerçevesinde gerçekleştirdim. Araştırmalarıma 1986-2005 yılları arasında Ohio'daki Miami Üniversitesi Bilgisayar ve Yazılım Mühendisliği Bölümü’nde devam ettim. Çalışmalarımı halen Bilkent Üniversitesi Bilgisayar Mühendisliği Bölümü’nde sürdürüyorum.
TÜBİTAK Bilim Genç: Hangi konularda araştırma yapıyorsunuz?
Prof. Dr. Fazlı Can: Araştırma konularımı bilgi erişimi ve veri madenciliği oluşturuyor. Özellikle bilgiye hızlı ve doğru şekilde ulaşmayı sağlayacak algoritmaların geliştirilmesi, haber ve tweet benzeri metinlerde tekrar eden bilgilerin elenerek yeni gelişmelerin tespit edilmesi ve metinler arası örüntü ve saklı ilişkilerin bulunması üzerine çalışmalar yürütüyorum. Ayrıca tarihi ya da güncel dokümanlarda kişi ve kuruluşlar arasındaki bağlantıların saptanması, dilin ve yazar üslubunun değişimi, belli bir konuyla ilgili olan metinlerin özetlenmesi, sayısal bilgi akışının sınıflandırılması da ilgilendiğim konular arasında.
TÜBİTAK Bilim Genç: Sizi bu konularda araştırma yapmaya yönelten sebepler neler?
Prof. Dr. Fazlı Can: Bilimsel kaynaklardaki, internet sitelerindeki ve günlük hayattaki bilgi patlamasının yanı sıra ihtiyaç duyduğum bilgiye ulaşmadaki sabırsızlığım ve okuduğum metinlerde hemen görülemeyen ayrıntıları tespit etme isteğim, bilgi erişimi ve veri madenciliği ile ilgili araştırmalara yönelmemde etkili oldu.
TÜBİTAK Bilim Genç: Peki, yaptığınız araştırmalar hangi alanlarda kullanıyor?
Prof. Dr. Fazlı Can: Bilgi erişimi ve haber zincirleri konusunda yaptığım araştırmalar ve tasarladığım algoritmalar bu konularda uygulama geliştiren yazılımcılara yol gösteriyor. Dolayısıyla bu tür uygulamaları kullanan bireyler, özellikle yayıncılar ve araştırmacı gazeteciler bu çalışmalarımdan faydalanabiliyor. Ayrıca dil ve sosyal ağlar ile ilgili araştırmalarım sosyal alanlarda özellikle de tarih, edebiyat ve dilbilim çalışmalarında kullanılıyor.
TÜBİTAK Bilim Genç: Bilim insanı olmak isteyen gençlere tavsiyeleriniz nelerdir?
Prof. Dr. Fazlı Can: Öncelikle kendilerini tanımalarını tavsiye ederim. Yazmanın, hiç olmazsa günlük tutmanın, insana ayna tutan önemli bir araç olduğunu düşünüyorum. Genellikle iyi yazabilen kişiler araştırmada da başarılı oluyor. Bilim insanı olmak için merak etmek, araştırmayı bir serüven olarak görmek, başarısız olma riskinden heyecan duymak, hayal etmek ve yazabilmek gerekiyor. Bunlar gençlerin zaman içinde çabayla kazanılabileceği nitelikler. Gençlerin kendilerini tanımalarının yanı sıra sevdikleri konuda eğitim almalarını, farklı insanlarla bilgi alışverişi yapmalarını ve kalıplardan sıyrılarak sıradışı bir hayata sahip olmalarını tavsiye ederim.