Skip to content Skip to navigation

Veri Madenciliği

Mehmet Koçak
18/01/2016 - 15:03

Bilkent Üniversitesi'ndeki araştırma grubunun ilk öğrencileriyle birlikte (soldan sağa): Onur M. Özsavaş, Cihan Kaynak, Fazlı Can, Erman Balçık ve H. Çağdaş Öcalan.

Bir olayla ilgili farklı kaynaklardan gelen haberler zaman içinde doğal bir haber zinciri oluşturur. Bu haber zincirinde birçok tekrar eden bilgi yer alır. Peki, bu tekrarlanmış bilgileri bir bilgisayar programı yardımıyla eleyebilmek mümkün müdür? Bu sorunun cevabının ipuçlarını Bilkent Üniversitesi Bilgisayar Mühendisliği Bölümü’nden Prof. Dr. Fazlı Can ile yaptığımız söyleşide bulabilirsiniz.

TÜBİTAK Bilim Genç: Kendinizi kısaca tanıtır mısınız? 

Prof. Dr. Fazlı Can: Lisans eğitimimi 1976 yılında Orta Doğu Teknik Üniversitesi Elektrik Mühendisliği Bölümü’nde tamamladım. 1979 yılında Bilgisayar Mühendisliği Bölümü’nden yüksek lisans ve 1985 yılında da doktora derecelerimi aldım. Doktora çalışmalarımın önemli kısmını Arizona State Üniversitesi (ASU) Bilgisayar Bilimi Bölümü’nde ve Intel-Arizona'da çalıştığım sırada (1982-1983) doktora tez hocam Prof. Esen A. Özkarahan'ın ASU ve Intel’de yönetmekte olduğu RAP Veri Tabanı Makinesi Projesi çerçevesinde gerçekleştirdim. Araştırmalarıma 1986-2005 yılları arasında Ohio'daki Miami Üniversitesi Bilgisayar ve Yazılım Mühendisliği Bölümü’nde devam ettim. Çalışmalarımı halen Bilkent Üniversitesi Bilgisayar Mühendisliği Bölümü’nde sürdürüyorum.

TÜBİTAK Bilim Genç: Hangi konularda araştırma yapıyorsunuz?

Prof. Dr. Fazlı Can: Araştırma konularımı bilgi erişimi ve veri madenciliği oluşturuyor. Özellikle bilgiye hızlı ve doğru şekilde ulaşmayı sağlayacak algoritmaların geliştirilmesi, haber ve tweet benzeri metinlerde tekrar eden bilgilerin elenerek yeni gelişmelerin tespit edilmesi ve metinler arası örüntü ve saklı ilişkilerin bulunması üzerine çalışmalar yürütüyorum. Ayrıca tarihi ya da güncel dokümanlarda kişi ve kuruluşlar arasındaki bağlantıların saptanması, dilin ve yazar üslubunun değişimi, belli bir konuyla ilgili olan metinlerin özetlenmesi, sayısal bilgi akışının sınıflandırılması da ilgilendiğim konular arasında.

TÜBİTAK Bilim Genç: Sizi bu konularda araştırma yapmaya yönelten sebepler neler?

Prof. Dr. Fazlı Can: Bilimsel kaynaklardaki, internet sitelerindeki ve günlük hayattaki bilgi patlamasının yanı sıra ihtiyaç duyduğum bilgiye ulaşmadaki sabırsızlığım ve okuduğum metinlerde hemen görülemeyen ayrıntıları tespit etme isteğim, bilgi erişimi ve veri madenciliği ile ilgili araştırmalara yönelmemde etkili oldu.

TÜBİTAK Bilim Genç: Peki, yaptığınız araştırmalar hangi alanlarda kullanıyor?

Prof. Dr. Fazlı Can: Bilgi erişimi ve haber zincirleri konusunda yaptığım araştırmalar ve tasarladığım algoritmalar bu konularda uygulama geliştiren yazılımcılara yol gösteriyor. Dolayısıyla bu tür uygulamaları kullanan bireyler, özellikle yayıncılar ve araştırmacı gazeteciler bu çalışmalarımdan faydalanabiliyor. Ayrıca dil ve sosyal ağlar ile ilgili araştırmalarım sosyal alanlarda özellikle de tarih, edebiyat ve dilbilim çalışmalarında kullanılıyor.

TÜBİTAK Bilim Genç:  Bilim insanı olmak isteyen gençlere tavsiyeleriniz nelerdir? 

Prof. Dr. Fazlı Can: Öncelikle kendilerini tanımalarını tavsiye ederim. Yazmanın, hiç olmazsa günlük tutmanın, insana ayna tutan önemli bir araç olduğunu düşünüyorum. Genellikle iyi yazabilen kişiler araştırmada da başarılı oluyor. Bilim insanı olmak için merak etmek, araştırmayı bir serüven olarak görmek, başarısız olma riskinden heyecan duymak, hayal etmek ve yazabilmek gerekiyor. Bunlar gençlerin zaman içinde çabayla kazanılabileceği nitelikler. Gençlerin kendilerini tanımalarının yanı sıra sevdikleri konuda eğitim almalarını, farklı insanlarla bilgi alışverişi yapmalarını ve kalıplardan sıyrılarak sıradışı bir hayata sahip olmalarını tavsiye ederim.

İlgili İçerikler

Bilgisayar ve İnternet

1939 yılında eğitim öğretime başlayan Cebeci Ortaokulu, devlet okulları arasında Ankara genelinde ilk kez oyun kodlama yarışmasının yapılmasına öncülük etti. “Oyunumu Kodluyorum” adıyla düzenlenen yarışma TÜBİTAK’ın yanı sıra EBA, Hacettepe Stem & Maker Lab, Roketsan, Havelsan gibi kurumların desteğiyle yapıldı.

Bilgisayar ve İnternet

TÜBİTAK’ın kamu kurumlarında açık kaynaklı yazılımlar ve teknolojilerinin yaygınlaştırılması ve bu konulardaki farkındalığın artırılması için bu yıl üçüncüsünü düzenleyeceği Kamu Açık Kaynak Konferansı 25-26 Ekim 2017 tarihleri arasında Ankara Congresium'da gerçekleştirilecek.

Bilgisayar ve İnternet

Hayatımızın vazgeçilmez bir parçası olan bilgisayarların nasıl çalıştığı birçoğumuz için karmaşık bir bulmaca gibidir. Bu inanışın doğru olmadığını düşünen Minnesota Üniversitesi’nden Paul Boswell, çocuklara ve yetişkinlere programlamayı eğlenceli bir şekilde öğretmek için bir oyun geliştirdi.

Bilgisayar ve İnternet

Spor karşılaşmalarında genellikle çoğunluğun favorisi olan bir taraf vardır. Bu değerlendirme, takımın ya da oyuncunun performansına göre yapılır.

Bilgisayar ve İnternet

Tesla’nın otomatik pilot kazasını inceleyen ABD’nin Ulusal Ulaşım Güvenliği Kurulu'nun raporu, kazadan önceki 37 dakika boyunca sistemin sürücüyü ellerini direksiyon üzerinde tutması için yedi kez uyardığını gösteriyor.

Bilgisayar ve İnternet

Günümüzde hayatımızın vazgeçilmez bir parçası olan kişisel bilgisayarlar 1980’li yılların başından itibaren kullanılmaya başlandı.

Bilgisayar ve İnternet

Günümüzde çevreyle ilgili problemler arasında en önemlilerinden biri olan hava kirliliği özellikle sanayileşmiş şehirlerde yaşayan insanlar için tehlike oluşturuyor.

Bilgisayar ve İnternet

Çoğumuz kullandığımız monitörlerde çözünürlük, renk kalitesi gibi unsurları ön planda tutarken e-spor tutkunlarının derdi bambaşka.

Bilgisayar ve İnternet

TÜBİTAK’ın üniversite öğrencileri arasında düzenlediği proje yarışmasının final sergisi 22 Ekim 2016 tarihinde...

Bilgisayar ve İnternet

Son yıllarda ortaya çıkan ve fidye yazılım (ransomware) adı verilen kötü amaçlı yazılımlar birçok kişinin ve kuruluşun kâbusu olmuş durumda.