TOJDE Dergisi üzerinde LDA ile konu modelleme
Özet
Çeşitli bilgilerin kayıt altına alınması hususunda bilgisayar sistemlerinin güvenlik, maliyet, erişilebilirlik gibi konularda sağladığı avantajlar ile birlikte içinde bulunulan bilgi çağında hızla büyüyen verilere erişimin sağlanması, bu veriler içerisinden aranılan bilginin çıkarılması konusu, üzerinde çalışılması güç problemler doğurmuştur. Latent Dirichlet Allocation gibi konu modelleme algoritmaları ve bu algoritmalar üzerine geliştirilmiş konu modelleme araçları binlerce kayıt arasında sıklıkla bahsedilen konuların saptanmasını sağlayabilmektedir. Bu tez kapsamında yapılan çalışma, The Turkish Online Journal of Distance Education (TOJDE) dergisi tarafından kayıt altına alınmış makalelerin araştırılabilir biçime çevrilmesi ve bu metin veriler üzerinde Latent Dirichlet Allocation algoritması ile konuların algılanmasını amaçlamaktadır. Konuların algılanması ile birlikte kullanıcı tarafından anlaşılır görsel analiz sonuçları sunan bir sistem ortaya koyarak yıllara göre konu dağılımlarını gösteren grafiklere ulaşılmıştır. Çalışmanın gerçekleştirilmesi için elde edilen metin veriler Latent Dirichlet Allocation algoritması ile analiz edilmeden önce makale arşivinde yer alan metinlerde geçen kelimeler, kök bulma gibi işlemlerle sadeleştirilerek konu algılama işleminin başarısının arttırılması sağlanmıştır.
Bağlantı
https://hdl.handle.net/11421/4394
Koleksiyonlar
- Tez Koleksiyonu [102]