The Role of Morphological Analysis in Natural Language Processing
Özet
Traditionally, the analysis of word structure (morphology) is divided into two basic fields as inflection and derivation. Therefore, the morphological structure of each word may include elements such as prefix, suffix, infix, or even a separate root, and these elements can modify the meaning of the basic root or stem of the word. If the consequent word is only a paradigmatic application of its base form, this variation of the word is called inflection; but if the resulting word is an entirely different word or a compound, which is formed of two or more roots, it is called derivation. While derivation is a word-creating process, inflection constitutes different forms of any word. The model developed in this study, which analyses the morphology of Turkish verbs, can recognize all of the inflectional categories. The computational tool consists of a Java applet that can run on every machine, and a database that has been extracted from Turkish Dictionary published by Turkish Language Society. The database includes both the verb roots and derived verbs. We utilize Koskenniemi‘s two-level system to develop the morphological model. The input verb, which precedes the suffixes, is analyzed as an invariant root by querying the database, and the following suffix particles may indicate voice (causative, reciprocal, reflexive, passive), modality (necessitive, abilitative, conditional), negation, tense-aspect mood and person/number. Kelime yapısının analizi (biçimbirim), geleneksel olarak çekim ve türetme şeklinde iki temel kısma ayrılır. Her kelimenin biçimbilimsel yapısı önek, sonek veya bağımsız kök gibi bazı ilave öğeler içerebilir ve bu öğeler temel kök veya gövdenin anlamını değiştirebilir. Eğer sonuçta elde edilen kelime başlangıç halinin sadece çekim örneğini oluşturuyorsa, bu değişime çekim adı verilir; oysa tamamen farklı bir kelime veya iki veya daha fazla kökten oluşan bir bileşen ise, buna da türetme adı verilir. Türetme, bir sözcük-oluşturulması yöntemi iken; çekim, verilen bir sözcüğün farklı bir biçiminin oluşturulmasıdır. Türkçe eylemlerin biçimbilimini analiz eden ve bu çalışmada geliştirilen model tüm çekim ulamlarım tanımaktadır. Berimsel paket her bilgisayarda çalışabilen bir Java applet ve hem kök durumunda hem de türemiş durumdaki eylemlerin yer aldığı bir veri tabanından oluşmaktadır. Biçimbilimsel modeli geliştirmek için Koskenniemi’nin iki-düzeyli sisteminden yararlanılmıştır. Giriş kelimesi, tüm eklerden önce gelen değişmeyen kök olarak veri tabanından sorgulanarak analiz edilmektedir; daha sonra gelen ekler ise çatı (ettirgen, işteş,dönüşlü,edilgen), kip durumu, olumsuzluk, asıl zaman kipi ve kişi ekini simgelemektedir.
Kaynak
Anadolu Üniversitesi Bilim ve Teknoloji Dergisi A - Uygulamalı Bilimler ve MühendislikBağlantı
https://hdl.handle.net/11421/822Koleksiyonlar
- Cilt.03 Sayı.1 [20]