Skip to content

6. Sözlükler

ESAT MAHMUT BAYOL edited this page Jun 18, 2020 · 4 revisions

Sözlükler:

Sözlüklerde çok fazla kelime olmasından dolayı sadece gözüme çarpan yanlışlıkları düzeltebildim. Sözlüklerdeki yanlışlıkları bana trnlp2020@gmail.com adresinden bildirirseniz sevinirim. Sözlüklerin doğruluğu analizlerin doğruluğunu etkileyecektir.

Sözlükler testler sonuçlanıncaya kadar değişikliğe uğrayabilir.

trnlp temel olarak 3 adet sözlük kullanır. Bunlar;

  1. Ana Sözlük
  2. Özel İsimler Sözlüğü
  3. Kısaltmalar Sözlüğü

Bu sözlükler trnlp/data klasörünün içerisinde .txt formatındadır. Bir ara yazılım ile .pickle haline dönüştürülür. Aslında şu anda sözlüğe ekleme yapmak yada değişiklik yapmak için bir komut bulunmamaktadır. Fakat sozlüklerin .txt dosyalarına giriş formatına uygun olması kaydı ile elle giriş yapılarak yeni kelime eklenebilir.

Herhangi bir sözlükte ekleme, çıkarma yada değişiklik yapıldığında "trnlp\generator\createLexiconsPickle.py" içerisindeki create_pickles() fonksiyonu bir kez çalıştırılmalıdır. Bu fonksiyon kendim için üstünkörü yazdığım bir fonksiyondur. Sözlük dosyalarını ve ekler listesini uygun formata getirip .pickle dosyası olarak gerekli klasöre kaydeder.

***ÖNEMLİ NOT : Bu fonksiyon ilk başta tüm .pickle doyalarını sildiği için yanlış bir giriş yapmanız halinde sorun çıkartabilir. Bu durumda yaptığınız değişikliğin doğruluğundan emin değilseniz değişikliği geri alıp fonksiyonu çalıştırın. Sistem eski haline dönecektir.

Ana Sözlük

İsim, Sıfat, Fiil, Bağlaç vb. türdeki kelimeleri barındıran sözlüktür. Sözlükteki örnek bir satır şu şekildedir;

icmal isim UYZ 0 Arapça icmāl icmal(isim)

Her bir bilgi bir tab boşluk ile ayrılmıştır. Yani bir tablonun sütunları gibi düşünülebilir. Bu durumda;

  1. Sütun* : Kelime
  2. Sütun* : Kelimenin türü
  3. Sütun* : Kelimedeki ses olayına ait bayrak ifade
  4. Sütun : Kelimenin sınıfı (Ben herhangi bir sınıflandırma yapmadım. Şimdilik "0" girilebilir.)
  5. Sütun : Kelimenin kökeni ("0" girilebilir.)
  6. Sütun* : Kelimenin kökü ve kökün türü. Kökün türü parantez içerisinde yazılmalı ve mutlaka kök ve türü sözlükte ekli olmalıdır.

*'lı satırlar mutlaka girilmesi gereken kısımlardır. Diğer kısımlar "0" verilebilir.

Ana Sözlükteki Bayrak İfadeler

Ses Olayları :

  1. Ünlü Düşmesi: oğul-u > oğlu

    Bayrak İfadesi : UDUS

  2. Ünlü Daralması: Sonu düz-geniş ünlü ile biten sözcükler “-yor” ekini aldığında sözcüğün sonundaki “a” veya “e” sesi daralarak “ı, i, u, ü” seslerinden birine dönüşür: başla-yor > başlıyor

    Bayrak İfadesi : UDAR-YOR

    “de-” ve “ye-” fiilleri “-yor” ekinden başka ekler aldığında da daralmaya uğrar: de-y-ecek > diyecek ye-y-ecek > yiyecek

    Bayrak İfadesi : UDAR

  3. Ünlü Türemesi: Ünsüzle biten bazı sözcükler “-cik” yapım ekini aldığında iki ünsüz arasında bir ünlü türer: bir-cik > biricik - UTUR[i] genç-cik > gencecik - UTUR[e]

    Bayrak İfadesi : UTUR[]

    • Şu anda bu bayrak ifade sözlükte bulunmasına rağmen kullanılmamaktadır. Çünkü zaten ünlü türemesi olan çoğu kelime sözlükte eklidir.
  4. Ünsüz Yumuşaması Sonu “p, ç, t, k” sert ünsüzleri ile biten sözcükler, ünlü ile başlayan bir ek aldığında sözcüğün sonundaki bu sert ünsüzler yumuşayarak “b, c, d, g, ğ” ye dönüşür: dolap-ı > dolab-ı

    Bayrak İfadesi : UZYUM

  5. Ünsüz Düşmesi “k” ünsüzüyle biten bazı sözcüklere “-cik/-cek” eklerinden biri geldiğinde sözcük sonundaki “k” ünsüzü düşer: çabuk-cak > çabucak sıcak-cık > sıcacık ufak-cık > ufacık

    Bayrak İfadesi : UZDUS

  6. Ünsüz Türemesi (Ünsüz İkizleşmesi) Dilimize yabancı dillerden gelen bazı sözcükler, ünlü ile başlayan bir ek aldıklarında ya da ünlüyle başlayan bir yardımcı fiille birleştiğinde sözcüğün sonundaki ünsüzden bir tane türer: zan et- > zannet- af eyle- > affeyle- hak-ı > hakkı

    Bayrak İfadesi : UZTUR

  7. Olumsuz Kelime Örneğin asla, değil, hayır kelimeleri vb.

    Bayrak İfadesi : NEG

  8. Çoğul Kelime Örneğin orman, ordu, orkestra kelimeleri vb.

    Bayrak İfadesi : TPL

  9. Geniş Zaman Ekleri

    Bayrak İfadesi : GZ[r], GZ[ir], GZ[ır], GZ[ür], GZ[ar], GZ[er]

Özel İsimler Sözlüğü

Adından da anlaşılacağı gibi özel isimlerin bulunduğu sözlüktür. Yapı olarak Ana Sözlük ile aynıdır. Sözlükteki örnek birkaç satır şu şekildedir;

esat	özel	0	E	Arapça	esat(özel) # E erkek ismi olduğunu ifade eder.

süleymanpaşa	özel	0	ilçe	Tekirdağ	süleymanpaşa(özel) # "Tekirdağ" Süleymanpaşa ilçesinin bağlı olduğu ildir.

türkçe	özel	0	dil	Türkçe	türk(özel)

Özel isimlerde okunuşta ses olayları olmasına rağmen yazılışta bu ses olayları yazılmadığından bayrak ifadeler kullanılmamıştır.

Kısaltmalar Sözlüğü

Adından da anlaşılacağı gibi kısaltmaların bulunduğu sözlüktür. Yapı olarak Ana Sözlük ile aynıdır. Sözlükteki örnek birkaç satır şu şekildedir;

aş	kısaltma	HB	Anonim şirket	AŞ	aş(kısaltma)

vb.	kısaltma	SN	Ve başkası;ve başkaları;ve benzeri;ve benzerleri;ve bunun gibi	vb.	vb.(kısaltma)

prof.	kısaltma	IHB,SN	Profesör	Prof.	prof.(kısaltma)

Kısaltmalar Sözlüğündeki Bayrak İfadeler

HB : Hepsi büyük harf

SN : Sonu noktalı

IHB : Sadece ilk harfi büyük

HK : Hepsi küçük harf