Skip to content

lang-uk/ukrainian-heteronyms-dictionary

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 
 
 

Repository files navigation

Словник гетеронімів української мови

English version

Словник містить слова, що пишуться однаково, але мають різну вимову (гетероніми). Іноді це відбувається, коли слова мають різне значення:

  • а́тлас - збірник карт
  • атла́с - тканина

Але більшість гетеронімів це слова, які мають різний наголос в залежності від форми слова (відмінку, множини, часу тощо). Наприклад:

  • блохи́ - родовий відмінок в однині ("немає ані блохи́")
  • бло́хи - множина називного відмінку ("повсюди були бло́хи")

Формат

Кожна група гетеронімів подається на окремому рядку. Кожен рядок має формат

headword [TAB]  heteronym1,heteronym2

headword це слово без наголосу, як воно зазвичай подається на письмі. heteronym1, heteronym2 це слова, які мають різну вимову (їх може бути більше, ніж два). Наголос в цих словах позначається Unicode символом COMBINING ACUTE ACCENT, що ставиться після наголошеної голосної.

Приклад коду на Python, який парсить цей формат:

dictionary = {}
with open("heteronyms.tsv") as f:
    for line in f:
        line = line.rstrip("\n")
        headword, heteronyms = line.split("\t")
        dictionary[headword] = heteronyms.split(",")

print(dictionary["пташки"])
# Out: ['пташки́', 'пта́шки']

Джерело

Словник сформував Олексій Сивоконь на основі "Словників України" Українського мовно-інформаційного фонду НАН України.

About

Dictionary of heteronyms in the Ukrainian language

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published