Module:az-IPA/testcases
Appearance
- The following documentation is located at Module:az-IPA/testcases/documentation. [edit] Categories were auto-generated by Module:module categorization. [edit]
- Useful links: root page • root page’s subpages • links • transclusions • tested module • sandbox
52 of 107 tests failed. (refresh)
Text | Expected | Actual | |
---|---|---|---|
aktyor | akt-yor | a(kty)or | |
Aleksandr | A-lek-sandr | A-lek-sandr | |
Aleksandriya | A-lek-sand-ri-ya | A-lek-sand-ri-ya | |
Alfred | Al-fred | A(lfr)ed | |
altmış | alt-mış | a(ltm)ış | |
altmışıncı | alt-mı-şın-cı | a(ltm)ı-şın-cı | |
amplua | amp-lua | amp-lua | |
Amsterdam | Ams-ter-dam | A(mst)er-dam | |
Andrey | And-rey | And-rey | |
ansambl | an-sambl | an-sambl | |
Antarktida | An-tark-ti-da | An-tark-ti-da | |
artmaq | art-maq | a(rtm)aq | |
astrofizika | ast-ro-fi-zi-ka | ast-ro-fi-zi-ka | |
avqustda | av-qust-da | av-qu(std)a | |
avqustdan | av-qustdan | av-qu(std)an | |
avqustlar | av-qust-lar | av-qust-lar | |
jurnalistdə | jur-na-list-də | jur-na-li(std)ə | |
jurnalistdən | jur-na-lis-tdən | jur-na-li(std)ən | |
jurnalistlər | jur-na-list-lər | jur-na-list-lər | |
jurnalistlərdə | jur-na-list-lər-də | jur-na-list-lər-də | |
konstitusiya | kons-ti-tu-siya | ko(nst)i-tu-si-ya | |
kontrabas | kont-ra-bas | kont-ra-bas | |
kənddə | kənd-də | kə(ndd)ə | |
kənddən | kənd-dən | kə(ndd)ən | |
mitoxondri | mi-to-xond-ri | mi-to-xond-ri | |
Moskva | Mosk-va | Mo(skv)a | |
Məmmədrza | Məm-məd-rza | Məm-mə(drz)a | |
neftçi | neft-çi | ne(ftç)i | |
nərdtaxta | nərd-tax-ta | nərd-tax-ta | |
oktyabr | okt-yabr | o(kty)abr | |
panpsixizm | pan-psi-xizm | pa(nps)i-xizm | |
partlamaq | part-la-maq | part-la-maq | |
partlatmaq | part-lat-maq | part-lat-maq | |
partlayış | part-la-yış | part-la-yış | |
politkorrektlik | po-lit-kor-rekt-lik | po-lit-kor-rekt-lik | |
qalstuk | qals-tuk | qa(lst)uk | |
qalxmaq | qalx-maq | qa(lxm)aq | |
qonaqpərəstlik | qo-naq-pə-rəst-lik | qo-naq-pə-rəst-lik | |
qorxmamaq | qorx-ma-maq | qo(rxm)a-maq | |
qorxmaq | qorx-maq | qo(rxm)aq | |
qorxmayan | qorx-ma-yan | qo(rxm)a-yan | |
Qorxmaz | Qorx-maz | Qo(rxm)az | |
qorxmaz | qorx-maz | qo(rxm)az | |
qırxmaq | qırx-maq | qı(rxm)aq | |
qəlbdə | qəlb-də | qəlb-də | |
qəlbdən | qəlb-dən | qəlb-dən | |
qəlblər | qəlb-lər | qəlb-lər | |
qəlblərdə | qəlb-lər-də | qəlb-lər-də | |
qəlblərdən | qəlb-lər-dən | qəlb-lər-dən | |
qəlbləri | qəlb-lər-i | qəlb-lə-ri | |
qəlblərin | qəlb-lər-in | qəlb-lə-rin | |
qəlblərə | qəlb-lə-rə | qəlb-lə-rə | |
qərbdə | qərb-də | qərb-də | |
qərbdən | qərb-dən | qərb-dən | |
qəşənglik | qə-şəng-lik | qə-şəng-lik | |
qəşəngləşdirmək | qə-şəng-ləş-dir-mək | qə-şəng-ləş-dir-mək | |
qəşəngləşmək | qə-şəng-ləş-mək | qə-şəng-ləş-mək | |
reportyor | re-port-yor | re-po(rty)or | |
rəhmsiz | rəhm-siz | rə(hms)iz | |
rəngləmək | rəng-ləm-ək | rəng-lə-mək | |
rəngləməmək | rəng-lə-mə-mək | rəng-lə-mə-mək | |
rəngləməyən | rəng-lə-mə-yən | rəng-lə-mə-yən | |
rənglər | rəng-lər | rəng-lər | |
rəngləyən | rəng-ləyən | rəng-lə-yən | |
sadəlöhvlük | sa-də-löhv-lük | sa-də-lö(hvl)ük | |
sancmaq | sanc-maq | sa(ncm)aq | |
Santyaqo | Sant-ya-qo | Sa(nty)a-qo | |
sarplıq | sarp-lıq | sarp-lıq | |
sehrbaz | sehr-baz | se(hrb)az | |
sentyabr | sent-yabr | se(nty)abr | |
serbcə | serb-cə | serb-cə | |
skripka | skrip-ka | skrip-ka | |
skripkalar | skrip-ka-lar | skrip-ka-lar | |
skripkanı | skrip-ka-nı | skrip-ka-nı | |
Türkmənistan | Türk-mə-nis-tan | Tü(rkm)ə-nis-tan | |
Uinston | U-ins-ton | Ui(nst)on | |
uzundraz | u-zund-raz | u-zund-raz | |
vətənpərəstlik | və-tən-pə-rəst-lik | və-tən-pə-rəst-lik | |
yadplanetli | yad-pla-net-li | yadp-la-net-li | |
yurddaş | yurd-daş | yurd-daş | |
yönəltmək | yö-nəlt-mək | yö-nə(ltm)ək | |
yırtmaq | yırt-maq | yı(rtm)aq | |
çirkli | çirk-li | çirk-li | |
çıxartmaq | çı-xart-maq | çı-xa(rtm)aq | |
çəyirtkə | çə-yirt-kə | çə-yirt-kə | |
ölçmək | ölç-mək | ö(lçm)ək | |
örtmək | ört-mək | ö(rtm)ək | |
öskürtmək | ös-kürt-mək | ös-kü(rtm)ək | |
şişirtmək | şi-şirt-mək | şi-şi(rtm)ək | |
şərqdə | şərq-də | şərq-də | |
şərqdən | şərq-dən | şərq-dən |
Text | Expected | Actual | |
---|---|---|---|
almaq | [ɑɫˈmɑχ] | [ɑɫˈmɑχ] | |
parlaq | [pɑˈrːɑχ] | [pɑˈrːɑχ] | |
yerli | [jeˈrːi] | [jeˈrːi] | |
dostlar | [dosˈtːɑr] | [dosˈtːɑr] | |
adlar | [ɑˈdːɑr] | [ɑˈdːɑr] | |
gedirlər | [ɡeˈdilːær] | [ɡediˈlːær] | |
yatırlar | [jɑˈtɯɫːɑr] | [jɑtɯˈɫːɑr] | |
şəhərlər | [ʃæhærːær] | [ʃæhæˈlːær] | |
şəhərləri | [ʃæhærːæri] | [ʃæhærːæˈri] | |
ganmaq | [ɡɑˈmːɑχ] | [ɡɑˈmːɑχ] | |
qazlar | [ɡɑzˈdɑr] | [ɡɑzˈdɑr] | |
mesajlar | [mesɑʒˈdɑr] | [mesɑʒˈdɑr] | |
əsaslar | [æsɑsˈtɑr] | [æsɑsˈtɑr] | |
tanışlar | [tɑnɯʃˈtɑr] | [tɑnɯʃˈtɑr] | |
başlamaq | [bɑʃtɑˈmɑχ] | [bɑʃtɑˈmɑχ] | |
uzundraz | [uzunˈdrɑz] | [uzundˈrɑz] |
local tests = require "Module:UnitTests"
local full_link = require "Module:links".full_link
local az = require "Module:languages".getByCode("az")
local function link(term)
return full_link({ term = term, lang = az })
end
local function show_IPA(IPA)
return '<span class="IPA">' .. IPA .. '</span>'
end
-- adapted from [[Module:transliteration module testcases]]
local function examples_string_to_array(examples)
examples = examples:gsub("%s*%-%-[^\n]*", "")
local array = {}
for line in examples:gmatch("[^\n]+") do
line = mw.text.trim(line)
if line ~= "" then
local original, expected, sc = line:match("^([^\t]+)\t+([^\t]+)$")
if not original then
error("The following line did not consist of two arguments separated by tabs:\n"
.. line)
end
table.insert(array, { original, expected })
end
end
return array
end
function tests:test_phonetic()
-- For now, double consonants written with double letters (makes it easier
-- to write the stress.)
local examples = examples_string_to_array [[
almaq ɑɫˈmɑχ
parlaq pɑˈrːɑχ
yerli jeˈrːi
dostlar dosˈtːɑr
adlar ɑˈdːɑr
gedirlər ɡeˈdilːær
yatırlar jɑˈtɯɫːɑr
şəhərlər ʃæhærːær
şəhərləri ʃæhærːæri
ganmaq ɡɑˈmːɑχ
qazlar ɡɑzˈdɑr
mesajlar mesɑʒˈdɑr
əsaslar æsɑsˈtɑr
tanışlar tɑnɯʃˈtɑr
başlamaq bɑʃtɑˈmɑχ
uzundraz uzunˈdrɑz
]]
-- Currently ignoring stress!
local to_phonetic = require "Module:az-IPA".phonetic
self:iterate(examples, function(self, word, expected)
self:equals(link(word), to_phonetic(word), expected, {
display = function(IPA)
return show_IPA("[" .. IPA .. "]")
end,
})
end)
end
local consonant_cluster_testcases = [[akt-yor
A-lek-sandr
A-lek-sand-ri-ya
Al-fred
alt-mış
alt-mı-şın-cı
amp-lua
Ams-ter-dam
And-rey
an-sambl
An-tark-ti-da
antrakt
apostrof
art-maq
ast-ro-fi-zi-ka
av-qust-da
av-qustdan
av-qust-lar
avqustlara
avqustlarda
avqustlardan
avqustları
avqustların
Avstraliya
Avstriya
avtoportret
Banqladeş
boşaltmaq
böyürtkən
bürcdə
bürcdən
bədbəxtlik
bərkdən
Ceyms
dartmaq
diriltmək
DNT
dongra
dostluq
DQR
DVD
düzəltmək
eksport
ekssentrik
elektrik
farsca
fəhmli
fəhmsiz
gənclik
haqqlar
hüznlü
həbsxana
hərbçi
irqçi
irqçilik
jur-na-list-də
jur-na-lis-tdən
jur-na-list-lər
jur-na-list-lər-də
jurnalistlərdən
jurnalistləri
jurnalistlərin
jurnalistlərə
knyaz
knyazlıq
Konstantinopol
kons-ti-tu-siya
kont-ra-bas
kənd-də
kənd-dən
mi-to-xond-ri
Mosk-va
Məm-məd-rza
neft-çi
nərd-tax-ta
okt-yabr
pan-psi-xizm
part-la-maq
part-lat-maq
part-la-yış
po-lit-kor-rekt-lik
qals-tuk
qalx-maq
QHT
qo-naq-pə-rəst-lik
qorx-ma-maq
qorx-maq
qorx-ma-yan
Qorx-maz
qorx-maz
qırx-maq
qəlb-də
qəlb-dən
qəlb-lər
qəlb-lər-də
qəlb-lər-dən
qəlb-lər-i
qəlb-lər-in
qəlb-lə-rə
qərb-də
qərb-dən
qə-şəng-lik
qə-şəng-ləş-dir-mək
qə-şəng-ləş-mək
re-port-yor
rəhm-siz
rəng-ləm-ək
rəng-lə-mə-mək
rəng-lə-mə-yən
rəng-lər
rəng-ləyən
sa-də-löhv-lük
sanc-maq
Sant-ya-qo
sarp-lıq
sehr-baz
sent-yabr
serb-cə
skrip-ka
skrip-ka-lar
skrip-ka-nı
SSRİ
Türk-mə-nis-tan
U-ins-ton
u-zund-raz
və-tən-pə-rəst-lik
xoşbəxtlik
yad-pla-net-li
yurd-daş
yö-nəlt-mək
yırt-maq
Çarlz
çirk-li
çı-xart-maq
çə-yirt-kə
ölç-mək
ört-mək
ös-kürt-mək
şi-şirt-mək
şərq-də
şərq-dən]]
local function is_stop(letter) -- stop or affricate actually
assert(mw.ustring.len(letter) == 1)
letter = mw.ustring.lower(letter)
return mw.ustring.find(letter, "^[bcçdgkqpt]$") ~= nil
end
local function is_fricative(letter)
assert(mw.ustring.len(letter) == 1)
letter = mw.ustring.lower(letter)
return mw.ustring.find(letter, "^[fğhxjsşvz]$") ~= nil
end
-- local function is_affricate(letter) end
local function is_obstruent(letter)
return is_stop(letter) or is_fricative(letter)
end
local function is_liquid(letter)
assert(mw.ustring.len(letter) == 1)
letter = mw.ustring.lower(letter)
return mw.ustring.find(letter, "^[rl]$") ~= nil
end
local function letter_at(letters, pos)
return mw.ustring.sub(letters, pos, pos)
end
local syllable_divider = "-"
local function divide_syllables(word)
word = mw.ustring.gsub(
word,
"()([^AaEeİiOoUuIıÖöÜüƏə]+)()",
function(start_pos, cluster, end_pos)
if start_pos == 1 or end_pos == mw.ustring.len(word) + 1 then
return cluster
elseif mw.ustring.len(cluster) == 1 then
return syllable_divider .. cluster
elseif mw.ustring.len(cluster) == 2 then
local first, second = mw.ustring.match(cluster, "^(.)(.)$")
return first .. syllable_divider .. second
elseif is_liquid(letter_at(cluster, -1))
and is_stop(letter_at(cluster, -2)) then
-- return mw.ustring.sub(cluster, 1, -3) .. "." .. mw.ustring.sub(cluster, -2)
local rest, last = mw.ustring.match(cluster, "^(.+)(.)$")
return rest .. syllable_divider .. last
elseif is_liquid(letter_at(cluster, -3))
and is_stop(letter_at(cluster, -2))
and is_stop(letter_at(cluster, -1)) then
local rest, last = mw.ustring.match(cluster, "^(.+)(.)$")
return rest .. syllable_divider .. last
else
return "(" .. cluster .. ")"
end
end)
return word
end
function tests:test_consonant_cluster_division()
local tests = require "Module:fun".map(
function(x) return {x} end,
mw.text.split(consonant_cluster_testcases, "%s+"))
local syllable_divider_pattern = require "Module:string utilities".pattern_escape(syllable_divider)
self:iterate(tests, function(self, expected)
local original = expected:gsub(syllable_divider_pattern, "")
if original ~= expected then
self:equals(original, divide_syllables(original), expected)
end
end)
end
return tests