- translit: ฿
- ไปอยู่ไหนมา (bpai )
- เจ้าลูกหมูส่งเสียงร้อง “อู๊ด อู๊ด” ดังลั่น
- [[:Unsupported titles/ไม่ใช่ครับ เป็นคนอังกฤษครับ มาจาก`lsqb`แมนเช็สเตอร์/แมน-เช็ส-เตอ`rsqb` ขอโทษครับ คุณชื่ออะไรครับ#Thai|ไม่ใช่ครับ เป็นคนอังกฤษครับ มาจาก[แมนเช็สเตอร์/แมน-เช็ส-เตอ] ขอโทษครับ คุณชื่ออะไรครับ]]
Batch 1
[edit]See below the same sentences with outputs listed in the same other using {{th-xi}}
- สวัสดี ค่ะ คุณ ชื่อ อะไร คะ
- สวัสดีค่ะ คุณชื่ออะไรคะ
- translit: sà-wàt-dii kâ • kun chʉ̂ʉ à-rai ká
- makeEntryName: สวัสดีค่ะ คุณชื่ออะไรคะ
- preprocessLinks: สวัสดีค่ะ คุณชื่ออะไรคะ
- ชื่อ ปีเตอร์ ครับ
- ชื่อปีเตอร์ครับ
- translit: chʉ̂ʉ bpii-dtə̂ə kráp
- makeEntryName: ชื่อปีเตอร์ครับ
- preprocessLinks: ชื่อปีเตอร์ครับ
- คุณ ปีเตอร์ เป็น คน อเมริกัน ใช่ ไหม คะ
- คุณปีเตอร์เป็นคนอเมริกันใช่ไหมคะ
- translit: kun bpii-dtə̂ə bpen kon à-mee-rí-gan châi mǎi ká
- makeEntryName: คุณปีเตอร์เป็นคนอเมริกันใช่ไหมคะ
- preprocessLinks: คุณปีเตอร์เป็นคนอเมริกันใช่ไหมคะ
- [[:Unsupported titles/ไม่ ใช่ ครับ เป็น คน อังกฤษ ครับ มา จาก `lsqb`แมนเช็สเตอร์/แมน-เช็ส-เตอ`rsqb` ขอโทษ ครับ คุณ ชื่อ อะไร ครับ#Thai|ไม่ ใช่ ครับ เป็น คน อังกฤษ ครับ มา จาก [แมนเช็สเตอร์/แมน-เช็ส-เตอ] ขอโทษ ครับ คุณ ชื่อ อะไร ครับ]]
- [[:Unsupported titles/ไม่ใช่ครับ เป็นคนอังกฤษครับ มาจาก`lsqb`แมนเช็สเตอร์/แมน-เช็ส-เตอ`rsqb` ขอโทษครับ คุณชื่ออะไรครับ#Thai|ไม่ใช่ครับ เป็นคนอังกฤษครับ มาจาก[แมนเช็สเตอร์/แมน-เช็ส-เตอ] ขอโทษครับ คุณชื่ออะไรครับ]]
- translit: mâi châi kráp • bpen kon ang-grìt kráp • maa jàak [แมนเช็สเตอร์/mɛɛn-chés-dtəə] • kɔ̌ɔ-tôot kráp • kun chʉ̂ʉ à-rai kráp
- makeEntryName: ไม่ใช่ครับ เป็นคนอังกฤษครับ มาจาก[แมนเช็สเตอร์/แมน-เช็ส-เตอ] ขอโทษครับ คุณชื่ออะไรครับ
- preprocessLinks: ไม่ใช่ครับ เป็นคนอังกฤษครับ มาจาก[[[แมนเช็สเตอร์]]/แมน-เช็ส-เตอ] ขอโทษครับ คุณชื่ออะไรครับ
is a link to an undefined term with a respelling. The expected transliteration is "mɛɛn-chés-dtəə" (Manchester) (may not be 100% accurate or there could be respelling variants with loanwords)- translit: [แมนเช็สเตอร์/mɛɛn-chés-dtəə]
- makeEntryName: [แมนเช็สเตอร์/แมน-เช็ส-เตอ]
- preprocessLinks: [[[แมนเช็สเตอร์]]/แมน-เช็ส-เตอ]
Cases with ๆ (WIP)
- จอด ใกล้ ๆ สี่แยก ได้ ไหม คะ
- จอดใกล้ ๆ สี่แยกได้ไหมคะ
- translit: jɔ̀ɔt glâi • glâi • sìi-yɛ̂ɛk dâai mǎi ká
- makeEntryName: จอดใกล้ ๆ สี่แยกได้ไหมคะ
- preprocessLinks: จอดใกล้ ๆ สี่แยกได้ไหมคะ
- ไป แล้ว [ๆ/ไป แล้ว] (this is impossible to demonstrate with the current Thai templates, it needs to reduplicate more than just the last word). The Thai spelling and transliteration should be ไปแล้ว ๆ (bpai lɛ́ɛo · bpai lɛ́ɛo). (A Thai reader will know that they have to reduplicate two last words, not just the last one).
- ไปแล้ว[ๆ/ไปแล้ว]
- translit: bpai lɛ́ɛo [lɛ́ɛo/bpai lɛ́ɛo]
- makeEntryName: ไปแล้ว[ๆ/ไปแล้ว]
- preprocessLinks: ไปแล้ว[[[ๆ]]/ไปแล้ว]
[edit]- Two spaces produce · (space + middle point + space) or an actual visible space in the translit (to be confirmed)
- "{/}" is used for native Thai respellings. Syllables are separated with a "-" (hyphen). The new method for respellings to be used is going to be "[/]"
Literal or semi-literal translations are not tested, only given to help to understand
- สวัสดีค่ะ คุณชื่ออะไรคะ ― sà-wàt-dii kâ · kun chʉ̂ʉ à-rai ká ― Hello. What's your name (female speaker)
- sà-wàt-dii kâ • kun chʉ̂ʉ à-rai ká
- ชื่อปีเตอร์ครับ ― chʉ̂ʉ bpii-dtə̂ə kráp ― My name is Peter
- คุณปีเตอร์เป็นคนอเมริกันใช่ไหมคะ ― kun bpii-dtə̂ə bpen kon à-mee-rí-gan châi mǎi ká ― Are you are American, (Mr) Peter?
- ไม่ใช่ครับ เป็นคนอังกฤษครับ มาจากแมนเช็สเตอร์ ขอโทษครับ คุณชื่ออะไรครับ ― mâi châi kráp · bpen kon ang-grìt kráp · maa jàak mɛɛn-chés-dtəə · kɔ̌ɔ-tôot kráp · kun chʉ̂ʉ à-rai kráp ― No. I am British. Come from Manchester. Excuse me. What's your name?
Cases with ๆ (WIP)
- จอดใกล้ ๆ สี่แยกได้ไหมคะ ― jɔ̀ɔt glâi · glâi · sìi-yɛ̂ɛk dâai mǎi ká ― Can you park near the intersection? (female speaker)
- The case with multiword reduplication doesn't work correctly: the correct Thai spelling with incorrect transliteration: ไปแล้ว ๆ(bpai lɛ́ɛo · lɛ́ɛo) (two words ไป แล้ว are to be reduplicated, not one), the incorrect Thai spelling with correct transliteration ไปแล้ว ไปแล้ว(bpai lɛ́ɛo · bpai lɛ́ɛo).
Batch 2
[edit]- เขา ชื่อ อะไร ครับ - เขาชื่ออะไรครับ ― kǎo chʉ̂ʉ à-rai kráp ― What's his name? (male speaker)
- ชื่อ ปีเตอร์ ค่ะ - ชื่อปีเตอร์ค่ะ ― chʉ̂ʉ bpii-dtə̂ə kâ ― (His) name is Peter. (female speaker)
- นามสกุล อะไร - นามสกุลอะไร ― naam-sà-gun à-rai ― What's (his) last name?
- นามสกุล [กรีน/กฺรีน] ค่ะ (naam-sà-gun[griin/griin]kâ) - นามสกุลกรีนค่ะ ― naam-sà-gun griin kâ ― (His) last name is Green. (In my opinion, unrespelled กรีน (griin) or กรีน(griin) should produce NIL as ambiguous.)
- เป็น คน ชาติ อะไร ครับ - เป็นคนชาติอะไรครับ ― bpen kon châat à-rai kráp ― What nationality is (he)?
- เป็น คน อังกฤษ ค่ะ - เป็นคนอังกฤษค่ะ ― bpen kon ang-grìt kâ ― (He) is a British (English) person
- คน อังกฤษ ใช่ ไหม - คนอังกฤษใช่ไหม ― kon ang-grìt châi mǎi ― A British (English) person?
- ใช่ ค่ะ (châi kâ) - ใช่ค่ะ ― châi kâ ― Yes
- ทำ งาน อะไร - ทำงานอะไร ― tam ngaan à-rai ― What does (he) do?
- เป็น นัก ธุรกิจ ค่ะ ทำ งาน กับ บริษัท เอ ไอ จี - เป็นนักธุรกิจค่ะ ทำงานกับบริษัทเอ ไอ จี ― bpen nák tú-rá-gìt kâ · tam ngaan gàp bɔɔ-rí-sàt ee · ai · jii ― (He) is a businessman. Works with (for) company (called) AIG.
- Note that
can handle กรีน (griin, “Green (surname)”) without a respelling as with many monosyllabic words and guesses a lack of a vowel (consonant cluster "gr") but it's better to respell it as กฺรีน with the symbol ◌ฺ (phinthu) to avoid ambiguity. Ambiguous cases should produce NIL.
Some special cases
[edit]- ฿ (bàat)
- translit: ฿
- preprocessLinks: ฿
- ๕๐๐ (500)
- translit: 500
- preprocessLinks: ๕๐๐
- 500 (500)
- translit: 500
- preprocessLinks: 500
- กรุงเทพฯ (grung-têep)
- translit: grung-têep
- preprocessLinks: กรุงเทพฯ
- ๏
- translit: ๏
- preprocessLinks: ๏
- ๛
- translit: ๛
- preprocessLinks: ๛
- กรีน (griin)
- translit: griin
- preprocessLinks: กรีน
- ไปอยู่ไหนมา (bpai )
- translit: bpai yùu nǎi maa
- preprocessLinks: ไปอยู่ไหนมา
- เจ้าลูกหมูส่งเสียงร้อง “อู๊ด อู๊ด” ดังลั่น
- translit: jâao lûuk mǔu sòng sǐiang rɔ́ɔng • “úut • úut” • dang lân
- preprocessLinks: เจ้าลูกหมูส่งเสียงร้อง “อู๊ด อู๊ด” ดังลั่น
Some special cases
[edit]- ฿ (bàat) should be ฿ (฿) ✅
- Thai and Arabic numerals: ๕๐๐ (500) should be ๕๐๐ (500) and 500 (500) should be 500 (500). Working fine. ✅
- กรุงเทพฯ (grung-têep) to be discussed if it should กรุงเทพฯ (grung-têep~) (and change the respelling in the entry) or leave the same as กรุงเทพ (grung-têep), i.e. "grung-têep"
- To decide if various Thai punctuation symbols, e.g. ๏, ๛ should produce nothing, copy as they are (i.e. ๏ = ๏) or have a symbol/respelling assigned to them.
- กรีน (griin) with a possible true cluster should give no transliteration - กรีน or demand respelling in usage examples. e.g. The word ... was not romanised successfully. Please supply its syllabified phonetic respelling .... The first consonant in a cluster, should be followed by ◌ฺ. The expected output for กรีน (griin) should be NILL (ambiguous), even if it looks like a true cluster. See more on เพลา (pee-laa) vs เพลา (plao) below.
- On Thai consonant clusters:
- True clusters are made of: ก (gɔɔ), ข (kɔ̌ɔ), ค (kɔɔ), ต (dtɔɔ), ป (bpɔɔ), ผ (pɔ̌ɔ), พ (pɔɔ) + one of the sonorants: ร (rɔɔ), ล (lɔɔ), ว (wɔɔ). E.g. ใกล้ (glâi) should be respelled as ไกฺล้ (spelled as ai+g+phinthu+l+mai tho). If a syllable starts with consonants without a vowel or phinthu, it should be deemed suspicious and produce NIL or require a respelling. An example where lack of a respelling may produce false positives (these terms should ideally be always respelled by editors using them):
- Letter ห (hɔ̌ɔ) and in a very few cases (about four words?) + sonorant consonants acts as tone changing marker, e.g. หนาว (nǎao) is respelled as หฺนาว. phinthu marks that letter ห (hɔ̌ɔ) is not pronounced separately but acts to change the tone, compare the reading produced without the initial ห (hɔ̌ɔ): นาว (naao). Words where letter อ (ɔɔ) acts as ห (hɔ̌ɔ), e.g. อยู่ (yùu) are respelled with like this หฺยู่.
- Non-cluster example: สนุก (sà-nùk). ส (sɔ̌ɔ) and น (nɔɔ) can't form a cluster (see rule #1), so there must be a vowel between them. The respelling is สะ-หฺนุก. All such cases are respelled with a vowel (which may be also inherent) These include words with inherent vowels, where no cluster occurs: รส (rót), ผล (pǒn). The initial consonant and the vowel normally don't require respellings if pronounced as spelled.
- False clusters: numerous loanwords from Sanskrit and other languages where two consonants are pronounced as one เสร็จ (sèt) (s+r=s), จริง (jing) (j+r=j). They are all respelled.
- Boldface word example: ไป อยู่ ไหน มา ― Where have [you] been? should be as ไปอยู่ไหนมา ― bpai yùu nǎi maa ― Where have [you] been?
- Quotation marks example: เจ้า ลูก หมู ส่ง เสียง ร้อง “อู๊ด อู๊ด” ดัง ลั่น should be as เจ้าลูกหมูส่งเสียงร้อง “อู๊ด อู๊ด” ดังลั่น ― jâao lûuk mǔu sòng sǐiang rɔ́ɔng · “úut · úut” · dang lân ― The piglet made a loud "Oink, oink" sound.