Bengali and English/GSoC2011 Code Review

From Apertium
< Bengali and English
Revision as of 04:28, 19 August 2011 by Darthxaher (talk | contribs) (→‎31091)
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)
Jump to navigation Jump to search

Code Review

SVN Commits:

29815

OK

30071

Some confusion, these are not wrong, but need to be rechecked

+    <e><p><l>অবস্থিত<s n="adj"/><s n="mf"/></l><r>placed<s n="adj"/></r></p></e>
+    <e><p><l>সম্মত<s n="adj"/><s n="mf"/></l><r>agreed<s n="adj"/></r></p></e>
+    <e><p><l>দীর্ঘায়িত<s n="adj"/><s n="mf"/></l><r>lengthened<s n="adj"/></r></p></e>
+    <e><p><l>সমাপনী<s n="adj"/><s n="mf"/></l><r>closing<s n="adj"/></r></p></e>
+    <e><p><l>ছাড়<s n="adj"/><s n="mf"/></l><r>concession<s n="adj"/></r></p></e>
+    <e><p><l>নিকটবর্তী<s n="adj"/><s n="mf"/></l><r>near<s n="adj"/><s n="sint"/></r></p></e>
+    <e><p><l>ধর্মীয়<s n="adj"/><s n="mf"/></l><r>religious<s n="adj"/></r></p></e>
+    <e><p><l>বিশিষ্ট<s n="adj"/><s n="mf"/></l><r>special<s n="adj"/></r></p></e>
+    <e><p><l>মঞ্চস্থ<s n="adj"/><s n="mf"/></l><r>staged<s n="adj"/></r></p></e>
+    <e><p><l>নিকট<s n="adj"/><s n="mf"/></l><r>near<s n="adj"/><s n="sint"/></r></p></e>
+    <e><p><l>সরাসরি<s n="adj"/><s n="mf"/></l><r>live<s n="adj"/></r></p></e>

Wrong Meaning

+    <e><p><l>ত্রুটিপূর্ণ<s n="adj"/><s n="mf"/></l><r>defected<s n="adj"/></r></p></e> - corrected to 'defective'
+    <e><p><l>বিরত<s n="adj"/><s n="mf"/></l><r>discontinued<s n="adj"/></r></p></e> - stopped ?
+    <e><p><l>সুনির্দিষ্ট<s n="adj"/><s n="mf"/></l><r>specified<s n="adj"/></r></p></e> - corrected to 'specific'
+    <e><p><l>বিশৃঙ্খল<s n="adj"/><s n="mf"/></l><r>caos<s n="adj"/></r></p></e> - corrected to 'caotic'
+    <e><p><l>গোটা<s n="adj"/><s n="mf"/></l><r>full<s n="adj"/><s n="sint"/></r></p></e> - corrected to 'whole'
+    <e><p><l>আতঙ্কিত<s n="adj"/><s n="mf"/></l><r>panicked<s n="adj"/></r></p></e> - corrected to 'terrified'
+    <e><p><l>সংখ্যালঘু<s n="adj"/><s n="mf"/></l><r>minor<s n="adj"/></r></p></e> - minority ? noun ?
+    <e><p><l>বিশদ<s n="adj"/><s n="mf"/></l><r>details<s n="adj"/></r></p></e> - corrected to 'evident'
+    <e><p><l>চকচকে<s n="adj"/><s n="mf"/></l><r>glitter<s n="adj"/></r></p></e> - corrected to 'shining'
+    <e><p><l>কাল<s n="adj"/><s n="mf"/></l><r>time<s n="adj"/></r></p></e> - tomorrow ? noun ?
+    <e><p><l>বিরক্তিকর<s n="adj"/><s n="mf"/></l><r>disturbing<s n="adj"/></r></p></e> - annoying is a better option - corrected

Wrong Parts of Speech Tagging

Possible Nouns

+    <e><p><l>জনগণ<s n="adj"/><s n="mf"/></l><r>people<s n="adj"/></r></p></e> - removed from adj
+    <e><p><l>শহীদ<s n="adj"/><s n="mf"/></l><r>martyr<s n="adj"/></r></p></e> - removed from adj
+    <e><p><l>বিশ্বাসী<s n="adj"/><s n="mf"/></l><r>believer<s n="adj"/></r></p></e> - removed from adj

Possible Adverbs

+    <e><p><l>নিয়মিতভাবে<s n="adj"/><s n="mf"/></l><r>regularly<s n="adj"/></r></p></e> - removed from adj
+    <e><p><l>নিয়মিত<s n="adj"/><s n="mf"/></l><r>regularly<s n="adj"/></r></p></e> - corrected to 'regular' (adj)

Possible Spelling Mistake, please recheck

+    <e><p><l>পচা<s n="adj"/><s n="mf"/></l><r>rotten<s n="adj"/></r></p></e> - corrected to পঁচা
+    <e><p><l>দূষিত<s n="adj"/><s n="mf"/></l><r>polluted<s n="adj"/></r></p></e> - ??

Capitalization

+    <e><p><l>বাংলাদেশী<s n="adj"/><s n="mf"/></l><r>Bangladeshi<s n="adj"/></r></p></e> - corrected

30075

Wrong Parts of Speech Tagging

Possible Adjective

+    <e><p><l>ভরা<s n="n"/><s n="mf"/><s n="nn"/></l><r>full<s n="n"/></r></p></e> - removed from noun
+    <e><p><l>আণবিক<s n="n"/><s n="mf"/><s n="nn"/></l><r>atomic<s n="n"/></r></p></e> - removed from noun
+    <e><p><l>সাম্রাজ্যবাদী<s n="n"/><s n="mf"/><s n="hu"/></l><r>imperialist<s n="n"/></r></p></e> - isn't noun ?
+    <e><p><l>আহত<s n="n"/><s n="mf"/><s n="nn"/></l><r>wounded<s n="n"/></r></p></e> - removed from noun
+    <e><p><l>হাজির<s n="n"/><s n="mf"/><s n="nn"/></l><r>present<s n="n"/></r></p></e> - removed from noun

Wrong Meaning

+    <e><p><l>নির্দেশ<s n="n"/><s n="mf"/><s n="nn"/></l><r>direction<s n="n"/></r></p></e> - order perhaps? - corrected
+    <e><p><l>সুশাসন<s n="n"/><s n="nt"/><s n="nn"/></l><r>justice<s n="n"/></r></p></e> - good administration ?
+    <e><p><l>বিদেশ<s n="n"/><s n="mf"/><s n="nn"/></l><r>foreign<s n="n"/></r></p></e> - abroad ?
+    <e><p><l>পল্লী<s n="n"/><s n="mf"/><s n="nn"/></l><r>village<s n="n"/></r></p></e> - shoudn't it be 'rural' - isn't 'rural' adj ?
+    <e><p><l>জিজ্ঞেস<s n="n"/><s n="mf"/><s n="nn"/></l><r>ask<s n="n"/></r></p></e>
+    <e><p><l>অনুসরণ<s n="n"/><s n="mf"/><s n="nn"/></l><r>follow<s n="n"/></r></p></e> - corrected to 'following'
+    <e><p><l>মিয়া<s n="n"/><s n="mf"/><s n="nn"/></l><r>Mia<s n="n"/></r></p></e> - ??
+    <e><p><l>অপেক্ষা<s n="n"/><s n="mf"/><s n="nn"/></l><r>wait<s n="n"/></r></p></e> - waiting - corrected

Possible Spelling Mistake

+    <e><p><l>ঝাপসা<s n="n"/><s n="nt"/><s n="nn"/></l><r>blurry<s n="n"/></r></p></e> - ??

Better translation

+    <e><p><l>বাড়িঘর<s n="n"/><s n="mf"/><s n="nn"/></l><r>house<s n="n"/></r></p></e> - household - corrected
+    <e><p><l>জোট<s n="n"/><s n="mf"/><s n="nn"/></l><r>union<s n="n"/></r></p></e> - coalition - corrected

Capitalization

+    <e><p><l>তামিল<s n="n"/><s n="mf"/><s n="nn"/></l><r>tamil<s n="n"/></r></p></e> - corrected to 'Tamil'
+    <e><p><l>ডাচ<s n="n"/><s n="mf"/><s n="nn"/></l><r>dutch<s n="n"/></r></p></e> - corrected to 'Dutch'

Some confusion

+    <e><p><l>রওনা<s n="n"/><s n="mf"/><s n="nn"/></l><r>start<s n="n"/></r></p></e>
+    <e><p><l>বেড়ানো<s n="n"/><s n="mf"/><s n="nn"/></l><r>touring<s n="n"/></r></p></e>
+    <e><p><l>ছিনতাই<s n="n"/><s n="mf"/><s n="nn"/></l><r>snatch<s n="n"/></r></p></e>
+    <e><p><l>অসহযোগ<s n="n"/><s n="nt"/><s n="nn"/></l><r>noncooperation<s n="n"/></r></p></e>
+    <e><p><l>নিন্দা<s n="n"/><s n="nt"/><s n="nn"/></l><r>disrepute<s n="n"/></r></p></e>

Missing Entry

+    <e><p><l>ব্যাট<s n="n"/><s n="mf"/><s n="nn"/></l><r><s n="n"/></r></p></e> - corrected to 'bat'

30090

Confusing entry, please recheck

+    <e><p><l>টের<s n="n"/><s n="mf"/><s n="nn"/></l><r>sensation<s n="n"/></r></p></e>
+    <e><p><l>তৃণমূল<s n="n"/><s n="nt"/><s n="nn"/></l><r>grassroot<s n="n"/></r></p></e>
+    <e><p><l>প্রণয়ন<s n="n"/><s n="mf"/><s n="nn"/></l><r>composition<s n="n"/></r></p></e>
+    <e><p><l>পালন<s n="n"/><s n="mf"/><s n="nn"/></l><r>maintenance<s n="n"/></r></p></e>

Better translation possible?

+    <e><p><l>তোলা<s n="n"/><s n="mf"/><s n="nn"/></l><r>picking<s n="n"/></r></p></e>
+    <e><p><l>আওতা<s n="n"/><s n="mf"/><s n="nn"/></l><r>custody<s n="n"/></r></p></e>
+    <e><p><l>সন্ধান<s n="n"/><s n="mf"/><s n="nn"/></l><r>search<s n="n"/></r></p></e>
+    <e><p><l>অবরোধ<s n="n"/><s n="mf"/><s n="nn"/></l><r>blockage<s n="n"/></r></p></e> - blockade? - corrected
+    <e><p><l>ধাওয়া<s n="n"/><s n="mf"/><s n="nn"/></l><r>gallop<s n="n"/></r></p></e>
+    <e><p><l>ঘরবাড়ি<s n="n"/><s n="mf"/><s n="nn"/></l><r>house<s n="n"/></r></p></e> - household? - corrected
+    <e><p><l>প্রীতি<s n="n"/><s n="mf"/><s n="nn"/></l><r>pleasure<s n="n"/></r></p></e>
+    <e><p><l>মোকাবিলা<s n="n"/><s n="mf"/><s n="nn"/></l><r>face<s n="n"/></r></p></e> - confrontation - corrected
+    <e><p><l>সংস্কার<s n="n"/><s n="mf"/><s n="nn"/></l><r>purification<s n="n"/></r></p></e> - amendment? - corrected
+    <e><p><l>স্থাপন<s n="n"/><s n="mf"/><s n="nn"/></l><r>place<s n="n"/></r></p></e> - placement? - corrected
+    <e><p><l>অকৃত্রিম<s n="n"/><s n="nt"/><s n="nn"/></l><r>real<s n="n"/></r></p></e> - unfeigned?
+    <e><p><l>পরিশোধ<s n="n"/><s n="mf"/><s n="nn"/></l><r>pay<s n="n"/></r></p></e> - payment? - corrected
+    <e><p><l>যোগদান<s n="n"/><s n="mf"/><s n="nn"/></l><r>join<s n="n"/></r></p></e> - joining? - corrected
+    <e><p><l>রক্ষা<s n="n"/><s n="mf"/><s n="nn"/></l><r>protect<s n="n"/></r></p></e> - protection - corrected
+    <e><p><l>রটানো<s n="n"/><s n="mf"/><s n="nn"/></l><r>rumor<s n="n"/></r></p></e> - 

Note: Gerund forms must be matched, for e.g. যোগদান should be matched with 'joining' not 'join'

Wrong meaning

+    <e><p><l>দুর্গা<s n="n"/><s n="nt"/><s n="nn"/></l><r>fort<s n="n"/></r></p></e> - corrected to 'Durga'
+    <e><p><l>ছুটা<s n="n"/><s n="mf"/><s n="nn"/></l><r>run<s n="n"/></r></p></e> - 'running' is more appropriate - corrected
+    <e><p><l>তরুণী<s n="n"/><s n="f"/><s n="hu"/></l><r>young<s n="n"/></r></p></e> - young girl/young lady ?
+    <e><p><l>রাজি<s n="n"/><s n="mf"/><s n="nn"/></l><r>agreement<s n="n"/></r></p></e>
+    <e><p><l>জবানবন্দি<s n="n"/><s n="mf"/><s n="nn"/></l><r>witness<s n="n"/></r></p></e> - witness is for স্বাক্ষী - corrected to 'testimony'
+    <e><p><l>পেয়ার<s n="n"/><s n="mf"/><s n="nn"/></l><r>pair<s n="n"/></r></p></e>
+    <e><p><l>সহসভাপতি<s n="n"/><s n="mf"/><s n="hu"/></l><r>vice<s n="n"/></r></p></e> - vice chairman, perhaps? - already corrected to 'vice president'
+    <e><p><l>সংযম<s n="n"/><s n="nt"/><s n="nn"/></l><r>restrained<s n="n"/></r></p></e> - restrain - already corrected
+    <e><p><l>আটক<s n="n"/><s n="mf"/><s n="nn"/></l><r>imprisoned<s n="n"/></r></p></e>  corrected to 'captive'

Possible Adjective

+    <e><p><l>জড়ো<s n="n"/><s n="mf"/><s n="nn"/></l><r>collected<s n="n"/></r></p></e> - removed from noun
+    <e><p><l>গোছানো<s n="n"/><s n="mf"/><s n="nn"/></l><r>organised<s n="n"/></r></p></e> - removed from noun
+    <e><p><l>অন্তর্বর্তীকালীন<s n="n"/><s n="nt"/><s n="nn"/></l><r>interum<s n="n"/></r></p></e> - removed from noun
+    <e><p><l>বিপুল<s n="n"/><s n="mf"/><s n="nn"/></l><r>many<s n="n"/></r></p></e> - removed from noun
+    <e><p><l>মোটামুটি<s n="n"/><s n="nt"/><s n="nn"/></l><r>moderate<s n="n"/></r></p></e> - removed from noun
+    <e><p><l>অর্ধেক<s n="n"/><s n="mf"/><s n="nn"/></l><r>half<s n="n"/></r></p></e> - removed from noun
+    <e><p><l>সামান্য<s n="n"/><s n="mf"/><s n="nn"/></l><r>few<s n="n"/></r></p></e> - removed from noun
+    <e><p><l>অক্ষম<s n="n"/><s n="nt"/><s n="nn"/></l><r>unable<s n="n"/></r></p></e> - removed from noun
+    <e><p><l>প্রতিবন্ধী<s n="n"/><s n="mf"/><s n="hu"/></l><r>handicapped<s n="n"/></r></p></e> - removed from noun
+    <e><p><l>প্রচুর<s n="n"/><s n="nt"/><s n="nn"/></l><r>many<s n="n"/></r></p></e> - removed from noun
+    <e><p><l>অধীর<s n="n"/><s n="nt"/><s n="nn"/></l><r>eager<s n="n"/></r></p></e> - removed from noun

Capitalization

+    <e><p><l>বাঙালি<s n="n"/><s n="mf"/><s n="hu"/></l><r>bangalee<s n="n"/></r></p></e> - corrected to 'Bangalee'

30095

Wrong

+    <e><p><l>বিরোধীদলীয়<s n="adj"/><s n="mf"/></l><r>opposition<s n="adj"/></r></p></e>
+    <e><p><l>অদম্য<s n="adj"/><s n="mf"/></l><r>turbulent<s n="adj"/></r></p></e> - ??
+    <e><p><l>নষ্ট<s n="adj"/><s n="mf"/></l><r>disposed<s n="adj"/></r></p></e> - destroyed ? ruined ?
+    <e><p><l>গণতান্ত্রিক<s n="adj"/><s n="mf"/></l><r>democrative<s n="adj"/></r></p></e> - democratic? - corrected
+    <e><p><l>যাবজ্জীবন<s n="adj"/><s n="mf"/></l><r>lifetime<s n="adj"/></r></p></e> - lifetime is a noun, lifelong is an adjective - corrected to 'lifelong'
+    <e><p><l>সমন্বিত<s n="adj"/><s n="mf"/></l><r>possessing<s n="adj"/></r></p></e>

Some confusion

+    <e><p><l>পরের<s n="adj"/><s n="mf"/></l><r>late<s n="adj"/><s n="sint"/></r></p></e>
+    <e><p><l>ফাস্ট<s n="adj"/><s n="mf"/></l><r>fast<s n="adj"/><s n="sint"/></r></p></e> - এটা কি ফাস্ট নাকি ফার্স্ট? - as i see,  ফাস্ট
+    <e><p><l>নিবিড়<s n="adj"/><s n="mf"/></l><r>quite<s n="adj"/></r></p></e> - did you mean 'quiet'? - corrected


Better translation

+    <e><p><l>স্বাগত<s n="adj"/><s n="mf"/></l><r>welcomed<s n="adj"/></r></p></e> - welcome - corrected
+    <e><p><l>বিপুলসংখ্যক<s n="adj"/><s n="mf"/></l><r>huge<s n="adj"/></r></p></e>
+    <e><p><l>কাঁচা<s n="adj"/><s n="mf"/></l><r>green<s n="adj"/><s n="sint"/></r></p></e> - unripe - corrected

Possible Nouns

+    <e><p><l>খসড়া<s n="adj"/><s n="mf"/></l><r>draft<s n="adj"/></r></p></e> - removed from adj
+    <e><p><l>ইহুদি<s n="adj"/><s n="mf"/></l><r>jew<s n="adj"/></r></p></e> - removed from adj
+    <e><p><l>প্রতারক<s n="adj"/><s n="mf"/></l><r>fraud<s n="adj"/></r></p></e> - removed from adj
+    <e><p><l>আইরিশ<s n="adj"/><s n="mf"/></l><r>irish<s n="adj"/></r></p></e> - removed from adj

Possible Adverbs

+    <e><p><l>অনুসারে<s n="adj"/><s n="mf"/></l><r>accordingly<s n="adj"/></r></p></e> - removed from adj

30104

Better translation?

+    <e><p><l>আপন<s n="adj"/><s n="mf"/></l><r>close<s n="adj"/><s n="sint"/></r></p></e> - own ? pronoun ?
+    <e><p><l>ভয়াবহ<s n="adj"/><s n="mf"/></l><r>horrible<s n="adj"/></r></p></e> - it's no longer a colloquial use - corrected to 'horrible'
+    <e><p><l>জড়িত<s n="adj"/><s n="mf"/></l><r>concerned<s n="adj"/></r></p></e> - corrected to 'related'
+    <e><p><l>বিষয়ক<s n="adj"/><s n="mf"/></l><r>concerning<s n="adj"/></r></p></e>
+    <e><p><l>বিগত<s n="adj"/><s n="mf"/></l><r>past<s n="adj"/></r></p></e> - former?
+    <e><p><l>বিধ্বস্ত<s n="adj"/><s n="mf"/></l><r>destroyed<s n="adj"/></r></p></e> - devastated

Possible Adverb

+    <e><p><l>আস্তে<s n="adj"/><s n="mf"/></l><r>slow<s n="adj"/><s n="sint"/></r></p></e> - it sould be 'slowly' - removed from adj
+    <e><p><l>দেরিতে<s n="adj"/><s n="mf"/></l><r>late<s n="adj"/><s n="sint"/></r></p></e> - latey? but I'm not sure either, but it's possibly adverb

Possible Noun

+    <e><p><l>জিম্মি<s n="adj"/><s n="mf"/></l><r>hostage<s n="adj"/></r></p></e> - removed from adj
+    <e><p><l>বিধান<s n="adj"/><s n="mf"/></l><r>law<s n="adj"/></r></p></e>
+    <e><p><l>বিকল্প<s n="adj"/><s n="mf"/></l><r>alternative<s n="adj"/></r></p></e>

Wrong

+    <e><p><l>সহজতর<s n="adj"/><s n="mf"/></l><r>easy<s n="adj"/><s n="sint"/></r></p></e> - সহজতর is the comparative form of সহজ
+    <e><p><l>দলীয়<s n="adj"/><s n="mf"/></l><r>party<s n="adj"/></r></p></e>
+    <e><p><l>বর্ণবাদী<s n="adj"/><s n="mf"/></l><r>racism<s n="adj"/></r></p></e> - racist, I think
+    <e><p><l>কথিত<s n="adj"/><s n="mf"/></l><r>so<s n="adj"/></r></p></e>

Check Spelling

+    <e><p><l>অদ্ভুত<s n="adj"/><s n="mf"/></l><r>strange<s n="adj"/><s n="sint"/></r></p></e>

Slight Confusion

+    <e><p><l>সোয়া<s n="adj"/><s n="mf"/></l><r>quarter<s n="adj"/></r></p></e>

30105

OK

30108

OK

30109

Possible Adverb

+    <e><p><l>নিয়মিতভাবে<s n="adj"/><s n="mf"/></l><r>regular<s n="adj"/></r></p></e> - corrected

30111

OK

30161

Capitalization

+    <e><p><l>জার্মান<s n="adj"/><s n="mf"/></l><r>german<s n="adj"/></r></p></e> - corrected
+    <e><p><l>ভারতীয়<s n="adj"/><s n="mf"/></l><r>indian<s n="adj"/></r></p></e> - corrected
+    <e><p><l>ব্রিটিশ<s n="adj"/><s n="mf"/></l><r>british<s n="adj"/></r></p></e> - corrected
+    <e><p><l>মুসলিম<s n="adj"/><s n="mf"/></l><r>muslim<s n="adj"/></r></p></e> - corrected
+    <e><p><l>আফ্রিকান<s n="adj"/><s n="mf"/></l><r>african<s n="adj"/></r></p></e> - corrected

Possible Adverb

+    <e><p><l>সহজভাবে<s n="adj"/><s n="mf"/></l><r>easily<s n="adj"/></r></p></e> - removed from adj

Possible Noun

+    <e><p><l>প্রতীক<s n="adj"/><s n="mf"/></l><r>symbol<s n="adj"/></r></p></e> - removed from adj
+    <e><p><l>বেতার<s n="adj"/><s n="mf"/></l><r>radio<s n="adj"/></r></p></e> - removed from adj

Enclitic form, need to be handled in special way (don't know how to do that now :P), but keeping the entry for documentation

+    <e><p><l>ভালোই<s n="adj"/><s n="mf"/></l><r>good<s n="adj"/><s n="sint"/></r></p></e>

Wrong

+    <e><p><l>সর্বশেষ<s n="adj"/><s n="mf"/></l><r>last<s n="adj"/>last<s n="det"/><s n="ord"/><s n="sp"/></r></p></e> - corrected
+    <e><p><l>অবাধ<s n="adj"/><s n="mf"/></l><r>fluent<s n="adj"/></r></p></e> - corrected to "uninterrupted"

Better Translation?

+    <e><p><l>আলোচিত<s n="adj"/><s n="mf"/></l><r>discussed<s n="adj"/></r></p></e>

30162

OK

30214

Generate a test case and see if the entry works, these are possibly right, but I need to be sure

?    these things work bengali to english, not english to bengali, besides we need corresponding entries in en monodix

+    <e><p><l>কর্তব্যরত<s n="adj"/><s n="mf"/></l><r>on<b/>duty<s n="adj"/></r></p></e> - works bn-en not en-bn
+    <e><p><l>সাড়ে<s n="adj"/><s n="mf"/></l><r>half<b/>past<s n="adj"/></r></p></e> - i don't know why lt-proc unable analyse this ??
+    <e><p><l>পৌনে<s n="adj"/><s n="mf"/></l><r>quarter<b/>to<s n="adj"/></r></p></e>

Better translation

+    <e><p><l>বিকট<s n="adj"/><s n="mf"/></l><r>huge<s n="adj"/></r></p></e> - বিকটের translation অন্য কিছু একটা হওয়া উচিৎ, huge টা ভাল শোনাচ্ছে না
+    <e><p><l>শরিক<s n="adj"/><s n="mf"/></l><r>joint<s n="adj"/></r></p></e> - coalition - corrected
+    <e><p><l>আনুমানিক<s n="adj"/><s n="mf"/></l><r>probable<s n="adj"/></r></p></e>
+    <e><p><l>প্রান্তিক<s n="adj"/><s n="mf"/></l><r>marginal<s n="adj"/></r></p></e>
+    <e><p><l>সম্পৃক্ত<s n="adj"/><s n="mf"/></l><r>saturated<s n="adj"/></r></p></e> - this one is OK, but I'd like to reconsider the most used context
+    <e><p><l>বহাল<s n="adj"/><s n="mf"/></l><r>unaltered<s n="adj"/></r></p></e>
+    <e><p><l>পরিত্যক্ত<s n="adj"/><s n="mf"/></l><r>rejected<s n="adj"/></r></p></e> - abandoned is a better example - corrected

Slightly confusing, because this is supposed to be superlative form, but normally we dont't generate সর্বোত্তম

+    <e><p><l>সর্বোত্তম<s n="adj"/><s n="mf"/></l><r>best<s n="adj"/></r></p></e>

Possible Noun

+    <e><p><l>খুচরা<s n="adj"/><s n="mf"/></l><r>retail<s n="adj"/></r></p></e> - in dictionary 'retail' is listed as noun, it seems strange to me too :( - yup :|

30286

Better Translation NOTE: When translating, always take into account the most used context

+    <e><p><l>ভীষণ<s n="adj"/><s n="mf"/></l><r>terrible<s n="adj"/></r></p></e> - very would be more suitable for most contexts - ok corrected

Generate test case and check, at least one of these entries, I'm curious to check out if the multiwords are translating conrrectly

?    again we need entries in en.dix, i just followed the way multiwords appeared in en-es:
?    <e><p><l>at<b/>least<s n="adv"/></l><r>al<b/>menos<s n="adv"/></r></p></e>

+    <e><p><l>যাত্রীবাহী<s n="adj"/><s n="mf"/></l><r>passenger<b/>carrying<s n="adj"/></r></p></e>
+    <e><p><l>একাধিক<s n="adj"/><s n="mf"/></l><r>more<b/>than<b/>one<s n="adj"/></r></p></e>
+    <e><p><l>অন্যতম<s n="adj"/><s n="mf"/></l><r>one<b/>of<b/>the<s n="adj"/></r></p></e>
+    <e><p><l>অন্তত<s n="adj"/><s n="mf"/></l><r>at<b/>least<s n="adj"/></r></p></e> - adverb ?? :P
+    <e><p><l>সন্ত্রাসবিরোধী<s n="adj"/><s n="mf"/></l><r>anti<b/>terrorist<s n="adj"/></r></p></e>
+    <e><p><l>দ্বিবার্ষিক<s n="adj"/><s n="mf"/></l><r>bi<b/>yearly<s n="adj"/></r></p></e>

Wrong

+    <e><p><l>স্বরাষ্ট্র<s n="adj"/><s n="mf"/></l><r>home<s n="adj"/></r></p></e>
+    <e><p><l>যুব<s n="adj"/><s n="mf"/></l><r>young<s n="adj"/></r></p></e> - youth - youth is noun, young adj

30338

Capitalization

+    <e><p><l>বাংলা<s n="adj"/><s n="mf"/></l><r>bengali<s n="adj"/></r></p></e> - corrected

30409

OK

30419

Possible Adjective

+    <e><p><l><b/>বাতিল<s n="n"/><s n="mf"/><s n="nn"/></l><r>rejected<s n="n"/></r></p></e> - removed from noun
+    <e><p><l><b/>নোংরা<s n="n"/><s n="nt"/><s n="nn"/></l><r>dirty<s n="n"/></r></p></e> - removed from noun
+    <e><p><l><b/>প্রস্তুত<s n="n"/><s n="mf"/><s n="nn"/></l><r>ready<s n="n"/></r></p></e> - removed from noun
+    <e><p><l><b/>বৃদ্ধ<s n="n"/><s n="mf"/><s n="hu"/></l><r>old<s n="n"/></r></p></e> - removed from noun
+    <e><p><l><b/>অসুস্থ<s n="n"/><s n="nt"/><s n="nn"/></l><r>sick<s n="n"/></r></p></e> - removed from noun

Wrong Meaning

+    <e><p><l><b/>ভোগ<s n="n"/><s n="mf"/><s n="nn"/></l><r>consume<s n="n"/></r></p></e> - consumption - corrected
+    <e><p><l><b/>উদযাপন<s n="n"/><s n="mf"/><s n="nn"/></l><r>celebrate<s n="n"/></r></p></e> - celebration - corrected
+    <e><p><l><b/>অনুভব<s n="n"/><s n="mf"/><s n="nn"/></l><r>feel<s n="n"/></r></p></e> - feeling - corrected
+    <e><p><l><b/>অতিক্রম<s n="n"/><s n="mf"/><s n="nn"/></l><r>cross<s n="n"/></r></p></e> - crossing - corrected

Wrong Entry

+    <e><p><l><b/>প্রেস<s n="n"/><s n="mf"/><s n="nn"/></l><r>press<s n="n"/>/press<s n="n"/><s n="pl"/></r></p></e> - corrected


Not sure

+    <e><p><l><b/>প্রদর্শন<s n="n"/><s n="nt"/><s n="nn"/></l><r>show<s n="n"/></r></p></e>
+    <e><p><l><b/>গ্রহণ<s n="n"/><s n="nt"/><s n="nn"/></l><r>acceptance<s n="n"/></r></p></e>

Capitalization

+    <e><p><l><b/>ঢাকা<s n="n"/><s n="mf"/><s n="nn"/></l><r>dhaka<s n="n"/></r></p></e>

30453

Multiword, check with genrated test case

+    <e><p><l>মহাব্যবস্থাপক<s n="n"/><s n="mf"/><s n="hu"/></l><r>general<b/>manager<s n="n"/></r></p></e>
+    <e><p><l>মনোনয়নপত্র<s n="n"/><s n="mf"/><s n="nn"/></l><r>nomination<b/>paper<s n="n"/></r></p></e>
+    <e><p><l>রীতিনীতি<s n="n"/><s n="nt"/><s n="nn"/></l><r>rules<b/>and<b/>regulations<s n="n"/></r></p></e>
+    <e><p><l>সাংসদ<s n="n"/><s n="mf"/><s n="hu"/></l><r>member<b/>of<b/>palriament<s n="n"/></r></p></e>
+    <e><p><l>জনসভা<s n="n"/><s n="mf"/><s n="nn"/></l><r>public<b/>meeting<s n="n"/></r></p></e>
+    <e><p><l>পররাষ্ট্র<s n="n"/><s n="mf"/><s n="nn"/></l><r>foreign<b/>state<s n="n"/></r></p></e>

Recheck

+    <e><p><l>আল<s n="n"/><s n="mf"/><s n="nn"/></l><r>boundary<s n="n"/></r></p></e> - ক্ষেতের আইল?

Better Translation

+    <e><p><l>দখল<s n="n"/><s n="mf"/><s n="nn"/></l><r>possession<s n="n"/></r></p></e>
+    <e><p><l>চাওয়া<s n="n"/><s n="mf"/><s n="nn"/></l><r>desire<s n="n"/></r></p></e>
+    <e><p><l>অবলম্বন<s n="n"/><s n="mf"/><s n="nn"/></l><r>support<s n="n"/></r></p></e>
+    <e><p><l>জানা<s n="n"/><s n="mf"/><s n="nn"/></l><r>acquaintance<s n="n"/></r></p></e> - knowing?

Adjective

+    <e><p><l>অশান্ত<s n="n"/><s n="nt"/><s n="nn"/></l><r>restless<s n="n"/></r></p></e> - removed from noun

30488

+    <e><p><l>সহজ<s n="adj"/><s n="sint"/><s n="mf"/></l><r>easy<s n="adj"/></r></p></e> - easy is also sint - corrected

30489

OK

30515

OK

30531

OK

30540

OK

30582

OK

30632

OK

30635

Better Translation

+    <e><p><l>অবাধ<s n="adj"/><s n="mf"/></l><r>unijnterrupted<s n="adj"/></r></p></e>

Noun

+    <e><p><l>শরিক<s n="adj"/><s n="mf"/></l><r>coalition<s n="adj"/></r></p></e>

30656

OK

30706

Better meaning

+    <e><p><l>গালমন্দ<s n="n"/><s n="nt"/><s n="nn"/></l><r>abuse<s n="n"/></r></p></e> - [appears twice]
+    <e><p><l>সহ্য<s n="n"/><s n="mf"/><s n="nn"/></l><r>tolerance<s n="n"/></r></p></e>
+    <e><p><l>তৈরি<s n="n"/><s n="mf"/><s n="nn"/></l><r>manufacture<s n="n"/></r></p></e>
+    <e><p><l>নির্ভর<s n="n"/><s n="mf"/><s n="nn"/></l><r>dependence<s n="n"/></r></p></e>
+    <e><p><l>দেখা<s n="n"/><s n="mf"/><s n="nn"/></l><r>seeing<s n="n"/></r></p></e> - watching
+    <e><p><l>বেলা<s n="n"/><s n="mf"/><s n="nn"/></l><r>hour<s n="n"/></r></p></e> - cant find a better meaning, but this one does not seem right
+    <e><p><l>দ্বিপক্ষীয়<s n="adj"/><s n="mf"/></l><r>bi-partial<s n="adj"/></r></p></e> - bilateral
+    <e><p><l>সহসভাপতি<s n="n"/><s n="mf"/><s n="hu"/></l><r>vice<b/>president<s n="n"/></r></p></e> - I'm really not sure

Wrong Meaning

+    <e><p><l>বে<s n="n"/><s n="mf"/><s n="nn"/></l><r>bay<s n="n"/></r></p></e>
+    <e><p><l>গালমন্দ<s n="n"/><s n="nt"/><s n="nn"/></l><r>abuse<s n="n"/></r></p></e>


Wrong Number [sic] :P

+    <e><p><l>নেতৃবৃন্দ<s n="n"/><s n="mf"/><s n="nn"/></l><r>leader<s n="n"/></r></p></e> - yes, the entry is twice, i think

Adjective

+    <e><p><l>সম্মুখীন<s n="n"/><s n="mf"/><s n="nn"/></l><r>confrontation<s n="n"/></r></p></e>

30718

Monodix preliminry check: Done

Monodix through check: pending

30731

Monodix preliminry check: Done

Monodix through check: pending

30752

Monodix preliminry check: Done

Monodix through check: pending


30777

Monodix preliminry check: Done

Monodix through check: pending

30783

Monodix preliminry check: Done

Monodix through check: pending

30915

 বাস্তব	n   ->  adj
 +শিমুল	np  ->  n

30916

OK

30950

+    <e lm="হোগা"><i>হোগা</i><par n="দশা__n_nt"/></e> - what does it mean? not familiar with the word

30995

OK

31038

+    <e lm="ঝাপসা"><i>ঝাপসা</i><par n="ঘন__adj"/></e> - correct spelling
+    <e lm="মধ্যরাত"><i>মধ্যরাত</i><par n="টক__adj"/></e> - n
+    <e lm="উভয়"><i>উভয়</i><par n="টক__adj"/></e> - check pos
+    <e lm="পরস্পর"><i>পরস্পর</i><par n="টক__adj"/></e> - check pos

31039

Note:

Common family names are mf, although they might seem f All place names and institutional names are nt, if there is a problem in the paradef, then fix it

+    <e lm="বড়ুয়া"><i>বড়ুয়া</i><par n="লা__np_m"/></e> - mf
+    <e lm="রুশ"><i>রুশ</i><par n="ড__np_mf"/></e>
+    <e lm="দাশ"><i>দাশ</i><par n="হক__np_m"/></e> - mf
+    <e lm="সিনহা"><i>সিনহা</i><par n="লা__np_m"/></e> - mf
+    <e lm="উল"><i>উল</i><par n="হক__np_m"/></e>

+    <e lm="কারওয়ান-বাজার"><i>কারওয়ান-বাজার</i><par n="চীন__np_mf"/></e> - nt
+    <e lm="পল্টন"><i>পল্টন</i><par n="চীন__np_mf"/></e> - nt
+    <e lm="শাহবাগ"><i>শাহবাগ</i><par n="চীন__np_mf"/></e> - nt
+    <e lm="কুলাউড়া"><i>কুলাউড়া</i><par n="ঢাকা__np_mf"/></e> - nt
+    <e lm="রায়গঞ্জ"><i>রায়গঞ্জ</i><par n="চীন__np_mf"/></e> - nt
+    <e lm="লালবাগ"><i>লালবাগ</i><par n="চীন__np_mf"/></e> - nt
+    <e lm="দুর্গাপুর"><i>দুর্গাপুর</i><par n="চীন__np_mf"/></e> - nt
+    <e lm="বদরগঞ্জ"><i>বদরগঞ্জ</i><par n="চীন__np_mf"/></e> - nt
+    <e lm="শরীয়তপুর"><i>শরীয়তপুর</i><par n="চীন__np_mf"/></e> - nt
+    <e lm="বিয়ানীবাজার"><i>বিয়ানীবাজার</i><par n="চীন__np_mf"/></e> - nt
+    <e lm="শ্রীমঙ্গল"><i>শ্রীমঙ্গল</i><par n="চীন__np_mf"/></e> - nt
+    <e lm="চকরিয়া"><i>চকরিয়া</i><par n="ঢাকা__np_mf"/></e> - nt
+    <e lm="কেশবপুর"><i>কেশবপুর</i><par n="চীন__np_mf"/></e> - nt
+    <e lm="মিরসরাই"><i>মিরসরাই</i><par n="দুবাই__np_mf"/></e> - nt
+    <e lm="হংকং"><i>হংকং</i><par n="দুবাই__np_mf"/></e> - nt
+    <e lm="পুঠিয়া"><i>পুঠিয়া</i><par n="ঢাকা__np_mf"/></e> - nt
+    <e lm="ডেমরা"><i>ডেমরা</i><par n="ঢাকা__np_mf"/></e> - nt
+    <e lm="লোহাগড়া"><i>লোহাগড়া</i><par n="ঢাকা__np_mf"/></e> - nt
+    <e lm="গাজা"><i>গাজা</i><par n="ঢাকা__np_mf"/></e> - nt

+    <e lm="গাজা"><i>গাজা</i><par n="ঢাকা__np_mf"/></e>  - nt
+    <e lm="আল-কায়েদা"><i>আল-কায়েদা</i><par n="এপি__np_mf"/></e> - nt
+    <e lm="জাসদ"><i>জাসদ</i><par n="যুবদল__np_mf"/></e> - nt
+    <e lm="আইএমএফ"><i>আইএমএফ</i><par n="যুবদল__np_mf"/></e> - nt
+    <e lm="হরকাতুল"><i>হরকাতুল</i><par n="যুবদল__np_mf"/></e> - nt
+    <e lm="উদীচী"><i>উদীচী</i><par n="এপি__np_mf"/></e> - nt
+    <e lm="রাজউক"><i>রাজউক</i><par n="যুবদল__np_mf"/></e> - nt
+    <e lm="ছাত্রশিবির"><i>ছাত্রশিবির</i><par n="যুবদল__np_mf"/></e> - nt

+    <e lm="আখ"><i>আখ</i><par n="ইন__np_mf"/></e> - nt
+    <e lm="ইউএস"><i>ইউএস</i><par n="ইন__np_mf"/></e> - nt
+    <e lm="এমবিএ"><i>এমবিএ</i><par n="দি__np_mf"/></e> - nt
+    <e lm="এএফসি"><i>এএফসি</i><par n="দি__np_mf"/></e> - nt

+    <e lm="শাওন"><i>শাওন</i><par n="বেগম__np_f"/></e>- mf

31062

OK

31091

OK

31092

31110

31111

31112

31114

31123

31168

31169

31172

31175

31218

31226

31227

31243

31250

31262

31277

31278

31282

31337

31338