Bengali and English/GSoC2011 Code Review

From Apertium
Jump to navigation Jump to search

Code Review

SVN Commits:

29815

OK

30071

Some confusion, these are not wrong, but need to be rechecked

+    <e><p><l>অবস্থিত<s n="adj"/><s n="mf"/></l><r>placed<s n="adj"/></r></p></e>
+    <e><p><l>সম্মত<s n="adj"/><s n="mf"/></l><r>agreed<s n="adj"/></r></p></e>
+    <e><p><l>দীর্ঘায়িত<s n="adj"/><s n="mf"/></l><r>lengthened<s n="adj"/></r></p></e>
+    <e><p><l>সমাপনী<s n="adj"/><s n="mf"/></l><r>closing<s n="adj"/></r></p></e>
+    <e><p><l>ছাড়<s n="adj"/><s n="mf"/></l><r>concession<s n="adj"/></r></p></e>
+    <e><p><l>নিকটবর্তী<s n="adj"/><s n="mf"/></l><r>near<s n="adj"/><s n="sint"/></r></p></e>
+    <e><p><l>ধর্মীয়<s n="adj"/><s n="mf"/></l><r>religious<s n="adj"/></r></p></e>
+    <e><p><l>বিশিষ্ট<s n="adj"/><s n="mf"/></l><r>special<s n="adj"/></r></p></e>
+    <e><p><l>মঞ্চস্থ<s n="adj"/><s n="mf"/></l><r>staged<s n="adj"/></r></p></e>
+    <e><p><l>নিকট<s n="adj"/><s n="mf"/></l><r>near<s n="adj"/><s n="sint"/></r></p></e>
+    <e><p><l>সরাসরি<s n="adj"/><s n="mf"/></l><r>live<s n="adj"/></r></p></e>

Wrong Meaning

+    <e><p><l>ত্রুটিপূর্ণ<s n="adj"/><s n="mf"/></l><r>defected<s n="adj"/></r></p></e> - corrected to 'defective'
+    <e><p><l>বিরত<s n="adj"/><s n="mf"/></l><r>discontinued<s n="adj"/></r></p></e> - stopped ?
+    <e><p><l>সুনির্দিষ্ট<s n="adj"/><s n="mf"/></l><r>specified<s n="adj"/></r></p></e> - corrected to 'specific'
+    <e><p><l>বিশৃঙ্খল<s n="adj"/><s n="mf"/></l><r>caos<s n="adj"/></r></p></e> - corrected to 'caotic'
+    <e><p><l>গোটা<s n="adj"/><s n="mf"/></l><r>full<s n="adj"/><s n="sint"/></r></p></e> - corrected to 'whole'
+    <e><p><l>আতঙ্কিত<s n="adj"/><s n="mf"/></l><r>panicked<s n="adj"/></r></p></e> - corrected to 'terrified'
+    <e><p><l>সংখ্যালঘু<s n="adj"/><s n="mf"/></l><r>minor<s n="adj"/></r></p></e> - minority ? noun ?
+    <e><p><l>বিশদ<s n="adj"/><s n="mf"/></l><r>details<s n="adj"/></r></p></e> - corrected to 'evident'
+    <e><p><l>চকচকে<s n="adj"/><s n="mf"/></l><r>glitter<s n="adj"/></r></p></e> - corrected to 'shining'
+    <e><p><l>কাল<s n="adj"/><s n="mf"/></l><r>time<s n="adj"/></r></p></e> - tomorrow ? noun ?
+    <e><p><l>বিরক্তিকর<s n="adj"/><s n="mf"/></l><r>disturbing<s n="adj"/></r></p></e> - annoying is a better option - corrected

Wrong Parts of Speech Tagging

Possible Nouns

+    <e><p><l>জনগণ<s n="adj"/><s n="mf"/></l><r>people<s n="adj"/></r></p></e> - removed from adj
+    <e><p><l>শহীদ<s n="adj"/><s n="mf"/></l><r>martyr<s n="adj"/></r></p></e> - removed from adj
+    <e><p><l>বিশ্বাসী<s n="adj"/><s n="mf"/></l><r>believer<s n="adj"/></r></p></e> - removed from adj

Possible Adverbs

+    <e><p><l>নিয়মিতভাবে<s n="adj"/><s n="mf"/></l><r>regularly<s n="adj"/></r></p></e> - removed from adj
+    <e><p><l>নিয়মিত<s n="adj"/><s n="mf"/></l><r>regularly<s n="adj"/></r></p></e> - corrected to 'regular' (adj)

Possible Spelling Mistake, please recheck

+    <e><p><l>পচা<s n="adj"/><s n="mf"/></l><r>rotten<s n="adj"/></r></p></e> - corrected to পঁচা
+    <e><p><l>দূষিত<s n="adj"/><s n="mf"/></l><r>polluted<s n="adj"/></r></p></e> - ??

Capitalization

+    <e><p><l>বাংলাদেশী<s n="adj"/><s n="mf"/></l><r>Bangladeshi<s n="adj"/></r></p></e> - corrected

30075

Wrong Parts of Speech Tagging

Possible Adjective

+    <e><p><l>ভরা<s n="n"/><s n="mf"/><s n="nn"/></l><r>full<s n="n"/></r></p></e> - removed from noun
+    <e><p><l>আণবিক<s n="n"/><s n="mf"/><s n="nn"/></l><r>atomic<s n="n"/></r></p></e> - removed from noun
+    <e><p><l>সাম্রাজ্যবাদী<s n="n"/><s n="mf"/><s n="hu"/></l><r>imperialist<s n="n"/></r></p></e> - isn't noun ?
+    <e><p><l>আহত<s n="n"/><s n="mf"/><s n="nn"/></l><r>wounded<s n="n"/></r></p></e> - removed from noun
+    <e><p><l>হাজির<s n="n"/><s n="mf"/><s n="nn"/></l><r>present<s n="n"/></r></p></e> - removed from noun

Wrong Meaning

+    <e><p><l>নির্দেশ<s n="n"/><s n="mf"/><s n="nn"/></l><r>direction<s n="n"/></r></p></e> - order perhaps? - corrected
+    <e><p><l>সুশাসন<s n="n"/><s n="nt"/><s n="nn"/></l><r>justice<s n="n"/></r></p></e> - good administration ?
+    <e><p><l>বিদেশ<s n="n"/><s n="mf"/><s n="nn"/></l><r>foreign<s n="n"/></r></p></e> - abroad ?
+    <e><p><l>পল্লী<s n="n"/><s n="mf"/><s n="nn"/></l><r>village<s n="n"/></r></p></e> - shoudn't it be 'rural' - isn't 'rural' adj ?
+    <e><p><l>জিজ্ঞেস<s n="n"/><s n="mf"/><s n="nn"/></l><r>ask<s n="n"/></r></p></e>
+    <e><p><l>অনুসরণ<s n="n"/><s n="mf"/><s n="nn"/></l><r>follow<s n="n"/></r></p></e> - corrected to 'following'
+    <e><p><l>মিয়া<s n="n"/><s n="mf"/><s n="nn"/></l><r>Mia<s n="n"/></r></p></e> - ??
+    <e><p><l>অপেক্ষা<s n="n"/><s n="mf"/><s n="nn"/></l><r>wait<s n="n"/></r></p></e> - waiting - corrected

Possible Spelling Mistake

+    <e><p><l>ঝাপসা<s n="n"/><s n="nt"/><s n="nn"/></l><r>blurry<s n="n"/></r></p></e> - ??

Better translation

+    <e><p><l>বাড়িঘর<s n="n"/><s n="mf"/><s n="nn"/></l><r>house<s n="n"/></r></p></e> - household - corrected
+    <e><p><l>জোট<s n="n"/><s n="mf"/><s n="nn"/></l><r>union<s n="n"/></r></p></e> - coalition - corrected

Capitalization

+    <e><p><l>তামিল<s n="n"/><s n="mf"/><s n="nn"/></l><r>tamil<s n="n"/></r></p></e> - corrected to 'Tamil'
+    <e><p><l>ডাচ<s n="n"/><s n="mf"/><s n="nn"/></l><r>dutch<s n="n"/></r></p></e> - corrected to 'Dutch'

Some confusion

+    <e><p><l>রওনা<s n="n"/><s n="mf"/><s n="nn"/></l><r>start<s n="n"/></r></p></e>
+    <e><p><l>বেড়ানো<s n="n"/><s n="mf"/><s n="nn"/></l><r>touring<s n="n"/></r></p></e>
+    <e><p><l>ছিনতাই<s n="n"/><s n="mf"/><s n="nn"/></l><r>snatch<s n="n"/></r></p></e>
+    <e><p><l>অসহযোগ<s n="n"/><s n="nt"/><s n="nn"/></l><r>noncooperation<s n="n"/></r></p></e>
+    <e><p><l>নিন্দা<s n="n"/><s n="nt"/><s n="nn"/></l><r>disrepute<s n="n"/></r></p></e>

Missing Entry

+    <e><p><l>ব্যাট<s n="n"/><s n="mf"/><s n="nn"/></l><r><s n="n"/></r></p></e> - corrected to 'bat'

30090

Confusing entry, please recheck

+    <e><p><l>টের<s n="n"/><s n="mf"/><s n="nn"/></l><r>sensation<s n="n"/></r></p></e>
+    <e><p><l>তৃণমূল<s n="n"/><s n="nt"/><s n="nn"/></l><r>grassroot<s n="n"/></r></p></e>
+    <e><p><l>প্রণয়ন<s n="n"/><s n="mf"/><s n="nn"/></l><r>composition<s n="n"/></r></p></e>
+    <e><p><l>পালন<s n="n"/><s n="mf"/><s n="nn"/></l><r>maintenance<s n="n"/></r></p></e>

Better translation possible?

+    <e><p><l>তোলা<s n="n"/><s n="mf"/><s n="nn"/></l><r>picking<s n="n"/></r></p></e>
+    <e><p><l>আওতা<s n="n"/><s n="mf"/><s n="nn"/></l><r>custody<s n="n"/></r></p></e>
+    <e><p><l>সন্ধান<s n="n"/><s n="mf"/><s n="nn"/></l><r>search<s n="n"/></r></p></e>
+    <e><p><l>অবরোধ<s n="n"/><s n="mf"/><s n="nn"/></l><r>blockage<s n="n"/></r></p></e> - blockade? - corrected
+    <e><p><l>ধাওয়া<s n="n"/><s n="mf"/><s n="nn"/></l><r>gallop<s n="n"/></r></p></e>
+    <e><p><l>ঘরবাড়ি<s n="n"/><s n="mf"/><s n="nn"/></l><r>house<s n="n"/></r></p></e> - household? - corrected
+    <e><p><l>প্রীতি<s n="n"/><s n="mf"/><s n="nn"/></l><r>pleasure<s n="n"/></r></p></e>
+    <e><p><l>মোকাবিলা<s n="n"/><s n="mf"/><s n="nn"/></l><r>face<s n="n"/></r></p></e> - confrontation - corrected
+    <e><p><l>সংস্কার<s n="n"/><s n="mf"/><s n="nn"/></l><r>purification<s n="n"/></r></p></e> - amendment? - corrected
+    <e><p><l>স্থাপন<s n="n"/><s n="mf"/><s n="nn"/></l><r>place<s n="n"/></r></p></e> - placement? - corrected
+    <e><p><l>অকৃত্রিম<s n="n"/><s n="nt"/><s n="nn"/></l><r>real<s n="n"/></r></p></e> - unfeigned?
+    <e><p><l>পরিশোধ<s n="n"/><s n="mf"/><s n="nn"/></l><r>pay<s n="n"/></r></p></e> - payment? - corrected
+    <e><p><l>যোগদান<s n="n"/><s n="mf"/><s n="nn"/></l><r>join<s n="n"/></r></p></e> - joining? - corrected
+    <e><p><l>রক্ষা<s n="n"/><s n="mf"/><s n="nn"/></l><r>protect<s n="n"/></r></p></e> - protection - corrected
+    <e><p><l>রটানো<s n="n"/><s n="mf"/><s n="nn"/></l><r>rumor<s n="n"/></r></p></e> - 

Note: Gerund forms must be matched, for e.g. যোগদান should be matched with 'joining' not 'join'

Wrong meaning

+    <e><p><l>দুর্গা<s n="n"/><s n="nt"/><s n="nn"/></l><r>fort<s n="n"/></r></p></e> - corrected to 'Durga'
+    <e><p><l>ছুটা<s n="n"/><s n="mf"/><s n="nn"/></l><r>run<s n="n"/></r></p></e> - 'running' is more appropriate - corrected
+    <e><p><l>তরুণী<s n="n"/><s n="f"/><s n="hu"/></l><r>young<s n="n"/></r></p></e> - young girl/young lady ?
+    <e><p><l>রাজি<s n="n"/><s n="mf"/><s n="nn"/></l><r>agreement<s n="n"/></r></p></e>
+    <e><p><l>জবানবন্দি<s n="n"/><s n="mf"/><s n="nn"/></l><r>witness<s n="n"/></r></p></e> - witness is for স্বাক্ষী - corrected to 'testimony'
+    <e><p><l>পেয়ার<s n="n"/><s n="mf"/><s n="nn"/></l><r>pair<s n="n"/></r></p></e>
+    <e><p><l>সহসভাপতি<s n="n"/><s n="mf"/><s n="hu"/></l><r>vice<s n="n"/></r></p></e> - vice chairman, perhaps? - already corrected to 'vice president'
+    <e><p><l>সংযম<s n="n"/><s n="nt"/><s n="nn"/></l><r>restrained<s n="n"/></r></p></e> - restrain - already corrected
+    <e><p><l>আটক<s n="n"/><s n="mf"/><s n="nn"/></l><r>imprisoned<s n="n"/></r></p></e>  corrected to 'captive'

Possible Adjective

+    <e><p><l>জড়ো<s n="n"/><s n="mf"/><s n="nn"/></l><r>collected<s n="n"/></r></p></e> - removed from noun
+    <e><p><l>গোছানো<s n="n"/><s n="mf"/><s n="nn"/></l><r>organised<s n="n"/></r></p></e> - removed from noun
+    <e><p><l>অন্তর্বর্তীকালীন<s n="n"/><s n="nt"/><s n="nn"/></l><r>interum<s n="n"/></r></p></e> - removed from noun
+    <e><p><l>বিপুল<s n="n"/><s n="mf"/><s n="nn"/></l><r>many<s n="n"/></r></p></e> - removed from noun
+    <e><p><l>মোটামুটি<s n="n"/><s n="nt"/><s n="nn"/></l><r>moderate<s n="n"/></r></p></e> - removed from noun
+    <e><p><l>অর্ধেক<s n="n"/><s n="mf"/><s n="nn"/></l><r>half<s n="n"/></r></p></e> - removed from noun
+    <e><p><l>সামান্য<s n="n"/><s n="mf"/><s n="nn"/></l><r>few<s n="n"/></r></p></e> - removed from noun
+    <e><p><l>অক্ষম<s n="n"/><s n="nt"/><s n="nn"/></l><r>unable<s n="n"/></r></p></e> - removed from noun
+    <e><p><l>প্রতিবন্ধী<s n="n"/><s n="mf"/><s n="hu"/></l><r>handicapped<s n="n"/></r></p></e> - removed from noun
+    <e><p><l>প্রচুর<s n="n"/><s n="nt"/><s n="nn"/></l><r>many<s n="n"/></r></p></e> - removed from noun
+    <e><p><l>অধীর<s n="n"/><s n="nt"/><s n="nn"/></l><r>eager<s n="n"/></r></p></e> - removed from noun

Capitalization

+    <e><p><l>বাঙালি<s n="n"/><s n="mf"/><s n="hu"/></l><r>bangalee<s n="n"/></r></p></e> - corrected to 'Bangalee'

30095

Wrong

+    <e><p><l>বিরোধীদলীয়<s n="adj"/><s n="mf"/></l><r>opposition<s n="adj"/></r></p></e>
+    <e><p><l>অদম্য<s n="adj"/><s n="mf"/></l><r>turbulent<s n="adj"/></r></p></e> - ??
+    <e><p><l>নষ্ট<s n="adj"/><s n="mf"/></l><r>disposed<s n="adj"/></r></p></e> - destroyed ? ruined ?
+    <e><p><l>গণতান্ত্রিক<s n="adj"/><s n="mf"/></l><r>democrative<s n="adj"/></r></p></e> - democratic? - corrected
+    <e><p><l>যাবজ্জীবন<s n="adj"/><s n="mf"/></l><r>lifetime<s n="adj"/></r></p></e> - lifetime is a noun, lifelong is an adjective - corrected to 'lifelong'
+    <e><p><l>সমন্বিত<s n="adj"/><s n="mf"/></l><r>possessing<s n="adj"/></r></p></e>

Some confusion

+    <e><p><l>পরের<s n="adj"/><s n="mf"/></l><r>late<s n="adj"/><s n="sint"/></r></p></e>
+    <e><p><l>ফাস্ট<s n="adj"/><s n="mf"/></l><r>fast<s n="adj"/><s n="sint"/></r></p></e> - এটা কি ফাস্ট নাকি ফার্স্ট? - as i see,  ফাস্ট
+    <e><p><l>নিবিড়<s n="adj"/><s n="mf"/></l><r>quite<s n="adj"/></r></p></e> - did you mean 'quiet'? - corrected


Better translation

+    <e><p><l>স্বাগত<s n="adj"/><s n="mf"/></l><r>welcomed<s n="adj"/></r></p></e> - welcome - corrected
+    <e><p><l>বিপুলসংখ্যক<s n="adj"/><s n="mf"/></l><r>huge<s n="adj"/></r></p></e>
+    <e><p><l>কাঁচা<s n="adj"/><s n="mf"/></l><r>green<s n="adj"/><s n="sint"/></r></p></e> - unripe - corrected

Possible Nouns

+    <e><p><l>খসড়া<s n="adj"/><s n="mf"/></l><r>draft<s n="adj"/></r></p></e> - removed from adj
+    <e><p><l>ইহুদি<s n="adj"/><s n="mf"/></l><r>jew<s n="adj"/></r></p></e> - removed from adj
+    <e><p><l>প্রতারক<s n="adj"/><s n="mf"/></l><r>fraud<s n="adj"/></r></p></e> - removed from adj
+    <e><p><l>আইরিশ<s n="adj"/><s n="mf"/></l><r>irish<s n="adj"/></r></p></e> - removed from adj

Possible Adverbs

+    <e><p><l>অনুসারে<s n="adj"/><s n="mf"/></l><r>accordingly<s n="adj"/></r></p></e> - removed from adj

30104

Better translation?

+    <e><p><l>আপন<s n="adj"/><s n="mf"/></l><r>close<s n="adj"/><s n="sint"/></r></p></e> - own ? pronoun ?
+    <e><p><l>ভয়াবহ<s n="adj"/><s n="mf"/></l><r>horrible<s n="adj"/></r></p></e> - it's no longer a colloquial use - corrected to 'horrible'
+    <e><p><l>জড়িত<s n="adj"/><s n="mf"/></l><r>concerned<s n="adj"/></r></p></e> - corrected to 'related'
+    <e><p><l>বিষয়ক<s n="adj"/><s n="mf"/></l><r>concerning<s n="adj"/></r></p></e>
+    <e><p><l>বিগত<s n="adj"/><s n="mf"/></l><r>past<s n="adj"/></r></p></e> - former?
+    <e><p><l>বিধ্বস্ত<s n="adj"/><s n="mf"/></l><r>destroyed<s n="adj"/></r></p></e> - devastated

Possible Adverb

+    <e><p><l>আস্তে<s n="adj"/><s n="mf"/></l><r>slow<s n="adj"/><s n="sint"/></r></p></e> - it sould be 'slowly' - removed from adj
+    <e><p><l>দেরিতে<s n="adj"/><s n="mf"/></l><r>late<s n="adj"/><s n="sint"/></r></p></e> - latey? but I'm not sure either, but it's possibly adverb

Possible Noun

+    <e><p><l>জিম্মি<s n="adj"/><s n="mf"/></l><r>hostage<s n="adj"/></r></p></e> - removed from adj
+    <e><p><l>বিধান<s n="adj"/><s n="mf"/></l><r>law<s n="adj"/></r></p></e>
+    <e><p><l>বিকল্প<s n="adj"/><s n="mf"/></l><r>alternative<s n="adj"/></r></p></e>

Wrong

+    <e><p><l>সহজতর<s n="adj"/><s n="mf"/></l><r>easy<s n="adj"/><s n="sint"/></r></p></e> - সহজতর is the comparative form of সহজ
+    <e><p><l>দলীয়<s n="adj"/><s n="mf"/></l><r>party<s n="adj"/></r></p></e>
+    <e><p><l>বর্ণবাদী<s n="adj"/><s n="mf"/></l><r>racism<s n="adj"/></r></p></e> - racist, I think
+    <e><p><l>কথিত<s n="adj"/><s n="mf"/></l><r>so<s n="adj"/></r></p></e>

Check Spelling

+    <e><p><l>অদ্ভুত<s n="adj"/><s n="mf"/></l><r>strange<s n="adj"/><s n="sint"/></r></p></e>

Slight Confusion

+    <e><p><l>সোয়া<s n="adj"/><s n="mf"/></l><r>quarter<s n="adj"/></r></p></e>

30105

30108

30109

30111

30161

30162

30214

30286

30338

30409

30419

30453