Commit 807ca65a authored by rabauti's avatar rabauti
Browse files

klasside kirjeldused lisatud

parent a1c05498
......@@ -103,17 +103,9 @@ for line in file_input:
collected_flags = {}
#paranduste klassifitseerimine
errorDecriptions = {
'tundmatu' : {'name':'Tundmatu', 'order':'1' }
, 'puudub' : {'name':'Parandus puudub', 'order':'1' }
, 'tühik' : {'name':'Tühik kirjavahemärgi ees v taga', 'order':'1' }
, 'punktuatsioon' : {'name':'Kirjavahemärk lisatud/eemaldatud', 'order':'1' }
, 'sõnadejärg' : {'name':'Sõnadejärjekord parandatud', 'order':'1' }
, 'sõnalisatud' : {'name':'Lisati puuduv sõna', 'order':'1' }
, 'sõnaeemaldatud' : {'name':'Kustutati sõna', 'order':'1' }
}
# alustame parandustest
d = Differ()
......@@ -123,7 +115,7 @@ stats = {}
stats['total'] = 0
stats['lahendamata1'] = 0
stats['lahendamata2'] = 0
filename2 = 'tulemus/tundmatu.html'
file_out = open(filename2, 'w')
......@@ -145,13 +137,12 @@ table, th, td
""")
file_out.write( '<h1>%s</h1>' % ('Tuvastamata veaga'))
file_out.write( '<table style="padding:5px">')
linenr = 0
for uid in sorted(corrections.keys()):
linenr +=1
#if linenr > 1000: continue
if linenr > 100: continue
to_print = 0
......@@ -695,9 +686,10 @@ for uid in sorted(corrections.keys()):
collected_flags[kkey] = 0
collected_flags[kkey] += 1
#print (flags, correction['text'])
if '0' in flags and kkey == '0':
if '0' in flags and kkey in ('0', '00'):
stats['lahendamata1'] +=1
elif '0' in flags:
stats['lahendamata1'] +=1
stats['lahendamata2'] +=1
file_out.write('</table>')
file_out.write ('</body></html>')
......@@ -738,46 +730,111 @@ for label in collected_flags:
file_out.write( '<h1>%s (%d)</h1>' % (label,collected_flags[label]))
file_out.write( '<h3>Kontrolliti %d parandust</h3>' % (stats['total']))
file_out.write( '<h3>Viga tuvastatud: %d</h3>' % (stats['total']- stats['lahendamata1']-stats['lahendamata2']))
file_out.write( '<h3>Viga tuvastamata: %d</h3>' % (stats['lahendamata1']))
file_out.write( '<h3>Viga osaliselt tuvastamata: %d</h3>' % (stats['lahendamata2']))
file_out.write( '<h3>Viga tuvastamata: %d (osaliselt tuvastatud %d)</h3>' % (stats['lahendamata1'] + stats['lahendamata2'] , stats['lahendamata2']))
file_out.write( '<h4>Kirjeldus <a target="_new" href="%s.html">#:</a></h4>')
for label2 in sorted(collected_flags):
file_out.write( '<span>%s <a href="%s.html">(%d)</a></span><br/>' % (label2,label2,collected_flags[label2]))
file_out.write( '<table style="padding:5px">')
for uid in sorted(corrections.keys()):
for (i, correction) in enumerate(corrections[uid]):
if not 'flags' in correction : continue
if not len (correction['flags']): continue
if not label == correction['flags_label']: continue
rows_html = ''
rows_html += '<tr><td>&nbsp;</td><td colspan="2">%s</td><td><a href="../morf/%s.html" target="_blank">Võrdlus:</a></td>\n' %( label, correction['id'])
rows_html += '<tr><td><b>%s</b></td><td>%s</td><td>%s</td><td rowspan="2">%s</td></tr>\n' %( uid, originals[uid]['text'], originals[uid]['tokenized'], "<br/>".join(correction['html_diff_result']) + '<hr/>' + "<br/>".join(correction['remained_diff']))
rows_html += '<tr><td><b>%s</b></td><td>%s</td><td>%s</td></tr>\n' %( correction['id'], correction['text'], correction['tokenized'])
for corr_set in corrections[uid][i]['correction_sets']:
rows_html += '<tr><td>&nbsp;</td><td>%s</td><td><span style="color:red">%s</span> ---&gt; <span style="color:green">%s</td><td></td></tr>\n' % (corr_set['type'], ' '.join(corr_set['deleted']) , ' '.join(corr_set['added'] ) )
rows_html += '<tr><td colspan="4">&nbsp;</td></tr>\n'
file_out.write(rows_html)
file_out.write(rows_html)
file_out.write('</table>')
#paranduste klassifitseerimine
errorDecriptions = {
'sõnadejärg' : {
'order':'1',
'rows': [
[ 'sõnadejärg', 'Sõna asukoht lauses on muutunud. Sõnakuju (va. väike-suurtäht lause alguses) pole muutunud. Sõnade morfanalüüsi ei vaadata.']
] },
'punktuatsioon' : {
'order':'2',
'rows': [
[ 'punktuatsioon', 'Lauses on muudetud (lisatud, eemaldatud, asendatud) mõnda kirjavahemärki.']
]},
'kokku-lahku' : {
'order':'3',
'rows': [
[ 'kokku-lahku', 'Lauses on muudetud (lisatud, eemaldatud, asendatud) mõnda kirjavahemärki.']
]},
file_out.write ('</body></html>')
file_out.close()
'valelemma' : {
'order':'4',
'rows': [
[ 'valelemma', 'Sõnavorm on sama, lemma on erinev. (Mitmesuse puhul otsitakse ühisosa.) Vaadatakse originaallauses/paranduses samal positsioonil olevaid sõnu.']
]},
'valevorm' : {
'order':'5',
'rows': [
[ 'valevorm', 'Lemma on sama. Sõnavorm on erinev. (Mitmesuse puhul otsitakse ühisosa.) Vaadatakse originaallauses/paranduses samal positsioonil olevaid sõnu.']
]},
'parallelvorm' : {
'order':'5',
'rows': [
[ 'parallelvorm', 'Sõnakuju on erinev. Lemma on sama. Sõnavorm on sama. (Mitmesuse puhul otsitakse ühisosa.) Vaadatakse originaallauses/paranduses samal positsioonil olevaid sõnu.']
]},
'sõnalisatud' : {
'order':'5',
'rows': [
[ 'sõnalisatud', 'Lauses oli sõna puudu.']
]},
'sõnaüle' : {
'order':'5',
'rows': [
[ 'sõnaüle', 'Lauses oli sõna üle.']
]},
}
filename2 = 'tulemus/kirjeldus.html'
file_out = open(filename2, 'w')
file_out.write( '<html> <meta charset="UTF-8"><head></head>')
file_out.write( "<body>")
file_out.write( '<h1>Tüübid</h1>')
for key in sorted(errorDecriptions.keys()):
#file_out.write( '<h2>%s</h2>' % key)
for row in errorDecriptions[key]['rows']:
file_out.write( '<p><b>%s</b><p><p style="padding-left:20px">%s</p>' % (row[0] , row[1]))
file_out.write ('</body></html>')
file_out.close()
exit()
Markdown is supported
0% or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment