Commit 1a2eeae6 authored by rabauti's avatar rabauti
Browse files

statistika käsud

parent 9e2d75df
......@@ -4,4 +4,39 @@ python joinXml.py > korpus_public/oppijakeel.xml
#korpuse faili formaalse korrektsuse valideerimine
xmllint --noout korpus_public/oppijakeel.xml
#header.xml ja muud rajad on hardcoded joinXML.py failis
\ No newline at end of file
#statistikaks
cat korpus_public/oppijakeel.xml | grep -o 'tase="[^"]*"' | sort | uniq -c | sort -nr
cat korpus_public/oppijakeel.xml | grep -o 'emakeel="[^"]*"' | sort | uniq -c | sort -nr
cat korpus_public/oppijakeel.xml | grep -o 'emakeel="[^"]*"' | sort | uniq -c | sort -nr
7528 tase="kesk"
1177 tase="määramata"
311 tase="kõrg"
13 tase="alg"
8375 emakeel="vene"
357 emakeel="soome"
152 emakeel="läti"
46 emakeel="hispaania"
44 emakeel="komi"
24 emakeel="bulgaaria"
18 emakeel="hollandi"
9 emakeel="inglise"
4 emakeel="saksa"
5752 tyyp="kirjand"
1819 tyyp="vastused"
653 tyyp="eksamitöö"
514 tyyp="refereering"
209 tyyp="tõlge"
42 tyyp="referaat"
25 tyyp="referering"
15 tyyp=""
\ No newline at end of file
Supports Markdown
0% or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment