Commit b068916d authored by Neeme Kahusk's avatar Neeme Kahusk

default mode

parent 07b839bb
settings.corpora = {};
settings.corporafolders = {};
settings.globalFilterCorpora = ["ivip"]
settings.corporafolders.sweac = {
title: "Akademiska texter",
contents: ["sweachum", "sweacsam"]
};
settings.corporafolders.strindberg = {
title: "August Strindberg",
contents: ["strindbergromaner", "strindbergbrev"]
};
settings.corporafolders.fisk = {
title: "Finlandssvenska texter",
contents: [],
description: "Det första steget för att skapa en finlandssvensk korpus togs redan " +
"på 1990-talet (Institutionen för nordiska språk vid Helsingfors universitet) " +
"och under åren 1999–2000 fortsatte arbetet (ett samarbetsprojekt mellan " +
"Institutet för de inhemska språken, Institutionen för allmän språkvetenskap " +
"och CSC (IT Center for Science)). Under åren 2011–2013 byggs den finlandssvenska " +
"korpusen ut som ett samarbetsprojekt mellan Svenska litteratursällskapet i Finland, " +
"Institutet för de inhemska språken och Göteborgs universitet."
};
settings.corporafolders.fisk.webtexts = {
title: "Webbtexter",
contents: ["fsbbloggvuxna", "magmakolumner"]
};
settings.corporafolders.fisk.governmental = {
title: "Myndighetstexter",
contents: ["informationstidningar", "lagtexter", "myndighet", "propositioner"]
};
settings.corporafolders.fisk.literature = {
title: "Skön- och facklitteratur",
contents: ["barnlitteratur", "fsbessaistik", "fsbsakprosa", "fsbskonlit1960-1999", "fsbskonlit2000tal", "ungdomslitteratur"]
};
settings.corporafolders.fisk.newspapertexts = {
title: "Tidningstexter",
contents: ["borgabladet", "vastranyland", "at2012", "ostranyland"]
};
settings.corporafolders.fisk.newspapertexts.fnb = {
title: "FNB",
contents: ["fnb1999", "fnb2000"],
description: "<a href=\"http://www.stt.fi/sv\" target=\"_blank\">FNB</a> är Finlands ledande nyhets- och bildbyrå."
};
settings.corporafolders.fisk.newspapertexts.hbl = {
title: "Hufvudstadsbladet",
contents: ["hbl1991", "hbl1998", "hbl1999", "hbl20122013", "hbl2014"],
description: "<a href=\"http://www.hbl.fi\" target=\"_blank\">Hufvudstadsbladet</a> är den största finlandssvenska dagstidningen i Finland."
};
settings.corporafolders.fisk.newspapertexts.jakobstadstidning = {
title: "Jakobstads tidning",
contents: ["jakobstadstidning1999", "jakobstadstidning2000"],
description: "Jakobstads Tidning var en lokal dagstidning i Österbotten som gavs ut under perioden 1898–2008."
};
settings.corporafolders.fisk.newspapertexts.pargaskungorelser = {
title: "Pargas kungörelser",
contents: ["pargaskungorelser2011", "pargaskungorelser2012"],
description: "<a href=\"http://www.pku.fi\" target=\"_blank\">Pargas Kungörelser</a> är en regional tvåspråkig (svenska och finska) tidning med spridning i Pargas med omnejd. I korpusen är endast den svenskspråkiga delen av tidningen med."
};
settings.corporafolders.fisk.newspapertexts.sydosterbotten = {
title: "Syd-Österbotten",
contents: ["sydosterbotten2010", "sydosterbotten2011", "sydosterbotten2012", "sydosterbotten2013", "sydosterbotten2014"],
description: "<a href=\"http://www.sydin.fi\" target=\"_blank\">Syd-Österbotten</a> är en regional svenskspråkig dagstidning i Österbotten."
};
settings.corporafolders.fisk.newspapertexts.vasab = {
title: "Vasabladet",
contents: ["vasabladet1991", "vasabladet2012", "vasabladet2013", "vasabladet2014"],
description: "<a href=\"http://www.vasabladet.fi\" target=\"_blank\">Vasabladet</a> är en regional svenskspråkig dagstidning i Österbotten."
};
settings.corporafolders.fisk.newspapertexts.abounderrattelser = {
title: "Åbo Underrättelser",
contents: ["abounderrattelser2012", "abounderrattelser2013"],
description: "<a href=\"www.abounderrattelser.fi\" target=\"_blank\">Åbo Underrättelser</a> är en regional svenskspråkig dagstidning i Åbotrakten."
};
settings.corporafolders.fisk.newspapertexts.osterbottenstidning = {
title: "Österbottens Tidning",
contents: ["osterbottenstidning2011", "osterbottenstidning2012", "osterbottenstidning2013", "osterbottenstidning2014"],
description: "<a href=\"http://www.ot.fi\" target=\"_blank\">Österbottens Tidning</a> är en regional svenskspråkig tidning i Österbotten."
//
};
settings.corporafolders.fisk.magazines = {
title: "Tidskrifter",
contents: ["astra1960-1979", "astranova", "bullen", "fanbararen", "finsktidskrift", "forumfeot", "hankeiten", "hanken", "jft", "kallan", "meddelanden", "nyaargus", "studentbladet", "svenskbygden"]
};
settings.corporafolders.medical = {
title: "Medicinska texter",
contents: ["diabetolog", "smittskydd"]
};
settings.corporafolders.medical.ltd = {
title: "Läkartidningen",
contents: ["lt1996", "lt1997", "lt1998", "lt1999", "lt2000", "lt2001", "lt2002", "lt2003", "lt2004", "lt2005", "lt2006"]
};
settings.corporafolders.governmental = {
title: "Myndighetstexter",
contents: ["klarsprak", "sou", "sfs"]
};
settings.corporafolders.protected = {
title: "Skyddade korpusar",
contents: ["ansokningar", "sprakfragor", "coctaill", "forhor", "gdc", "ivip", "lawline", "mepac", "mepac-i", "soexempel", "sw1203", "tisus"]
};
settings.corporafolders.novels = {
title: "Skönlitteratur",
contents: ["aspacsv", "romi", "romii", "rom99", "storsuc", "romg"]
};
settings.corporafolders.socialmedia = {
title: "Sociala medier",
contents: []
};
settings.corporafolders.socialmedia.bloggmix = {
title: "Bloggmix",
contents: ["bloggmix1998", "bloggmix1999", "bloggmix2000", "bloggmix2001", "bloggmix2002", "bloggmix2003", "bloggmix2004", "bloggmix2005", "bloggmix2006", "bloggmix2007", "bloggmix2008", "bloggmix2009", "bloggmix2010", "bloggmix2011", "bloggmix2012", "bloggmix2013", "bloggmix2014", "bloggmix2015", "bloggmix2016", "bloggmix2017", "bloggmixodat"],
description: "Material från ett urval av svenska bloggar. Uppdateras regelbundet."
};
settings.corporafolders.socialmedia.forum = {
title: "Diskussionsforum",
contents: []
};
settings.corporafolders.socialmedia.forum.familjeliv = {
title: "Familjeliv",
contents: ["familjeliv-adoption", "familjeliv-allmanna-ekonomi", "familjeliv-allmanna-familjeliv", "familjeliv-allmanna-fritid", "familjeliv-allmanna-hushem", "familjeliv-allmanna-husdjur", "familjeliv-allmanna-kropp", "familjeliv-allmanna-noje", "familjeliv-allmanna-samhalle", "familjeliv-allmanna-sandladan", "familjeliv-expert", "familjeliv-foralder", "familjeliv-gravid", "familjeliv-kansliga", "familjeliv-medlem-allmanna", "familjeliv-medlem-foraldrar", "familjeliv-medlem-planerarbarn", "familjeliv-medlem-vantarbarn", "familjeliv-pappagrupp", "familjeliv-planerarbarn", "familjeliv-sexsamlevnad", "familjeliv-svartattfabarn", "familjeliv-anglarum"],
description: "Material från diskussionsforumet <a target=\"_blank\" href=\"https://www.familjeliv.se/\">Familjeliv</a>. Materialet är under uppbyggnad."
};
settings.corporafolders.socialmedia.forum.flashback = {
title: "Flashback",
contents: ["flashback-dator", "flashback-droger", "flashback-fordon", "flashback-hem", "flashback-kultur", "flashback-livsstil", "flashback-mat", "flashback-politik", "flashback-resor", "flashback-samhalle", "flashback-sex", "flashback-sport", "flashback-vetenskap", "flashback-ovrigt", "flashback-flashback"],
description: "Material från diskussionsforumet <a target=\"_blank\" href=\"https://www.flashback.org/\">Flashback</a>."
};
settings.corporafolders.socialmedia.twitter = {
title: "Twitter",
contents: ["twitter", "twitter-pldebatt-130612", "twitter-pldebatt-131006", "twitter-pldebatt-140504"]
};
settings.corporafolders.newspapertexts = {
title: "Tidningstexter",
contents: ["attasidor", "dn1987", "ordat"]
};
settings.corporafolders.newspapertexts.gp = {
title: "GP",
contents: ["gp1994", "gp2001", "gp2002", "gp2003", "gp2004", "gp2005", "gp2006", "gp2007", "gp2008", "gp2009", "gp2010", "gp2011", "gp2012", "gp2013", "gp2d"]
};
settings.corporafolders.newspapertexts.press = {
title: "Press",
contents: ["press65", "press76", "press95", "press96", "press97", "press98"]
};
settings.corporafolders.newspapertexts.webnews = {
title: "Webbnyheter",
contents: ["webbnyheter2001", "webbnyheter2002", "webbnyheter2003", "webbnyheter2004", "webbnyheter2005", "webbnyheter2006", "webbnyheter2007", "webbnyheter2008", "webbnyheter2009", "webbnyheter2010", "webbnyheter2011", "webbnyheter2012", "webbnyheter2013"]
};
settings.corporafolders.magazines = {
title: "Tidskrifter",
contents: ["fof"]
};
/*
* PRESELECTED CORPORA
* Folders will be expanded to all corpora. Optionally prefix folders with __ , which will be ignored.
*/
settings.preselectedCorpora = ["suc3", "wikipedia-sv", "talbanken", "sfs", "snp7879", "__newspapertexts", "__fisk",
"fof", "twitter", "__socialmedia.bloggmix", "romi", "romii", "rom99", "storsuc"];
/*
* CORPORA
*/
settings.corpora["magmakolumner"] = {
id: "magmakolumner",
title: "Magma kolumner 2009–2012",
description: "Material ur kolumner publicerade av <a target=\"_blank\" href=\"http://www.magma.fi\">Tankesmedjan Magma</a>",
within: spWithin,
context: spContext,
attributes: modernAttrs,
structAttributes: {
text_author: {label: "author"},
text_title: {label: "title"},
text_date: {label: "date"}
}
};
settings.corpora["fsbbloggvuxna"] = {
id: "fsbbloggvuxna",
title: "Bloggtexter 2006–2013",
description: "",
within: spWithin,
context: spContext,
attributes: modernAttrs,
structAttributes: {
blog_title: {label: "blog_title"},
blog_url: {label: "blog_url", type: "url"},
blog_age: {label: "author_age"},
blog_city: {label: "city"},
text_title: {label: "post_title"},
text_date: {label: "date"},
text_tags: {label: "tags", type: "set"},
text_url: {label: "post_url", type: "url"}
}
};
settings.corpora["fsbskonlit1960-1999"] = {
id: "fsbskonlit1960-1999",
title: "Skönlitteratur 1960–1999",
description: "Material ur skönlitterära verk publicerade under 1960–1999.",
within: settings.defaultWithin,
context: defaultContext,
attributes: modernAttrs,
structAttributes: {
text_author: {label: "author"},
text_title: {label: "title"},
text_date: {label: "year"},
text_publisher: {label: "publisher"}
}
};
settings.corpora["fsbskonlit2000tal"] = {
id: "fsbskonlit2000tal",
title: "Skönlitteratur 2000–2013",
description: "Material ur skönlitterära verk publicerade under 2000–2013.",
within: settings.defaultWithin,
context: defaultContext,
attributes: modernAttrs,
structAttributes: {
text_author: {label: "author"},
text_title: {label: "title"},
text_date: {label: "year"},
text_publisher: {label: "publisher"}
}
};
settings.corpora["barnlitteratur"] = {
id: "barnlitteratur",
title: "Barnlitteratur 1988–2013",
description: "Material ur barnlitterära verk publicerade under 2000–2013.",
within: spWithin,
context: spContext,
attributes: modernAttrs,
structAttributes: {
text_author: {label: "author"},
text_title: {label: "title"},
text_date: {label: "year"},
text_publisher: {label: "publisher"}
}
};
settings.corpora["fsbessaistik"] = {
id: "fsbessaistik",
title: "Essäistisk litteratur 1963–2010",
description: "Material ur essäistiska verk publicerade under 1992–2013",
within: spWithin,
context: spContext,
attributes: modernAttrs,
structAttributes: {
text_author: {label: "author"},
text_title: {label: "title"},
text_date: {label: "year"},
text_publisher: {label: "publisher"}
}
};
settings.corpora["fsbsakprosa"] = {
id: "fsbsakprosa",
title: "Sakprosa 2006–2013",
description: "Material ur facklitterära verk publicerade under 2006–2013.",
within: spWithin,
context: spContext,
attributes: modernAttrs,
structAttributes: {
text_author: {label: "author"},
text_title: {label: "title"},
text_date: {label: "year"},
text_publisher: {label: "publisher"}
}
};
settings.corpora["ungdomslitteratur"] = {
id: "ungdomslitteratur",
title: "Ungdomslitteratur 1992–2011",
description: "Material ur ungdomslitterära verk publicerade under 1992–2013.",
within: spWithin,
context: spContext,
attributes: modernAttrs,
structAttributes: {
text_author: {label: "author"},
text_title: {label: "title"},
text_date: {label: "year"},
text_publisher: {label: "publisher"}
}
};
settings.corpora["informationstidningar"] = {
id: "informationstidningar",
title: "Kommuners och städers informationstidningar 2001–2013",
description: "Material ur informationstidningar som ges ut av kommuner och städer.",
within: settings.defaultWithin,
context: defaultContext,
attributes: modernAttrs,
structAttributes: {
text_date: {label: "year"},
text_issue: {label: "issue"},
text_title: {label: "title"}
}
};
settings.corpora["lagtexter"] = {
id: "lagtexter",
title: "Lagtexter 1990–2000",
description: "Material ur Finlands lag.",
within: spWithin,
context: spContext,
attributes: modernAttrs,
structAttributes: {
}
};
settings.corpora["myndighet"] = {
id: "myndighet",
title: "Myndighetsprosa 1990–2013",
description: "Material ur bland annat Utbildningsstyrelsens, Undervisningsministeriets och Länsstyrelsens publikationer.",
within: spWithin,
context: spContext,
attributes: modernAttrs,
structAttributes: {
text_date: {label: "year"},
text_publisher: {label: "publisher"},
text_title: {label: "title"}
}
};
settings.corpora["propositioner"] = {
id: "propositioner",
title: "Propositioner 1993–2013",
description: 'Material ur <a target="_blank" href="http://www.eduskunta.fi/triphome/bin/vexhaku.sh?lyh=HE?kieli=ru">regeringens propositioner</a>.',
within: settings.defaultWithin,
context: defaultContext,
attributes: modernAttrs,
structAttributes: {
text_date: {label: "year"},
text_title: {label: "title"}
}
};
settings.corpora["finsktidskrift"] = {
id: "finsktidskrift",
title: "Finsk tidskrift 2011–2012",
description: "<a target=\"_blank\" href=\"http://www.abo.fi/public/finsktidskrift\">Finsk Tidskrift</a> är en tidskrift som strävar efter ingående reflektion inom ett brett område och vill ge djupare historisk, politisk och kulturell förståelse av den aktuella samtidsdebatten.",
within: spWithin,
context: spContext,
attributes: modernAttrs,
structAttributes: {
text_date: {label: "year"},
text_issue: {label: "issue"}
}
};
settings.corpora["forumfeot"] = {
id: "forumfeot",
title: "Forum för ekonomi och teknik 2008–2012",
description: "<a target=\"_blank\" href=\"http://www.forummag.fi\">Forum för ekonomi och teknik</a> är Finlands enda svenskspråkiga affärsmagasin och ger sina läsare information om näringsliv, ledarskap och teknologi.",
within: spWithin,
context: spContext,
attributes: modernAttrs,
structAttributes: {
text_date: {label: "date"}
}
};
settings.corpora["hanken"] = {
id: "hanken",
title: "Hanken 2008–2011",
description: "Tidningen <a target=\"_blank\" href=\"http://www.hanken.fi/public/alumntidning\">Hanken</a> är Svenska handelshögskolans alumntidning.",
within: spWithin,
context: spContext,
attributes: modernAttrs,
structAttributes: {
text_date: {label: "year"},
text_issue: {label: "issue"}
}
};
settings.corpora["svenskbygden"] = {
id: "svenskbygden",
title: "Svenskbygden 2010–2011",
description: "<a target=\"_blank\" href=\"http://www.sfv.fi/publikationer/svenskbygden/\">Svenskbygden</a> är Svenska Folkskolans Vänners medlemstidning. Tiskriften innehåller artiklar som berör allt från utbildning och aktuella samhällsfrågor till kultur och litteratur.",
within: spWithin,
context: spContext,
attributes: modernAttrs,
structAttributes: {
text_year: {label: "year"},
text_issue: {label: "issue"}
}
};
settings.corpora["studentbladet"] = {
id: "studentbladet",
title: "Studentbladet 2011",
description: "<a target=\"_blank\" href=\"http://www.stbl.fi\">Studentbladet</a> är en tidskrift som bevakar samtliga svenskspråkiga studieorter på fastlandet i Finland.",
within: spWithin,
context: spContext,
attributes: modernAttrs,
structAttributes: {
text_date: {label: "year"},
text_issue: {label: "issue"}
}
};
settings.corpora["jakobstadstidning1999"] = {
id: "jakobstadstidning1999",
title: "Jakobstads tidning 1999",
description: "",
within: spWithin,
context: spContext,
attributes: modernAttrs,
structAttributes: {
text_date: {label: "date"}
}
};
settings.corpora["jakobstadstidning2000"] = {
id: "jakobstadstidning2000",
title: "Jakobstads tidning 2000",
description: "",
within: spWithin,
context: spContext,
attributes: modernAttrs,
structAttributes: {
text_date: {label: "date"}
}
};
settings.corpora["sweachum"] = {
id: "sweachum",
title: "Humaniora",
description: "",
within: settings.defaultWithin,
context: defaultContext,
attributes: modernAttrs,
structAttributes: {
text_type: {label: "type",
extendedTemplate: selectType.extendedTemplate,
extendedController: selectType.extendedController,
dataset: {
"Licentiat": "Licentiat",
"PhD": "PhD"
settings.corpora["testcorpus"] = {
id: "testcorpus",
title: "The Korp Test Corpus",
description: "A test corpus for testing Korp.",
within: {"sentence": "sentence"},
attributes: {
pos: {
label: "pos",
opts: {
"is": "=",
"is_not": "!="
}
}
},
text_subject: {label: "subject",
extendedTemplate: selectType.extendedTemplate,
extendedController: selectType.extendedController,
dataset: {
"Etnologi": "Etnologi",
"Filosofi": "Filosofi",
"Historia": "Historia",
"Jämförande språkvetenskap och lingvistik": "Jämförande språkvetenskap och lingvistik",
"Konst": "Konst",
"Litteraturvetenskap": "Litteraturvetenskap",
"Religionsvetenskap": "Religionsvetenskap"
}
structAttributes: {
}
}
};
settings.corpora["sweacsam"] = {
id: "sweacsam",
title: "Samhällsvetenskap",
description: "",
within: settings.defaultWithin,
context: defaultContext,
attributes: modernAttrs,
structAttributes: {
text_type: {label: "type",
extendedTemplate: selectType.extendedTemplate,
extendedController: selectType.extendedController,
dataset: {
"Licentiat": "Licentiat",
"PhD": "PhD"
}
},
text_subject: {label: "subject",
extendedTemplate: selectType.extendedTemplate,
extendedController: selectType.extendedController,
dataset: {
"Ekonomi och näringsliv": "Ekonomi och näringsliv",
"Juridik": "Juridik",
"Medie- och kommunikationsvetenskap": "Medie- och kommunikationsvetenskap",
"Psykologi": "Psykologi",
"Social och ekonomisk geografi": "Social och ekonomisk geografi",
"Sociologi": "Sociologi",
"Statsvetenskap": "Statsvetenskap",
"Utbildningsvetenskap": "Utbildningsvetenskap"
}
}
}
};
settings.corpora["attasidor"] = {
id: "attasidor",
title: "8 SIDOR",
description: "<a target=\"_blank\" href=\"http://www.8sidor.se/\">8 SIDOR</a> är en lättläst nyhetstidning.",
within: settings.defaultWithin,
context: defaultContext,
attributes: modernAttrs2,
structAttributes: {
text_date: sattrs.date,
text_title: {label: "title"}
}
};
settings.corpora["dn1987"] = {
id: "dn1987",
title: "DN 1987",
description: "Dagens Nyheter 1987.",
within: spWithin,
context: spContext,
attributes: modernAttrs2,
structAttributes: {
text_date: sattrs.date,
text_sectionshort: {label: "section"}
}
};
settings.corpora["webbnyheter2001"] = {
id: "webbnyheter2001",
title: "Webbnyheter 2001",
description: "",
within: settings.defaultWithin,
context: defaultContext,
attributes: modernAttrs,
structAttributes: {
text_date: sattrs.date,
text_title: {label: "title"},
text_url: {label: "url", type: "url"},
text_newspaper: {label: "newspaper"}
}
};
settings.corpora["webbnyheter2002"] = {
id: "webbnyheter2002",
title: "Webbnyheter 2002",
description: "",
within: settings.defaultWithin,
context: defaultContext,
attributes: modernAttrs,
structAttributes: {
text_date: sattrs.date,
text_title: {label: "title"},
text_url: {label: "url" , type: "url"},
text_newspaper: {label: "newspaper"}
}
};
settings.corpora["webbnyheter2003"] = {
id: "webbnyheter2003",
title: "Webbnyheter 2003",
description: "",
within: settings.defaultWithin,
context: defaultContext,
attributes: modernAttrs,
structAttributes: {
text_date: sattrs.date,
text_title: {label: "title"},
text_url: {label: "url" , type: "url"},
text_newspaper: {label: "newspaper"}
}
};
settings.corpora["webbnyheter2004"] = {