Datasets:
id
string
| tokens
sequence
| ner_tags
sequence
|
---|---|---|
"0" | [
"Vertaling",
"van",
"die",
"inligting",
"in",
"die",
"oorblywende",
"amptelike",
"tale",
"sal",
"na",
"verwagting",
"teen",
"Maart",
"2007",
"afgehandel",
"wees",
"."
] | [
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
7,
8,
0,
0,
0
] |
"1" | [
"Dienste-inligting",
"word",
"oorspronklik",
"in",
"Engels",
"opgestel",
",",
"waarna",
"dit",
"in",
"die",
"ander",
"tale",
"vertaal",
"word",
"."
] | [
0,
0,
0,
0,
7,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0
] |
"2" | [
"Gebruik",
"die",
"Kontak",
"ons",
"bladsy",
"om",
"kommentaar",
"te",
"lewer",
"oor",
"of",
"navraag",
"te",
"doen",
"na",
"die",
"Regeringsdienste-webtuiste",
"."
] | [
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0
] |
"3" | [
"Sien",
"Terme",
"en",
"Voorwaardes",
",",
"par.",
"4.3",
"."
] | [
0,
0,
0,
0,
0,
0,
0,
0
] |
"4" | [
"Regeringskommunikasie",
"(",
"GCIS",
")",
"is",
"verantwoordelik",
"vir",
"die",
"oorkoepelende",
"bestuur",
"en",
"koördinering",
"van",
"die",
"webtuiste",
"se",
"inhoud",
"."
] | [
3,
0,
3,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0
] |
"5" | [
"Ten",
"einde",
"PDF-dokumente",
"te",
"kan",
"oopmaak",
",",
"moet",
"jy",
"Adobe",
"Acrobat",
"Reader",
"4",
"of",
"hoër",
"op",
"jou",
"rekenaar",
"geïnstalleer",
"hê",
"."
] | [
0,
0,
7,
0,
0,
0,
0,
0,
0,
3,
4,
7,
8,
0,
0,
0,
0,
0,
0,
0,
0
] |
"6" | [
"Soms",
"neem",
"dit",
"lank",
"om",
"PDF-dokumente",
"oop",
"te",
"maak",
"."
] | [
0,
0,
0,
0,
0,
7,
0,
0,
0,
0
] |
"7" | [
"Wanneer",
"jy",
"Internet",
"Explorer",
"as",
"jou",
"blaaier",
"gebruik",
":"
] | [
0,
0,
7,
8,
0,
0,
0,
0,
0
] |
"8" | [
"In",
"die",
"tuimel-kieslys",
"wat",
"verskyn",
",",
"kies",
"'",
"Save",
"Target",
"As",
"'",
"."
] | [
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0
] |
"9" | [
"In",
"die",
"'",
"Save",
"As",
"'",
"venstertjie",
",",
"kies",
"die",
"plek",
"op",
"jou",
"hardeskyf",
"waar",
"jy",
"die",
"dokument",
"wil",
"stoor",
"en",
"klik",
"op",
"die",
"'",
"Save",
"'",
"knoppie",
"."
] | [
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0
] |
"10" | [
"Maak",
"jou",
"Acrobat",
"Reader",
"toepassing",
"oop",
"en",
"maak",
"daarna",
"die",
"dokumente",
"wat",
"jy",
"afgelaai",
"het",
"oop",
"."
] | [
0,
0,
3,
7,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0
] |
"11" | [
"Wanneer",
"jy",
"Netscape",
"as",
"jou",
"blaaier",
"gebruik",
":"
] | [
0,
0,
3,
0,
0,
0,
0,
0
] |
"12" | [
"In",
"die",
"'",
"Save",
"As",
"'",
"venstertjie",
",",
"kies",
"die",
"plek",
"op",
"jou",
"hardeskyf",
"waar",
"jy",
"die",
"dokument",
"wil",
"stoor",
"en",
"klik",
"op",
"die",
"'",
"Save",
"'",
"knoppie",
"."
] | [
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0
] |
"13" | [
"Maak",
"jou",
"Acrobat",
"Reader",
"toepassing",
"oop",
"en",
"maak",
"daarna",
"ook",
"die",
"dokumente",
"wat",
"jy",
"afgelaai",
"het",
"oop",
"."
] | [
0,
0,
3,
7,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0
] |
"14" | [
"Kontak",
"ons",
"asseblief",
"(",
"[email protected]",
")",
"indien",
"jy",
"enige",
"probleme",
"met",
"die",
"webtuiste",
"ondervind",
"."
] | [
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0
] |
"15" | [
"Indien",
"'n",
"vereniging",
",",
"maatskappy",
"of",
"beslote",
"korporasie",
"nie",
"sy",
"skuld",
"kan",
"of",
"wil",
"betaal",
"nie",
"en",
"ook",
"nie",
"sy",
"verpligtinge",
"kan",
"nakom",
"nie",
"(",
"weens",
"insolvensie",
",",
"wanbestuur",
"of",
"om",
"enige",
"ander",
"rede",
")",
"mag",
"die",
"Direkteur-generaal",
"van",
"Handel",
"en",
"Nywerheid",
"'n",
"sakeonderneming",
"onder",
"administrasie",
"plaas",
"of",
"laat",
"likwideer",
"."
] | [
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
3,
4,
4,
0,
0,
0,
0,
0,
0,
0,
0,
0
] |
"16" | [
"Indien",
"die",
"hof",
"beslis",
"dat",
"die",
"Direkteur-generaal",
"die",
"vereniging",
"of",
"voorlopige",
"vereniging",
"onder",
"administrasie",
"moet",
"plaas",
",",
"sal",
"hy",
"of",
"sy",
"oor",
"die",
"nodige",
"gesag",
"beskik",
"om",
"die",
"vereniging",
"of",
"voorlopige",
"vereniging",
"se",
"sake",
"ooreenkomstig",
"die",
"voorwaardes",
"van",
"die",
"Maatskappywet",
",",
"1973",
"te",
"administreer",
"."
] | [
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
7,
8,
8,
0,
0,
0
] |
"17" | [
"Indien",
"die",
"vereniging",
"of",
"voorlopige",
"vereniging",
"skriftelik",
"by",
"die",
"Direkteur-generaal",
"daarom",
"aansoek",
"doen",
",",
"kan",
"hy",
"of",
"sy",
"die",
"vereniging",
"of",
"voorlopige",
"vereniging",
"deregistreer",
"indien",
"hy",
"of",
"sy",
"tevrede",
"is",
"dat"
] | [
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0
] |
"18" | [
"In",
"sy",
"beslissing",
"sal",
"die",
"hof",
"enige",
"moontlike",
"aanbevelings",
"deur",
"die",
"Direkteur-generaal",
"oor",
"die",
"verdeling",
"van",
"bates",
"in",
"ag",
"neem",
"."
] | [
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0
] |
"19" | [
"In",
"die",
"geval",
"van",
"'n",
"maatskappy",
"of",
"beslote",
"korporasie",
"(",
"BK",
")",
"kan",
"enige",
"belanghebbende",
"party",
",",
"direkteur",
"of",
"ouditeur",
"van",
"die",
"maatskappy",
",",
"die",
"Suid-Afrikaanse",
"Inkomstediens",
"(",
"SAID",
")",
"of",
"die",
"Registrateur",
"van",
"Maatskappye",
"om",
"die",
"deregistrasie",
"van",
"'n",
"maatskappy",
"of",
"BK",
"aansoek",
"doen",
"."
] | [
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
3,
4,
0,
3,
0,
0,
0,
1,
2,
2,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0
] |
"20" | [
"Hierdie",
"voorkeurbehandeling",
"is",
"egter",
"net",
"van",
"toepassing",
"op",
"organisasies",
"wat",
"aan",
"die",
"bepalings",
"van",
"die",
"Wet",
"op",
"Organisasies",
"sonder",
"Winsoogmerk",
",",
"1997",
"en",
"verwante",
"wetgewing",
"voldoen",
"."
] | [
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
7,
8,
8,
8,
8,
8,
8,
0,
0,
0,
0,
0
] |
"21" | [
"Organisasies",
"wat",
"vir",
"vrystelling",
"aansoek",
"wil",
"doen",
",",
"moet",
"in",
"een",
"van",
"die",
"onderstaande",
"kategorieë",
"val",
":"
] | [
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0
] |
"22" | [
"So",
"'n",
"artikel",
"21-maatskappy",
"moet",
"'n",
"akte",
"van",
"oprigting",
"as",
"stigtingsdokument",
"hê",
"en",
"by",
"die",
"Registrateur",
"van",
"Maatskappye",
"geregistreer",
"wees",
"."
] | [
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
1,
2,
2,
0,
0,
0
] |
"23" | [
"As",
"die",
"stigtingsdokument",
"nie",
"aan",
"die",
"voorwaardes",
"van",
"Artikel",
"30",
"van",
"die",
"Wet",
"op",
"Organisasies",
"sonder",
"Winsoogmerk",
",",
"1997",
"voldoen",
"nie",
",",
"moet",
"'n",
"geskrewe",
"onderneming",
"wat",
"deur",
"die",
"aansoeker",
"onderteken",
"is",
",",
"saam",
"met",
"die",
"aansoekvorm",
"ingedien",
"word",
"."
] | [
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
7,
8,
8,
8,
8,
8,
8,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0
] |
"24" | [
"Organisasies",
"wat",
"tans",
"nie",
"formeel",
"van",
"inkomstebelasting",
"vrygestel",
"is",
"nie",
",",
"kan",
"'n",
"ingevulde",
"aansoekvorm",
"indien",
",",
"saam",
"met",
"die",
"nodige",
"ondersteunende",
"dokumente",
"en",
"die",
"ondertekende",
"geskrewe",
"onderneming",
"waarin",
"persone",
"wat",
"in",
"'n",
"fidusiêre",
"hoedanigheid",
"optree",
",",
"onderneem",
"om",
"aan",
"die",
"voorwaardes",
"van",
"Artikel",
"30",
"van",
"die",
"Wet",
"op",
"Organisasies",
"sonder",
"Winsoogmerk",
",",
"1997",
",",
"te",
"voldoen",
"."
] | [
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
7,
8,
8,
8,
8,
8,
8,
0,
0,
0,
0
] |
"25" | [
"maatskappy",
":",
"Heg",
"'n",
"kopie",
"van",
"die",
"akte",
"van",
"oprigting",
"aan",
"(",
"insluitende",
"kopieë",
"van",
"al",
"die",
"geregistreerde",
"spesiale",
"besluite",
"wat",
"die",
"akte",
"van",
"oprigting",
"wysig",
")"
] | [
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0
] |
"26" | [
"trust",
":",
"Heg",
"'n",
"kopie",
"van",
"die",
"trustakte",
"en",
"enige",
"daaropvolgende",
"aktes",
"van",
"wysiging",
"aan"
] | [
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0
] |
"27" | [
"vereniging",
"van",
"persone",
":",
"Heg",
"'n",
"kopie",
"van",
"die",
"jongste",
"weergawe",
"van",
"die",
"grondwet",
"aan",
"."
] | [
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0
] |
"28" | [
"Organisasies",
"wat",
"gestig",
"is",
"met",
"die",
"hoofdoelstelling",
"om",
"stipendiums",
",",
"studiebeurse",
"en",
"ander",
"toekennings",
"vir",
"studie",
",",
"navorsing",
"en",
"onderrig",
"te",
"verskaf",
",",
"moet",
"naas",
"al",
"die",
"ondersteunende",
"dokumente",
"wat",
"hierbo",
"genoem",
"is",
"ook",
"'n",
"EI",
"3",
"Geskrewe",
"Onderneming",
"invul",
"en",
"indien",
"."
] | [
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
7,
8,
8,
8,
0,
0,
0,
0
] |
"29" | [
"Openbare",
"en",
"onafhanklike",
"(",
"privaat",
")",
"skole",
",",
"hoëronderwysinstellings",
",",
"instellings",
"vir",
"volwassene-",
"basiese",
"onderwys",
"en",
"opleiding",
"(",
"VBOO",
")",
"en",
"instellings",
"vir",
"verdere",
"onderwys",
"en",
"opleiding",
"(",
"VOO",
")",
"moet",
"'n",
"kopie",
"van",
"'n",
"registrasiesertifikaat",
"wat",
"deur",
"die",
"betrokke",
"opvoedkundige",
"owerheid",
"uitgereik",
"is",
",",
"indien",
"."
] | [
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0
] |
"30" | [
"Jou",
"kinders",
"se",
"reg",
"op",
"onderhoud",
"is",
"nie",
"afhanklik",
"van",
"jou",
"siening",
"van",
"die",
"ander",
"ouer",
"se",
"gedrag",
"nie",
".",
"Jy",
"moet",
"steeds",
"onderhoud",
"betaal",
",",
"selfs",
"indien",
"die",
"ander",
"ouer"
] | [
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0
] |
"31" | [
"Deur",
"middel",
"van",
"'n",
"bevel",
"wat",
"aan",
"die",
"werkgewer",
"van",
"persoon",
"wat",
"aanspreeklik",
"is",
"vir",
"die",
"betaling",
"van",
"onderhoud",
"opdrag",
"gee",
"om",
"die",
"onderhoudsbetalings",
"regstreeks",
"van",
"sy",
"werknemer",
"se",
"salaris",
"af",
"te",
"trek",
",",
"in",
"ooreenstemming",
"met",
"die",
"Wet",
"op",
"Onderhoud",
",",
"1998"
] | [
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
7,
8,
8,
8,
8
] |
"32" | [
"In",
"die",
"afdeling",
"Soort",
"kliënt",
":"
] | [
0,
0,
0,
7,
8,
0
] |
"33" | [
"Verstrek",
"die",
"volgende",
"inligting",
"in",
"die",
"afdeling",
"Invoerdersbesonderhede",
":"
] | [
0,
0,
0,
0,
0,
0,
0,
7,
0
] |
"34" | [
"wie",
"verantwoordelik",
"sal",
"wees",
"vir",
"die",
"opstel",
"en",
"voorlegging",
"van",
"dokumente",
"aan",
"die",
"Suid-Afrikaanse",
"Inkomstediens",
";",
"en"
] | [
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
3,
4,
0,
0
] |
"35" | [
"Vul",
"die",
"aansoekvorm",
"in",
"en",
"handig",
"dit",
"in",
"by",
"die",
"naaste",
"SAID-doeane-en-aksynskantoor",
"in",
"."
] | [
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
3,
0,
0
] |
"36" | [
"'n",
"Permit",
"van",
"die",
"Departement",
"van",
"Handel",
"en",
"Nywerheid",
"-",
"indien",
"van",
"toepassing"
] | [
0,
0,
0,
0,
3,
4,
4,
4,
4,
0,
0,
0,
0
] |
"37" | [
"Verstrek",
"die",
"volgende",
"inligting",
"in",
"die",
"Handelsbesonderhede-gedeelte",
"(",
"Kliënttipe",
"II",
")",
":"
] | [
0,
0,
0,
0,
0,
0,
7,
0,
7,
8,
0,
0
] |
"38" | [
"Verstrek",
"die",
"volgende",
"inligting",
"in",
"die",
"gedeelte",
"getiteld",
"Besonderhede",
"van",
"kortingspakhuis",
":"
] | [
0,
0,
0,
0,
0,
0,
0,
0,
7,
8,
8,
0
] |
"39" | [
"Verstrek",
"die",
"volgende",
"inligting",
"in",
"die",
"Verklaring-gedeelte",
":"
] | [
0,
0,
0,
0,
0,
0,
7,
0
] |
"40" | [
"Dien",
"die",
"ingevulde",
"vorm",
"by",
"die",
"naaste",
"doeane-",
"en",
"aksynskantoor",
"van",
"die",
"SAID",
"in",
"."
] | [
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
3,
0,
0
] |
"41" | [
"die",
"besigheid",
"se",
"registrasiesertifikaat",
",",
"wat",
"deur",
"die",
"Registrateur",
"van",
"Maatskappye",
"of",
",",
"in",
"die",
"geval",
"van",
"'n",
"trust",
",",
"deur",
"die",
"Meester",
"van",
"die",
"Hooggeregshof",
"uitgereik",
"is"
] | [
0,
0,
0,
0,
0,
0,
0,
0,
1,
2,
2,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
1,
2,
2,
2,
0,
0
] |
"42" | [
"'n",
"Permit",
"van",
"die",
"Departement",
"van",
"Handel",
"en",
"Nywerheid",
"(",
"indien",
"van",
"toepassing",
")"
] | [
0,
0,
0,
0,
3,
4,
4,
4,
4,
0,
0,
0,
0,
0
] |
"43" | [
"die",
"besonderhede",
"en",
"bewoording",
"op",
"die",
"etiket",
"of",
"houer",
"mag",
"nie",
"verander",
"word",
"sonder",
"vooraf",
"goedkeuring",
"van",
"die",
"registrateur",
"nie"
] | [
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0
] |
"44" | [
"die",
"sak-",
"of",
"houergrootte",
"mag",
"nie",
"verander",
"word",
"sonder",
"vooraf",
"geskrewe",
"goedkeuring",
"van",
"die",
"registrateur",
"nie",
"."
] | [
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0
] |
"45" | [
"Dien",
"aansoekvorms",
"in",
"duplikaat",
"in",
"en",
"vul",
"die",
"vorms",
"volledig",
"in",
",",
"sonder",
"om",
"te",
"verwys",
"na",
"vorige",
"aansoeke",
",",
"bladsynommers",
"of",
"ander",
"produkte",
"(",
"ten",
"minste",
"een",
"afskrif",
"van",
"die",
"aansoekvorms",
"moet",
"'n",
"oorspronklike",
"handtekening",
"hê",
"."
] | [
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0
] |
"46" | [
"die",
"besonderhede",
"en",
"bewoording",
"op",
"die",
"etiket",
"of",
"houer",
"mag",
"nie",
"verander",
"word",
"sonder",
"vooraf",
"goedkeuring",
"van",
"die",
"registrateur",
"nie"
] | [
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0
] |
"47" | [
"die",
"sak-",
"of",
"houergrootte",
"mag",
"nie",
"verander",
"word",
"sonder",
"vooraf",
"geskrewe",
"goedkeuring",
"van",
"die",
"registrateur",
"nie",
"."
] | [
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0
] |
"48" | [
"Dien",
"aansoekvorms",
"in",
"duplikaat",
"in",
"en",
"vul",
"die",
"vorms",
"volledig",
"in",
",",
"sonder",
"om",
"te",
"verwys",
"na",
"vorige",
"aansoeke",
",",
"bladsynommers",
"of",
"ander",
"produkte",
"(",
"ten",
"minste",
"een",
"afskrif",
"van",
"die",
"aansoekvorms",
"moet",
"'n",
"oorspronklike",
"handtekening",
"hê",
"."
] | [
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0
] |
"49" | [
"Planttelersregte",
"word",
"slegs",
"toegestaan",
"vir",
"variëteite",
"van",
"dié",
"soorte",
"plante",
"wat",
"ingevolge",
"die",
"Wet",
"op",
"Planttelersregte",
",",
"1976",
"verklaar",
"is",
"."
] | [
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
7,
8,
8,
8,
8,
0,
0,
0
] |
"50" | [
"Voortplantingsmateriaal",
"aan",
"die",
"DUS-vereistes",
"(",
"onderskeibaarheid",
",",
"eenvormigheid",
"en",
"stabiliteit",
")",
"voldoen",
",",
"naamlik",
":"
] | [
0,
0,
0,
7,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0
] |
"51" | [
"Dokumente",
"en",
"voortplantingsmateriaal",
"moet",
"op",
"voorgeskrewe",
"datums",
"by",
"die",
"Registrateur",
"ingedien",
"word",
"."
] | [
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0
] |
"52" | [
"Jy",
"kan",
"hierdie",
"datums",
",",
"asook",
"inligting",
"oor",
"die",
"hoeveelheid",
"van",
"die",
"voortplantingsmateriaal",
"wat",
"ingedien",
"moet",
"word",
"en",
"die",
"plek",
"van",
"indiening",
",",
"kan",
"by",
"die",
"Registrateur",
"aanvra",
"."
] | [
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0
] |
"53" | [
"Om",
"seewatervis",
"op",
"rekreasiegrondslag",
"in",
"te",
"voer",
",",
"moet",
"jy",
"aansoek",
"doen",
"om",
"'n",
"rekreasie-invoerpermit",
"wat",
"deur",
"die",
"Minister",
"van",
"Omgewingsake",
"en",
"Toerisme",
"(",
"DEA&T",
")",
",",
"of",
"gedelegeerde",
"instansie",
",",
"uitgereik",
"sal",
"word",
"."
] | [
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
1,
2,
2,
2,
2,
0,
3,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0
] |
"54" | [
"LW",
":",
"Hierdie",
"invoerpermit",
"sluit",
"varswatervis",
"uit",
",",
"want",
"dit",
"word",
"deur",
"die",
"Departement",
"van",
"Landbou",
"geadministreer",
"."
] | [
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
3,
4,
4,
0,
0
] |
"55" | [
"Aansoek",
"om",
"'n",
"invoerpermit",
"vir",
"lewende",
"varswatervis",
"of",
"tropiese",
"vis",
"moet",
"by",
"die",
"Departement",
"van",
"Landbou",
"ingedien",
"word",
"."
] | [
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
3,
4,
4,
0,
0,
0
] |
"56" | [
"Geen",
"spesie",
"wat",
"deur",
"die",
"Konvensie",
"oor",
"Internasionale",
"Handel",
"in",
"Bedreigde",
"Spesies",
"van",
"Wilde",
"Fauna",
"en",
"Flora",
"(",
"CITES",
")",
"gelys",
"is",
",",
"mag",
"ingevoer",
"word",
"nie",
"."
] | [
0,
0,
0,
0,
0,
7,
8,
8,
8,
8,
8,
8,
8,
8,
8,
8,
8,
0,
7,
0,
0,
0,
0,
0,
0,
0,
0,
0
] |
"57" | [
"(",
"Kry",
"meer",
"inligting",
"oor",
"CITES",
"by",
"http://www.cites.org",
".",
")"
] | [
0,
0,
0,
0,
0,
7,
0,
0,
0,
0
] |
"58" | [
"Vul",
"die",
"nodige",
"aansoekvorms",
"in",
"en",
"dien",
"hulle",
",",
"saam",
"met",
"ondergenoemde",
"inligting",
",",
"by",
"die",
"Departement",
"van",
"Omgewingsake",
"en",
"Toerisme",
"(",
"Department",
"of",
"Environmental",
"Affairs",
"and",
"Tourism",
")",
"in",
":"
] | [
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
3,
4,
4,
4,
4,
0,
3,
4,
4,
4,
4,
4,
0,
0,
0
] |
"59" | [
"bewys",
"van",
"betaling",
"(",
"bankdepositostrokie",
"vir",
"die",
"permitfooi",
"van",
"R120",
"per",
"aansoeker",
")"
] | [
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0
] |
"60" | [
"Varswatervis",
"word",
"deur",
"die",
"Departement",
"van",
"Landbou",
"geadministreer",
"."
] | [
0,
0,
0,
0,
3,
4,
4,
0,
0
] |
"61" | [
"Aansoeke",
"om",
"'n",
"uitvoerpermit",
"vir",
"lewende",
",",
"gematigde",
"varswatervis",
"of",
"tropiese",
"vis",
"moet",
"by",
"die",
"Departement",
"van",
"Landbou",
"ingedien",
"word",
"."
] | [
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
3,
4,
4,
0,
0,
0
] |
"62" | [
"Geen",
"spesie",
"wat",
"deur",
"die",
"Konvensie",
"oor",
"Internasionale",
"Handel",
"in",
"Bedreigde",
"Spesies",
"van",
"Wilde",
"Fauna",
"en",
"Flora",
"gelys",
"is",
",",
"mag",
"ingevoer",
"word",
"nie",
"."
] | [
0,
0,
0,
0,
0,
7,
8,
8,
8,
8,
8,
8,
8,
8,
8,
8,
8,
0,
0,
0,
0,
0,
0,
0,
0
] |
"63" | [
"(",
"Kry",
"meer",
"inligting",
"oor",
"CITES",
"by",
"http://www.cites.org",
")",
"."
] | [
0,
0,
0,
0,
0,
7,
0,
0,
0,
0
] |
"64" | [
"Vir",
"elke",
"uitvoerpermit",
"wat",
"vir",
"grootoog-tuna",
",",
"suidelike",
"blouvin-tuna",
",",
"swaardvis",
",",
"Antarktiese",
"tandvis",
"en",
"Patagoniese",
"tandvis",
"uitgereik",
"is",
",",
"moet",
"jy",
"vir",
"elke",
"besending",
"ook",
"die",
"betrokke",
"vangsstatistiek-dokument",
"hê",
"."
] | [
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
7,
0,
0,
7,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0
] |
"65" | [
"Kry",
"'n",
"uitvoer-aansoekvorm",
"en",
"die",
"CITES-aansoekvorm",
"by",
"die",
"Mariene-",
"en",
"Kusbestuurskantoor",
"(",
"die",
"kontakbesonderhede",
"verskyn",
"onder",
")",
",",
"of",
"by",
"'n",
"takkantoor",
"van",
"die",
"Departement",
"van",
"Omgewingsake",
"en",
"Toerisme",
",",
"of",
"laai",
"die",
"vorms",
"van",
"http://www.mcm-deat.gov.za",
"af",
"."
] | [
0,
0,
0,
0,
0,
7,
0,
0,
7,
8,
8,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
3,
4,
4,
4,
4,
0,
0,
0,
0,
0,
0,
0,
0,
0
] |
"66" | [
"kopieë",
"van",
"vangsstatistiek-dokumente",
"moet",
"verskaf",
"word",
"vir",
"al",
"die",
"grootoog-tuna",
",",
"suidelike",
"blouvin-tuna",
",",
"swaardvis",
",",
"Antarktiese",
"tandvis",
"en",
"Patagoniese",
"tandvis",
"wat",
"ingevolge",
"die",
"vorige",
"uitvoerpermit",
"uitgevoer",
"word",
"."
] | [
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
7,
0,
0,
7,
0,
0,
0,
0,
0,
0,
0,
0,
0
] |
"67" | [
"jou",
"identiteitsdokument",
"(",
"ID",
")",
"en",
"jou",
"maatskappy",
",",
"beslote",
"korporasie",
"of",
"trust",
"se",
"registrasiedokumente"
] | [
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0
] |
"68" | [
"geldige",
"uitvoerpermitte",
"van",
"die",
"Departement",
"van",
"Handel",
"en",
"Nywerheid"
] | [
0,
0,
0,
0,
3,
4,
4,
4,
4
] |
"69" | [
"die",
"belastingklaringsertifikaat",
"wat",
"deur",
"die",
"Suid-Afrikaanse",
"Inkomstediens",
"goedgekeur",
"en",
"uitgereik",
"is",
"."
] | [
0,
0,
0,
0,
0,
3,
4,
0,
0,
0,
0,
0
] |
"70" | [
"Stel",
"jou",
"naaste",
"tak",
"van",
"die",
"Suid-Afrikaanse",
"Buro",
"vir",
"Standaarde",
"van",
"jou",
"uitvoerbesending",
"in",
"kennis",
"as",
"die",
"vis",
"wat",
"jy",
"wil",
"uitvoer",
"nie",
"vars",
"is",
"nie",
"en",
"nie",
"vir",
"menslike",
"verbruik",
"bedoel",
"is",
"nie",
"."
] | [
0,
0,
0,
0,
0,
0,
3,
4,
4,
4,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0
] |
"71" | [
"As",
"die",
"vis",
"wel",
"vars",
"en",
"vir",
"menslike",
"verbruik",
"bedoel",
"is",
",",
"moet",
"jy",
"die",
"Hawegesondheid",
"in",
"kennis",
"stel",
"."
] | [
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
3,
0,
0,
0,
0
] |
"72" | [
"Vul",
"die",
"aansoekvorm",
"om",
"'n",
"uitvoerpermit",
"in",
",",
"onderteken",
"dit",
"en",
"pos",
"dit",
"saam",
"met",
"die",
"nodige",
"dokumente",
"aan",
"die",
"kantoor",
"van",
"Mariene",
"en",
"Kusbestuur",
"(",
"die",
"adres",
"verskyn",
"onder",
")",
"."
] | [
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
3,
4,
4,
0,
0,
0,
0,
0,
0,
0
] |
"73" | [
"Om",
"seewatervis",
"te",
"mag",
"invoer",
",",
"moet",
"jy",
"aansoek",
"doen",
"om",
"'n",
"invoerpermit",
",",
"wat",
"deur",
"die",
"Minister",
"van",
"Omgewingsake",
"en",
"Toerisme",
"of",
"die",
"gedelegeerde",
"gesagsowerheid",
"toegeken",
"word",
"."
] | [
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
1,
2,
2,
2,
2,
0,
0,
0,
0,
0,
0,
0
] |
"74" | [
"NB",
":",
"Hierdie",
"invoerpermit",
"sluit",
"varswatervis",
"uit",
",",
"want",
"dit",
"word",
"deur",
"die",
"Departement",
"van",
"Landbou",
"geadministreer",
"."
] | [
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
3,
4,
4,
0,
0
] |
"75" | [
"'n",
"Aansoek",
"om",
"'n",
"invoerpermit",
"vir",
"lewende",
"varswatervis",
"of",
"tropiese",
"vis",
"moet",
"by",
"die",
"Departement",
"van",
"Landbou",
"ingedien",
"word",
"."
] | [
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
3,
4,
4,
0,
0,
0
] |
"76" | [
"Geen",
"spesie",
"wat",
"deur",
"die",
"Konvensie",
"oor",
"Internasionale",
"Handel",
"in",
"Bedreigde",
"Spesies",
"van",
"Wilde",
"Fauna",
"en",
"Flora",
"(",
"CITES",
")",
"gelys",
"is",
",",
"mag",
"ingevoer",
"word",
"nie",
"."
] | [
0,
0,
0,
0,
0,
7,
8,
8,
8,
8,
8,
8,
8,
8,
8,
8,
8,
0,
7,
0,
0,
0,
0,
0,
0,
0,
0,
0
] |
"77" | [
"(",
"Kry",
"meer",
"inligting",
"oor",
"CITES",
"by",
"http://www.cites.org",
")"
] | [
0,
0,
0,
0,
0,
7,
0,
0,
0
] |
"78" | [
"Bekom",
"'n",
"aansoekvorm",
"deur",
"'n",
"versoek",
"aan",
"Mariene-",
"en",
"Kusbestuur",
"se",
"bestuurskantoor",
"te",
"rig",
"(",
"die",
"kontakbesonderhede",
"verskyn",
"onder",
")",
",",
"of",
"kry",
"'n",
"vorm",
"by",
"die",
"Departement",
"van",
"Omgewingsake",
"en",
"Toerisme",
"se",
"takkantoor",
",",
"of",
"laai",
"'n",
"vorm",
"by",
"http://www.mcm-deat.gov.za",
"af",
"."
] | [
0,
0,
0,
0,
0,
0,
0,
3,
4,
4,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
3,
4,
4,
4,
4,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0
] |
"79" | [
"gewaarmerkte",
"kopieë",
"van",
"geldige",
"invoerpermitte",
"van",
"die",
"Departement",
"van",
"Handel",
"en",
"Nywerheid",
"of",
"permitbekendstellings"
] | [
0,
0,
0,
0,
0,
0,
0,
3,
4,
4,
4,
4,
0,
0
] |
"80" | [
"gewaarmerkte",
"kopieë",
"van",
"die",
"oorspronklike",
"belastingklaringsertifikate",
"wat",
"deur",
"die",
"Suid-Afrikaanse",
"Inkomstediens",
"goedgekeur",
"en",
"uitgereik",
"is",
"."
] | [
0,
0,
0,
0,
0,
0,
0,
0,
0,
3,
4,
0,
0,
0,
0,
0
] |
"81" | [
"As",
"die",
"vis",
"wat",
"jy",
"gaan",
"invoer",
"nie",
"vars",
"is",
"nie",
"en",
"nie",
"vir",
"menslike",
"gebruik",
"bedoel",
"is",
"nie",
",",
"moet",
"jy",
"jou",
"naaste",
"tak",
"van",
"die",
"Suid-Afrikaanse",
"Buro",
"vir",
"Standaarde",
"daarvan",
"in",
"kennis",
"stel",
"."
] | [
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
3,
4,
4,
4,
0,
0,
0,
0,
0
] |
"82" | [
"Vul",
"jou",
"aansoekvorm",
"in",
",",
"onderteken",
"dit",
"en",
"pos",
"dit",
"saam",
"met",
"die",
"nodige",
"ondersteunende",
"dokumente",
"aan",
"Mariene-",
"en",
"Kustebestuur",
"se",
"bestuurskantoor",
"(",
"die",
"adres",
"verskyn",
"onderaan",
")",
"."
] | [
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
3,
4,
4,
0,
0,
0,
0,
0,
0,
0,
0,
0
] |
"83" | [
"Kry",
"meer",
"inligting",
"by",
"die",
"Departement",
"van",
"Justisie",
"en",
"Grondwetlike",
"Ontwikkeling",
"."
] | [
0,
0,
0,
0,
0,
3,
4,
4,
4,
4,
4,
0
] |
"84" | [
"Tree",
"met",
"die",
"Companies",
"and",
"Intellectual",
"Property",
"Registration",
"Office",
"in",
"verbinding",
"."
] | [
0,
0,
0,
3,
4,
4,
4,
4,
4,
0,
0,
0
] |
"85" | [
"Doen",
"aansoek",
"om",
"'n",
"naam",
"te",
"reserveer",
"deur",
"vorm",
"CM5",
"voor",
"te",
"lê",
"-",
"Aansoek",
"om",
"die",
"reservering",
"van",
"'n",
"naam",
"."
] | [
0,
0,
0,
0,
0,
0,
0,
0,
7,
8,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0
] |
"86" | [
"Vul",
"vorm",
"CM29",
"in",
"-",
"Inhoud",
"van",
"register",
"van",
"direkteure",
",",
"ouditeure",
"en",
"amptenare",
"."
] | [
0,
7,
8,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0
] |
"87" | [
"Elke",
"direkteur",
"van",
"die",
"maatskappy",
"moet",
"een",
"kopie",
"van",
"vorm",
"CM47",
"invul",
"."
] | [
0,
0,
0,
0,
0,
0,
0,
0,
0,
7,
8,
0,
0
] |
"88" | [
"Vul",
"vorm",
"CM31",
"in",
"om",
"toestemming",
"te",
"gee",
"dat",
"'n",
"persoon",
"as",
"ouditeur",
"mag",
"optree",
"."
] | [
0,
7,
8,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0
] |
"89" | [
"Dit",
"is",
"die",
"dokument",
"wat",
"deur",
"die",
"Registrateur",
"van",
"Maatskappye",
"onderteken",
"en",
"gestempel",
"word",
"sodra",
"al",
"die",
"meegaande",
"dokumente",
"(",
"wat",
"hierbo",
"gelys",
"is",
")",
"nagegaan",
"en",
"gefinaliseer",
"is",
"."
] | [
0,
0,
0,
0,
0,
0,
0,
1,
2,
2,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0
] |
"90" | [
"Akte",
"van",
"oprigting",
"plus",
"CM2A",
",",
"CM2B",
"en",
"CM2C",
"indien",
"daar",
"meer",
"as",
"een",
"aandeelhouer",
"is",
",",
"of",
"CM2D",
"indien",
"daar",
"net",
"een",
"aandeelhouer",
"is",
"."
] | [
0,
0,
0,
0,
7,
0,
7,
0,
7,
0,
0,
0,
0,
0,
0,
0,
0,
0,
7,
0,
0,
0,
0,
0,
0,
0
] |
"91" | [
"Indien",
"jy",
"voor",
"15",
"November",
"2000",
"ingevolge",
"die",
"gewoontereg",
"getroud",
"is",
",",
"moet",
"jy",
"jou",
"huwelik",
"by",
"die",
"Departement",
"van",
"Binnelandse",
"Sake",
"registreer",
"."
] | [
0,
0,
0,
7,
8,
8,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
3,
4,
4,
4,
0,
0
] |
"92" | [
"Huwelike",
"volgens",
"die",
"Gewoontereg",
"en",
"Gemeenskap",
"van",
"Goedere",
"?"
] | [
0,
0,
0,
0,
0,
0,
0,
0,
0
] |
"93" | [
"Indien",
"hulle",
"dit",
"wil",
"verander",
"nadat",
"hulle",
"reeds",
"getroud",
"is",
",",
"moet",
"hulle",
"by",
"die",
"Hoërhof",
"aansoek",
"doen",
"."
] | [
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0
] |
"94" | [
"Ingevolge",
"die",
"Wet",
"op",
"Erkenning",
"van",
"Gebruiklike",
"Huwelike",
",",
"1998",
"geniet",
"die",
"vrou",
"dieselfde",
"regte",
"en",
"status",
"as",
"die",
"man",
"om",
"te",
"besluit",
"oor",
"wat",
"met",
"die",
"eiendom",
"gebeur",
"."
] | [
0,
0,
7,
8,
8,
8,
8,
8,
8,
8,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0
] |
"95" | [
"'n",
"aangewese",
"persoon",
"wat",
"deur",
"die",
"Direkteur-Generaal",
"aangewys",
"is",
"om",
"funksies",
"ooreenkomstig",
"hierdie",
"regulasies",
"uit",
"te",
"voer",
"."
] | [
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0
] |
"96" | [
"'n",
"Buitelandse",
"visvaartuig",
"is",
"'n",
"vaartuig",
"wat",
"deur",
"'n",
"nie-Suid-Afrikaanse",
"burger",
",",
"dit",
"wil",
"sê",
"'n",
"buitelander",
",",
"besit",
"word",
"en",
"onder",
"'n",
"ander",
"vlagstaat",
"as",
"die",
"Republiek",
"van",
"Suid-Afrika",
"(",
"RSA",
")",
"geregistreer",
"is",
"."
] | [
0,
0,
0,
0,
0,
0,
0,
0,
0,
7,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
5,
6,
6,
0,
5,
0,
0,
0,
0
] |
"97" | [
"Voor",
"jy",
"by",
"visvangs",
"betrokke",
"raak",
",",
"moet",
"jy",
"met",
"die",
"Departement",
"van",
"Omgewingsake",
"en",
"Toerisme",
"in",
"verbinding",
"om",
"vas",
"te",
"stel",
"of",
"die",
"huur",
"van",
"'n",
"buitelandse",
"vaartuig",
"in",
"'n",
"spesifieke",
"visvangsektor",
"toegelaat",
"sal",
"word",
"en",
"om",
"uit",
"te",
"vind",
"watter",
"dokumente",
"nodig",
"is",
"om",
"goedkeuring",
"vir",
"so",
"'n",
"aansoek",
"te",
"verkry",
"."
] | [
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
3,
4,
4,
4,
4,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0
] |
"98" | [
"Sodra",
"daar",
"in",
"beginsel",
"steun",
"vir",
"die",
"gebruik",
"van",
"'n",
"buitelandse",
"vaartuig",
"verleen",
"is",
",",
"moet",
"jy",
"'n",
"aansoekvorm",
"vir",
"'n",
"lisensie",
"vir",
"'n",
"buitelandse",
"visvaartuig",
"by",
"jou",
"naaste",
"kantoor",
"van",
"die",
"Departement",
"van",
"Omgewingsake",
"en",
"Toerisme",
"(",
"DEA&T-kantoor",
")",
"Department",
"of",
"Environmental",
"Affairs",
"and",
"Tourism",
"kry",
"."
] | [
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
3,
4,
4,
4,
4,
0,
7,
0,
3,
4,
4,
4,
4,
4,
0,
0
] |
"99" | [
"Vul",
"die",
"aansoekvorm",
"in",
"en",
"dien",
"dit",
"saam",
"met",
"die",
"ondergenoemde",
"inligting",
"by",
"jou",
"naaste",
"DEA&T-kantoor",
"in",
":"
] | [
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
7,
0,
0
] |
Dataset Card for Afrikaans Ner Corpus
Dataset Summary
The Afrikaans Ner Corpus is an Afrikaans dataset developed by The Centre for Text Technology (CTexT), North-West University, South Africa. The data is based on documents from the South African goverment domain and crawled from gov.za websites. It was created to support NER task for Afrikaans language. The dataset uses CoNLL shared task annotation standards.
Supported Tasks and Leaderboards
[More Information Needed]
Languages
The language supported is Afrikaans.
Dataset Structure
Data Instances
A data point consists of sentences seperated by empty line and tab-seperated tokens and tags. {'id': '0', 'ner_tags': [0, 0, 0, 0, 0], 'tokens': ['Vertaling', 'van', 'die', 'inligting', 'in'] }
Data Fields
id
: id of the sampletokens
: the tokens of the example textner_tags
: the NER tags of each token
The NER tags correspond to this list:
"OUT", "B-PERS", "I-PERS", "B-ORG", "I-ORG", "B-LOC", "I-LOC", "B-MISC", "I-MISC",
The NER tags have the same format as in the CoNLL shared task: a B denotes the first item of a phrase and an I any non-initial word. There are four types of phrases: person names (PER), organizations (ORG), locations (LOC) and miscellaneous names (MISC). (OUT) is used for tokens not considered part of any named entity.
Data Splits
The data was not split.
Dataset Creation
Curation Rationale
The data was created to help introduce resources to new language - Afrikaans.
[More Information Needed]
Source Data
Initial Data Collection and Normalization
The data is based on South African government domain and was crawled from gov.za websites.
[More Information Needed]
Who are the source language producers?
The data was produced by writers of South African government websites - gov.za
[More Information Needed]
Annotations
Annotation process
[More Information Needed]
Who are the annotators?
The data was annotated during the NCHLT text resource development project.
[More Information Needed]
Personal and Sensitive Information
[More Information Needed]
Considerations for Using the Data
Social Impact of Dataset
[More Information Needed]
Discussion of Biases
[More Information Needed]
Other Known Limitations
[More Information Needed]
Additional Information
Dataset Curators
The annotated data sets were developed by the Centre for Text Technology (CTexT, North-West University, South Africa).
See: more information
Licensing Information
The data is under the Creative Commons Attribution 2.5 South Africa License
Citation Information
@inproceedings{afrikaans_ner_corpus,
author = { Gerhard van Huyssteen and
Martin Puttkammer and
E.B. Trollip and
J.C. Liversage and
Roald Eiselen},
title = {NCHLT Afrikaans Named Entity Annotated Corpus},
booktitle = {Eiselen, R. 2016. Government domain named entity recognition for South African languages. Proceedings of the 10th Language Resource and Evaluation Conference, Portorož, Slovenia.},
year = {2016},
url = {https://repo.sadilar.org/handle/20.500.12185/299},
}
Contributions
Thanks to @yvonnegitau for adding this dataset.
- Downloads last month
- 465