id
int64
121k
134k
tokens
sequence
ner_tags
sequence
124,811
[ "Sept", "des", "huit", "agences", "de", "communication", "les", "plus", "importantes", "du", "monde", "ont", "pour", "siège", "Manhattan", "." ]
[ 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0 ]
121,270
[ "Ses", "velléités", "de", "liberté", "le", "conduiront", "à", "s'", "affranchir", "des", "textes", "qu'", "il", "met", "en", "musique", "au", "point", "de", "les", "écrire", "lui-même", "comme", "le", "fit", "aussi", "Richard", "Wagner", "." ]
[ 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 2, 2, 0 ]
124,055
[ "D'", "autre", "part", "une", "coalition", "a", "proposé", "comme", "compétiteur", "le", "système", "de", "fenêtrage", "X", "originaire", "du", "Massachusetts", "Institute", "of", "Technology", "(", "MIT", ")", "." ]
[ 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 3, 0, 0, 4, 4, 4, 4, 0, 4, 0, 0 ]
131,515
[ "Certaines", "îles", "étaient", "désertes", "au", "moment", "de", "leur", "découverte", "par", "les", "Européens", "." ]
[ 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0 ]
131,801
[ "Au", "terme", "de", "la", "guerre", "de", "la", "Conquête", ",", "la", "Nouvelle-France", "tomba", "sous", "occupation", "militaire", "britannique", "de", "1760", "à", "1763", "." ]
[ 0, 0, 0, 0, 3, 3, 3, 3, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0 ]
133,499
[ "Kant", "est", "le", "premier", "grand", "philosophe", "à", "donner", "un", "enseignement", "universitaire", "régulier", "." ]
[ 2, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0 ]
131,962
[ "Elles", "englobaient", "la", "Caroline", "du", "Nord", "et", "la", "Caroline", "du", "Sud", "." ]
[ 0, 0, 0, 1, 1, 1, 0, 0, 1, 1, 1, 0 ]
127,346
[ "Les", "races", "proposées", "dans", "Oblivion", "correspondent", "à", "celles", "présentes", "dans", "le", "monde", "de", "la", "saga", "des", "Elder", "Scrolls", ":" ]
[ 0, 0, 0, 0, 3, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 3, 3, 0 ]
132,003
[ "Graceland", "désigne", "l'", "ancienne", "demeure", "de", "la", "légende", "du", "rock", "Elvis", "Presley", ";", "elle", "est", "la", "seconde", "maison", "la", "plus", "visitée", "des", "États-Unis", "(", "après", "la", "Maison", "Blanche", ")", "attirant", "plus", "de", "600", "000", "visiteurs", "américains", "et", "étrangers", "par", "an", "." ]
[ 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 2, 2, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0 ]
126,121
[ "Le", "génial", "Léonard", "de", "Vinci", "(", "1452", "--", "1519", ")", "laisse", "également", "une", "œuvre", "fragmentaire", "mais", "riche", ",", "à", "travers", "plus", "de", "cinq", "mille", "feuillets", "qui", "composent", "ses", "carnets", "." ]
[ 0, 0, 2, 2, 2, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0 ]
121,266
[ "En", "1847", ",", "sur", "les", "conseils", "de", "son", "ami", "Balzac", ",", "alors", "qu'", "il", "était", "--", "comme", "souvent", "--", "à", "court", "d'", "argent", ",", "il", "se", "rend", "en", "tournée", "en", "Russie", "où", "il", "remporte", "un", "triomphe", "à", "Saint-Pétersbourg", "et", "à", "Moscou", "." ]
[ 0, 0, 0, 0, 0, 0, 0, 0, 0, 2, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 1, 0, 0, 1, 0 ]
121,979
[ "La", "plus", "grande", "ville", "est", "Saskatoon", ",", "dont", "la", "population", "est", "225927", "habitants", ",", "suivie", "par", "la", "capitale", "Regina", "(", "population", "193093", ")", "." ]
[ 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0 ]
125,757
[ "La", "peinture", "de", "paysages", "(", "山水", "shanshui", ",", "\"", "montagne", "et", "eau", "\"", "en", "chinois", ")", "commença", "sous", "les", "Tang", "et", "constitua", "le", "thème", "majeur", "de", "la", "peinture", ",", "nettement", "inspiré", "par", "la", "pensée", "bouddhiste", "." ]
[ 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 3, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0 ]
132,480
[ "La", "loi", "relative", "au", "renforcement", "et", "à", "la", "simplification", "de", "la", "coopération", "intercommunale", "du", "12", "juillet", "1999", "(", "loi", "Chevènement", ")", "consacre", "l'", "intercommunalité", "de", "projet", "." ]
[ 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 2, 0, 0, 0, 0, 0, 0, 0 ]
133,730
[ "Depuis", "la", "version", "2002", "le", "nombre", "maximum", "de", "feuilles", "par", "classeur", "est", "limité", "par", "la", "quantité", "de", "mémoire", "disponible", "mais", ",", "auparavant", "(", "depuis", "Excel", "5.0", ")", ",", "la", "limite", "du", "nombre", "de", "feuilles", "était", "de", "256", "." ]
[ 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 3, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0 ]
132,383
[ "Tous", "les", "astéroïdes", "de", "la", "ceinture", "sont", "des", "petits", "corps", "du", "système", "solaire", ",", "à", "l'", "exception", "de", "Cérès", ",", "considéré", "comme", "une", "planète", "naine", "." ]
[ 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0 ]
130,355
[ "Les", "vulgarisateurs", "scientifiques", "Jack", "Cohen", "et", "Ian", "Stewart", "s'", "approchent", "de", "ce", "concept", "avec", "un", "nom", "plus", "médiatique", "d'", "extelligence", "." ]
[ 0, 0, 0, 2, 2, 0, 2, 2, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0 ]
131,809
[ "L'", "on", "entreprit", "alors", "le", "renforcement", "des", "colonies", "depuis", "les", "villes", "nouvellement", "fondées", "de", "Louisbourg", "et", "Port-la-Joye", "." ]
[ 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 1, 0 ]
128,215
[ "Elle", "est", "classée", "comme", "très", "peu", "peuplée", "en", "comparaison", "à", "d'", "autres", "capitales", "européennes", "comme", "Moscou", ",", "Londres", "ou", "Berlin", "." ]
[ 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 1, 0, 1, 0 ]
125,391
[ "On", "lui", "propose", "alors", ",", "au", "sud", "du", "Mexique", ",", "un", "nouvel", "évêché", "au", "Chiapas", "dont", "la", "capitale", "est", "Ciudad", "Real", "." ]
[ 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 1, 1, 0 ]
128,569
[ "Le", "mot", "Dacie", "vient", "du", "nom", "romain", "de", "ses", "occupants", "principaux", ",", "les", "Daces", ",", "qui", "sont", "très", "proches", "des", "Thraces", "." ]
[ 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 3, 0, 0, 0, 0, 0, 0, 3, 0 ]
123,377
[ "Comme", "le", "temps", "était", "particulièrement", "aride", "et", "que", "l'", "unique", "point", "d'", "eau", "se", "situait", "à", "Hattin", ",", "près", "de", "Tibériade", ",", "le", "roi", "fit", "prendre", "cette", "direction", "à", "ses", "troupes", "." ]
[ 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 3, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0 ]
126,506
[ "Ronsard", "ne", "pouvait", "épouser", "la", "jeune", "fille", "car", "il", "était", "clerc", "tonsuré", "." ]
[ 2, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0 ]
128,369
[ "Les", "États-Unis", "ne", "veulent", "pas", "voir", "disparaître", "leur", "encaisse-or", "." ]
[ 0, 1, 0, 0, 0, 0, 0, 0, 0, 0 ]
121,237
[ "Pour", "lui", "Vigny", "\"", "avait", "résolu", "le", "problème", "éternel", "manqué", "par", "tous", "les", "poètes", ",", "d'", "être", "pur", "et", "de", "ne", "pas", "être", "froid.", "\"" ]
[ 0, 0, 2, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0 ]
122,518
[ "Ce", "sont", "des", "arbres", "et", "des", "arbustes", ",", "souvent", "producteurs", "d'", "huiles", "aromatiques", ",", "des", "zones", "tempérées", ",", "sub-tropicales", "à", "tropicales", ",", "poussant", "principalement", "en", "Australie", "et", "en", "Amérique", "tropicale", "." ]
[ 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 1, 0, 0 ]
128,955
[ "Cet", "événement", "marque", "la", "fin", "du", "règne", "des", "princes", "électeurs", "de", "Trèves", "." ]
[ 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0 ]
128,941
[ "Des", "vestiges", "de", "murs", "et", "de", "routes", "témoignent", "encore", "aujourd'hui", "dans", "le", "vieux", "Coblence", "des", "fortifications", "du", "temps", "de", "la", "colonie", "romaine", "." ]
[ 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0 ]
131,792
[ "New", "York", "a", "connu", "l'", "occupation", "britannique", "et", "fut", "pendant", "un", "temps", "la", "capitale", "des", "États-Unis", "." ]
[ 1, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0 ]
126,081
[ "Guillaume", "de", "Nogaret", "recule", ",", "impressionné", ",", "tandis", "que", "Sciarra", "Colonna", ",", "dans", "sa", "haine", "de", "Boniface", "VIII", ",", "se", "serait", "avancé", "insolemment", "et", "lui", "aurait", ",", "dit-on", ",", "donné", "une", "gifle", "avec", "son", "gantelet", "de", "fer", "." ]
[ 2, 2, 2, 0, 0, 0, 0, 0, 0, 2, 2, 0, 0, 0, 0, 0, 2, 2, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0 ]
133,075
[ "Pour", "les", "remercier", ",", "saint", "Martin", "a", "transformé", "toutes", "les", "petites", "crottes", "de", "l'", "âne", "en", "brioches", "à", "la", "forme", "particulière", ",", "que", "l'", "on", "appelle", "folard", ",", "ou", "craquandoules", "." ]
[ 0, 0, 0, 0, 2, 2, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0 ]
125,897
[ "Gravelines", "était", "par", "conséquent", "le", "port", "espagnol", "à", "la", "fois", "le", "plus", "proche", "de", "l'", "Angleterre", ",", "et", "le", "seul", "de", "la", "côte", "flamande", "accessible", "sans", "naviguer", "entre", "les", "bancs", "de", "sable", "et", "les", "plages", "." ]
[ 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0 ]
127,571
[ "Johan", "et", "Pirlouit", "devient", "l'", "une", "des", "séries", "les", "plus", "populaires", "du", "journal", "." ]
[ 3, 3, 3, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0 ]
134,076
[ "La", "Poste", "exploite", "aujourd'hui", "un", "parc", "automobile", "de", "près", "de", "50000", "véhicules", "légers", "et", "utilitaires", "et", "pourrait", "à", "terme", "utiliser", "uniquement", "des", "véhicules", "électriques", "." ]
[ 4, 4, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0 ]
131,441
[ "Dans", "le", "même", "temps", ",", "l'", "empereur", "Napoléon", "I", "er", "imposait", "en", "France", "la", "réorganisation", "de", "la", "franc-maçonnerie", "autour", "du", "Grand", "Orient", "de", "France", "et", "d'", "une", "orientation", "plus", "proche", "de", "celle", "des", "\"", "modernes", "\"", "." ]
[ 0, 0, 0, 0, 0, 0, 0, 2, 2, 2, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 4, 4, 4, 4, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0 ]
124,438
[ "L'", "importance", "du", "thème", "galant", "est", "un", "reste", "de", "la", "pièce", "précédente", "de", "Racine", ",", "Alexandre", "Le", "Grand", "." ]
[ 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 2, 0, 3, 3, 3, 0 ]
120,688
[ "De", "plus", ",", "le", "code", "du", "travail", "est", "promulgué", "et", "le", "traité", "de", "Lima", ",", "qui", "résout", "les", "problèmes", "de", "frontières", "avec", "le", "Pérou", ",", "est", "ratifié", ",", "le", "3", "juin", "1929", "." ]
[ 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0 ]
121,698
[ "Le", "VISCII", "(", "Vietnamese", "Standard", "Code", "for", "Information", "Interchange", ")", "est", "une", "adaptation", "de", "l'", "ASCII", "utilisant", "cette", "approche", "pour", "le", "codage", "sur", "7", "ou", "8", "bits", ",", "mais", "n'", "est", "pas", "compatible", "avec", "l'", "ISO", "646", "car", "il", "alloue", "des", "caractères", "au", "lieu", "des", "positions", "réservées", "aux", "caractères", "de", "contrôle", ";", "toutefois", "ce", "codage", "est", "resté", "populaire", "." ]
[ 0, 3, 0, 3, 3, 3, 3, 3, 3, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 3, 3, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0 ]
127,166
[ "Après", "un", "long", "siège", ",", "les", "croisés", "s'", "emparent", "de", "Damiette", "le", "5", "novembre", "1219", "." ]
[ 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0 ]
130,492
[ "Richard", "prend", "et", "détruit", "le", "château", "de", "Vierzon", ",", "dans", "le", "Berry", ",", "et", "se", "fait", "livrer", "à", "prix", "d'", "argent", "le", "château", "de", "Nonancourt", "." ]
[ 2, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0 ]
127,255
[ "Le", "28", "octobre", "1917", ",", "le", "général", "Duchêne", "commande", "sur", "place", "une", "aide", "franco-britannique", "sur", "le", "front", "italien", "." ]
[ 0, 0, 0, 0, 0, 2, 2, 2, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0 ]
120,877
[ "Par", "exemple", ",", "Laplace", "a", "considéré", "l'", "analyse", "comme", "un", "outil", "pour", "affronter", "les", "problèmes", "physiques", ",", "tout", "en", "se", "montrant", "extrêmement", "habile", "pour", "inventer", "les", "concepts", "dont", "il", "a", "besoin", "pour", "atteindre", "cet", "objectif", "." ]
[ 0, 0, 0, 2, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0 ]
124,700
[ "Ses", "deux", "opéras", "en", "un", "acte", "d'", "après", "Poe", "sont", "eux", "restés", "inachevés", "." ]
[ 0, 0, 0, 0, 0, 0, 0, 0, 2, 0, 0, 0, 0, 0 ]
131,475
[ "Sakhaline", "fut", "annexée", "en", "1945", "par", "Staline", "et", "rattachée", "à", "l'", "URSS", "." ]
[ 1, 0, 0, 0, 0, 0, 2, 0, 0, 0, 0, 4, 0 ]
127,862
[ "En", "Corée", "du", "nord", "se", "trouve", "l'", "un", "des", "bâtiments", "les", "plus", "haut", "de", "la", "planète", ",", "l'", "Hôtel", "Ryugyong", "haut", "de", "330", "mètres", "sur", "105", "étages", "mais", "qui", "n'", "a", "jamais", "été", "achevé", "." ]
[ 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0 ]
121,213
[ "Servitude", "et", "Grandeur", "Militaires", "(", "1835", ")", ",", "est", "une", "autre", "œuvre", "en", "prose", "." ]
[ 3, 3, 3, 3, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0 ]
132,559
[ "En", "1990", ",", "AIX", "version", "3", "sortit", "avec", "les", "IBM", "RS/6000", "." ]
[ 0, 0, 0, 3, 0, 0, 0, 0, 0, 4, 3, 0 ]
124,533
[ "Son", "maintien", "est", "grave", "et", "sérieux", ":", "elle", "est", "richement", "vêtue", ",", "et", "chaussée", "de", "cothurnes", ";", "elle", "tient", "d'", "une", "main", "un", "sceptre", "et", "des", "couronnes", ",", "de", "l'", "autre", "un", "poignard", "ensanglanté", ",", "parfois", "une", "massue", "d'", "Héraclès", "dont", "le", "théâtre", "aimait", "célébrer", "les", "exploits", "." ]
[ 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 2, 0, 0, 0, 0, 0, 0, 0, 0 ]
128,406
[ "On", "y", "fabrique", "une", "eau-de-vie", "de", "grain", "réputée", ",", "aromatisée", "avec", "des", "baies", "de", "genièvre", ",", "le", "genièvre", "de", "Houlle", "." ]
[ 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0 ]
121,596
[ "Après", "Katrina", ",", "le", "nombre", "de", "meurtre", "sur", "la", "ville", "de", "Houston", "a", "augmenté", "de", "70", "%", "entre", "novembre", "et", "décembre", "2005", "par", "rapport", "au", "niveau", "de", "l'", "année", "précédente", "sur", "la", "même", "période", "." ]
[ 0, 3, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0 ]
127,998
[ "L'", "humidité", "naturelle", "du", "lieu", "favorise", "la", "pousse", "de", "l'", "herbe", ",", "l'", "Armance", "et", "ses", "aflluents", "drainent", "le", "surplus", "d'", "eau", "." ]
[ 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0 ]
125,521
[ "Elle", "a", "reçu", "le", "Prix", "Nobel", "de", "la", "paix", "en", "2003", "." ]
[ 0, 0, 0, 0, 3, 3, 3, 3, 3, 0, 0, 0 ]
126,254
[ "C'", "est", "son", "fils", ",", "Geoffroi", "II", "Martel", ",", "qui", "mène", "à", "terme", "la", "construction", "de", "cet", "imposant", "édifice", "." ]
[ 0, 0, 0, 0, 0, 2, 2, 2, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0 ]
126,824
[ "Il", "est", "ainsi", "appelé", "en", "référence", "à", "la", "planète", "Saturne", ",", "symbole", "du", "plomb", "en", "alchimie", "." ]
[ 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 0, 0, 0, 0, 0, 0, 0 ]
129,732
[ "À", "la", "rentrée", "2002", ",", "Diwan", "compte", "33", "écoles", ",", "4", "collèges", "et", "1", "lycée", ",", "employant", "quelque", "250", "personnes", ",", "dont", "130", "à", "plein", "temps", "." ]
[ 0, 0, 0, 0, 0, 4, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0 ]
122,950
[ "En", "2000", ",", "le", "monument", "fait", "partie", "des", "propositions", "pour", "désigner", "les", "\"", "sept", "nouvelles", "merveilles", "du", "monde", "\"", ",", "projet", "lancé", "par", "le", "réalisateur", "suisse", "Bernard", "Weber", "." ]
[ 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 3, 3, 0 ]
131,458
[ "Pour", "Léon", "Trotski", ",", "l'", "appartenance", "à", "une", "loge", "maçonnique", "suppose", "la", "collaboration", "de", "classe", ",", "nécessairement", "contre-révolutionnaire", ",", "et", "donc", "incompatible", "avec", "le", "militantisme", "révolutionnaire", ":", "\"", "La", "franc-maçonnerie", "est", "une", "plaie", "sur", "le", "corps", "du", "communisme", "français", ",", "qu'", "il", "faut", "brûler", "au", "fer", "rouge", "\"", "." ]
[ 0, 2, 2, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0 ]
132,783
[ "Dès", "1803", ",", "Lewis", "étudia", "à", "Philadelphie", "les", "informations", "consignées", "dans", "les", "journaux", "des", "trappeurs", "et", "des", "marchands", "qui", "avaient", "visité", "l'", "ouest", "." ]
[ 0, 0, 0, 2, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0 ]
122,772
[ "En", "novembre", "1958", ",", "Duclos", "perdit", "son", "siège", "de", "député", "dans", "son", "fief", "de", "Montreuil", ",", "face", "à", "un", "adversaire", "gaulliste", "." ]
[ 0, 0, 0, 0, 2, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0 ]
131,002
[ "Via", "Campesina", "est", "un", "mouvement", "qui", "se", "dit", "indépendant", "de", "toute", "organisation", "politique", ",", "économique", "ou", "religieuse", "." ]
[ 4, 4, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0 ]
123,902
[ "Jean-Sébastien", "Bach", ",", "entre", "autres", "compositeurs", ",", "avait", "pour", "lui", "une", "grande", "estime", "." ]
[ 2, 2, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0 ]
121,064
[ "VeriSign", "lui", "y", "proposait", "un", "formulaire", "de", "recherche", "de", "site", "." ]
[ 4, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0 ]
133,698
[ "Le", "24", "février", "1583", ",", "il", "est", "nommé", "gouverneur", "de", "Normandie", "." ]
[ 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0 ]
122,522
[ "En", "France", ",", "les", "communes", "suivantes", "portent", "le", "nom", "de", "Sainte-Anne", ":" ]
[ 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0 ]
131,567
[ "Le", "caractère", "ṁ", "s'", "emploie", ",", "dans", "la", "transcription", "des", "langues", "de", "l'", "Inde", ",", "en", "concurrence", "avec", "ṃ", ",", "pour", "l", "'", "anusvāra", "(", "=ं", ",", "signe", "de", "nasalisation", "dont", "la", "réalisation", "varie", "grandement", "d'", "une", "langue", "à", "l'", "autre", ";", "il", "peut", "aussi", "noter", "une", "consonne", "nasale", "simple", ")", ";", "le", "phonème", "[", "ɽ", "]", "(", "devanâgarî", ":", "ड", ")", ",", "quant", "à", "lui", ",", "n'", "est", "que", "rarement", "transcrit", "ṙ", "." ]
[ 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 3, 3, 3, 3, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0 ]
126,310
[ "Quant", "à", "l'", "Ostrevent", ",", "Arnoul", "parvient", "dès", "931", "à", "déloger", "Roger", "II", "de", "Laon", "et", "ses", "frères", "de", "la", "place", "de", "Mortagne", "." ]
[ 0, 0, 0, 1, 0, 2, 0, 0, 0, 0, 0, 2, 2, 2, 2, 0, 0, 0, 0, 0, 0, 0, 1, 0 ]
131,873
[ "Un", "train", "spécial", "les", "conduit", "en", "Italie", ",", "après", "avoir", "traversé", "la", "Suisse", "." ]
[ 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 1, 0 ]
126,835
[ "Cette", "famille", "est", "endémique", "d'", "Australie", "et", "de", "Tasmanie", "." ]
[ 0, 0, 0, 0, 0, 1, 0, 0, 1, 0 ]
128,131
[ "La", "lame", "d'", "eau", "écoulée", "dans", "le", "bassin", "est", "de", "212", "millimètres", "annuellement", ",", "un", "peu", "inférieure", "à", "la", "moyenne", "du", "bassin", "versant", "de", "la", "Seine", "(", "220", "à", "240", "millimètres", ")", "." ]
[ 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0 ]
128,094
[ "Certains", "défauts", "sont", "dus", "à", "des", "cas", "de", "force", "majeure", "ponctuels", "comme", ",", "par", "exemple", ",", "celui", "du", "Koweït", ",", "dont", "les", "paiements", "d'", "intérêt", "ont", "été", "interrompus", "pendant", "la", "durée", "de", "l'", "occupation", "irakienne", "entre", "août", "1990", "et", "janvier", "1991", "." ]
[ 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0 ]
131,701
[ "Le", "5", "mars", "1770", ",", "au", "cours", "d'", "une", "violente", "manifestation", "dans", "le", "centre", "de", "Boston", ",", "les", "soldats", "britanniques", "tirèrent", "sur", "la", "foule", "." ]
[ 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0 ]
129,391
[ "Gérard", "Ayache", "parle", "d'", "hypermonde", "pour", "exprimer", "les", "mutations", "radicales", "nées", "de", "l'", "association", "de", "la", "mondialisation", "économique", "et", "de", "l'", "hyper-information", "." ]
[ 2, 2, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0 ]
131,845
[ "La", "Commission", "européenne", "a", "accepté", "cette", "création", ",", "en", "étudiant", "les", "risques", "d'", "atteinte", "à", "la", "concurrence", "et", "d'", "abus", "de", "position", "dominante", "par", "segment", "de", "marché", "." ]
[ 0, 4, 4, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0 ]
124,665
[ "Au", "traditionnel", "concours", "de", "piano", "annuel", ",", "avec", "au", "programme", "l'", "allegro", "de", "la", "sonate", "op.", "39", "de", "Weber", ",", "Debussy", "fit", "vache", "maigre", "et", "repartit", "sans", "aucun", "prix", "." ]
[ 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 2, 0, 2, 0, 0, 0, 0, 0, 0, 0, 0, 0 ]
130,440
[ "Chaque", "université", "fouille", "le", "site", "sous", "forme", "de", "projets", "triennaux", "qui", "se", "tournent", "actuellement", "vers", "la", "compréhension", "du", "mode", "de", "fonctionnement", "d'", "une", "cité", "celte", "de", "la", "période", "de", "la", "Tène", "." ]
[ 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 0 ]
123,531
[ "La", "pièce", "débute", "par", "la", "plainte", "d'", "Apollon", ",", "que", "le", "chœur", "de", "satyres", "propose", "d'", "aider", "contre", "la", "promesse", "d'", "être", "libérés", "de", "l'", "esclavage", "." ]
[ 0, 0, 0, 0, 0, 0, 0, 2, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0 ]
129,031
[ "Il", "meurt", "à", "Paris", "le", "5", "juillet", "1463", "." ]
[ 0, 0, 0, 1, 0, 0, 0, 0, 0 ]
125,549
[ "L'", "Unicef", "lutte", "en", "particulier", "contre", "la", "pauvreté", "des", "enfants", "." ]
[ 0, 4, 0, 0, 0, 0, 0, 0, 0, 0, 0 ]
123,758
[ "En", "mars", "1996", ",", "Netscape", "implémente", "le", "moteur", "JavaScript", "dans", "son", "navigateur", "web", "Netscape", "Navigator", "2.0", "." ]
[ 0, 0, 0, 0, 4, 0, 0, 0, 3, 0, 0, 0, 0, 3, 3, 0, 0 ]
122,059
[ "À", "titre", "d'", "exemple", ",", "une", "préparation", "pour", "tisane", "amaigrissante", ",", "vendue", "en", "pharmacie", ",", "a", "ainsi", "fait", "des", "victimes", "au", "début", "des", "années", "1990", ":", "une", "erreur", "de", "traduction", "a", "inclus", "une", "plante", "de", "la", "famille", "des", "aristoloches", ",", "très", "dangereuse", ",", "qui", "a", "entraîné", "des", "insuffisances", "rénales", "majeures", "et", "des", "cancers", "chez", "110", "personnes", "en", "Belgique", "." ]
[ 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0 ]
124,986
[ "Il", "sera", "accompagné", "de", "la", "mise", "à", "2x2", "voies", "de", "la", "RN", "13", "entre", "Saint-Germain-en-Laye", "et", "le", "nouvel", "échangeur", "." ]
[ 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 0, 1, 0, 0, 0, 0, 0 ]
127,635
[ "Ce", "secteur", "est", "actuellement", "dominé", "par", "l'", "entreprise", "Mittal", "Steel", "." ]
[ 0, 0, 0, 0, 0, 0, 0, 0, 4, 4, 0 ]
127,732
[ "Avec", "Amédée", "Ozenfant", ",", "il", "jette", "les", "bases", "en", "1918", "du", "purisme", ",", "courant", "artistique", "contemporain", "du", "cubisme", "mais", "ne", "le", "partageant", "pas", "du", "tout", "(", "voir", "ses", "propos", "acides", "sur", "le", "cubisme", "dans", "son", "livre", "manifeste", "\"", "après", "le", "cubisme", "\"", ",", "1918", ")", "." ]
[ 0, 2, 2, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0 ]
121,422
[ "En", "1904", ",", "il", "fonde", "la", "Ford", "Motor", "Company", "." ]
[ 0, 0, 0, 0, 0, 0, 4, 4, 4, 0 ]
123,900
[ "Il", "participe", "activement", "à", "la", "mise", "en", "forme", "de", "la", "suite", "de", "danses", "et", "à", "sa", "diffusion", "en", "Allemagne", "." ]
[ 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0 ]
122,416
[ "L'", "homosexualité", "était", "une", "des", "préoccupations", "de", "Pierre", "Loti", "." ]
[ 0, 0, 0, 0, 0, 0, 0, 2, 2, 0 ]
126,773
[ "La", "culture", "grecque", "quant", "à", "elle", "imprègne", "les", "élites", "romaines", "à", "tel", "point", "qu'", "une", "culture", "commune", ",", "issue", "du", "monde", "hellénistique", "avec", "des", "apports", "romains", ",", "s'", "impose", "dans", "l'", "Empire", "." ]
[ 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0 ]
123,368
[ "Dans", "l'", "article", "28", ",", "la", "règle", "latine", "précisait", "que", "\"", "les", "frères", "devront", "avoir", "les", "cheveux", "ras", "\"", ",", "ceci", "pour", "des", "raisons", "à", "la", "fois", "pratiques", "et", "d'", "hygiène", "dont", "ne", "parlait", "pas", "saint", "Bernard", ",", "mais", "surtout", "\"", "afin", "de", "se", "considérer", "comme", "reconnaissant", "la", "règle", "en", "permanence", "\"", "." ]
[ 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 2, 2, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0 ]
133,428
[ "Paul", "Diel", "voit", "aussi", "en", "lui", ",", "le", "cheval", "des", "Muses", ",", "un", "symbole", "de", "l'", "inspiration", "sublimée", ",", "l'", "imagination", "créatrice", "." ]
[ 2, 2, 0, 0, 0, 0, 0, 0, 0, 0, 2, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0 ]
123,036
[ "En", "2007", ",", "il", "était", "envoyé", "50000", "SMS", "à", "chaque", "minute", "à", "travers", "le", "monde", "." ]
[ 0, 0, 0, 0, 0, 0, 0, 3, 0, 0, 0, 0, 0, 0, 0, 0 ]
132,162
[ "Ga", "est", "une", "unité", "de", "temps", "(", "non", "SI", ")", ",", "qui", "signifie", "giga", "annum", "ou", "milliard", "d'", "années", "." ]
[ 1, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0 ]
132,640
[ "L'", "aiguille", "d'", "Orcières", "est", "un", "fromage", "français", ",", "fabriqué", "dans", "le", "pays", "du", "Champsaur", "." ]
[ 0, 1, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0 ]
132,888
[ "Un", "groupe", "représente", "Pan", "et", "Apollon", "jouant", "de", "la", "lyre", "et", "du", "flageolet", "devant", "Midas", "et", "Tmolos", ",", "juges", "du", "combat", ";", "un", "autre", "groupe", ",", "la", "nymphe", "Écho", "répondant", "à", "un", "satyre", ",", "ete", "." ]
[ 0, 0, 0, 2, 0, 2, 0, 0, 0, 0, 0, 0, 0, 0, 2, 0, 2, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 2, 0, 0, 0, 0, 0, 0, 0 ]
125,228
[ "En", "France", ",", "entre", "2002", "et", "2003", "les", "décès", "par", "accident", "de", "la", "route", "imputables", "à", "une", "ivresse", "alcoolique", "représentent", "un", "total", "de", "2200", "personnes", "." ]
[ 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0 ]
125,812
[ "L'", "IUCN", "classe", "l'", "ornithorynque", "dans", "sa", "liste", "des", "espèces", "menacées", "comme", "\"", "peu", "concerné", "\"", "." ]
[ 0, 4, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0 ]
122,235
[ "Le", "lac", "Titicaca", "lui-même", "déverse", "ses", "excédents", "dans", "le", "lac", "Uru", "Uru", "et", "le", "lac", "Poopó", "par", "l'", "intermédiaire", "du", "río", "Desaguadero", "." ]
[ 0, 1, 1, 0, 0, 0, 0, 0, 0, 1, 1, 1, 0, 0, 1, 1, 0, 0, 0, 0, 1, 1, 0 ]
127,539
[ "Les", "mesures", "sont", "définies", "par", "la", "norme", "ISO", "13406-2", ",", "dont", "la", "règle", "la", "plus", "connue", "concerne", "les", "pixels", "défectueux", ",", "et", "qui", "répartit", "les", "écrans", "en", "4", "classes", "selon", "le", "nombre", "de", "défauts", "par", "millions", "de", "pixels", ":" ]
[ 0, 0, 0, 0, 0, 0, 0, 4, 4, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0 ]
131,577
[ "Diablo", ",", "jeu", "commercial", "édité", "par", "Blizzard", "Entertainment", "en", "1997", ",", "se", "différencie", "par", "son", "graphisme", "et", "sa", "gestion", "en", "temps", "réel", "des", "événements", "." ]
[ 3, 0, 0, 0, 0, 0, 4, 4, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0 ]
126,760
[ "Le", "geste", "d'", "Alexandre", "le", "Grand", "qui", ",", "à", "peine", "en", "Asie", ",", "rend", "hommage", "à", "Achille", "et", "Patrocle", ",", "est", "révélateur", "de", "cet", "état", "d'", "esprit", "." ]
[ 0, 0, 0, 2, 2, 2, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 2, 0, 2, 0, 0, 0, 0, 0, 0, 0, 0, 0 ]
120,950
[ "BeOS", "est", "un", "système", "présentant", "des", "caractéristiques", "innovantes", "pour", "l'", "époque", ":" ]
[ 3, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0 ]

Dataset Card for "wikiner_fr"

Dataset Description:

Downloads last month
1,212
Edit dataset card
Evaluate models HF Leaderboard

Models trained or fine-tuned on Jean-Baptiste/wikiner_fr