| translation
"0" | {
"en": "Today is June 18th and it is Muiriel's birthday!",
"mr": "आज १८ जून आहे व आज म्यूरिएलचा वाढदिवस आहे!"
} |
"1" | {
"en": "Muiriel is 20 now.",
"mr": "म्यूरिएल आता २० वर्षांची आहे."
} |
"2" | {
"en": "The password is \"Muiriel\".",
"mr": "पासवर्ड \"Muiriel\" आहे."
} |
"3" | {
"en": "I will be back soon.",
"mr": "मी लवकरच परत येईन."
} |
"4" | {
"en": "I will be back soon.",
"mr": "मी लवकरच परतेन."
} |
"5" | {
"en": "I'm at a loss for words.",
"mr": "मला शब्दच सुचत नाहीयेत."
} |
"6" | {
"en": "I'm at a loss for words.",
"mr": "मला शब्द सुचत नाहीये."
} |
"7" | {
"en": "This is never going to end.",
"mr": "हे कधीच संपणार नाही आहे."
} |
"8" | {
"en": "This is never going to end.",
"mr": "ह्याचा कधीच अंत होणार नाहीये."
} |
"9" | {
"en": "This is never going to end.",
"mr": "हे कधीच संपणार नाहीये."
} |
"10" | {
"en": "I was in the mountains.",
"mr": "मी डोंगरांमध्ये होतो."
} |
"11" | {
"en": "I was in the mountains.",
"mr": "मी डोंगरांमध्ये होते."
} |
"12" | {
"en": "You are in my way.",
"mr": "तू माझ्या वाटेत आहेस."
} |
"13" | {
"en": "You are in my way.",
"mr": "तुम्ही माझ्या वाटेत आहात."
} |
"14" | {
"en": "I make €100 a day.",
"mr": "मी दिवसाचे €१०० कमावतो."
} |
"15" | {
"en": "I make €100 a day.",
"mr": "मी दिवसाचे €१०० कमवते."
} |
"16" | {
"en": "I make €100 a day.",
"mr": "मी दिवसाचे €१०० कमावते."
} |
"17" | {
"en": "That won't happen.",
"mr": "तसं नाही होणार."
} |
"18" | {
"en": "That won't happen.",
"mr": "तसं घडणार नाही."
} |
"19" | {
"en": "That won't happen.",
"mr": "तसं होणार नाही."
} |
"20" | {
"en": "I miss you.",
"mr": "मला तुझी आठवण येते."
} |
"21" | {
"en": "I miss you.",
"mr": "मला तुमची आठवण येते."
} |
"22" | {
"en": "I'll call them tomorrow when I come back.",
"mr": "मी उद्या परतल्यावर त्यांना फोन करेन."
} |
"23" | {
"en": "You should sleep.",
"mr": "तुला झोपायला पाहिजे."
} |
"24" | {
"en": "You should sleep.",
"mr": "तुम्हाला झोपायला पाहिजे."
} |
"25" | {
"en": "I'm going to go.",
"mr": "मी जाणार आहे."
} |
"26" | {
"en": "I can't live that kind of life.",
"mr": "मी तसलं आयुष्य जगू शकत नाही."
} |
"27" | {
"en": "Most people think I'm crazy.",
"mr": "बहुतेक लोकांना वाटतं की मी वेडा आहे."
} |
"28" | {
"en": "Most people think I'm crazy.",
"mr": "बहुतेक लोकं मला वेडी म्हणून समजतात."
} |
"29" | {
"en": "Most people think I'm crazy.",
"mr": "बहुतेक लोकांना वाटतं की मी वेडी आहे."
} |
"30" | {
"en": "No I'm not; you are!",
"mr": "नाही, मी नाहीये; तू आहेस!"
} |
"31" | {
"en": "That's MY line!",
"mr": "ती तर माझी लाईन आहे!"
} |
"32" | {
"en": "That's MY line!",
"mr": "तसं मला म्हणायला पाहिजे!"
} |
"33" | {
"en": "That's MY line!",
"mr": "ते मी विचारायला पाहिजे!"
} |
"34" | {
"en": "He's kicking me!",
"mr": "तो मला लात मारतोय!"
} |
"35" | {
"en": "He's kicking me!",
"mr": "ते मला लात मारत आहेत!"
} |
"36" | {
"en": "He's kicking me!",
"mr": "तो मला लाथ मारतोय!"
} |
"37" | {
"en": "Are you sure?",
"mr": "नक्की का?"
} |
"38" | {
"en": "Are you sure?",
"mr": "तुम्ही निश्चित आहात का?"
} |
"39" | {
"en": "It doesn't surprise me.",
"mr": "त्याने मला आश्चर्य होत नाही."
} |
"40" | {
"en": "When I grow up, I want to be a king.",
"mr": "मी मोठा झाल्यावर मला राजा बनायचं आहे."
} |
"41" | {
"en": "I'm so fat.",
"mr": "मी किती जाडा आहे."
} |
"42" | {
"en": "I'm so fat.",
"mr": "मी किती जाडी आहे."
} |
"43" | {
"en": "So what?",
"mr": "तर काय?"
} |
"44" | {
"en": "So what?",
"mr": "मग काय झालं?"
} |
"45" | {
"en": "So what?",
"mr": "त्यात काय?"
} |
"46" | {
"en": "I'm gonna shoot him.",
"mr": "मी त्याला गोळी मारणार आहे."
} |
"47" | {
"en": "That's because you're a girl.",
"mr": "ते कारण तू मुलगी आहेस."
} |
"48" | {
"en": "I may be antisocial, but it doesn't mean I don't talk to people.",
"mr": "मी समाजविघातक असेन, पण याचा हा अर्थ नाही की मी लोकांशी बोलत नाही."
} |
"49" | {
"en": "Most people write about their daily life.",
"mr": "बहुतेक लोकं आपल्या दैनिक जीवनाबद्दल लिहितात."
} |
"50" | {
"en": "How long did you stay?",
"mr": "कधी पर्यन्त राहिलास?"
} |
"51" | {
"en": "How long did you stay?",
"mr": "कधी पर्यन्त राहिलीस?"
} |
"52" | {
"en": "How long did you stay?",
"mr": "कधी पर्यन्त राहिलात?"
} |
"53" | {
"en": "How long did you stay?",
"mr": "किती वाजे पर्यन्त राहिलास?"
} |
"54" | {
"en": "How long did you stay?",
"mr": "किती वाजे पर्यन्त राहिलीस?"
} |
"55" | {
"en": "How long did you stay?",
"mr": "किती वाजे पर्यन्त राहिलात?"
} |
"56" | {
"en": "I didn't know where it came from.",
"mr": "कुठून आलं मला माहीत नाही."
} |
"57" | {
"en": "This is not important.",
"mr": "हे महत्त्वाचं नाही आहे."
} |
"58" | {
"en": "I didn't like it.",
"mr": "मला नाही आवडलं."
} |
"59" | {
"en": "I didn't like it.",
"mr": "मला चांगलं नाही वाटलं."
} |
"60" | {
"en": "You can do it.",
"mr": "तू करू शकतोस."
} |
"61" | {
"en": "You can do it.",
"mr": "तू करू शकतेस."
} |
"62" | {
"en": "You can do it.",
"mr": "तुम्ही करू शकता."
} |
"63" | {
"en": "After that, I left, but then I realized that I forgot my backpack at their house.",
"mr": "त्यानंतर मी निघालो, पण मग मला लक्षात आलं की मी माझं दप्तर त्यांच्या घरी विसरलोय."
} |
"64" | {
"en": "After that, I left, but then I realized that I forgot my backpack at their house.",
"mr": "त्यानंतर मी निघाले, पण मग मला लक्षात आलं की मी माझं दप्तर त्यांच्या घरी विसरलेय."
} |
"65" | {
"en": "There are many words that I don't understand.",
"mr": "असे भरपूर शब्द आहेत जे मला कळत नाहीत."
} |
"66" | {
"en": "There are many words that I don't understand.",
"mr": "असे भरपूर शब्द आहेत जे मला समजत नाहीत."
} |
"67" | {
"en": "I like candlelight.",
"mr": "मला मेणबत्तीचा प्रकाश आवडतो."
} |
"68" | {
"en": "What did you answer?",
"mr": "तू काय उत्तर दिलंस?"
} |
"69" | {
"en": "What did you answer?",
"mr": "तुम्ही काय उत्तर दिलंत?"
} |
"70" | {
"en": "No, he's not my new boyfriend.",
"mr": "नाही, तो माझा नवीन बॉयफ्रेंड नाहीये."
} |
"71" | {
"en": "I love you.",
"mr": "माझं तुझ्यावर प्रेम आहे."
} |
"72" | {
"en": "I love you.",
"mr": "माझं तुमच्यावर प्रेम आहे."
} |
"73" | {
"en": "I don't like you anymore.",
"mr": "मला आता तू आवडत नाहीस."
} |
"74" | {
"en": "Congratulations!",
"mr": "अभिनंदन!"
} |
"75" | {
"en": "What other options do I have?",
"mr": "माझ्याकडे आजून कोणते पर्याय उरले आहेत?"
} |
"76" | {
"en": "How could I be a robot? Robots don't dream.",
"mr": "मी यंत्रमानव कसा असू शकतो? यंत्रमानव स्वप्ने पाहत नाहीत."
} |
"77" | {
"en": "I don't speak Japanese.",
"mr": "मी जपानी बोलत नाही."
} |
"78" | {
"en": "\"Who is it?\" \"It's your mother.\"",
"mr": "\"कोण आहे?\" \"तुझी आई.\""
} |
"79" | {
"en": "\"Who is it?\" \"It's your mother.\"",
"mr": "\"कोण आहे?\" \"तुमची आई आहे.\""
} |
"80" | {
"en": "\"Trust me,\" he said.",
"mr": "तो म्हणाला \"माझ्यावर विश्वास ठेव.\""
} |
"81" | {
"en": "\"Trust me,\" he said.",
"mr": "ते म्हणाले \"माझ्यावर विश्वास ठेव.\""
} |
"82" | {
"en": "Allen is a poet.",
"mr": "अॅलेन कवी आहे."
} |
"83" | {
"en": "The archer killed the deer.",
"mr": "तिरंदाजाने हरणाला मारलं."
} |
"84" | {
"en": "Are they all the same?",
"mr": "ते सर्व एकसारखेच आहेत का?"
} |
"85" | {
"en": "Those who live in glass houses should not throw stones.",
"mr": "काचेच्या घरात राहणार्यांनी दगडं फेकू नये."
} |
"86" | {
"en": "They say love is blind.",
"mr": "म्हणतात की प्रेम आंधळं असतं."
} |
"87" | {
"en": "May I ask a question?",
"mr": "मी एक प्रश्न विचारू का?"
} |
"88" | {
"en": "May I ask a question?",
"mr": "मी एक प्रश्न विचारू शकतो का?"
} |
"89" | {
"en": "May I ask a question?",
"mr": "मी एक प्रश्न विचारू शकते का?"
} |
"90" | {
"en": "I can't live without a TV.",
"mr": "मी टीव्हीशिवाय जगूच शकत नाही."
} |
"91" | {
"en": "I can't live without a TV.",
"mr": "मी टीव्हीशिवाय जगू शकत नाही."
} |
"92" | {
"en": "Do whatever he tells you.",
"mr": "तो तुला जे काही सांगेल ते कर."
} |
"93" | {
"en": "It is already eleven.",
"mr": "अकरा वाजले पण."
} |
"94" | {
"en": "Paris is the most beautiful city in the world.",
"mr": "पॅरिस जगातलं सर्वात सुंदर शहर आहे."
} |
"95" | {
"en": "I have a dream.",
"mr": "माझं एक स्वप्न आहे."
} |
"96" | {
"en": "My name is Jack.",
"mr": "माझं नाव जॅक आहे."
} |
"97" | {
"en": "These things aren't mine!",
"mr": "त्या गोष्टी माझ्या नाहीयेत!"
} |
"98" | {
"en": "These things aren't mine!",
"mr": "त्या वस्तू माझ्या नाहीयेत!"
} |
"99" | {
"en": "Italy is a very beautiful country.",
"mr": "इटली हा एक अतिशय सुंदर देश आहे."
} |
Dataset Card for Tatoeba
Dataset Summary
Tatoeba is a collection of sentences and translations.
To load a language pair which isn't part of the config, all you need to do is specify the language code as pairs. You can find the valid pairs in Homepage section of Dataset Description: http://opus.nlpl.eu/Tatoeba.php E.g.
dataset = load_dataset("tatoeba", lang1="en", lang2="he")
The default date is v2021-07-22, but you can also change the date with
dataset = load_dataset("tatoeba", lang1="en", lang2="he", date="v2020-11-09")
Supported Tasks and Leaderboards
[More Information Needed]
The languages in the dataset are:
- ab
- acm
- ady
- af
- afb
- afh
- aii
- ain
- ajp
- akl
- aln
- am
- an
- ang
- aoz
- apc
- ar
- arq
- ary
- arz
- as
- ast
- avk
- awa
- ayl
- az
- ba
- bal
- bar
- be
- ber
- bg
- bho
- bjn
- bm
- bn
- bo
- br
- brx
- bs
- bua
- bvy
- bzt
- ca
- cay
- cbk
- ce
- ceb
- ch
- chg
- chn
- cho
- chr
- cjy
- ckb
- ckt
- cmn
- co
- code
- cpi
- crh
- crk
- cs
- csb
- cv
- cy
- da
- de
- dng
- drt
- dsb
- dtp
- dv
- dws
- ee
- egl
- el
- emx
- en
- enm
- eo
- es
- et
- eu
- ext
- fi
- fj
- fkv
- fo
- fr
- frm
- fro
- frr
- fuc
- fur
- fuv
- fy
- ga
- gag
- gan
- gbm
- gcf
- gd
- gil
- gl
- gn
- gom
- gos
- got
- grc
- gsw
- gu
- gv
- ha
- hak
- haw
- hbo
- he
- hi
- hif
- hil
- hnj
- hoc
- hr
- hrx
- hsb
- hsn
- ht
- hu
- hy
- ia
- iba
- id
- ie
- ig
- ii
- ike
- ilo
- io
- is
- it
- izh
- ja
- jam
- jbo
- jdt
- jpa
- jv
- ka
- kaa
- kab
- kam
- kek
- kha
- kjh
- kk
- kl
- km
- kmr
- kn
- ko
- koi
- kpv
- krc
- krl
- ksh
- ku
- kum
- kw
- kxi
- ky
- kzj: Coastal Kadazan (deprecated tag; preferred value: Kadazan Dusun; Central Dusun (
)) - la
- laa
- lad
- lb
- ldn
- lfn
- lg
- lij
- liv
- lkt
- lld
- lmo
- ln
- lo
- lt
- ltg
- lut
- lv
- lzh
- lzz
- mad
- mai
- max
- mdf
- mfe
- mg
- mgm
- mh
- mhr
- mi
- mic
- min
- mk
- ml
- mn
- mni
- mnw
- moh
- mr
- mt
- mvv
- mwl
- mww
- my
- myv
- na
- nah
- nan
- nb
- nch
- nds
- ngt
- ngu
- niu
- nl
- nlv
- nn
- nog
- non
- nov
- npi
- nst
- nus
- nv
- ny
- nys
- oar
- oc
- ofs
- ood
- or
- orv
- os
- osp
- ota
- otk
- pa
- pag
- pal
- pam
- pap
- pau
- pcd
- pdc
- pes
- phn
- pi
- pl
- pms
- pnb
- ppl
- prg
- ps
- pt
- qu
- quc
- qya
- rap
- rif
- rm
- rn
- ro
- rom
- ru
- rue
- rw
- sa
- sah
- sc
- scn
- sco
- sd
- sdh
- se
- sg
- sgs
- shs
- shy
- si
- sjn
- sl
- sm
- sma
- sn
- so
- sq
- sr
- stq
- su
- sux
- sv
- swg
- swh
- syc
- ta
- te
- tet
- tg
- th
- thv
- ti
- tig
- tk
- tl
- tlh
- tly
- tmr
- tmw
- tn
- to
- toi
- tok
- tpi
- tpw
- tr
- ts
- tt
- tts
- tvl
- ty
- tyv
- tzl
- udm
- ug
- uk
- umb
- ur
- uz
- vec
- vep
- vi
- vo
- vro
- wa
- war
- wo
- wuu
- xal
- xh
- xqa
- yi
- yo
- yue
- zlm
- zsm
- zu
- zza
Dataset Structure
Data Instances
Data Fields
Data Splits
Dataset Creation
Curation Rationale
Source Data
Initial Data Collection and Normalization
Who are the source language producers?
Annotation process
Who are the annotators?
Personal and Sensitive Information
Considerations for Using the Data
Social Impact of Dataset
Discussion of Biases
Other Known Limitations
Additional Information
Dataset Curators
Licensing Information
Citation Information
Thanks to @abhishekkrthakur for adding this dataset.
