Profile
Sentences
Vocabulary
Reviews
Lists
Favorites
Comments
Comments on Thanuir's sentences
Wall messages
Logs
Audio
Transcriptions
Translate Thanuir's sentences
Ehkä. Olen kuitenkin löytänyt muutaman kirjoitusvirheen tanskankielisissä lauseissa tuollaisen pakan kautta.
Epäilen sen johtuvan enemmän siitä, että Tatoeba, varsinkaan vanhempien lauseiden ja pienempien kielten kohdalla, ei aina ole laadukas. Mutta ehkä siellä on konekäännöksiäkin, en siitä tiedä.
Ankissa on Tatoebasta (ilman mainintaaa) haettuja ja järjestettetyjä lauseita sisältävä pakka: https://ankiweb.net/shared/info/241481292
Sama henkilö on tehnyt useita vastaavia eikä mainitse Tatoebaa, mutta valtava Tom- ja Mary-lauseiden määrä paljastaa lähteen. https://frequencylists.blogspot.com/
Ja kuten aiemmin mainittu, on tämä huono ajatus: kaupunkien, valtioiden ja kielten nimet vaihtelevat kielestä toiseen, eri nimet muuttuvat eri tavalla aakkostosta toiseen ja eri nimet taipuvat eri lailla eri kielissä. Lisäksi on hyvä, jos kussakin kielessä esiintyy myös sille tavanomaisia erisnimiä, myös kielenoppijoiden kannalta.
Tiedän. Ymmärsin tämän kysymyksen kuitenkin yleisenä, en vain niitä lauseita koskevana.
Yksittäisen lauseen käännöksillä, vaikka ne muistuttaisivatkin toisiaan, on arvoa.
1. Ne näyttävät yhdellä silmäyksellä kuinka moninaisilla tavoilla erään lauseen voi kääntää.
2. Ne tukevat monimuotoisuutta esimerkiksi persoonapronominien sukupuolen ja yksiköllisyyden/monikollisuuden suhteen.
Lisäksi niillä on sekä positiivinen että negatiivinen vaikutus linkittämiseen; negatiivinen sinänsä, että jos joku kääntää yhden lauseen, ei hän välttämättä linkitä samankaltaisia lauseita, eihän käyttöliittymä anna tähän hyvää mahdollisuutta. Positiivinen sinänsä, että jos joku on vaikkapa suomentanut ruotsinkielisen lauseen ja toinen ranskankielisen, ja näillä olisi mahdollinen yhteinen käännös, siihen osutaan todennäköisemmin jos molemmilla lauseilla on useita käännöksiä.
Valitettavasti yhteisö, joka sallii kaikenlaisen sisällön, ajaa pois herkemmät ja haavoittuvammat käyttäjät ja jättää jälkeensä vain meidät, jotka ovat tarpeeksi välinpitämättömiä, vahvoja tai etuoikeutettuja jaksaakseen kaikenlaisia lauseita.
On mahdotonta rakentaa yhteisöä siten, että kaikkien ääni kuuluu siellä. Joidenkin ääni hukuttaa tai ajaa pois toisten äänet. Tämä on hyvin valitettavaa; maailma olisi mukavampi paikka, jos sananvapaus olisi helpommin toteutettavissa.
FI
Jos tiedoston lataaminen ei ole ongelma itsessään, niin senhän voisi ladata ja sitten muokata tekstitiedostona. Poistaa vaan suurimman osan datasta, niin että jäljelle jää vain haluttu määrä lauseita.
EN
If downloading the file is not an issue as such, you could do that and edit the file (as a text file) to remove most of the data, leaving behind only a usable amount.
Periaate on ihan hyvä; ainakin viimeksi, kun tarkistin, oli miespuolisia nimiä ja persoonapronominejä enemmän kuin naispuolisia vastaavia, puhumattakaan sukupuolineutraaleista.
Olen myös käyttänyt suomalaisia nimiä.
Nimien käyttö aina välillä on parempi kuin jättää nimet täysin käyttämättä, tai niiden käyttö jatkuvasti.
Monipuolinen nimien käyttö on parempi kuin yksipuolinen nimien käyttö.
Niinpä on parempi jos on monia eri nimiä käytössä kuin jos niitä on vain kaksi (Tom ja Ziri tässä esimerkissä), mutta kahden nimen käyttö on parempi kuin vain yhden nimen (Tom tässä esimerkissä).
On myös hyvä jos nimiä on eri kulttuureista ja myös että monimuotoisuutta on sukupuolten suhteen.
Thanks.
Are there any recommendations on which to use? I would guess «archaic» to be the most old-fashioned, but have no idea how to classify «dated» and «old-fashioned».
Do we have some recommended hierarchy of old-fashiodness? Archaic is the only one I have seen in use so the only one I have used myself.
Might be a good idea to tag these with "needs native check", since these are likely to contain old-fashioned language and should be tagged "archaic".
Suosittelen lukemaan varsinaisen lisenssin: https://creativecommons.org/lic.../4.0/legalcode
Kappale 3, kohta a vastannee kysymyksiisi.
Lisenssi löytyy myös joillakin toisilla kielillä.
Ongelmana ovat kielet ilman aktiivisia korkean oikeustason käyttäjiä ja joissa on runsaasti vihreellisiä lauseita. Tälle ongelmalle on melko vaikea tehdä mitään nopeasti; sitä voi toivoa, että jostain löytyisi uusia aktiiveja kyseisen kielen pariin, tai yrittää etsiä heitä itse.
Jos lauseet ovat linkitettyjä, mutta eivät vastaa toisiaan, linkityksen voi poistaa.
Käytän tässä yleensä harkintaa: jos lauseet ovat lähellä toisiaan ja parempaa käännöstä ei ole, annan linkin yleensä pysyä; jos taas tarkka käännös on olemassa ja linkitetty epätarkan lisäksi, saatan katkaista epätarkemman linkin.
Minun mielestäni kaksi lausetta voi linkittää, jos ainakin toinen niistä on pätevä käännös toiselle, eli on vähintään yksi käyttötarkoitus tai asiayhteys, jossa yhden voisi kääntää toiseksi.
Lauseiden merkitys muuttuu aina ja välttämättä käännettäessä. Se, että käännösten käännökset voivat olla jo varsin erilaisia keskenään, on välttämätön seuraus käsitteestä ja ylipäätänsä siitä, että järjestelmä ei erottele alkuperäisiä lauseita ja käännöksiä, vaan suhde on symmetrinen, eli kaksi lausetta ovat molemmat toistensa käännöksiä ja siten tasa-arvoisia.
As far as I know, sentences written and spoken in dialect are completely fine.
For written dialectical sentences, adding a relevant tag or a comment is polite so that others know what is going on with the sentence.
It might be that variation in the corpus is a multidimensional matter.
If I were to add a new sentence with Tom and Mary, but also a new word, would it add to or reduce the variation in the corpus? What if the sentence structure is novel or very frequent?
What about translating «Tom likes Mary» -type sentences to a language with many sentences? What about translating it in a way that uses an idiom particular to that language? What about to a language with very few sentences?
The questions above are rhetorical ones and not meant to be answered. But the point is, I believe great many people care about issues of variation, but they do it along the dimensions that matter to them.
In the end the ways to affect Tatoeba are:
1. Do something, maybe someone else eventually does something more with it. Like add a sentence or translate a sentence. This does not work if you want the satisfaction of seeing your work flourish and grow.
2. Establish a personal relation with another user; maybe translate stuff from each other.
3. Add sentences on a huge scale.
4. Build a tool or code the website to increase or decrease the visilibity of something or alter people's workflow in a way that emphasizes some stuff.
Please also add your translations in case number two, especially if it is a matter of regional or dialectical variation. The corpus benefits from such variation and having several different translations for a given sentence is a strenght, not a flaw.