menu
Tatoeba
language
Register Log in
language English
menu
Tatoeba

chevron_right Register

chevron_right Log in

Browse

chevron_right Show random sentence

chevron_right Browse by language

chevron_right Browse by list

chevron_right Browse by tag

chevron_right Browse audio

Community

chevron_right Wall

chevron_right List of all members

chevron_right Languages of members

chevron_right Native speakers

search
clear
swap_horiz
search
Thanuir {{ icon }} keyboard_arrow_right

Profile

keyboard_arrow_right

Sentences

keyboard_arrow_right

Vocabulary

keyboard_arrow_right

Reviews

keyboard_arrow_right

Lists

keyboard_arrow_right

Favorites

keyboard_arrow_right

Comments

keyboard_arrow_right

Comments on Thanuir's sentences

keyboard_arrow_right

Wall messages

keyboard_arrow_right

Logs

keyboard_arrow_right

Audio

keyboard_arrow_right

Transcriptions

translate

Translate Thanuir's sentences

Thanuir's messages on the Wall (total 427)

Thanuir Thanuir February 3, 2023 February 3, 2023 at 5:11:10 PM UTC link Permalink

Ehkä. Olen kuitenkin löytänyt muutaman kirjoitusvirheen tanskankielisissä lauseissa tuollaisen pakan kautta.

Epäilen sen johtuvan enemmän siitä, että Tatoeba, varsinkaan vanhempien lauseiden ja pienempien kielten kohdalla, ei aina ole laadukas. Mutta ehkä siellä on konekäännöksiäkin, en siitä tiedä.

Thanuir Thanuir January 31, 2023 January 31, 2023 at 9:05:05 AM UTC link Permalink

Ankissa on Tatoebasta (ilman mainintaaa) haettuja ja järjestettetyjä lauseita sisältävä pakka: https://ankiweb.net/shared/info/241481292

Sama henkilö on tehnyt useita vastaavia eikä mainitse Tatoebaa, mutta valtava Tom- ja Mary-lauseiden määrä paljastaa lähteen. https://frequencylists.blogspot.com/

Thanuir Thanuir January 13, 2023 January 13, 2023 at 7:35:36 AM UTC link Permalink

Ja kuten aiemmin mainittu, on tämä huono ajatus: kaupunkien, valtioiden ja kielten nimet vaihtelevat kielestä toiseen, eri nimet muuttuvat eri tavalla aakkostosta toiseen ja eri nimet taipuvat eri lailla eri kielissä. Lisäksi on hyvä, jos kussakin kielessä esiintyy myös sille tavanomaisia erisnimiä, myös kielenoppijoiden kannalta.

Thanuir Thanuir January 7, 2023 January 7, 2023 at 8:16:29 AM UTC link Permalink

Tiedän. Ymmärsin tämän kysymyksen kuitenkin yleisenä, en vain niitä lauseita koskevana.

Thanuir Thanuir January 5, 2023 January 5, 2023 at 7:30:42 PM UTC link Permalink

Yksittäisen lauseen käännöksillä, vaikka ne muistuttaisivatkin toisiaan, on arvoa.

1. Ne näyttävät yhdellä silmäyksellä kuinka moninaisilla tavoilla erään lauseen voi kääntää.
2. Ne tukevat monimuotoisuutta esimerkiksi persoonapronominien sukupuolen ja yksiköllisyyden/monikollisuuden suhteen.

Lisäksi niillä on sekä positiivinen että negatiivinen vaikutus linkittämiseen; negatiivinen sinänsä, että jos joku kääntää yhden lauseen, ei hän välttämättä linkitä samankaltaisia lauseita, eihän käyttöliittymä anna tähän hyvää mahdollisuutta. Positiivinen sinänsä, että jos joku on vaikkapa suomentanut ruotsinkielisen lauseen ja toinen ranskankielisen, ja näillä olisi mahdollinen yhteinen käännös, siihen osutaan todennäköisemmin jos molemmilla lauseilla on useita käännöksiä.

Thanuir Thanuir December 28, 2022 December 28, 2022 at 8:30:32 AM UTC link Permalink

Valitettavasti yhteisö, joka sallii kaikenlaisen sisällön, ajaa pois herkemmät ja haavoittuvammat käyttäjät ja jättää jälkeensä vain meidät, jotka ovat tarpeeksi välinpitämättömiä, vahvoja tai etuoikeutettuja jaksaakseen kaikenlaisia lauseita.

On mahdotonta rakentaa yhteisöä siten, että kaikkien ääni kuuluu siellä. Joidenkin ääni hukuttaa tai ajaa pois toisten äänet. Tämä on hyvin valitettavaa; maailma olisi mukavampi paikka, jos sananvapaus olisi helpommin toteutettavissa.

Thanuir Thanuir December 12, 2022 December 12, 2022 at 6:00:43 PM UTC link Permalink

FI
Jos tiedoston lataaminen ei ole ongelma itsessään, niin senhän voisi ladata ja sitten muokata tekstitiedostona. Poistaa vaan suurimman osan datasta, niin että jäljelle jää vain haluttu määrä lauseita.

EN
If downloading the file is not an issue as such, you could do that and edit the file (as a text file) to remove most of the data, leaving behind only a usable amount.

Thanuir Thanuir November 26, 2022 November 26, 2022 at 8:23:50 AM UTC link Permalink

Periaate on ihan hyvä; ainakin viimeksi, kun tarkistin, oli miespuolisia nimiä ja persoonapronominejä enemmän kuin naispuolisia vastaavia, puhumattakaan sukupuolineutraaleista.

Thanuir Thanuir November 15, 2022 November 15, 2022 at 9:36:35 AM UTC link Permalink

Olen myös käyttänyt suomalaisia nimiä.

Thanuir Thanuir November 7, 2022, edited November 7, 2022 November 7, 2022 at 7:56:55 AM UTC, edited November 7, 2022 at 8:46:29 AM UTC link Permalink

Nimien käyttö aina välillä on parempi kuin jättää nimet täysin käyttämättä, tai niiden käyttö jatkuvasti.

Monipuolinen nimien käyttö on parempi kuin yksipuolinen nimien käyttö.

Niinpä on parempi jos on monia eri nimiä käytössä kuin jos niitä on vain kaksi (Tom ja Ziri tässä esimerkissä), mutta kahden nimen käyttö on parempi kuin vain yhden nimen (Tom tässä esimerkissä).

On myös hyvä jos nimiä on eri kulttuureista ja myös että monimuotoisuutta on sukupuolten suhteen.

Thanuir Thanuir November 3, 2022 November 3, 2022 at 6:08:42 AM UTC link Permalink

Thanks.

Are there any recommendations on which to use? I would guess «archaic» to be the most old-fashioned, but have no idea how to classify «dated» and «old-fashioned».

Thanuir Thanuir November 2, 2022 November 2, 2022 at 1:57:25 PM UTC link Permalink

Do we have some recommended hierarchy of old-fashiodness? Archaic is the only one I have seen in use so the only one I have used myself.

Thanuir Thanuir October 31, 2022 October 31, 2022 at 7:23:25 AM UTC link Permalink

Might be a good idea to tag these with "needs native check", since these are likely to contain old-fashioned language and should be tagged "archaic".

Thanuir Thanuir October 26, 2022 October 26, 2022 at 6:52:01 AM UTC link Permalink

Suosittelen lukemaan varsinaisen lisenssin: https://creativecommons.org/lic.../4.0/legalcode

Kappale 3, kohta a vastannee kysymyksiisi.

Lisenssi löytyy myös joillakin toisilla kielillä.

Thanuir Thanuir October 17, 2022 October 17, 2022 at 7:14:34 AM UTC link Permalink

Ongelmana ovat kielet ilman aktiivisia korkean oikeustason käyttäjiä ja joissa on runsaasti vihreellisiä lauseita. Tälle ongelmalle on melko vaikea tehdä mitään nopeasti; sitä voi toivoa, että jostain löytyisi uusia aktiiveja kyseisen kielen pariin, tai yrittää etsiä heitä itse.

Thanuir Thanuir August 8, 2022 August 8, 2022 at 1:34:35 PM UTC link Permalink

Jos lauseet ovat linkitettyjä, mutta eivät vastaa toisiaan, linkityksen voi poistaa.

Käytän tässä yleensä harkintaa: jos lauseet ovat lähellä toisiaan ja parempaa käännöstä ei ole, annan linkin yleensä pysyä; jos taas tarkka käännös on olemassa ja linkitetty epätarkan lisäksi, saatan katkaista epätarkemman linkin.

Thanuir Thanuir August 8, 2022 August 8, 2022 at 12:49:44 PM UTC link Permalink

Minun mielestäni kaksi lausetta voi linkittää, jos ainakin toinen niistä on pätevä käännös toiselle, eli on vähintään yksi käyttötarkoitus tai asiayhteys, jossa yhden voisi kääntää toiseksi.

Lauseiden merkitys muuttuu aina ja välttämättä käännettäessä. Se, että käännösten käännökset voivat olla jo varsin erilaisia keskenään, on välttämätön seuraus käsitteestä ja ylipäätänsä siitä, että järjestelmä ei erottele alkuperäisiä lauseita ja käännöksiä, vaan suhde on symmetrinen, eli kaksi lausetta ovat molemmat toistensa käännöksiä ja siten tasa-arvoisia.

Thanuir Thanuir July 17, 2022 July 17, 2022 at 6:57:24 AM UTC link Permalink

As far as I know, sentences written and spoken in dialect are completely fine.
For written dialectical sentences, adding a relevant tag or a comment is polite so that others know what is going on with the sentence.

Thanuir Thanuir July 1, 2022 July 1, 2022 at 7:24:42 AM UTC link Permalink

It might be that variation in the corpus is a multidimensional matter.

If I were to add a new sentence with Tom and Mary, but also a new word, would it add to or reduce the variation in the corpus? What if the sentence structure is novel or very frequent?

What about translating «Tom likes Mary» -type sentences to a language with many sentences? What about translating it in a way that uses an idiom particular to that language? What about to a language with very few sentences?

The questions above are rhetorical ones and not meant to be answered. But the point is, I believe great many people care about issues of variation, but they do it along the dimensions that matter to them.

In the end the ways to affect Tatoeba are:
1. Do something, maybe someone else eventually does something more with it. Like add a sentence or translate a sentence. This does not work if you want the satisfaction of seeing your work flourish and grow.
2. Establish a personal relation with another user; maybe translate stuff from each other.
3. Add sentences on a huge scale.
4. Build a tool or code the website to increase or decrease the visilibity of something or alter people's workflow in a way that emphasizes some stuff.

Thanuir Thanuir June 29, 2022 June 29, 2022 at 7:24:32 AM UTC link Permalink

Please also add your translations in case number two, especially if it is a matter of regional or dialectical variation. The corpus benefits from such variation and having several different translations for a given sentence is a strenght, not a flaw.