CAT TUTORIALS #3
sty 22
Witajcie w kolejnym tutorialu!
Tym razem tutorial będzie dotyczyć narzędzia CAT, które jest dostępne dla każdego za darmo – Google Translator ToolKit! Wielu tłumaczy nawet nie wie o jego istnieniu. Większość zna tylko translator dostępny na http://translate.google.pl/.
Narzędzie CAT jakie oferuje Google ma następujące zalety:
- obsługa różnych formatów zaczynając od formatu .doc,
- tłumaczenie stron www,
- tłumaczenie maszynowe przy wykorzystaniu globalnej bazy Google,
- możliwość dodania własnej bazy TM w formacie TMX,
- możliwość dodania własnego glosariusza w formacie .csv,
- praca wielu użytkowników nad plikami,
- nadawanie użytkownikom uprawnień (edycja, odczyt, pisanie komentarzy),
- status tłumaczenia,
- analiza ilości słów,
- udostępnianie,
- podział na segmenty,
- dwa tryby widoku,
- pokazywanie ukrytych znaczników np. html’a,
- eksport przetłumaczonego pliku,
- praca w przeglądarce www.
Aby przedstawić Wam w praktyce jak wygląda tłumaczenie CAT w Google polecam obejrzeć poniższe HOW TO.
1.Aby skorzystać z tego narzędzia musimy mieć założone konto gmail. Logujemy się na stronie http://translate.google.com/toolkit
2.Po zalogowaniu się do panelu możemy wybrać plik, który chcemy tłumaczyć. Google Translator Toolkit obsługuje formaty:
- AdWords Editor Archive (.aea),
- HTML (.html),
- Microsoft Word (.doc),
- OpenDocument Text (.odt),
- zwykły tekst (.txt),
- tekst sformatowany (.rtf),
- SubRip (.srt),
- SubViewer (.sub).
Niestety dostępna wersja ma także pewne ograniczenia. Jednym z nich jest objętość dokumentu, który nie może przekraczać 1MB. Aby obniżyć wielkość pliku możemy usunąć zbędną grafikę lub wysłać plik w formacie .txt. Musimy wybrać również kombinację językową a następnie wpisujemy tytuł projektu. Opcjonalnie możemy dodać bazę TM.
3.Klikamy przeglądaj a następnie wybieramy plik.
4.Po konwersji otworzy się workflow, w którym zobaczymy tekst oryginalny oraz tłumaczony.Tłumaczenie maszynowe jest wykonane automatycznie, jednak jego jakość jest bardzo niska. Dlatego możemy sami wprowadzić poprawne tłumaczenie. CAT od Google dzieli tekst na segmenty oraz wspiera bazy TMX.
Po przetłumaczeniu danego segmentu możemy kliknąć dalej. Warto przyjrzeć się całemu interfejsowi, ponieważ wyświetla także krótką analizę pod przyciskiem „zapisz i zamknij”. Dodatkowo widzimy % wykonanego tłumaczenia.
5.Polecam włączyć pakiet narzędzi. Znajdziecie tam między innymi:
- wyniki wyszukiwania tłumaczeń,
- tłumaczenie maszynowe,
- glosariusz,
- słownik.
Okno narzędziowe będzie przydatne wtedy, gdy posiadamy bazy TM oraz glosariusze.
6.W zakładce tłumaczenie maszynowe możemy kliknąć „Użyj sugestii”. Tłumaczenie maszynowe przeprowadzone jest na podstawie globalnej bazy TM.
Naukowcy z Google zastosowali całkiem odmienny sposób na translację. W przeciwieństwie do narzędzi typu Trados, ich silnik zbudowany jest o algorytmy statystyczne. Pomysł jest świetny jednak jakość tłumaczenia wykonanego automatycznie jest zbyt kiepska, aby z niej korzystać. Potrzeba jeszcze kilku, kilkunastu lat aby baza zbudowana na algorytmie statystki pozwalała otrzymać w miarę spójne tłumaczenie. Nic nie zastąpi człowieka, jego wyobraźni, doświadczenia i indywidualnej interpretacji. Pomimo słabo działającej funkcji tłumaczenia maszynowego wiele użyteczności zaproponowanych przez narzędzia Google jest bardzo przydatna.
7.Kolejną funkcją, która wzbudza mój podziw jest funkcja udostępniania dokumentu.
Pozwala ona nam na zaproszenie osób powiązanych z danym tłumaczeniem. W tym celu należy kliknąć „Udostępnij” -> „Zaproś inne osoby…”.
8.W oknie Udostępniania możemy podać konta Google naszych współpracowników.
Dzięki uprawnieniom możemy wydzielić korektorów, obserwatora, innego tłumacza lub właściciela.
9.Gdy już przetłumaczymy nasz dokument klikamy „Zapisz i zamknij”.
10.Jak już wcześniej wspominałem możemy dodać bazę tłumaczeń TM.
W tym celu klikamy w lewym menu „Bazy tłumaczeń” a następnie klikamy „Dodaj”.
11.Google translator Toolkit obsługuje bazy TM w formacie TMX ( Translation Memory Exchange ).
Należy wprowadzić przykładową nazwę bazy tłumaczeń oraz zaznaczyć czy chcemy, aby nasza baza TM została udostępniona innym. Udostępnianie bazy, której jesteśmy właścicielem pomaga budować globalną bazę Google. Google pozwala wysłać bazy o pojemności łącznej do 50 MB. Spowodowane jest to zapewne tym, że przy zaznaczonej opcji udostępniania Google korzysta z naszych baz, aby budować własną.
12.Dodatkowo atutem jest możliwość importowania glosariuszy.
Obsługiwany format to .csv.
13.Gdy zakończysz proces tłumaczenia, przejdź do zakładki „Aktywne”. Zaznaczając checkbox przy naszym dokumencie, klikamy „Pobierz”.
Jak widać Google Translator Toolkit oferuje funkcje profesjonalnych rozwiązań, prawie za darmo. Dlaczego prawie? Ponieważ tak jak w przypadku systemu reCaptcha wykonana praca, w tym przypadku tłumaczenie pozwala budować globalną bazę, powodując tym samym, że przekład maszynowy z roku na rok będzie lepszy. Tłumaczenie maszynowe wg algorytmów Google potrzebuje jeszcze sporo czasu, aby dać zadowalające efekty. Lepsze algorytmy tłumaczenia maszynowego oparte o bazy TM posiada np. Trados ze swoim serwerem Enterprise. Jednak skorzystanie z ich serwera wymaga zakupienia licencji Professional.
Mam nadzieję, że powyższy tutorial przyda się w codziennych zmaganiach z tłumaczeniami. Z pewnością narzędzie to, jak sama jego nazwa wskazuje, przyda się przede wszystkim tłumaczom.
Tutorial możecie pobrać również w formacie:
http://www.atominium.com/cat-tutorials/Google-Translator-Toolkit/CAT-Tutorials-3 – Google Translator Toolkit.pdf















lut 02 at 18:44
Za darmo, tak? To przeczytajcie sobie warunki korzystania z usługi. Każdy zawodowy tłumacz, powiązany z klientami typowymi umowami (tj. zawierającymi np. klauzule o prawach autorskich czy poufności), po ich przeczytaniu pokaże Google’owi i jego, nomen omen, kitowi solidnego fu**a.
lut 03 at 00:23
W odpowiedzi na Pani komentarz to chcę zaznaczyć, że przeczytałem warunki korzystania z usługi
.
Warunki w żaden sposób nie łamią prawa autorskiego ani poufności.
Wystarczy tylko zaznaczyć odpowiednie opcje przed przystąpieniem do tłumaczenia.
Prawo autorskie dotyczyć będzie tu pracy wykonanej dla „google”, ale tylko w przypadku udostępniania bazy i dokumentu.
Ponadto zaprezentowanie darmowego narzędzia CAT ma charakter edukacyjny dla osób, które chcą poznać i przetestować funkcje takich programów.
Jest to świetna alternatywa dla tłumaczy rozpoczynających przygodę z narzędziami CAT.
Już nie wspomnę o zaletach systemu na którym może pracować kilka osób jednocześnie.
Cała praca odbywa się w przeglądarce.
Komercyjne rozwiązania kosztują od kilku do kilkunastu tysięcy zł.
Tak jak wspominałem w http://www.atominium.com/blog/index.php/2010/01/26/cat-tutorial-3-ciag-dalszy/, Google promuje rozwój.
Nie zachęcam do korzystania z narzędzia Google tylko przedstawiam krok po kroku jak na nim pracować.
Poniżej fragment warunków korzystania z google translator toolkit.
lut 04 at 19:01
1. Google słynie z kolekcjonowania wszelakich danych – dlatego nigdy się nic nie umieszcza na stronach, co może gdziekolwiek dalej wyciec
2. Jakość tłumaczenia jest tak mierna, że lepiej sobie darować, niż poprawiać to wszystko
3. Formaty plików do tłumaczenia nie są userfriendly
4. Tłumaczenie statystyczne jest dobre do tłumaczenia formularzy, dokumentów standardowych, na innych tekstach wymięka (większości).
Na bezrybiu i rak ryba, ale jak chcę darmowy CAT to albo Across (zadziwił mnie funkcjonalnością – jak się wgryzłem głębiej, albo OmegaT – prościutki programik)
lut 06 at 00:45
1.Jak każda strona.Nie ma co się oszukiwać, google ma najwięcej danych statystycznych co nie znaczy, że z niego nie korzystamy.
.Globalna statystyka = Google.
.Tłumaczenie maszynowe Google jest do niczego.
.
.
Z pewnością kilka razy dziennie wyszukujesz coś w internecie.Jak nie Google to bing lub yahoo, którzy także kolekcjonują wszelakie dane.
Google wie wszystko o Tobie i mnie.Wie, że osoba z danego adresu IP szukała np. połączenia pkp do warszawy itd.
Google wie nawet co jemy
2.Potwierdzam…. n-ty raz
3.Co może być bardziej user friendly od doc’a?Plain text?Chyba, że miałeś coś innego na myśli.
4.Ja to wiem i każdy to wie.Statystyk ma tą wadę, że nie jest weryfikowana.
Do acrossa z pewnością wrócę
Omega T?Działa w przeglądarce?Może na pliku pracować kilka osób jednocześnie?Z tego co wiem to nie…
Chciałem ukazać tylko parę funkcji narzędzia Google dla tłumaczy.
Widzę, że tym tematem wywołałem burzliwą dyskusję
Zaproponujcie kolejny CAT a chętnie przygotuję dla was obszerny tutorial.
mar 02 at 23:13
Ja się obawiam, że google będzie mogło rościć sobie potem prawa do naszych tłumaczeń zachowanych w googlowym TM. Dlatego nie korzystałbym z tego narzędzia.
mar 03 at 00:06
Witam.Widać od razu, że nie zapoznał się Pan z całym artykułem
.Bardzo mnie to boli.Pisałem kilkakrotnie o zaletach i wadach tego narzędzia.Regulamin jest jasny.Proszę przeczytać cały tutorial oraz komentarze do niego a wtedy Pańska wypowiedź okaże się niepotrzebna, nierozbudowana, wnosząca zamęt czyli tzw. off top.
.
.
Widzę, że jest Pan tłumaczem z aspiracjami do stworzenia biura tłumaczeń.
Na Pana stronie widać już spory nacisk na SEO a komentarze są wpisywane szybko i niedbale tylko i wyłącznie po to aby zamieścić linka
Ten blog tworzy kilka osób, które poświęcają mu naprawdę wiele czasu.Robimy to z pasją i zamiłowaniem.Prosimy o bardziej rozwiniętą wypowiedź, ponieważ ta świadczy o braku szacunku do pracy autorów tego bloga
Pańskiego komentarza do posta Tłumacz Miłosz nie zamieściłem, ponieważ zawierał błędy, a nie chcę ingerować w treść czyjegoś komentarza.
Proszę poprawić a zamieszczę!
Pozdrawiam!
mar 10 at 16:59
Można jeszcze napisać o Wordfast Anywhere – również darmowy program wspomagający tłumaczenie.
mar 10 at 17:31
Również o QtLinguist
,Okapi,OmegaT itp. itd:).
Na wszystko przyjdzie pora.
Postaram się w wolnej chwili przygotować kilka tutoriali.
Pozdrawiam!
cze 17 at 21:01
Witam, wprawdzie temat poruszony został dawno ale właśnie dzięki temu postowi ściągnęłam sobie program OmegaT. Niestety „działa” mi tylko okno „tłumaczeniowe”, nie potrafie uruchomić dopasowania rozmytego ani słownika. Przeszukałam strone Omegi i przeczytałam instrukcje, ale niestety nadal „no habla”. Dopiero uczę się korzystać z programu tego typu, mogłabym liczyć na jakąś wskazówkę? Thanx from the mountain