Chuyển đến nội dung chính

OmegaT - Công cụ trợ giúp biên dịch (CAT)

http://www.omegat.org/images/logo_omegat.jpg

Khác với những phần mềm dịch tự động, công cụ trợ giúp biên dịch (Computer Aided Translation) chỉ ghi nhớ những gì đã từng được dịch để giúp cho công việc của người dịch thuật được nhẹ nhàng thuận tiện, nhanh chóng hơn mà thôi. Vì vậy đây mới đúng là công cụ cần thiết cho công tác biên dịch chuyên nghiệp. OmegaT là một trong những công cụ như vậy, và miễn phí.

Thông thường, để dịch một văn bản, nhiều người thường nghĩ đến những phần mềm dịch tự động (machine translation) trực tuyến. Tuy nhiên, chất lượng dịch của những phần mềm này không như mong đợi, vì hầu hết chúng chỉ biết “máy móc” thực hiện theo những quy tắc lập sẵn mà không thể hiểu hết những gì tinh tế trong ngôn ngữ như con người được. Bài viết sau đây sẽ giới thiệu một phần mềm có thể giúp bạn khắc phục khuyết điểm này.

Các tính năng cơ bản của một trình biên dịch CAT:
Người biên dịch chuyên nghiệp ngày nay thường sử dụng các trình CAT (Computer Aided Translation) để giúp họ hoàn thành công việc của mình với hiệu quả cao mà không phải tốn quá nhiều công sức. Những trình CAT này không làm thay công việc của người dịch, mà chỉ là những công cụ trợ giúp, với những tính năng điển hình như sau:
- Phân mảnh:
Trình CAT sẽ tách tài liệu cần dịch ra nhiều đơn vị gọi là phân mảnh (segment). Mỗi phân mảnh có thể là một câu hoặc đoạn văn, cũng có khi chỉ là một từ của văn bản gốc, gọi là phân mảnh gốc (Source segment). Phần dịch của bạn được chứa trong phân mảnh mục tiêu (Target segment). Mỗi khi bạn dịch xong một phân mảnh gốc, máy sẽ tự động nhảy sang phân mảnh gốc kế tiếp.
- Bộ nhớ TM:
Tất cả các phân mảnh gốc và phân mảnh mục tiêu sẽ được lưu trong một tập tin gọi là Translation Memory (TM). Sau này, nếu bạn gặp lại một câu văn gốc giống hệt hoặc tương tự, máy tính sẽ gợi ý cách dịch trước đây của bạn, giúp bảo đảm tính nhất quán khi văn bản cần dịch có nhiều từ hoặc đoạn lặp lại. Nếu gặp câu văn là giống hệt, máy tính sẽ tự nhập vào phân mảnh mục tiêu phần bạn đã dịch trước đây, xong chờ bạn chấp thuận. Trường hợp này gọi là khớp 100% (100% match). Nếu gặp phân mảnh tương tự, máy tính vẫn gợi ý cách dịch trước đây, kèm theo nhận xét mức độ tương tự (%) của phân mảnh đang gặp với phân mảnh sẵn có trong TM. Trường hợp này gọi là khớp mờ (fuzzy match).
- Sử dụng thuật ngữ:
Trình CAT có nhiều công cụ để giúp người dịch bảo đảm tính nhất quán trong bản dịch và sử dụng đúng thuật ngữ. Điều này được thực hiện bằng cách tích hợp các bộ từ điển và thuật ngữ chuyên ngành, đồng thời bạn có thể tự xây dựng thuật ngữ cho riêng mình.
- Kiểm tra chất lượng:
Một trình CAT tốt phải cho phép bạn kiểm tra bản dịch của mình bằng nhiều thông số khác nhau. Tất nhiên, chức năng kiểm tra lỗi chính tả là một phần tất yếu, đồng thời nó còn cho phép kiểm tra được các thuật ngữ đã sử dụng (nhiều khách hàng chỉ muốn bạn dùng thuật ngữ mà họ đề xuất).
- Xử lý tập tin:
Văn bản cần dịch thường có rất nhiều dạng: tập tin html, doc, rtf, bảng tính Excel, tài liệu Power Point, Translation Memories, vv... CAT phải có cách xử lý các dạng này.
Trên đây là những tính năng chung của các trình CAT, để bạn thấy những công cụ này có thể giúp người dịch nâng cao năng suất và đạt đến chuẩn mực chất lượng tốt hơn như thế nào.
Những trình CAT chuyên dụng hiện có trên thị trường thì nhiều (như DejaVu, Trados, Wordfast...) nhưng đa số phải trả tiền và giá bán không rẻ. Bài viết này xin giới thiệu OmegaT, một trình CAT miễn phí được viết bằng ngôn ngữ Java, với các tính năng tương tự nhằm giúp những ai đang làm công việc biên dịch chuyên nghiệp. Bạn có thể tải về tại http://www.omegat.org/en/omegat.html.
 http://www.omegat.org/images/screenshot2.jpg
Cài đặt OmegaT
Máy tính của bạn cần cài đặt Java Runtime Environment (JRE) version 1.4 hoặc cao hơn để chạy trình OmegaT. Hiện nay các phiên bản OmegaT được cung cấp với Java Runtime Environment cài sẵn, rất thuận tiện.
Nếu máy tính của bạn được cài sẵn bộ ứng dụng văn phòng OpenOffice.org (đây cũng là phần mềm miễn phí, có khả năng thay thế tốt Microsoft Office như đã giới thiệu trong LMVMT số 220), thì việc cài đặt OmegaT chẳng có gì khó khăn. Chỉ cần giải nén vào một thư mục là có thể chạy được chương trình.
Có thể tải OpenOffice.org tại địa chỉ sau:
- Phiên bản tiếng Anh: http://download.openoffice.org/680/index.html.
- Phiên bản tiếng Việt: http://vi.openoffice.org/about-downloads.html.

Tiến hành biên dịch
Khi khởi động OmegaT bạn sẽ thấy 2 cửa sổ. Mỗi cửa sổ đều có thể điều chỉnh được kích thước bằng chuột. Cửa sổ bên trái là nơi để bạn dịch văn bản. Cửa sổ bên phải, phần trên là nơi hiển thị các cặp từ (gốc và mục tiêu) khớp nhau trong bộ nhớ TM. Phần dưới cửa sổ bên phải là nơi hiển thị các các cặp từ (gốc và mục tiêu) khớp nhau trong bộ nhớ glossary.
Đầu tiên, bạn phải khởi tạo một dự án dịch (Translation project), là một công việc biên dịch theo cách gọi của OmegaT: bạn hãy bấm chuột vào Project > New, xong chọn thư mục để lưu lại các tập tin (tốt nhất cứ chấp nhận đề xuất của OmegaT). Chuyển con trỏ đến thư mục mà bạn muốn lưu các tập tin của dự án dịch và gõ tên mà bạn đặt cho dự án. Cái tên này sẽ được dùng cho thư mục chính của dự án, các tập tin của dự án sẽ được lưu trong thư mục này hoặc các thư mục con của nó. OmegaT sẽ nhắc bạn xác nhận hoặc thay đổi các thư mục dự án sẽ được tạo ra bằng một hộp thoại.
Khi bạn bấm OK để chấp nhận cách bố trí dự án, thì OmegaT sẽ nhắc bạn chọn văn bản cần dịch (Source document) để nhập. Bạn cần phải kiểm tra xem các mã ngôn ngữ có đúng không, chẳng hạn khi cần dịch từ tiếng Anh (kiểu Mỹ) sang tiếng Việt, thì Source Files Language phải ghi mã EN-US, còn Translated Files Language phải ghi mã VI.
Bấm Enter để bắt đầu dịch. Trong cửa sổ Editor, bạn sẽ thấy OmegaT trình bày băn bản gốc thành từng phân mảnh (segment), bạn sẽ dịch từng phân mảnh này. Mỗi khi dịch xong một phân mảnh, bạn lại bấm Enter. Muốn quay về phân mảnh trước, bấm Ctrl+P.
Trong quá trình dịch, bản dịch của bạn sẽ được lưu vào trong bộ nhớ TM. Sau khi bạn dịch xong các phân mảnh (hoặc muốn dừng trước đó), chọn Project > Create Translated Documents từ thực đơn, OmegaT sẽ tạo ra kết xuất (gồm những phần đã dịch xong và cả phần chưa dịch của văn bản gốc) và lưu trong thư mục Mục tiêu (Target folder).

Nhận xét:
Trình OmegaT có các ưu điểm sau:
- Thao tác gọn và nhanh: việc di chuyển từ một phân mảnh này sang phân mảnh kế tiếp diễn ra gần như tức thời. Một khi bạn đã biết bấm Enter để chuyển sang phân mảnh kế tiếp và Ctrl+P để quay lại phân mảnh trước, thì cứ thế mà dịch.
- Không phụ thuộc nền tảng nào: OmegaT có thể chạy trên bất kỳ platform nào, nhưng yêu cầu máy tính của bạn phải có cài đặt Java J2RE. Điều này đã được giải quyết do hiện nay các phiên bản OmegaT được cung cấp với Java J2RE cài sẵn, bạn chỉ còn có việc cài đặt OpenOffice.org nữa là đủ.
- Chức năng tìm kiếm: OmegaT cho phép tìm kiếm với các wildcard như dấu sao (*) và dấu hỏi (?). Bạn có thể tìm kiếm trong bộ nhớ TM.
Tuy nhiên, OmegaT chưa phải là một trình CAT hoàn chỉnh, nó vẫn còn một số nhược điểm cần khắc phục như:
- Màn hình hiển thị các phân mảnh không được đẹp mắt, font chữ nhỏ khó đọc. Chỉ có phần Source segment được tô màu xanh, còn Target segment không có màu (lẽ ra nên tô màu vàng để dễ phân biệt).
- Chức năng glossary chưa được thuận tiện.
Dù sao, đây vẫn có thể là một trợ thủ đắc lực cho những người làm công việc biên dịch chuyên nghiệp. Nếu từ trước đến nay bạn chưa từng sử dụng một trình CAT nào cả, thì cũng nên dùng thử OmegaT, vì còn gì hấp dẫn hơn miễn phí?
NGÔ ĐỨC QUANG quangaduc@gmail.com

Bài đăng phổ biến từ blog này

Bit.ly: vừa upload file vừa rút gọn link

TTO - Không chỉ "ăn đứt" TinyURL.com nhờ khả năng quản lý tất cả link rút gọn và thống kê số lượt truy cập link, Bit.ly đi trước TinyURL.com một bước khi kết nối với dịch vụ yfrog.com, cho phép người dùng upload file jpg, png, gif, bmp, tiff, swf, flv, pdf, mp4, mov, avi. Đương nhiên, sau khi upload file thành công, link sẽ được Bit.ly tự động rút gọn. Đáng tiếc là dung lượng file hỗ trợ upload hơi bị hạn chế. Theo thử nghiệm, nếu upload file lớn hơn 10MB thường bị đứt gánh giữa chừng. Bạn nên đăng ký một tài khoản miễn phí tại http://bit.ly/ để có thể khai thác hết tính năng mà Bit.ly hỗ trợ, bằng cách nhấp vào liên kết Sign Up phía trên góc phải, điền thông tin cần thiết vào ba hộp Choose a Username (tên đăng nhập; bạn sẽ cung cấp trang nhà có địa chỉ http://tênđăng nhập.bit.ly), Enter Your Email Address (địa chỉ email), Choose a Password (mật khẩu đăng nhập), rồi bấm nút Sign Up ở cuối trang để hoàn tất đăng ký và đăng nhập dịch vụ.

Tiếp cận Microsoft Office Pro 2010

Sau Windows 7 RC, thần dân IT lại có dịp tiếp cận với “hàng khủng” khác của Microsoft: bộ Microsoft Office Pro Plus 2010 Technical Preview (MO10), phiên bản thử nghiệm đầu tiên của Microsoft Office Pro 2010. MO10 là phiên bản được Microsoft phân phối cho các đối tác thân cận thử nghiệm, tích hợp đầy đủ các thành phần cần thiết như: Word 2010, Excel 2010, PowerPoint 2010, Access 2010, InfoPath 2010, OneNote 2010, Outlook 2010, Publisher 2010, Project Professional 2010, SharePoint Designer 2010, Visio Professional 2010. MO10 có dung lượng 1,34GB, tương thích với Windows XP SP2/XP SP3/Vista/7, yêu cầu máy có bộ nhớ RAM và CPU tối thiểu lần lượt là 512MB, 1GHz.

[Hướng dẫn] Làm Portable với Thinstall

Thinstall sẽ biến những phần mềm phức tạp thành phần mềm chỉ có một file EXE duy nhất, có thể chạy ngay mà không cần cài đặt, giống như những phần mềm portable. Tuy nhiên về bản chất thì khác, những phần mềm này sẽ chạy với đầy đủ những thành phần cài đặt nhưng đã được Thinstall giả lập để tạo một môi trường ảo,không ảnh hưởng gì đến hệ điều hành thật sự trong máy. Hiện nay nhu cầu tạo và sử dụng các phần mềm portable (chạy trực tiếp không cần cài đặt) ngày càng tăng, nhờ có ưu điểm không gây ảnh hưởng đến hệ thống (không để lại rác sau khi sử dụng), có thể copy vào ổ đĩa flash USB để sử dụng mọi lúc, mọi nơi. Nhưng tạo ra được một bản portable cũng không phải là chuyện dễ dàng với nhiều người, kể cả những người có kinh nghiệm. Thinstall sẽ giúp thực hiện vấn đề này theo một cách khác đơn giản hơn bằng cách làm cho các chương trình chạy trong một môi trường ảo dành riêng cho nó, hay nói một cách khác là tạo ra những phần mềm ảo (virtual). Những phần mềm ảo này sẽ có các đặc điểm như: t