AI dịch thuật của startup Việt tốt hơn cả Google, ChatGPT (St). Fr: Minh Đỗ Texas

34 views
Skip to first unread message

Mikali Nguyễn

unread,
Jan 18, 2025, 4:44:27 PMJan 18
to Giaitri & Kienthuc (EG)
AI dịch thuật của startup Việt tốt hơn cả Google, ChatGPT

Doctranslate.io có thể dịch được hình ảnh, âm thanh, video và hiểu sâu sắc tiếng Việt, nhờ đó kết quả benchmark cũng vượt trội so với ChatGPT, Google Translate.

Doctranslate.io là nền tảng dịch thuật bằng AI (trí tuệ nhân tạo), được sáng lập bởi tiến sĩ Trần Vũ Anh. Startup ra đời năm 2023, được Google chọn tham gia chương trình Google Accelerator for Startups 2024. Mới đây, Doctranslate.io tiếp tục nằm trong top 5 startup tiềm năng nhất tại Ngày hội Khởi nghiệp đổi mới sáng tạo Quốc gia (TECHFEST 2024).

AI dịch tối ưu hơn Google, ChatGPT

Sau nhiều năm sinh sống và làm việc ở nước ngoài, Vũ Anh nhận thấy ngôn ngữ là rào cản lớn để mang tri thức đến gần hơn với người Việt. Trong khi các mô hình ngôn ngữ lớn như Google dịch thuật, ChatGPT làm rất tốt công việc phiên dịch trong giao tiếp, hội thoại, Vũ Anh nhận ra còn một "thị trường ngách" nhiều dư địa mà các ông lớn chưa "với tay" đến là dịch thuật văn bản.

"Nếu bạn có một file tài liệu, bài nghiên cứu khoa học dài 20 trang, bạn có thể đưa vào cho ChatGPT dịch. Nhưng chatbot sẽ chỉ trả về các bản dịch dưới dạng chữ viết. Những phần rất quan trọng như biểu đồ, hình ảnh, bảng dữ liệu… gần như bị mất tất cả định dạng. Nếu phải ngồi sắp xếp, thiết kế lại các bảng biểu đó sẽ vô cùng mất thời gian, công sức, thậm chí có thể xảy ra sai sót. Các mô hình ngôn ngữ lớn của Google, OpenAI dù mạnh nhưng vẫn chưa xử lý được triệt để vấn đề. Đó là lý do Doctranslate.io ra đời, tập trung vào việc dịch văn bản, hình ảnh, âm thanh, video", Vũ Anh nói.

image.png

 File hình ảnh gốc (trái) và file dịch thuật của Doctranslate.io

Điểm đặc biệt của nền tảng là người dùng có thể đưa đầu vào là một file văn bản, nhiều định dạng với biểu đồ, hình ảnh. Sau đó AI không chỉ dịch các đoạn văn mà còn dịch cả hình ảnh, giữ nguyên định dạng gốc, giúp người dùng có thể so sánh trực tiếp và dùng ngay, không tốn thêm thời gian để thiết kế lại. Với một file hình ảnh nhiều nội dung, Doctranslate.io thậm chí còn cho phép xuất ra file PowerPoint để người dùng tùy chỉnh từng chi tiết và dùng vào nhiều mục đích khác nhau.

Trong nghiên cứu khoa học được công bố tại hội nghị IEEE-RIVF (International Conference on Computing and Communication Technologies) và IEEE - tổ chức kỹ thuật chuyên nghiệp lớn nhất thế giới), mô hình ALMA-Gemma-7B-IT-ST của Doctranslate.io đã cho điểm vượt trội so với Google Translate, GPT-3.5-Turbo của OpenAI… trong bài kiểm tra dịch thuật từ tiếng Anh sang tiếng Việt.

Cụ thể, trong khi GPT-3.5 Turbo lần lượt được 39,3 điểm và 34,1 điểm cho bài dịch Anh - Việt và ngược lại Việt - Anh, AI của Doctranslate.io vượt trội với 56,21 điểm và 57,32 điểm. Còn Google Translate được 39,86 điểm và 35,76 điểm.

Công thức riêng của startup Việt

Ngoài việc cung cấp những sản phẩm ngách mà các mô hình AI lớn chưa đánh chiếm, một trong những lý do khiến Doctranslate.io vượt trội so với ChatGPT, Google Translate là khả năng hiểu tiếng Việt sâu sắc.

Theo Vũ Anh, tiếng Việt có nhiều đặc trưng so với tiếng Anh và những ngôn ngữ khác. Nếu không nắm rõ, sẽ không thể cải thiện được khả năng dịch thuật của AI. Một trong những ví dụ đơn giản nhất là ngôi thứ. "Chúng ta có rất nhiều danh từ, đại từ nhân xưng để chỉ mối quan hệ và cả sắc thái trong từng ngữ cảnh khác nhau. Ví dụ khi dịch truyện, nói 'ông Chí Phèo' và 'thằng Chí Phèo' là khác nhau rất nhiều. Đây là điều các mô hình AI lớn, nếu không hiểu biết sâu sắc tiếng Việt và không tinh chỉnh sẽ không thể cải thiện được độ chính xác", người sáng lập Doctranslate.io nói.

image.png
 Giao diện nền tảng dịch thuật Doctranslate.io
Reply all
Reply to author
Forward
0 new messages