Mới đây, chia sẻ trên trang Facebook cá nhân, Mark Zuckerberg cho biết, Công ty vừa phát hành SeamlessM4T, một mô hình AI đa phương thức mới cho phép mọi người trên thế giới giao tiếp hiệu quả hơn.
“SeamlessM4T có khả năng chuyển giọng nói thành văn bản, chuyển văn bản thành giọng nói, chuyển giọng nói thành giọng nói, dịch văn bản thành văn bản và nhận dạng giọng nói gần 100 ngôn ngữ. Theo thời gian, chúng tôi sẽ tích hợp những tiến bộ AI này trong dịch thuật và phiên âm vào Facebook, Instagram, WhatsApp, Messenger và Threads”, ông chia sẻ.
Vào tháng 7/2022, công ty đã triển khai dự án No Language Left Behind, sử dụng AI để dịch văn bản cho 200 ngôn ngữ với trọng tâm cải thiện bản dịch cho các ngôn ngữ hiếm hoặc ít được sử dụng. Giống như nhiều công ty công nghệ lớn, Meta đã tăng cường tập trung phát triển AI trong năm nay.
Trước đó, Microsoft đã phát hành công cụ tìm kiếm Bing được tích hợp AI mới, sử dụng cùng một công nghệ như ChatGPT của OpenAI. Tương tự, Amazon cho biết họ sẽ sử dụng AI tổng quát để phân tích và tóm tắt các đánh giá của khách hàng, trong khi Google thử nghiệm tạo ra trải nghiệm tìm kiếm mới lạ.
AI gần như đã được áp dụng trong nhiều lĩnh vực, tuy nhiên, sự gia tăng của AI cũng làm dấy lên mối lo ngại về những tác động tiềm tàng đối với xã hội .
Đối với mô hình SeamlessM4T, các nhà nghiên cứu của Meta cho biết họ đã thu thập dữ liệu đào tạo âm thanh từ 4 triệu giờ "âm thanh thô của kho lưu trữ dữ liệu web có sẵn công khai ". Họ không nói rõ là kho lưu trữ nào. Người phát ngôn của Meta không trả lời các câu hỏi về nguồn gốc của dữ liệu âm thanh. Dữ liệu văn bản đến từ các bộ dữ liệu được tạo ra vào năm ngoái, lấy nội dung từ Wikipedia và các trang web liên kết, theo tài liệu nghiên cứu.