Trí tuệ như tạo là một trong bốn trụ cột quan trọng của cuộc cách mạng công nghiệp lần thứ tư. Nó được hiểu một cách đơn giản là cố gắng làm cho máy móc có được năng lực trí tuệ như con người.
Đây thực sự là một thách thức lớn đối với nền khoa học kỹ thuật của nhân loại, cần phải có một quá trình nghiên cứu và phát triển lâu dài mới có thể đạt được.
Viettel là một trong những “ông lớn” ở Việt Nam đi đầu trong lĩnh vực trí tuệ nhân tạo. Và sản phẩm tiêu biểu nhất của tập đoàn Viettel trong lĩnh vực này là Viettel AI Open Platform.
Viettel AI Open Platform cung cấp cho chúng ta tất cả bốn công nghệ và ba giải pháp, cho phép xử lý tốt ngôn ngữ tiếng Việt.
Mục Lục Nội Dung
I. Công nghệ của Viettel AI Open Platform
Như mình vừa chia sẻ bên trên, Viettel AI Open Platform cung cấp cho chúng ta bốn công nghệ xử lý tiếng Việt, cụ thể là chuyển văn bản thành giọng nói, chuyển giọng nói (audio) thành văn bản, trích xuất các kí tự trong hình ảnh thành văn bản và xử lí ngôn ngữ tự nhiên.
Bạn có thể trải nghiệm các công nghệ này bằng cách truy cập vào trang chủ của Viettel AI Open Platform => sau đó đăng kí một tài khoản để sử dụng.
#1. Tổng hợp các giọng nói (chuyển văn bản thành audio)
Công nghệ này tổng hợp các giọng nói giúp chúng ta dễ dàng chuyển đổi văn bản thành giọng đọc một cách nhanh chóng, chính xác và chuyên nghiệp…
Đơn giản bởi vì công nghệ này đã ứng dụng nhiều công nghệ tiên tiến về xử lý ngôn ngữ tự nhiên, xử lý tiếng nói, giọng đọc, học sâu, … nên sản phẩm đầu ra có chất lượng giọng đọc khá là tự nhiên.
Tính đến thời điểm hiện tại Viettel AI Open Platform cung cấp cho người dùng chúng ta 11 giọng đọc tất cả. Giọng đọc không chỉ tự nhiên mà còn rất phong phú và đa dạng về giới tính, cũng như vùng miền..
#2. Công nghệ nhận dạng tiếng nói (chuyển giọng nói thành văn bản)
Công nghệ nhận dạng tiếng nói là một công nghệ “ngược” với công nghệ tổng hợp tiếng nói. Công nghệ này tự động chuyển đổi giọng nói thành văn bản với độ chính xác cao về mặt chính tả cũng như ngữ pháp.
Bạn có thể chuyển giọng nói sang dạng chữ bằng cách ghi âm trực tiếp trên hệ thống, hoặc bạn cũng có thể Upload một tệp tin âm thanh (định dạng *.mp3) có sẵn trên máy tính để nó chuyển sang dạng text.
Không những được ứng dụng trong những công việc có tính chuyên môn cao, công nghệ này còn được ứng dụng trong những công việc thường nhật, chẳng hạn như trong soạn thảo văn bản bằng giọng nói chẳng hạn.
Bạn chỉ việc trang bị một chiếc Microphone có chất lượng thu âm tốt => sao đó nói => lúc này chương trình sẽ thực hiện chuyển giọng nói sang dạng text => sao chép => và dán vào Microsoft Word là xong, điều này giúp bạn tiết kiệm được nhiều thời gian và công sức để làm việc..
#3. Nhận dạng kí tự quang học
Công nghệ nhận dạng kí tự quang học cho phép trích xuất các ký tự từ hình ảnh hoặc từ các tệp tin văn bản có định dạng *.pdf
Công nghệ này hỗ trợ nhiều định dạng hình ảnh khác nhau như *.jpg, *.bmp, *.png, … đồng thời xuất ra nhiều kết quả trong cùng một thời điểm.
Công nghệ này hiện còn đang trong giai đoạn nghiên cứu và phát triển nên chúng ta tạm thời chưa thể trải nghiệm nó
#4. Xử lí ngôn ngữ tự nhiên
Từ việc nghiên cứu nhiều lĩnh vực khác nhau như khoa học máy tính, ngôn ngữ học tính toán, … Công nghệ xử lí ngôn ngữ tự nhiên đã thực hiện rất tốt các công việc như tách từ, phân loại từ loại, nhận dạng các thực thể và sửa lỗi chính tả:
- Tách từ là xác định ranh giới của các từ trong câu.
- Phân loại từ loại là phân tích từ xem từ đó là danh từ, động từ, tính từ, …
- Nhận dạng tên thực thể là xác định và phân loại các nội dung trong văn bản vào từng loại cụ thể như tổ chức, tên người, địa điểm, …
- Sửa lỗi chính tả
Nếu bạn là phụ huynh của một học sinh hay là bạn một giáo viên tiểu học thì công nghệ này sẽ rất hữu ích với bạn đấy. Đặc biệt là ở tính năng phân loại từ loại và sửa lỗi chính tả.
II. Giải pháp
Ba giải pháp tiêu biểu mà Viettel AI Open Platform cung cấp là Cyberbot, Reputa và Voice Note.
Hiện tại thì bạn chỉ có thể trải nghiệm giải pháp Reptuta, còn giải pháp Cyberbot và Voice vẫn còn đang trong quá trình nghiên cứu và phát triển. Hy vọng trong một thời gian không xa chúng ta có thể trải nghiệm hết các giải pháp này.
III. Lời kết
Trong bốn công nghệ xử lý tiếng Việt mà Viettel AI Open Platform cung cấp thì mình thích nhất là công nghệ chuyển văn bản sang giọng đọc và chuyển giọng đọc sang dạng văn bản.
Mình đã test thử rất nhiều và kết quả cho ra đều rất tốt. Với công nghệ thứ nhất thì giọng đọc rất tự nhiên, còn với công nghệ thứ hai thì khả năng nhận dạng tiếng nói cũng khá chính xác
Hai công nghệ này đã được phát triển hoàn thiện và hiện đang được cung cấp với các mức giá cho gói Small lần lượt là 3.200.000 VND và 12.000.000 VND cho 30 ngày sử dụng.
Những công nghệ như thế này sẽ rất hữu ích trong tương lai, bạn có thể để ý mấy trang báo lớn đều đang sử dụng giải pháp audio cho các bài báo, để những người dùng lười đọc có thể nghe audio.
Okay, hi vọng là bà viết này sẽ hữu ích với bạn. Xin chào tạm biệt và hẹn gặp lại các bạn trong những bài viết tiếp theo !
CTV: Nhựt Nguyễn – Blogchiasekienthuc.com