Vui lòng điền đầy đủ các thông tin sau

 

Generative Artificial Intelligence (GenAI - AI tạo sinh), đang được ứng dụng trong nhiều lĩnh vực, bởi khả năng tạo ra những nội dung có tính sáng tạo và phù hợp với ngữ cảnh, giống như được tạo bởi con người. Tuy còn bất cập về các vấn đề sở hữu trí tuệ, quyền riêng tư, thông tin sai lệch cần phải kiểm chứng lại, nhưng GenAI được dự đoán sẽ trở thành xu hướng tất yếu thu hút sự đầu tư từ các doanh nghiệp công nghệ, nhằm hỗ trợ hoạt động vận hành và phát triển sản phẩm-dịch vụ.

Theo định nghĩa từ Tổ chức Hợp tác và Phát triển Kinh tế (OECD), GenAI là “một công nghệ có thể tạo nội dung, bao gồm văn bản, hình ảnh, âm thanh hoặc video, khi được người dùng nhắc nhở”. Trong đó, “lời nhắc” ở đây tương ứng với các hướng dẫn bằng văn bản, thường do người dùng tạo ra, tùy chọn kết hợp với một số dữ liệu nhất định. Còn theo quan điểm của người dùng nói chung, không giống như các mô hình học máy “có giám sát” truyền thống đòi hỏi một lượng lớn dữ liệu đào tạo có chú thích cụ thể cho từng tác vụ, các mô hình này có thể tạo ra nội dung mới chỉ bằng cách viết “lời nhắc”. Việc sử dụng các công cụ GenAI dựa trên các mô hình này không yêu cầu kỹ năng kỹ thuật, do đó AI dễ dàng tiếp cận trực tiếp đến công chúng.

 

GenAI – thế hệ tiếp theo của AI

Trong giai đoạn đầu, các thuật toán và phần mềm AI được phát triển dựa trên quy tắc logic và tham số do các lập trình viên chỉ định, do đó, chúng chỉ hiểu một danh sách hạn chế các câu hỏi, chưa thể áp dụng “kiến thức” của mình vào các vấn đề mới hoặc giải quyết sự không chắc chắn. Đến đầu thế kỷ 21, với sức mạnh tính toán, nguồn dữ liệu lớn, cùng với thuật toán học máy tốt hơn, đã tạo ra bước đột phá trong sự phát triển của AI. Các mô hình AI hiện đại được cung cấp dữ liệu huấn luyện đầu vào và kết quả mong muốn đầu ra, cho phép chúng xây dựng các mô hình hoặc chương trình có thể áp dụng cho dữ liệu hoàn toàn mới.

Một phương pháp tiếp cận mạnh mẽ trong học máy được gọi là học sâu. Nó sử dụng các cấu trúc phức tạp được gọi là mạng nơ-ron nhân tạo, mô phỏng theo bộ não con người. AI được hỗ trợ bởi học sâu đã đạt được những tiến bộ đáng kể, đặc biệt là trong các lĩnh vực như nhận dạng hình ảnh và giọng nói. Tuy nhiên, độ chính xác của kết quả dù rất ấn tượng, nhưng quá trình ra quyết định vẫn chưa rõ ràng. Mặt khác, với khả năng học các mẫu dữ liệu phức tạp và mở rộng chúng, học sâu dường như rất phù hợp để tạo dữ liệu, cũng như mô hình hóa các loại dữ liệu khác nhau. Qua đó, các mô hình GenAI đã được nghiên cứu và phát triển, nổi bật nhất là công cụ ChatGPT (Chat Generative Pre-trained Transformer) do OpenAI giới thiệu lần đầu tiên đến công chúng vào tháng 11/2022, đã thu hút hơn một triệu người đăng ký sử dụng chỉ trong năm ngày. So với các ứng dụng AI dựa trên quy tắc cũ chỉ có thể thực hiện một tác vụ duy nhất, các mô hình GenAI hiện đại được đào tạo trên dữ liệu từ nhiều lĩnh vực khác nhau và không có bất kỳ hạn chế nào về tác vụ.

Trong những năm gần đây, học sâu đã cho phép phát triển nhiều loại mô hình GenAI khác nhau. Những mô hình thường được sử dụng nhất là:

  • Mạng đối nghịch tạo sinh (generative adversarial networks - GANs): bao gồm bộ tạo hình ảnh đầu ra và bộ phân biệt để đánh giá mức độ chân thực của hình ảnh của bộ tạo hình ảnh. Bộ tạo hình ảnh cố gắng cải thiện sản phẩm đầu ra của mình để đánh lừa bộ phân biệt và bộ phân biệt cố gắng cải thiện khả năng phân biệt hình ảnh thực với hình ảnh được tạo ra để tránh bị bộ tạo đánh lừa, do đó bộ tạo sẽ tối đa hóa khả năng tạo ra hình ảnh chân thực của mình. GANs được sử dụng cho nhiều tác vụ liên quan đến hình ảnh như tạo và tăng cường hình ảnh siêu thực.
  • Mô hình ngôn ngữ lớn dựa trên bộ giải mã (large language models - LLMs): là cơ sở của các hệ thống chatbot như ChatGPT. Các mô hình này được đào tạo trên các tập dữ liệu lớn để tìm hiểu các mẫu và cấu trúc trong dữ liệu, cho phép chúng tạo ra nội dung mới mạch lạc và phù hợp với ngữ cảnh.
  • Bộ mã hóa tự động biến thiên (variational autoencoders - VAE): dựa trên ba phần: bộ mã hóa, mã và bộ giải mã. Bộ mã hóa là một mạng nơ-ron học cách mã hóa và nén dữ liệu đầu vào thành một biểu diễn trung gian, mã về cơ bản là một chuỗi số. Mã sau đó được bộ giải mã (một mạng nơ-ron khác) sử dụng, học cách giải nén và tái cấu trúc dữ liệu thành định dạng đầu vào mong đợi. VAE được sử dụng để tạo các mẫu hình ảnh phức tạp và đa dạng.
  • Mô hình khuếch tán (diffusion model): được sử dụng để tạo ảnh liên quan đến mạng nơ-ron nhằm dự đoán và loại bỏ nhiễu trong một ảnh nhiễu nhất định. Đầu tiên, áp dụng nhiễu ngẫu nhiên cho một ảnh, sau đó lặp lại bằng mạng nơ-ron để loại bỏ nhiễu, khi nhiễu được loại bỏ dần, một hình ảnh mới và có ý nghĩa sẽ được xây dựng. Các mô hình khuếch tán hiện rất thành công đối với việc chuyển các văn bản thành ảnh.

Hình ảnh được tạo bởi GenAI từ câu “một con mèo đang đọc bằng sáng chế” qua 30 bước (Nguồn: WIPO)

 

Xu hướng nghiên cứu và những ứng dụng tiềm năng của GenAI trong các lĩnh vực

Hiện tại, GenAI vẫn là một phần tương đối nhỏ trong tất cả các hoạt động nghiên cứu AI. Theo Patent Landscape Report: Generative Artificial Intelligence xuất bản năm 2024 của WIPO, trong khoảng 230.000 ấn phẩm về họ sáng chế AI nói chung, chỉ có 14.080 ấn phẩm về họ sáng chế GenAI. Tuy nhiên, đã có một sự tăng trưởng lớn trong hoạt động cấp bằng sáng chế liên quan đến GenAI bắt đầu từ năm 2017, với mức tăng trưởng trung bình hàng năm khoảng 45%.

Sự phát triển của các họ sáng chế và các ấn phẩm khoa học liên quan đến GenAI trên toàn cầu trong giai đoạn 2014-2023
(Nguồn: Patent Landscape Report: Generative Artificial Intelligence (WIPO, 2024))

Năm 2017 cũng là năm ra đời mô hình Transformer Neural Network, được các nhà khoa học của Google giới thiệu qua bài báo “Attention Is All You Need” ở Hội nghị lần thứ 31 về Hệ thống xử lý thông tin thần kinh, được tổ chức tại Mỹ vào tháng 12/2017, một mô hình học sâu được thiết kế để phục vụ giải quyết các bài toán trong lĩnh vực xử lý ngôn ngữ tự nhiên và thị giác máy tính. Bên cạnh các sáng chế, thống kê từ các ấn phẩm khoa học liên quan đến GenAI được công bố còn có mức tăng trưởng mạnh hơn, khi với chỉ khoảng 100 vào năm 2014, đã tăng vọt lên hơn 34.000 vào năm 2023. Đặc biệt, việc giới thiệu các mô hình và công cụ GenAI đến công chúng vào năm 2022 (như: ChatGPT, Stable Diffusion, LlaMA,...) có thể đã tạo nên một làn sóng nghiên cứu mới, thúc đẩy sự gia tăng mạnh mẽ các ấn bản khoa học trong năm 2023.

Các mô hình GenAI rất hiệu quả cho nhiều ứng dụng, đến mức chúng có thể thách thức đến sự sáng tạo của con người. Một số mô hình GenAI hỗ trợ nhiều loại dữ liệu đầu vào và đầu ra khác nhau như: Hình ảnh, video (CLIP do OpenAI phát triển năm 2021, Flamingo do DeepMind phát triển năm 2022); Văn bản (từ GPT do OpenAI phát triển từ năm 2018, đến đến ChatGPT được công bố đến công chúng vào năm 2022); Lời nói, âm thanh, âm nhạc (WaveNet do DeepMind phát triển năm 2016; MusicML do Google phát triển năm 2023), Code (Copilot do GitHub và OpenAI hợp tác phát triển, dựa trên phiên bản đã sửa đổi của GPT-3); Phân tử, gen, protein (Alpha Fold 2 do Deepmind phát triển năm 2021 nhằm tạo ra các cấu trúc protein đáng tin cậy một cách tự động); Mô hình hình ảnh 3D (Neural Radiance Field – NeRF được một nhóm các nhà khoa học giới thiệu năm 2020, cho khả năng tái tạo cảnh 3D từ tập hợp dữ liệu ảnh 2D và được ứng dụng trong bản đồ, hình ảnh y tế, robotics, tái tạo bề mặt từ hình ảnh vệ tinh, tạo nội dung chân thực trong thiết kế sản phẩm).

Google Immersive View sử dụng NeRF để chuyển đổi hình ảnh đường phố 2D thành hình ảnh 3D cho một số thành phố nhất định trên Google Maps từ tháng 6/2023
(Nguồn: App Google Maps)

GenAI được dự báo sẽ có tác động to lớn đến nhiều ngành công nghiệp khi nó được ứng dụng vào các sản phẩm, dịch vụ và quy trình, trở thành công nghệ hỗ trợ cho việc sáng tạo nội dung và cải thiện năng suất. Báo cáo toàn cảnh công nghệ GenAI của WIPO cũng đã xác định 21 ứng dụng mà các hoạt động nghiên cứu GenAI đang tập trung vào, bao gồm: (1) Phần mềm/Ứng dụng khác; (2) Khoa học sự sống; (3) Quản lý và xuất bản tài liệu; (4) Giải pháp kinh doanh; (5) Công nghiệp và sản xuất; (6) Giao thông vận tải; (7) An ninh; (8) Viễn thông; (9) Thiết bị cá nhân; (10) Ngân hàng và tài chính; (11) Khoa học vật lý và kỹ thuật; (12) Giáo dục; (13) Giải trí; (14) Nghệ thuật và nhân văn; (15) Máy tính trong Chính phủ; (16) Mạng/Thành phố thông minh; (17) Sở hữu công nghiệp, luật, khoa học xã hội và hành vi; (18) Bản đồ học; (19) Quân sự; (20) Quản lý năng lượng; (21) Nông nghiệp.

Số lượng sáng chế và mức tăng trưởng trung bình hàng năm của các họ sáng chế GenAI theo lĩnh vực ứng dụng
(Nguồn: Patent Landscape Report: Generative Artificial Intelligence (WIPO, 2024))

Lĩnh vực ứng dụng GenAI lớn nhất là Phần mềm. Tuy nhiên, nhóm này bao gồm cả một số lượng lớn họ sáng chế không được chỉ định cho một ứng dụng cụ thể. Đứng thứ hai là Khoa học sự sống; Quản lý và xuất bản tài liệu đứng ở vị trí thứ ba. Các lĩnh vực ứng dụng khác xếp hạng tiếp theo dao động từ khoảng 2.000 đến gần 5.000 sáng chế là: các Giải pháp kinh doanh, Công nghiệp và sản xuất, Giao thông vận tải, An ninh Viễn thông.

Bên cạnh đó, có thể thấy hầu hết các lĩnh vực ứng dụng đều có mức tăng trưởng dương từ năm 2018, với tốc độ tăng trưởng rất cao, cả trong các lĩnh vực có ít sáng chế như: Nông nghiệp, Quản lý năng lượng và các lĩnh vực có lượng sáng chế lớn như Khoa học sự sống, An ninh và Khoa học vật lý/kỹ thuật. Ngược lại, số lượng các sáng chế bị sụt giảm trong một số lĩnh vực như: Sở hữu công nghiệp/luật/khoa học xã hội và hành vi, Nghệ thuật và nhân văn, Quân sự hoặc Viễn thông.

 

Nghiên cứu và ứng dụng GenAI tại Việt Nam

Kể từ khi OpenAI ra mắt ChatGPT vào tháng 11/2022, cuộc đua nghiên cứu và phát triển GenAI nhanh chóng bùng nổ với sự tham gia của nhiều tập đoàn lớn trên thế giới. Đầu tư vào GenAI của các doanh nghiệp tư nhân cũng ghi nhận đạt mức 25,23 tỷ USD trong năm 2023, tăng gấp 9 lần so với năm 2022. Còn tại Việt Nam, mặc dù chưa ghi nhận đề tài nghiên cứu khoa học đề cập đến GenAI, nhưng đã có nhiều kết quả nghiên cứu, phát triển và ứng dụng GenAI từ các doanh nghiệp lớn, có thể kể đến một số ứng dụng như:

  • ViGPT được VinBigdata giới thiệu vào ngày 27/12/2023, mô hình ChatGPT phiên bản Việt dành cho người dùng cuối và doanh nghiệp, tích hợp trong nền tảng trí tuệ nhân tạo đa nhận thức VinBase 2.0, tập trung vào một số nội dung như pháp luật, lịch sử, văn hóa, danh nhân, danh lam thắng cảnh, đặc trưng vùng miền,… Doanh nghiệp có thể đăng ký sử dụng phiên bản trải nghiệm giới hạn của ViGPT bằng tiếng Việt trên giao diện website https://vigpt.vinbigdata.com/.
  • FPT.AI được phát triển bởi Công ty FPT Smart Cloud (thành viên tập đoàn FPT), bao gồm 5 nhóm giải pháp chủ lực: (1) Hội thoại AI (FPT AI Chat); (2) Quản lý Trung tâm chăm sóc khách hàng tự động (FPT AI Engage, FPT AI Enhance); (3) Xử lý tài liệu thông minh (FPT AI Read); (4) Định danh khách hàng điện tử (FPT AI eKYC); (5) Quản lý và nâng cao chất lượng nguồn nhân lực (FPT AI Mentor, FPT AI Agents). Trong khuôn khổ chương trình Thách thức đổi mới sáng tạo Việt Nam 2024, vượt qua 750 giải pháp đến từ 20 quốc gia, FPT.AI đã đạt được danh hiệu “Giải thưởng nền tảng AI vì tương lai doanh nghiệp số”, thuộc hạng mục Giải pháp trí tuệ nhân tạo tiêu biểu xuất sắc.
  • VNPT GenAI được Tập đoàn VNPT phát triển, bao gồm: nền tảng AI định danh và xác thực điện tử VNPT eKYC, nền tảng AI xử lý hình ảnh VNPT SmartVision, nền tảng AI phân tích hành vi cá nhân hóa trải nghiệm. VNPT GenAI không chỉ giúp rút ngắn thời gian khởi tạo trợ lý AI, mà còn cung cấp các câu trả lời tự nhiên, chính xác và tiết kiệm thời gian cho người dùng. Tháng 6/2024, VNPT đã vượt qua hơn 400 đội thi trên thế giới để giành giải nhất tại AI City Challenge – diễn ra trong khuôn khổ Hội nghị thường niên hàng đầu thế giới về Thị giác máy tính và Nhận dạng mẫu CVPR (Computer Vision and Pattern Recognition), được tổ chức tại Mỹ vào tháng 6/2024.
  • ViePro được ngân hàng VIB ra mắt vào cuối tháng 12/2024, là trợ lý ảo tích hợp công nghệ GenAI, được xây dựng trên dịch vụ điện toán đám mây hàng đầu thế giới Amazon Web Services. ViePro hoạt động 24/7 trên nền tảng ngân hàng số MyVIB, phản hồi chính xác và tức thì bằng tiếng Việt với đa dạng chủ đề về sản phẩm dịch vụ của ngân hàng.

 

Một số thách thức khi ứng dụng GenAI

Tuy có nhiều tiềm năng ứng dụng tích cực, nhưng cũng có những lo ngại về việc sử dụng ngày càng nhiều các mô hình và công cụ GenAI sai mục đích, từ vi phạm bản quyền, phát tán tin giả, tạo hình ảnh, video lừa đảo, cho đến nguy cơ mất việc làm do AI tác động.

Tác động đến việc làm, GenAI vừa có thể thay thế một số nhiệm vụ liên quan đến tự động hóa mà con người đang đảm nhiệm, nhưng cũng có thể giúp nhiều ngành nghề phát triển tốt hơn thông qua các công cụ hỗ trợ. Tuy nhiên, không giống như các làn sóng ứng dụng công nghệ tự động hóa như trước đây, chủ yếu ảnh hưởng đến những người lao động có kỹ năng trung bình, rủi ro về sự thay thế của AI mở rộng sang một số vị trí được mang tính chuyên môn cao hơn như các nhà phân tích dữ liệu, nhân viên kế toán, nhân viên chăm sóc khách hàng, hoặc trợ lý pháp lý.

Bản quyền và sở hữu trí tuệ, các mô hình GenAI có thể tạo ra văn bản, hình ảnh và âm thanh rất giống với các ấn phẩm hiện có, vì vậy đã tạo nên những tranh luận về vấn đề vi phạm bản quyền. Các hành vi vi phạm xuất hiện ngày càng nhiều như: sao chép nội dung từ báo, đài, rồi sử dụng AI để chỉnh sửa, cắt ghép, đăng tải lại để kiếm tiền từ quảng cáo, bán sản phẩm; hay sử dụng AI để lấy video gốc rồi tạo ra các video cắt ghép, chỉnh sửa nhằm chống lại công cụ rà quét bản quyền của các nền tảng.

Trong lĩnh vực thông tin - truyền thông, mặc dù việc ứng dụng GenAI đã khiến việc tạo ra nội dung, tổng hợp thông tin, cũng như tiếp cận thông tin trở nên dễ dàng hơn, hơn nữa các công cụ GenAI còn có thể giúp người tiêu thụ nội dung trở thành người sản xuất nội dung. Tuy nhiên, các chuyên gia cho rằng cần phải có biện pháp kiểm soát chất lượng các nguồn thông tin nhằm đảm bảo tính tin cậy cho các thông tin được GenAI đưa ra. GenAI và AI nói chung chỉ tốt khi dữ liệu mà nó được đào tạo đảm bảo chất lượng, các sai lệch trong dữ liệu đào tạo sẽ dẫn đến sai lệch trong kết quả phản hồi.

Ngoài ra, công cụ GenAI cũng được sử dụng để thực hiện các cuộc gọi bằng công nghệ deepfake, tạo ra hình ảnh hoặc video giả mạo chèn hình ảnh của một người vào video khác nhằm mục đích lừa đảo hay tống tiền. Việc bùng nổ các cuộc gọi lừa đảo trực tuyến Deepfake đang là một mối đe dọa đối với sự trung thực và tin cậy của video và hình ảnh.

***

Mặc dù GenAI đã tạo nên một cuộc cách mạng về công nghệ, ứng dụng trong các lĩnh vực sản xuất, kinh doanh, tài chính, dịch vụ,…, nhưng cũng đặt ra nhiều thách thức khi có khả năng tác động đến việc làm của con người, vi phạm bản quyền, thông tin cung cấp chưa được xác thực hay cả việc sử dụng vào các mục đích xấu. Để giải quyết những thách thức đó, một số quốc gia như Trung Quốc, Mỹ và Liên minh Châu Âu đã ban hành các quy định về GenAI với mục đích khai thác lợi ích của GenAI, bảo vệ người tiêu dùng, ngăn chặn việc sử dụng sai mục đích và đảm bảo phát triển AI một cách có trách nhiệm.

Việt Nam, với những tiềm năng và đang trên đà phát triển các ứng dụng GenAI, Bộ Thông tin và Truyền thông cũng đã tiến hành xây dựng dự thảo Luật Công nghiệp công nghệ số, xác định các nguyên tắc quản lý và phát triển AI nhằm phát triển thế mạnh, lợi thế của AI, đồng thời hạn chế tác động bất lợi trong nghiên cứu, phát triển và ứng dụng công nghệ AI. Dự thảo Luật Công nghiệp công nghệ số hiện đang trong quá trình lấy ý kiến hoàn thiện, dự kiến sẽ trình Quốc hội xem xét biểu quyết thông qua tại Kỳ họp thứ 9 vào tháng 5/2025.

Duy Sang

----------------------------------------

Tài liệu tham khảo:

[1] Duy Tuấn. FPT.AI được vinh danh giải pháp trí tuệ nhân tạo xuất sắc. https://vnexpress.net/fpt-ai-duoc-vinh-danh-giai-phap-tri-tue-nhan-tao-xuat-sac-4799436.html
[2] Hồ Mạnh Tùng và các cộng sự. Ảnh hưởng của các sản phẩm trí tuệ nhân tạo tạo sinh lên ngành báo chí và truyền thông: hành vi và kinh tế báo chí. Tạp chí Thông tin và Truyền thông, 80-89.
[3] Hoàng Giang. Việt Nam trước cơ hội bứt phá từ AI tạo sinh. https://baochinhphu.vn/viet-nam-truoc-co-hoi-but-pha-tu-ai-tao-sinh-102240823184400494.htm
[4] Minh Huy. VinBigdata ra mắt ứng dụng ViGPT. Retrieved from VnExpress: https://vnexpress.net/vinbigdata-ra-mat-ung-dung-vigpt-4693202.html
[5] P.A.T. VNPT và hành trình phát triển AI tạo sinh từ thực tiễn https://www.vista.gov.vn/vi/news/khoa-hoc-ky-thuat-va-cong-nghe/vnpt-va-hanh-trinh-phat-trien-ai-tao-sinh-tu-thuc-tien-9824.html
[6] V.T.K. Ngân hàng Việt Nam tích hợp GenAI của AWS cho ngân hàng số: https://tuoitre.vn/ngan-hang-viet-nam-tich-hop-genai-cua-aws-cho-ngan-hang-so-20241210213733906.htm
[7] WIPO. Patent Landscape Report: Generative Artificial Intelligence. WIPO.

Back to top

Chưa có tài khoản Đăng ký ngay!

Đăng nhập