AI (Trí tuệ nhân tạo) sáng tạo

Thứ tư - 10/01/2024 19:38

Các hệ thống AI (Trí tuệ nhân tạo) mạnh mẽ như ChatGPT hoạt động như thế nào và điều gì khiến chúng khác biệt với các loại trí tuệ nhân tạo khác?
Thông tin trên các trang công nghệ cho thấy ngày nay có vẻ như trí tuệ nhân tạo tổng hợp có mặt ở khắp mọi nơi. Trên thực tế, một số tiêu đề đó thực sự có thể đã được viết bởi AI tổng hợp, như ChatGPT của OpenAI, một chatbot đã chứng tỏ khả năng kỳ lạ trong việc tạo ra văn bản dường như được viết bởi con người.

Nhưng mọi người thực sự có ý gì khi nói “AI sáng tạo”?
Trước thời kỳ bùng nổ AI trong vài năm qua, khi mọi người nói về AI, thông thường họ đang nói về các mô hình học máy có thể học cách đưa ra dự đoán dựa trên dữ liệu. Ví dụ, những mô hình như vậy được đào tạo, sử dụng hàng triệu ví dụ, để dự đoán liệu một bức ảnh X-quang nào đó có dấu hiệu của khối u hay không hoặc liệu một người đi vay cụ thể có khả năng vỡ nợ hay không.
AI sáng tạo có thể được coi là một mô hình học máy được đào tạo để tạo ra dữ liệu mới, thay vì đưa ra dự đoán về một tập dữ liệu cụ thể. Hệ thống AI tổng quát là hệ thống học cách tạo ra nhiều đối tượng trông giống với dữ liệu mà nó đã được đào tạo.
“Khi nói đến bộ máy thực tế làm nền tảng cho AI sáng tạo và các loại AI khác, sự khác biệt có thể hơi mờ nhạt. Thông thường, các thuật toán giống nhau có thể được sử dụng cho cả hai,” Phillip Isola, phó giáo sư kỹ thuật điện và khoa học máy tính tại MIT, đồng thời là thành viên của Phòng thí nghiệm Khoa học Máy tính và Trí tuệ Nhân tạo (CSAIL), cho biết.
Và bất chấp sự cường điệu đi kèm với việc phát hành ChatGPT và các đối tác của nó, bản thân công nghệ này không phải là thương hiệu mới. Những mô hình học máy mạnh mẽ này dựa trên những tiến bộ về nghiên cứu và tính toán trong hơn 50 năm qua.
Sự gia tăng độ phức tạp
Một ví dụ ban đầu về AI sáng tạo là một mô hình đơn giản hơn nhiều được gọi là chuỗi Markov. Kỹ thuật này được đặt theo tên của Andrey Markov, một nhà toán học người Nga vào năm 1906 đã giới thiệu phương pháp thống kê này để mô hình hóa hành vi của các quá trình ngẫu nhiên. Trong học máy, các mô hình Markov từ lâu đã được sử dụng cho các nhiệm vụ dự đoán từ tiếp theo, như chức năng tự động hoàn thành trong chương trình email.
Trong dự đoán văn bản, mô hình Markov tạo ra từ tiếp theo trong câu bằng cách xem từ trước đó hoặc một vài từ trước đó. Nhưng vì những mô hình đơn giản này chỉ có thể nhìn lại quá xa nên chúng không giỏi trong việc tạo ra văn bản hợp lý, Tommi Jaakkola, Giáo sư Kỹ thuật Điện và Khoa học Máy tính Thomas Siebel tại MIT, cũng là thành viên của CSAIL và Viện Nghiên cứu, cho biết. Dữ liệu, Hệ thống và Xã hội (IDSS).
Ông giải thích: “Chúng tôi đã tạo ra mọi thứ từ trước thập kỷ trước, nhưng điểm khác biệt chính ở đây là về độ phức tạp của các đối tượng mà chúng tôi có thể tạo ra và quy mô mà chúng tôi có thể đào tạo các mô hình này”.
Chỉ vài năm trước, các nhà nghiên cứu có xu hướng tập trung vào việc tìm kiếm một thuật toán học máy giúp tận dụng tốt nhất một tập dữ liệu cụ thể. Nhưng trọng tâm đó đã thay đổi một chút và nhiều nhà nghiên cứu hiện đang sử dụng các bộ dữ liệu lớn hơn, có thể với hàng trăm triệu hoặc thậm chí hàng tỷ điểm dữ liệu, để đào tạo các mô hình có thể đạt được kết quả ấn tượng.
Các mô hình cơ sở của ChatGPT và các hệ thống tương tự hoạt động theo cách tương tự như mô hình Markov. Nhưng có một điểm khác biệt lớn là ChatGPT lớn hơn và phức tạp hơn nhiều, với hàng tỷ tham số. Và nó đã được đào tạo dựa trên một lượng dữ liệu khổng lồ - trong trường hợp này là phần lớn văn bản có sẵn công khai trên internet.
Trong kho văn bản khổng lồ này, các từ và câu xuất hiện theo trình tự với sự phụ thuộc nhất định. Sự lặp lại này giúp mô hình hiểu cách cắt văn bản thành các khối thống kê có khả năng dự đoán được. Nó tìm hiểu các mẫu của các khối văn bản này và sử dụng kiến thức này để đề xuất điều gì có thể xảy ra tiếp theo.
Kiến trúc mạnh mẽ hơn
Trong khi các bộ dữ liệu lớn hơn là một chất xúc tác dẫn đến sự bùng nổ của AI, thì nhiều tiến bộ nghiên cứu lớn cũng dẫn đến các kiến trúc deep-learning phức tạp hơn.
Vào năm 2014, một kiến trúc máy học được gọi là mạng đối thủ tổng quát (GAN) đã được các nhà nghiên cứu tại Đại học Montreal đề xuất. GAN sử dụng hai mô hình hoạt động song song: Một mô hình học cách tạo đầu ra mục tiêu (như hình ảnh) và mô hình còn lại học cách phân biệt dữ liệu thực với đầu ra của trình tạo. Trình tạo cố gắng đánh lừa người phân biệt đối xử và trong quá trình đó sẽ học cách tạo ra kết quả đầu ra thực tế hơn. Trình tạo hình ảnh StyleGAN dựa trên các loại mô hình này.
Các mô hình khuếch tán được giới thiệu một năm sau đó bởi các nhà nghiên cứu tại Đại học Stanford và Đại học California tại Berkeley. Bằng cách tinh chỉnh đầu ra nhiều lần, các mô hình này học cách tạo các mẫu dữ liệu mới giống với các mẫu trong tập dữ liệu huấn luyện và được sử dụng để tạo ra hình ảnh trông như thật. Mô hình khuếch tán là trung tâm của hệ thống tạo văn bản thành hình ảnh Khuếch tán ổn định.
Vào năm 2017, các nhà nghiên cứu tại Google đã giới thiệu kiến trúc máy biến áp, được sử dụng để phát triển các mô hình ngôn ngữ lớn, giống như các mô hình hỗ trợ ChatGPT. Trong xử lý ngôn ngữ tự nhiên, một máy biến áp mã hóa từng từ trong kho văn bản dưới dạng mã thông báo, sau đó tạo bản đồ chú ý, bản đồ này ghi lại mối quan hệ của từng mã thông báo với tất cả các mã thông báo khác. Bản đồ chú ý này giúp máy biến áp hiểu ngữ cảnh khi tạo văn bản mới.
Đây chỉ là một vài trong số rất nhiều cách tiếp cận có thể được sử dụng cho AI sáng tạo.
Một loạt các ứng dụng
Điểm chung của tất cả các phương pháp này là chúng chuyển đổi đầu vào thành một tập hợp các mã thông báo, là các biểu thị bằng số của các khối dữ liệu. Miễn là dữ liệu của bạn có thể được chuyển đổi sang định dạng mã thông báo tiêu chuẩn này thì về mặt lý thuyết, bạn có thể áp dụng các phương pháp này để tạo dữ liệu mới trông tương tự.
“Quãng đường đi của bạn có thể thay đổi, tùy thuộc vào mức độ nhiễu của dữ liệu và độ khó trích xuất tín hiệu, nhưng nó thực sự đang tiến gần hơn đến cách một CPU đa năng có thể tiếp nhận bất kỳ loại dữ liệu nào và bắt đầu xử lý nó trong một hệ thống thống nhất. cách này,” Isola nói.
Điều này mở ra một loạt ứng dụng khổng lồ cho AI tổng hợp.
Ví dụ, nhóm của Isola đang sử dụng AI tổng hợp để tạo ra dữ liệu hình ảnh tổng hợp có thể dùng để huấn luyện một hệ thống thông minh khác, chẳng hạn như bằng cách dạy mô hình thị giác máy tính cách nhận dạng vật thể.
Nhóm của Jaakkola đang sử dụng AI tổng quát để thiết kế các cấu trúc protein mới hoặc cấu trúc tinh thể hợp lệ nhằm xác định các vật liệu mới. Ông giải thích, giống như cách một mô hình sinh học tìm hiểu sự phụ thuộc của ngôn ngữ, thay vào đó, nếu nó hiển thị các cấu trúc tinh thể, nó có thể tìm hiểu các mối quan hệ làm cho cấu trúc ổn định và có thể thực hiện được.
Nhưng mặc dù các mô hình tổng quát có thể đạt được kết quả đáng kinh ngạc nhưng chúng không phải là lựa chọn tốt nhất cho tất cả các loại dữ liệu. Devavrat Shah, Giáo sư Andrew và Erna Viterbi về Kỹ thuật Điện và Khoa học Máy tính tại MIT cho biết, đối với các nhiệm vụ liên quan đến việc đưa ra dự đoán về dữ liệu có cấu trúc, như dữ liệu dạng bảng trong bảng tính, các mô hình AI tổng quát có xu hướng hoạt động tốt hơn các phương pháp học máy truyền thống. và là thành viên của IDSS và Phòng thí nghiệm Hệ thống Thông tin và Quyết định.
“Theo tôi, giá trị cao nhất mà chúng có là trở thành giao diện tuyệt vời với máy móc thân thiện với con người. Trước đây, con người phải nói chuyện với máy móc bằng ngôn ngữ của máy móc để thực hiện mọi việc. Giờ đây, giao diện này đã tìm ra cách giao tiếp với cả con người và máy móc,” Shah nói.
Giương cờ đỏ
Các chatbot AI sáng tạo hiện đang được sử dụng trong các trung tâm cuộc gọi để trả lời các câu hỏi thực địa của khách hàng, nhưng ứng dụng này nhấn mạnh một cảnh báo nguy hiểm tiềm ẩn khi triển khai các mô hình này - sự dịch chuyển công nhân.
Ngoài ra, AI tổng quát có thể kế thừa và phát triển những thành kiến tồn tại trong dữ liệu đào tạo hoặc khuếch đại lời nói căm thù và tuyên bố sai sự thật. Các mô hình này có khả năng đạo văn và có thể tạo ra nội dung trông giống như được tạo ra bởi một người sáng tạo cụ thể, gây ra các vấn đề tiềm ẩn về bản quyền.
Mặt khác, Shah đề xuất rằng AI có khả năng sáng tạo có thể trao quyền cho các nghệ sĩ, những người có thể sử dụng các công cụ sáng tạo để giúp họ tạo ra nội dung sáng tạo mà họ có thể không có phương tiện để sản xuất.
Trong tương lai, ông nhận thấy AI có tính sáng tạo sẽ thay đổi nền kinh tế trong nhiều lĩnh vực.
Một hướng đi đầy hứa hẹn trong tương lai mà Isola nhận thấy đối với AI sáng tạo là việc sử dụng nó để chế tạo. Thay vì yêu cầu một mô hình tạo ra hình ảnh của một chiếc ghế, có lẽ nó có thể tạo ra một kế hoạch cho một chiếc ghế có thể được sản xuất.
Ông cũng nhận thấy những ứng dụng trong tương lai của hệ thống AI tổng quát trong việc phát triển các tác nhân AI thông minh nói chung hơn.
“Có những khác biệt trong cách các mô hình này hoạt động và cách chúng ta nghĩ về hoạt động của bộ não con người, nhưng tôi nghĩ cũng có những điểm tương đồng. Isola nói: “Chúng tôi có khả năng suy nghĩ và mơ ước trong đầu, đưa ra những ý tưởng hoặc kế hoạch thú vị và tôi nghĩ AI có tính tổng hợp cũng là một trong những công cụ sẽ trao quyền cho các đặc vụ để thực hiện điều đó”.

Hãy liên hệ với chúng tôi để được tư vấn miễn phí và đưa ra giải pháp dịch vụ phù hợp với nhu cầu của bạn!
Tư vấn đăng ký và hỗ trợ dịch vụ:
Điện thoại: 0886 67 96 01 hoặc 0986 379 601 | Email: info@ictso.top hoặc info@ictso.net | 👉 Zalo Tư vấn ICTSO