Hoàng Lan Anh
2,749
04-07-2023
Người thực hiện: Học viên Tô Xuân Hoàng – K4 Khóa AI/Machine Learning/Deep Learning Foundation
1. Giới thiệu đề tài Text-to-Image: Chuyển đổi văn bản thành hình ảnh
Các mô hình text-to-image model được nhận nhiều sự quan tâm nhờ khả năng sáng tạo ra những hình ảnh rất thú vị từ đoạn văn bản mô tả cho trước. Những mô hình là công cụ hỗ trợ con người rất nhiều trong việc xây dựng những content hình ảnh và nhiều ứng dụng khác.
Kết thúc khóa học AI Basic, Tô Xuân Hoàng đã thực hiện bài toán Text-to-Image huấn luyện trên mô hình Latent Diffusion và đem lại kết quả khá kinh ngạc.
2. Giới thiệu Kỹ thuật – Công nghệ được sử dụng trong bài toán: Mạng Latent Diffusion
Diffusion Models là các mô hình cũng dùng để sinh ra dữ liệu ảnh mới nhưng đạt được hiệu suất training tốt hơn mạng GAN. Diffusion Models (DMs) lấy cảm hứng từ hiện tượng nhiệt động lực học không cân bằng từ Vật lý. Hiểu một cách đơn giản thì mô hình sẽ từ từ phá hủy cấu trúc của ảnh bằng cách thêm dần nhiễu, mô hình được huấn luyện để học cách phục hồi nhiễu về ảnh ban đầu.
3. Các bước xây dựng bài toán Text-to-Image bằng mô hình Latent Diffusion
Xem chi tiết phần trình bày của học viên Tô Xuân Hoàng tại:
Trí tuệ nhân tạo đang ngày càng nổi lên như 1 xu hướng trên thế giới và dường như không thể đo lường được hết những ứng dụng của nó khi mà các công nghệ đặc biệt là Trí tuệ nhân tạo mỗi ngày lại có những đổi mới cải tiến hơn.
Với kinh nghiệm tổ chức hàng trăm khóa Đào tạo ngắn hạn về AI – Data Science, Cole tự hào giới thiệu tới quý anh/chị các dự án cá nhân của học viên khóa học AI Basic vô cùng xuất sắc và có ứng dụng thực tiễn cao trong nhiều lĩnh vực khác nhau.