Seminar Khoa Toán - Thống kê "Một số vấn đề trong nghiên cứu, giảng dạy và học tập về khoa học dữ liệu"

20/08/2022

Nhằm mục tiêu chia sẻ một số nội dung liên quan đến việc nghiên cứu, giảng dạy và học tập về khoa học dữ liệu và trí tuệ nhân tạo, chiều ngày 20/8/2022, tại phòng B2.108, Khoa Toán-Thống kê đã tổ chức Seminar với chủ đề "Một số vấn đề trong nghiên cứu, giảng dạy và học tập về khoa học dữ liệu".

Seminar vinh dự được đón tiếp các khách mời là các Thầy TS. Nguyễn An Khương và TS. Nguyễn Tiến Thịnh, cùng với các bạn sinh viên xuất sắc đến từ Khoa khoa học máy tính, Trường Đại học Bách khoa-Đại học Quốc gia TPHCM. Trong seminar này, các khách mời đã mang tới cho người tham dự những bài nói chuyện đầy thú vị về những công trình nghiên cứu gần đây của mình.

Chủ đề đầu tiên là “Giảm nhiễu tiếng ồn bằng học sâu” do bạn Nguyễn Long Vũ, hiện là kỹ sư nghiên cứu AI của công ty FPT trình bày.

Những năm gần đây, đặc biệt là trong giai đoạn tình hình dịch bệnh diễn biến phức tạp, các hoạt động thông qua những nền tảng trực tuyến ngày càng trở nên phổ biến và giữ vai trò quan trọng. Chất lượng của các hoạt động trực tuyến thường bị tác động bởi yếu tố môi trường xung quanh của các cá nhân tham dự. Một trong những yếu tố quan trọng đó là tiếng ồn. Để hạn chế điều này, người ta thường sử dụng các phần mềm thương mại hay các tai nghe lọc nhiễu đắt tiền. Tuy nhiên không phải ai cũng có thể tiếp cận được những sản phẩm này. Với mục tiêu đưa ra một giải pháp miễn phí, tiện dụng, nhằm cải thiện chất lượng của các hoạt động trực tuyến, bạn Nguyễn Long Vũ đã nghiên cứu và xây dựng thành công ứng dụng cho phép lọc nhiễu tiếng ồn cho các hoạt động trực tuyến với nhiều ưu điểm. Trong nghiên cứu của mình, tác giả đã có những nghiên cứu chi tiết liên quan đến các khía cạnh khác nhau của âm thanh. Đồng thời, sử dụng linh hoạt các công cụ Toán học như biến đổi Fourier, cũng như các phương pháp hiện đại trong lĩnh vực Deep Learning như LSTM để giải quyết vấn đề đặt ra.

Một chủ đề khác cũng thú vị không kém, đó là “Nghiên cứu mô hình chủ đề bằng cách sử dụng mô hình Phân bổ Dirichlet tiềm ẩn (LDA) trên dữ liệu đánh giá về du lịch” được trình bởi các bạn Lê Thành Sơn và Trần Đình Vĩnh Thụy, hiện là học viên chương trình Master 2 tại Đại học Limoges.

Tại Việt Nam cũng như nhiều nước trên thế giới, du lịch là một trong những lĩnh vực có đóng góp quan trọng vào nền kinh tế quốc gia. Việc xác định các xu hướng du lịch để có những chính sách phù hợp nhằm phát triển du lịch là một trong những nhu cầu cần thiết và quan trọng. Để đạt được mục tiêu này, có nhiều cách tiếp cận. Một trong số đó là xác định xu hướng căn cứ vào trải nghiệm, chia sẻ và đánh giá của khách hàng. Cùng với sự phát triển của các phương tiện truyền thông, các trải nghiệm và đánh giá của khách du lịch có thể được thực hiện thông qua hình thức trực tuyến. Các đánh giá này là nguồn dữ liệu lớn và rất phong phú. Khai thác và sử dụng một cách hiệu quả nguồn dữ liệu này là một trong những nhu cầu quan trọng và cần thiết đối với nhà quản lý.

Mô hình LDA là một mô hình thống kê, cho phép khai phá các chủ đề ẩn trong một kho ngữ liệu gồm nhiều văn bản khác nhau. Đây là mô hình phổ biến nhất được sử dụng trong việc phân loại chủ đề do khả năng tính toán nhanh và có độ chính xác cao. Trong đề tài của mình các tác giả đã nghiên cứu một cách chi tiết cơ sở toán học của mô hình LDA và vận dụng nó trên bộ dữ liệu đánh giá của người dùng được thu thập từ TripAdvisor để xác định các chủ đề ẩn trong đó. Thông qua các chủ đề này, các tác giả đã tiến hành phân tích để nắm được xu hướng du lịch và tìm thấy nhiều kết quả thú vị.

Buổi seminar đã thu hút được sự quan tâm của rất nhiều thầy cô và SV khoa Toán-Thống kê cùng tham dự.

-------

B.L.Thuy