Công nghệ Deepfake là gì? Làm hình ảnh có thể di chuyển và giao tiếp dựa trên video hiện có. Phần mềm trí tuệ nhân tạo có thể thay đổi khuôn mặt của một nhân vật trong một bộ phim nào đó sang một bộ phim khác, đòi hỏi nhiều dữ liệu hình ảnh để cho ra những bức ảnh giả giống thật nhất. Giờ đây, các chuyên gia kỹ thuật hàng đầu thế giới đã phát triển thành công hệ thống trí tuệ nhân tạo có thể tạo clip giả chỉ bằng dữ liệu trong ảnh hết sức bất ngờ và đầy thú vị. Cùng 2findx tìm hiểu nhé.
Mục lục
Tim hiểu ứng dụng Speaking Portrait
Ứng dụng Speaking Portrait có thể làm cho các bức ảnh chuyển động; và nói chuyện dựa trên một đoạn video nguồn. Đầu năm nay, nhà phát triển D-ID gây xôn xao với Deep Nostalgia – giúp những bức ảnh thời xưa biết “động đậy” trong giây lát. Tại sự kiện TechCrunch Disrupt cuối tháng 9; công ty có trụ sở tại Israel đã giới thiệu thế hệ công nghệ tiếp theo của Deep Nostalgia; mang tên Speaking Portrait. Ứng dụng mới có khả năng biến ảnh tĩnh thành video chuyển động; và nói bất cứ điều gì người dùng muốn.
Speaking Portrait có hai phiên bản. Đầu tiên là Single Portrait; giúp chuyển một bức ảnh thành video dạng chân dung biết nói. Tuy nhiên, chuyển động của phiên bản này chỉ giới hạn ở phần đầu; bất kỳ thứ gì khác trong nền vẫn ở trạng thái tĩnh, do đó khả năng sử dụng vào mục đích giả mạo khá thấp.
Bản nâng cao hơn là Trained Character. Ngoài một bức ảnh, phần mềm yêu cầu thêm một video dài 10 phút quay lại một nhóm chuyển động cụ thể cùng giọng nói thông qua một đoạn thoại được chuẩn bị sẵn. Kết quả là phiên bản này trông thực hơn nhiều so với Single Portrait nhờ khả năng xác định vật thể trong nền và tạo ra chuyển động cơ thể của người, bao gồm cả cánh tay và bàn tay của họ.
Deepfake là gì?

Bắt nguồn từ một người dùng Reddit có tên “deepfakes”; cái tên này đã mở đường cho công nghệ học sâu (deep learning), một mảng nhỏ của công nghệ học máy (machine learning) – sử dụng trí tuệ nhân tạo huấn luyện máy tính thực hiện một nhiệm vụ nào đó.
Về cơ bản, công nghệ deepfake sẽ thu hình ảnh chất lượng cao; khuôn mặt của một đối tượng nhất định, sau đó thay thế hoàn toàn khuôn mặt của một người khác trong video. Các tập tin âm thanh deepfake được tạo ra bằng cách sử dụng bản ghi âm thực để huấn luyện máy tính nói chuyện; giống hệt đối tượng cụ thể. Những kỹ thuật học máy tương tự có thể được sử dụng; để đào tạo máy tính viết văn bản giả. Tùy theo ý đồ của người tạo mà video sẽ được điều chỉnh chậm, tăng nhanh hoặc chỉnh sửa; để đánh lừa người xem.
Công nghệ Deepfake có thể thay đổi công nghệ theo hướng tích cực

Tính năng làm ảnh tĩnh động đậy trên Deep Nostalgia; giống như một công cụ quảng cáo, thu hút người dùng đến với trang web bảo tồn phả hệ MyHeritage. Trong khi đó, Speaking Portrait có tiềm năng hơn nhiều. Nó không chỉ dành cho những ai muốn xây dựng nhân vật ảo thuyết trình chuyên nghiệp; bằng nhiều thứ tiếng trong các cuộc họp trực tuyến. Công nghệ này còn đảm bảo cho các hãng thông tấn luôn có người dẫn chương trình trực tiếp để cập nhật tin tức nóng hổi; ngay cả vào nửa đêm.
Đây là xu hướng ứng dụng đang được nhiều công ty AI; theo đuổi với mục tiêu làm cho các bộ phim nước ngoài được lồng tiếng trông tự nhiên hơn, bằng cách đảm bảo chuyển động miệng và khuôn mặt khớp với lời thoại.
Dù vẫn còn nhiều lý do để lo ngại rằng deepfake có thể bị sử dụng vào mục đích giả mạo; công nghệ này hiện đã đạt đến một trình độ mới và trở nên dễ sử dụng hơn; đồng thời cho thấy nhiều lợi ích tiềm năng nếu được sử dụng đúng cách.
Cảm ơn bạn đã theo dõi bài viêt này. Tìm hiểu thêm thông tin về khoa học công nghệ tại đây.