Bí mật ẩn bên trong thuật toán "gây nghiện" của TikTok

22/12/2022 838

Mục lục

    TikTok đã thiết lập không ít những thuật toán khác nhau để thu hút đông đảo người dùng sử dụng nền tảng này. Hãy cùng 24hStore tìm hiểu thông tin chi tiết ngay trong bài viết dưới đây!

    TikTok “gây nghiện” cho người dùng nhờ thuật toán đề xuất nội dung

    Sự phát triển nhanh như vũ bão của Tiktok trong thời gian ngắn đang khiến toàn thế giới phải kinh ngạc. Hàng tỷ người dùng trẻ đang bị cuốn theo những nội dung, xu hướng xuất hiện trên nền tảng này, thậm chí những mạng xã hội khổng lồ trên toàn cầu cũng phải chạy theo cơn bão do những đoạn clip ngắn trên TikTok tạo ra.

    Tuy nhiên cho đến thời điểm hiện tại, dường như vẫn chưa có một ứng dụng nào có thể lặp lại được cơn sốt "gây nghiện" mà TikTok tạo ra trong thời gian qua.

    Lí do đến từ việc các công ty đối thủ mới chỉ sao chép TikTok ở việc tạo ra những đoạn video ngắn, điều mà hiện nay kể cả Youtube hay Instagram cũng đã thực hiện, còn làm thế nào để "gây nghiện" cho người dùng lại là câu chuyện hoàn toàn khác. Bí quyết nằm ở thuật toán đề xuất nội dung cho người dùng.

    Vào tháng 9 năm nay, Bytedance, công ty mẹ của TikTok đã khiến nhiều người bất ngờ khi công bố thiết kế cho hệ thống đề xuất nội dung được sử dụng trên ứng dụng này.

    Điều này nằm trong nỗ lực của Bytedance nhằm biến hệ thống đề xuất nội dung này thành một dịch vụ thuê bao đám mây dành cho các khách hàng doanh nghiệp. Qua đó, thế giới sẽ có cái nhìn toàn diện hơn về phương thức TikTok gây nên "cơn nghiện" đối với người dùng khắp toàn cầu.

    thuật toán gây nghiện TikTok

    Ngỡ ngàng với những gì TikTok thu thập từ người dùng và cách hạn chế

    Monolith: Hệ thống AI đề xuất nội dung của TikTok

    Trong khi thuật toán của Facebook dựa trên "social graph" – mạng lưới kết nối xã hội – của người dùng, hay mức độ tương tác của họ với những người khác để đưa ra các đề xuất nội dung tương tự để giữ chân người dùng, thuật toán đề xuất của TikTok tập trung vào tương tác giữa người dùng với chính nội dung đó, được đặt tên hệ thống Monolith.

    thuật toán gây nghiện TikTok

    Kiến trúc huấn luyện trực tuyến của Monolith được chia làm 2 giai đoạn: huấn luyện sơ bộ và huấn luyện trực tuyến. 

    Về cơ bản, kiến trúc của Monolith tuân theo thiết lập phân tán của TensorFlow – một thư viện phần mềm mã nguồn mở của Google dành cho máy học và trí tuệ nhân tạo, vốn được tạo ra để dành cho việc huấn luyện học sâu các mạng lưới thần kinh nhân tạo.

    Monolith bắt đầu với giai đoạn huấn luyện sơ bộ (Batch Training) với việc nạp các dữ liệu đầu vào cho hệ thống cùng các tham số cơ bản. Các dữ liệu này được tổng hợp từ những thông tin như thiết lập ngôn ngữ, quốc gia hay loại thiết bị.

    Nhưng một phần quan trọng khác là các lựa chọn ban đầu của người dùng đối với chủ đề video mà họ quan tâm. Từ các chủ đề này, TikTok đề xuất ra một loạt các nội dung tương ứng với cấp độ ngang hàng nhau – từ của người dùng mới đăng tải cho đến nội dung của những người có ảnh hưởng.

    Tiếp đó hệ thống phân tích phản hồi của người dùng đối với nội dung được đề xuất và đánh giá chất lượng của nội dung đó dựa trên các tham số bao gồm: số lượng like, lượt xem, thời gian xem, số bình luận, lượt repost, lượt share, mức độ gia tăng người theo dõi, … Các nội dung thuộc top 10% điểm số cao nhất sẽ được ưu tiên hiển thị.

    Nhưng không dừng lại ở đó, hệ thống Monolith còn trải qua quá trình huấn luyện trực tuyến với các dữ liệu liên tục được nạp vào theo thời gian thực. Sau khi một mô hình được xây dựng dựa trên các dữ liệu đưa vào từ giai đoạn huấn luyện sơ bộ, nó tiếp tục được cập nhật dựa trên các dữ liệu đưa vào theo thời gian thực.

    Các tham số về phản hồi của người dùng cũng được cập nhật và đồng bộ theo thời gian thực để hệ thống đưa ra các tác động gần như ngay lập tức đến người dùng.

    ứng dụng gây nghiện TikTok

    Vòng lặp thông tin phản hồi của hệ thống huấn luyện Monolith: Ở giai đoạn huấn luyện sơ bộ [Người dùng - Máy chủ mô hình - máy chủ huấn luyện - máy chủ mô hình - người dùng], thời gian vòng lặp kết thúc kéo dài hơn trong khi giai đoạn huấn luyện trực tuyến, vòng lặp gần như kết thúc ngay lập tức - theo ByteDance chia sẻ.

    Để đánh đổi khả năng huấn luyện liên tục với tốc độ cao, hệ thống Monolith được TikTok thiết kế với việc chấp nhận tỷ lệ lỗi cao hơn (fault Tolerance) – hay nói cách khác, công ty chấp nhận giảm độ chính xác trong mô hình của mình để các tham số được đồng bộ liên tục nhanh hơn, với băng thông mạng lớn hơn và đưa ra kết quả theo thời gian thực đáng tin cậy hơn.

    Tương tự thuật toán đề xuất của Facebook, tương tác của người dùng đối với nội dung được đánh giá thông qua các hành vi khi like, share hoặc bình luận dưới đoạn video. Nhưng yếu tố then chốt trong thuật toán của TikTok là thời gian người dùng xem video. Điều này được thể hiện trong chính tài liệu do TikTok công bố:

    "Các ID chỉ dành một ít thời gian (với đoạn video được đề xuất) sẽ có ít đóng góp cho việc cải thiện chất lượng mô hình," ngoài ra các ID "có thời hạn sử dụng từ lâu hiếm khi đóng góp vào mô hình hiện tại khi phần nhiều trong số chúng không bao giờ được truy cập. Điều này có thể là vì người dùng đã không còn hoạt động hoặc đoạn video ngắn đã lỗi thời."

    Trong khi các hành vi người dùng như like, chia sẻ, bình luận không phải lúc nào cũng xuất hiện trong mỗi đoạn video được đề xuất, do vậy thời gian xem đoạn video vẫn được TikTok xem là yếu tố then chốt để đánh giá mức độ ưa thích của người dùng đối với đoạn video đó.

    thuật toán gây nghiện TikTok

    TikTok đang thay đổi ngành công nghiệp âm nhạc toàn cầu như thế nào?

    Một số hệ lụy từ thuật toán "gây nghiện" của TikTok

    Trên thực tế, mọi nền tảng mạng xã hội đều được thiết kế để giữ chân người dùng ở lại càng lâu càng tốt. Nhưng có thể nhận ra thuật toán đề xuất của TikTok được thiết kế để tập trung vào phản hồi của người dùng đối với nội dung được hiển thị, thay vì dựa vào mối quan hệ tương tác giữa người dùng với nhau như cách mà Facebook làm.

    Điều này kéo theo một tác hại khác trong hệ thống đề xuất nội dung của TikTok, đó là duy trì tương tác của người dùng bằng cách "gây nghiện" cho họ. TikTok thực hiện đề xuất các nội dung gây thích thú cho não bộ để kéo dài thời gian xem video và tương tác của người dùng.

    thuật toán gây nghiện TikTok

    Trên thực tế, thiết kế giữ chân người dùng của TikTok cũng gần như tương tự YouTube. Điểm khác biệt nằm ở thiết kế giao diện của 2 ứng dụng này. YouTube ban đầu dành cho người dùng máy tính sau đó mới được thiết kế cho điện thoại thông minh, vì vậy các video có thời lượng dài với giao diện mặc định chỉ chiếm một phần màn hình. Không gian còn lại dành cho các đề xuất video khác.

    Ngược lại, các video TikTok có thời lượng rất ngắn, giao diện mặc định chiếm trọn toàn bộ màn hình điện thoại, thu hút toàn bộ sự chú ý của người dùng. Với các nội dung liên tục xuất hiện trong thời gian ngắn, một chuỗi các video như vậy có thể làm mất hoàn toàn sự tập trung của người dùng, gần như thực sự "gây nghiện" khi khiến họ không thể rời mắt khỏi màn hình điện thoại.

    Để làm nên các nội dung thu hút sự chú ý của người xem, bên cạnh việc tạo ra các video với hình ảnh, âm thanh ngày càng cuốn hút, thì cũng kéo theo đó là nhiều nội dung "rác" hoặc gây tranh cãi mạnh mẽ trong cộng đồng.

    Khi lôi kéo được nhiều tương tác, hệ thống đề xuất của TikTok sẽ nhanh chóng đưa nó lên hàng đầu trong số các nội dung được ưu tiên hiển thị và lan truyền rộng rãi tới người dùng khác – bất kể họ là ai hay mối quan tâm là gì.

    TikTok thường xuyên phải xóa một số lượng lớn video do vi phạm "Tiêu chuẩn cộng đồng" của mình. Riêng quý 2/2022, TikTok cho biết đã xóa 113 triệu video vi phạm. Đây là một mức gia tăng khổng lồ khi trong 6 tháng cuối năm 2019, số lượng video xóa khỏi nền tảng này chỉ ở con số 49 triệu.

    Số lượng video bị xóa cho thấy tốc độ tăng trưởng khủng khiếp của các nội dung rác trên nền tảng này lớn đến mức nào. Hơn thế nữa, con số này còn chưa bao gồm vô số nội dung rác khác chưa bị phát hiện và xóa bỏ trước khi phát tán rộng rãi trên nền tảng này.

    Để trải nghiệm ứng dụng TikTok một cách mượt mà trên hệ điều hành iOS/Android, bạn có thể cân nhắc đến việc sắm ngay một trong các sản phẩm đến từ thương hiệu Apple, Samsung, Xiaomi hoặc Oppo trực tiếp tại 24hStore. Khi mua hàng ở đây, bạn sẽ kèm ưu đãi hấp dẫn. Ngoài ra, bộ phận tư vấn cũng sẵn sàng trao đổi mọi thông tin một cách tận tình nếu bạn liên hệ trước qua hotline 19000351.

    Xem thêm: Làm việc và xem TikTok cùng lúc trên máy tính nhờ bật chế độ Hình trong hình

    iPhone 14 128GB | Chính hãng VN/A

    iPhone 14 128GB | Chính hãng VN/A

    15.490.000 đ