Chuyển đến nội dung chính
Trang Trắng

Minh bạch AI và biên tập

Trang Trắng dùng AI để hỗ trợ phân loại và lọc nhận xét cộng đồng - không phải để đưa ra phán quyết. Mọi quyết định gỡ bỏ hoặc ẩn nội dung đều cần xác nhận từ kiểm duyệt viên. Trang này mô tả cụ thể AI can thiệp ở bước nào, và ở đâu con người giữ quyền quyết định cuối cùng.

Cập nhật lần cuối: tháng 3/2026

AI hỗ trợ, con người chịu trách nhiệm cuối cùng

Phạm vi ứng dụng AI trong quy trình kiểm duyệt

AI chỉ đóng vai trò sàng lọc sơ bộ. Dưới đây là ranh giới cụ thể giữa những gì hệ thống tự động xử lý và những gì bắt buộc phải có người xem xét.

AI làm

  • Sàng lọc spam, ngôn từ vi phạm và nội dung trùng lặp trước khi nhận xét đến kiểm duyệt viên.
  • Dựa trên dữ liệu lịch sử, hệ thống tự gắn nhãn phân loại cho từng nhận xét (ví dụ: quảng cáo, cảnh báo lừa đảo, phản hồi dịch vụ).
  • Khi nội dung vượt ngưỡng rủi ro, AI chuyển sang hàng đợi kiểm duyệt thủ công thay vì tự xử lý.

AI không làm

  • Quyết định gỡ hay ẩn nội dung luôn cần xác nhận từ kiểm duyệt viên - AI không tự thao tác.
  • Thông tin cá nhân ngoài phạm vi nhận xét cộng đồng không bao giờ được AI truy cập hay xử lý.
  • Bối cảnh văn hóa, ý định người viết, sắc thái ngôn ngữ vùng miền - những yếu tố này nằm ngoài khả năng của hệ thống tự động.

Kiểm duyệt thủ công

  • Mọi nội dung AI gắn cờ đều qua kiểm duyệt viên trước khi bị ẩn hoặc gỡ.
  • Tranh chấp, khiếu nại, hoặc nhận xét có bối cảnh phức tạp do người xử lý trực tiếp.
  • Khi phát hiện sai sót trong phân loại, kiểm duyệt viên điều chỉnh lại ngưỡng lọc của hệ thống.

Ví dụ thực tế: Nhận xét "Số này gọi quảng cáo bảo hiểm 3 lần/tuần" được AI phân loại là "quảng cáo/telemarketing" và hiển thị trực tiếp. Nhận xét chứa ngôn từ mạnh hoặc cáo buộc pháp lý sẽ chuyển sang kiểm duyệt viên thay vì tự động hiển thị.

Quy trình xử lý nhận xét

  1. 1

    Gửi nhận xét

    Người dùng nhập nhận xét qua form trên trang tra cứu số điện thoại.

  2. 2

    Lọc tự động

    Trong vài giây, AI kiểm tra spam và ngôn từ vi phạm. Nội dung trùng lặp với nhận xét đã có cũng bị loại ở bước này.

  3. 3

    Phân loại rủi ro

    Mỗi nhận xét được gắn nhãn (quảng cáo, cảnh báo lừa đảo, phản hồi dịch vụ...) và đánh giá mức rủi ro dựa trên mẫu hành vi lịch sử.

  4. 4

    Kiểm duyệt thủ công

    Vượt ngưỡng rủi ro? Nhận xét chuyển sang hàng đợi kiểm duyệt viên. Nội dung dưới ngưỡng đi thẳng sang bước 5.

  5. 5

    Tổng hợp tín hiệu

    Nhận xét đã duyệt được tính vào điểm tín hiệu và phân tích xu hướng của số điện thoại.

  6. 6

    Hiển thị công khai

    Nhận xét xuất hiện trên trang tra cứu.

Điều kiện xử lý nội dung

Nhận xét cộng đồng được hiển thị mặc định sau khi qua lọc tự động. Đội ngũ biên tập chỉ can thiệp (ẩn hoặc gỡ) khi nội dung thuộc một trong các trường hợp dưới đây, theo quy trình biên tập đã công bố:

Nội dung sai lệch thực tế
Nội dung gây hại cho cộng đồng
Vi phạm tiêu chuẩn cộng đồng
Yêu cầu hợp lệ từ cơ quan pháp luật

Giới hạn của hệ thống

Chúng tôi công khai các giới hạn sau để cộng đồng biết khi nào nên sử dụng kênh báo cáo thay vì chờ hệ thống tự nhận diện.

Sai sót trong lọc tự động

Nhận xét hợp lệ có thể bị gắn cờ nhầm, hoặc nội dung vi phạm tinh vi lọt qua bộ lọc. Kiểm duyệt viên xem lại các trường hợp được báo cáo.

Thiên kiến từ dữ liệu lịch sử

AI học từ nhận xét cộng đồng trước đó. Nếu dữ liệu gốc có thiên kiến, kết quả phân loại sẽ phản ánh thiên kiến đó chứ không phải thực tế khách quan.

Ngôn ngữ vùng miền và mã hóa chữ

Tiếng Việt phổ thông được xử lý tốt. Tiếng địa phương, lối viết tắt vùng miền, hoặc ký tự mã hóa sai thì hệ thống dễ hiểu nhầm.

Tình huống cần phán đoán con người

Tranh chấp thương mại, nội dung nhạy cảm pháp lý, hay ngữ cảnh đặc biệt đòi hỏi kiểm duyệt viên can thiệp - AI không đủ khả năng xử lý các trường hợp này.

Hỗ trợ và quản trị nội dung

Bạn có thể yêu cầu xem xét hoặc chỉnh sửa nội dung thông qua các kênh dưới đây.

Lưu ý quan trọng

  • Dữ liệu cộng đồng không phải kết luận pháp lý.
  • AI không phải người ra quyết định cuối cùng.
  • Trang Trắng không xác định danh tính người gọi.
Chúng tôi soát xét tài liệu này mỗi 90 ngày theo quy tắc cập nhật chính sách. Các thay đổi về thuật toán hoặc cách kiểm duyệt sẽ cập nhật công khai.