Bitget App
Giao dịch thông minh hơn
Mua CryptoThị trườngGiao dịchFutures‌EarnWeb3Quảng trườngThêm
Giao dịch
Spot
Mua bán tiền điện tử
Ký quỹ
Gia tăng vốn và tối ưu hiệu quả đầu tư
Onchain
Tương tác on-chain dễ dàng với Onchain
Convert & GD khối lượng lớn
Chuyển đổi tiền điện tử chỉ với một nhấp chuột và không mất phí
Khám phá
Launchhub
Giành lợi thế sớm và bắt đầu kiếm lợi nhuận
Sao chép
Sao chép elite trader chỉ với một nhấp
Bots
Bot giao dịch AI đơn giản, nhanh chóng và đáng tin cậy
Giao dịch
USDT-M Futures
Futures thanh toán bằng USDT
USDC-M Futures
Futures thanh toán bằng USDC
Coin-M Futures
Futures thanh toán bằng tiền điện tử
Khám phá
Hướng dẫn futures
Hành trình giao dịch futures từ người mới đến chuyên gia
Chương trình ưu đãi futures
Vô vàn phần thưởng đang chờ đón
Bitget Earn
Sản phẩm kiếm tiền dễ dàng
Simple Earn
Nạp và rút tiền bất cứ lúc nào để kiếm lợi nhuận linh hoạt không rủi ro
On-chain Earn
Kiếm lợi nhuận mỗi ngày và được đảm bảo vốn
Structured Earn
Đổi mới tài chính mạnh mẽ để vượt qua biến động thị trường
Quản lý Tài sản và VIP
Dịch vụ cao cấp cho quản lý tài sản thông minh
Vay
Vay linh hoạt với mức độ an toàn vốn cao
Đồng sáng lập Ethereum cho biết quản trị do AI dẫn dắt có thể bị lợi dụng, kêu gọi giám sát thông tin-tài chính

Đồng sáng lập Ethereum cho biết quản trị do AI dẫn dắt có thể bị lợi dụng, kêu gọi giám sát thông tin-tài chính

CoinotagCoinotag2025/09/15 02:38
Hiển thị bản gốc
Theo:Jocelyn Blake

  • Vitalik Buterin cảnh báo quản trị do AI dẫn dắt có thể bị thao túng thông qua jailbreak và tích hợp ứng dụng.

  • Nhà nghiên cứu bảo mật Eito Miyamura đã trình diễn cách tích hợp ứng dụng có thể làm lộ dữ liệu riêng tư cho các khai thác AI.

  • Các kiến trúc tài chính thông tin với đa dạng mô hình và kiểm tra ngẫu nhiên bởi con người được khuyến nghị để giảm rủi ro hệ thống.

Rủi ro quản trị AI: Vitalik Buterin cảnh báo quản trị do AI dẫn dắt có thể bị khai thác—đọc phân tích, bằng chứng và các biện pháp bảo vệ được khuyến nghị. Tìm hiểu những gì các nhà hoạch định chính sách và nhà phát triển nên làm tiếp theo.




Rủi ro quản trị AI là gì?

Rủi ro quản trị AI là mối đe dọa rằng các hệ thống AI tự động được giao nhiệm vụ ra quyết định—đặc biệt là phân bổ tài nguyên—có thể bị thao túng để tạo ra các kết quả có hại. Vitalik Buterin nhấn mạnh rằng nếu không có các lớp kiểm tra, kẻ tấn công có thể sử dụng các prompt và tích hợp để làm sai lệch logic quyết định và chuyển hướng quỹ hoặc dữ liệu.

Làm thế nào các hệ thống AI có thể bị thao túng?

Các agent AI có thể bị đánh lừa bằng các prompt jailbreak được nhúng trong các đầu vào hàng ngày. Nhà nghiên cứu bảo mật Eito Miyamura đã trình diễn một khai thác trong đó một lời mời lịch hoặc tích hợp ứng dụng có thể chuyển một lệnh ẩn mà khi được AI xử lý sẽ làm lộ nội dung email hoặc tệp tin.

Những khai thác này cho thấy các tích hợp ứng dụng (ví dụ: Gmail, Notion, Google Calendar được đề cập như bối cảnh) mở rộng bề mặt tấn công. Kẻ tấn công có thể tạo ra các đầu vào có vẻ vô hại nhưng lại thay đổi hành vi mô hình khi được đọc trong các tác vụ thường nhật.

Tại sao Vitalik Buterin phản đối quản trị AI hoàn toàn tự động?

Buterin lập luận rằng quản trị AI tự động làm tăng rủi ro hệ thống. Ông đề xuất một phương pháp “tài chính thông tin” nơi nhiều mô hình độc lập cạnh tranh và được kiểm toán bởi các hội đồng con người và kiểm tra ngẫu nhiên tự động. Sự kết hợp này nhằm phát hiện nhanh các thất bại của mô hình và duy trì động lực phát triển trung thực.

Làm thế nào để giảm rủi ro quản trị AI?

Giảm thiểu thực tế đòi hỏi các biện pháp phòng thủ nhiều lớp:

  1. Giới hạn phạm vi: hạn chế các hệ thống tự động di chuyển quỹ hoặc ra quyết định quản trị cuối cùng một cách đơn phương.
  2. Đa dạng mô hình: triển khai nhiều mô hình và so sánh kết quả để phát hiện bất thường.
  3. Giám sát của con người: yêu cầu đánh giá của con người cho các quyết định rủi ro cao và duy trì dấu vết kiểm toán.
  4. Lọc đầu vào: làm sạch và gắn cờ các đầu vào không đáng tin cậy từ ứng dụng và lịch chia sẻ.
  5. Động lực và kiểm toán: thưởng cho các kiểm toán viên độc lập và duy trì các chương trình săn lỗi.


Bằng chứng nào hỗ trợ những lo ngại này?

Các trình diễn được báo cáo bởi các nhà nghiên cứu bảo mật đã cho thấy cách các tích hợp ứng dụng có thể bị lạm dụng. Eito Miyamura (EdisonWatch) đã trình diễn một kịch bản trong đó một mục lịch tưởng chừng vô hại có thể kích hoạt việc rò rỉ dữ liệu khi được AI hội thoại đọc. Những trình diễn như vậy nhấn mạnh các vector tấn công thực tế.

Comparison: AI governance vs Info Finance Feature AI Governance (Autonomous) Info Finance (Buterin’s proposal)
Kiểm soát quyết định Chỉ AI AI hỗ trợ + đánh giá của con người
Khả năng chống thao túng Thấp nếu không có biện pháp bảo vệ Cao hơn nhờ đa dạng mô hình
Minh bạch Kết quả mô hình không rõ ràng Kiểm toán và kiểm tra ngẫu nhiên
Định hướng động lực Nguy cơ bị thao túng Động lực cho kiểm toán viên và nhà phát triển trung thực

Câu hỏi thường gặp

AI thực sự có thể bị “bỏ tù” hoặc bị đánh lừa bởi prompt không?

Có. Các trình diễn đã cho thấy rằng các prompt được thiết kế tốt hoặc lệnh ẩn trong đầu vào có thể thay đổi hành vi của AI. Các biện pháp bảo vệ thực tế bao gồm làm sạch đầu vào, kết hợp nhiều mô hình và điểm kiểm tra của con người để ngăn chặn thao túng độc hại.

DAOs có nên giao quyền quản trị cho AI không?

Bằng chứng hiện tại cho thấy giao toàn quyền cho AI là quá sớm. Các thiết kế lai yêu cầu sự phê duyệt của con người cho các hành động quan trọng sẽ giảm rủi ro thảm họa trong khi tận dụng AI cho phân tích và đề xuất.


Những điểm chính

  • Rủi ro quản trị AI là có thật: Các trình diễn cho thấy AI có thể bị thao túng thông qua prompt và tích hợp.
  • Giám sát của con người là thiết yếu: Yêu cầu đánh giá của con người và dấu vết kiểm toán cho các quyết định quan trọng.
  • Tài chính thông tin mang lại con đường an toàn hơn: Nhiều mô hình, kiểm tra ngẫu nhiên và động lực có thể giảm khai thác.

Kết luận

Cảnh báo của Vitalik Buterin nhấn mạnh rằng AI trong quản trị tiềm ẩn nguy cơ hệ thống nghiêm trọng nếu triển khai mà không có biện pháp bảo vệ. Bằng chứng từ các nhà nghiên cứu bảo mật cho thấy các khai thác thực tế tồn tại. Áp dụng mô hình tài chính thông tin—kết hợp đa dạng mô hình, kiểm toán liên tục và giám sát bắt buộc của con người—mang lại hướng đi thực tế. Các nhà hoạch định chính sách và nhà phát triển nên ưu tiên kiểm toán và cấu trúc động lực ngay từ bây giờ.

Xuất bản: 15 Tháng Chín 2025 | 02:50

Tác giả: Alexander Stefanov — Phóng viên tại COINOTAG

Nguồn đề cập (văn bản thuần): Vitalik Buterin, Eito Miyamura, EdisonWatch, ChatGPT, Gmail, Notion, Google Calendar.

In Case You Missed It: Tron’s Stablecoin-Driven Revenue May Be Reinforcing Its Market Dominance
0

Tuyên bố miễn trừ trách nhiệm: Mọi thông tin trong bài viết đều thể hiện quan điểm của tác giả và không liên quan đến nền tảng. Bài viết này không nhằm mục đích tham khảo để đưa ra quyết định đầu tư.

PoolX: Khóa để nhận token mới.
APR lên đến 12%. Luôn hoạt động, luôn nhận airdrop.
Khóa ngay!