OpenAI đại diện AI đầu tiên 'Operator' đã đến! Có thể giúp bạn mua sắm, đặt vé, gọi món... giải quyết nhiệm vụ trực tuyến phức tạp

OpenAI chính thức giới thiệu AI Agent đầu tiên của mình, gọi là "Operator", có khả năng tự động điều khiển trình duyệt thực hiện các nhiệm vụ khác nhau, bao gồm đặt vé du lịch, đặt món ăn, điền biểu mẫu, vv và hỗ trợ xử lý đa nhiệm và cài đặt cá nhân hóa. Operator hiện chỉ hỗ trợ cho người dùng phiên bản chuyên nghiệp ở Mỹ. Operator là một đường đua được rất quan tâm trong lĩnh vực AI và mã hóa trong năm nay. Sau khi công ty Anthropic ra mắt "Computer Use" vào cuối tháng 10 năm ngoái: một hệ thống AI có thể thao tác giao diện máy tính giống như con người, sự phát triển của AI Agent đã mở ra nhiều khả năng tưởng tượng hơn. Và hôm nay, OpenAI, dẫn đầu trong lĩnh vực trí tuệ nhân tạo tạo ra bộ công cụ AI Agent đầu tiên của mình, được gọi là "Operator", đã trở thành chủ đề chính trong cộng đồng AI. Operator có thể tự điều khiển trình duyệt và thực hiện các nhiệm vụ cho người dùng. Người dùng chỉ cần mô tả nhiệm vụ mà họ muốn hoàn thành, Operator sẽ xử lý phần còn lại như đặt đơn đặt phòng trên Booking.com và đặt món ăn, điền biểu mẫu, giúp bạn thu thập danh sách mua sắm, tạo meme... Operator có thể xử lý đồng thời nhiều nhiệm vụ (giống như mở nhiều tab trên trình duyệt). Ngoài ra, nó cũng có thể ghi nhớ sở thích và cấu hình của người dùng để cung cấp dịch vụ cá nhân hóa hơn; người dùng cũng có thể can thiệp vào hoạt động, điều chỉnh hoặc hủy bỏ nhiệm vụ. Ngoài tiện ích của chức năng, Operator cũng chú trọng đến quyền riêng tư và bảo mật của người dùng. Công ty cho biết người dùng có thể xóa tất cả lịch sử duyệt web và đăng xuất khỏi tất cả các trang web chỉ bằng một cú nhấp chuột. Đồng thời, OpenAI cung cấp các tùy chọn cài đặt quyền riêng tư, người dùng có thể tắt chức năng "Cải thiện mô hình" để tránh việc dữ liệu của họ được sử dụng cho việc huấn luyện mô hình. Operator hiện đang là phiên bản xem trước nghiên cứu, chỉ mở cho người dùng phiên bản chuyên nghiệp tại Mỹ (với giá 200 USD mỗi tháng), người dùng có thể truy cập qua địa chỉ Operator.ChatGPT.com. Trong tương lai, nó sẽ mở rộng cho người dùng Plus, Teams và Enterprise. Tôi đã có quyền truy cập sớm vào ChatGPT Operator. Đó là AI agent mới của OpenAI tự động thực hiện các hành động trên web thay bạn. 9 trường hợp sử dụng ấn tượng nhất mà tôi đã thử: 1. Đặt món ăn tối dựa trên hình ảnh và công thức pic.twitter.com/tdbApPELD4 - Rowan Cheung @rowancheung 23 tháng 1 năm 2025 Operator hoạt động dựa trên mô hình mới được gọi là "Computer-Using Agent (CUA)", kết hợp khả năng xử lý hình ảnh của GPT-4o với khả năng suy luận cao cấp từ học tăng cường, được đào tạo đặc biệt để tương tác với giao diện người dùng đồ họa (GUI) như các nút, menu và trường văn bản trên màn hình. Operator có thể "nhìn thấy" nội dung giao diện thông qua chụp màn hình và "tương tác" bằng cách sử dụng chuột và bàn phím, do đó thực hiện các hoạt động trên trang web mà không cần tích hợp API. Khi gặp thách thức hoặc lỗi, Operator sẽ sử dụng khả năng suy luận để tự sửa chữa; nếu không thể giải quyết vấn đề, nó sẽ trả quyền kiểm soát lại cho người dùng để đảm bảo hoạt động mượt mà và hoàn thành nhiệm vụ cùng người dùng. OpenAI cho biết họ đã thiết lập hợp tác với một số đối tác, bao gồm DoorDash, Instacart, OpenTable, Priceline, StubHub, Thumbtack, Uber, vv., để đảm bảo Operator tuân thủ các quy tắc và đáp ứng các yêu cầu thực tế. Tuy nhiên, theo chia sẻ của doanh nhân Greg Isenberg, Operator cũng có một số hạn chế. Ví dụ, nó không thể xử lý các nhiệm vụ liên quan đến thanh toán hoặc đăng nhập, có thể bị mắc kẹt trong giao diện phức tạp và không thể giải quyết CAPTCHA (mã xác nhận), và số lần sử dụng hàng ngày bị giới hạn. Ngoài ra, thời gian ra mắt ở khu vực Châu Âu vẫn chưa được xác định, theo CEO của OpenAI, Sam Altman, cần "một thời gian". Trong tương lai, Operator sẽ mở API để hỗ trợ cho các nhà phát triển và tiếp tục cải thiện tính năng và mở rộng phạm vi người dùng, và sẽ tích hợp trực tiếp tính năng này vào ChatGPT.

Xem bản gốc
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Phần thưởng
  • Bình luận
  • Chia sẻ
Bình luận
0/400
Không có bình luận
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)