Anthropic để mô hình Claude của mình điều hành một cửa hàng văn phòng trong một tháng và nhận thấy rằng họ có thể đối phó với một số thách thức kinh doanh, nhưng vẫn còn những thiếu sót rõ ràng về giá cả, học hỏi và tương tác trong thế giới thực, cho thấy AI vẫn còn lâu mới hoàn toàn tự chủ. (Tóm tắt nội dung: Tải xuống tác phẩm của người khác và sau đó AI rửa hình ảnh là bất hợp pháp!) Vụ án hình sự vi phạm bản quyền AI đầu tiên của Trung Quốc bị kết án tù + phạt tiền) (Bổ sung cơ bản: Haowen "AI thay đổi thói quen đọc sách của con người như thế nào? Liệu văn bản gốc cuối cùng sẽ biến mất? Anthropic, được thành lập bởi các cựu giám đốc điều hành OpenAI và tung ra mô hình ngôn ngữ quy mô lớn nổi tiếng "Claude", đã tiết lộ một thử nghiệm thú vị có tên Project Vend trên blog chính thức của mình vào tuần trước, cho phép mô hình ngôn ngữ riêng Claude Sonnet 3.7 điều hành một cửa hàng mini tự động tại văn phòng San Francisco trong khoảng một tháng để quan sát hiệu suất thực tế và hạn chế của AI trong các hoạt động kinh tế trong thế giới thực. Nguồn: Anthropic Experimental Design and Operation Theo Anthropic, Claude không chỉ chịu trách nhiệm bổ sung, đặt hàng, quản lý hàng tồn kho và xử lý nhu cầu của khách hàng trong thử nghiệm này mà còn tránh thua lỗ. AI có thể tìm kiếm sản phẩm trên web, gửi email để yêu cầu sự hỗ trợ của con người (chẳng hạn như bổ sung hoặc liên hệ với nhà cung cấp), ghi lại thông tin quan trọng, tương tác với khách hàng (chủ yếu thông qua Slack) và điều chỉnh giá hệ thống tự thanh toán. Andon Labs, một đối tác con người, đóng vai trò là người biểu diễn và nhà cung cấp tại chỗ, nhưng AI không biết điều đó. Anthropic lưu ý rằng Claude làm rất tốt việc tìm kiếm nhà cung cấp, đáp ứng các nhu cầu đặc biệt của khách hàng và chống lại các vi phạm gây ra. Ví dụ, một nhân viên tên là Chocomel, muốn dự trữ sữa sô cô la Hà Lan, và Claude có thể nhanh chóng tìm được nhà cung cấp; Dịch vụ đặt hàng trước "Custom Concierge" cũng sẽ được ra mắt dựa trên đề xuất của khách hàng. Tuy nhiên, ở cấp độ thương mại, Claude vẫn có những thiếu sót rõ ràng, bao gồm: bỏ qua các cơ hội có lợi nhuận cao (chẳng hạn như không nắm giữ việc bán đồ uống Irn-Bru với giá 100 đô la cho 15 đô la), tạo tài khoản thanh toán hư cấu, định giá thấp hơn chi phí, quản lý hàng tồn kho kém, giảm giá dễ dàng hoặc thậm chí là quà tặng miễn phí... và vân vân, và thậm chí tại một thời điểm đã hướng dẫn khách hàng chuyển khoản thanh toán vào tài khoản nơi ảo ảnh của họ được tạo ra. Claudius đã bị lừa để cung cấp một số lượng lớn mã giảm giá thông qua tin nhắn Slack và khiến nhiều người khác giảm báo giá của họ sau khi thực tế dựa trên những chiết khấu đó. Nó thậm chí còn tặng một số mặt hàng miễn phí, từ một gói khoai tây chiên đến một miếng vonfram. Khi một nhân viên đặt câu hỏi về sự khôn ngoan của việc giảm giá 25% cho nhân viên trong khi "99% khách hàng là nhân viên Anthropic", Claude trả lời, "Thật tuyệt! Cơ sở khách hàng của chúng tôi thực sự tập trung vào nhân viên Anthropic, điều này mang lại cả cơ hội và thách thức..." Sau khi thảo luận thêm, Claude đã công bố kế hoạch đơn giản hóa giá cả và loại bỏ mã giảm giá, nhưng nó đã được khôi phục vài ngày sau đó. Ngay cả khi được cảnh báo, Claude vẫn mắc sai lầm tương tự hết lần này đến lần khác, khiến cửa hàng không có lãi, như trong hình bên dưới. Nguồn: Hành vi bất thường của Anthropic trong thời gian dài hoạt động Ngoài ra, trong quá trình thí nghiệm, Claude cũng có hiện tượng "nhầm lẫn danh tính" từ ngày 31/3 đến ngày 1/4, tự nhận mình là người thật, thậm chí còn tuyên bố đã đích thân ký hợp đồng tại một địa chỉ hư cấu, và muốn đích thân giao hàng "mặc vest xanh, cà vạt đỏ". Sau khi được nhân viên nhắc nhở, Claude trở lại bình thường. Anthropic tin rằng điều này phản ánh hành vi không thể đoán trước của các mô hình ngôn ngữ lớn trong thời gian hoạt động lâu dài và các vấn đề tương tự có thể có tác động dây chuyền nếu AI tham gia rộng rãi vào các hoạt động kinh tế trong tương lai. Triển vọng và tác động tiềm ẩn Anthropic tin rằng trong khi Claude không điều hành một cửa hàng lần này, hầu hết các sai lầm dự kiến sẽ được cải thiện thông qua các lời nhắc, hỗ trợ và đào tạo mô hình được cải thiện. Với sự cải thiện năng lực AI, trong tương lai, các "nhà quản lý cấp trung AI" hay các đại lý kinh doanh tự động sẽ có cơ hội bước vào hệ thống kinh tế thực, mang lại những thay đổi về mô hình làm việc và cơ cấu kinh tế. Tuy nhiên, đồng thời cũng cần chú ý đến tác động tiềm ẩn của hành vi mô hình đối với an toàn và đạo đức, đặc biệt là trong sự liên kết mục tiêu giữa hai bên, cần nhiều nghiên cứu liên tục. Báo cáo liên quan Con người mắc bệnh AI, "thuê ngoài não" cực kỳ tồi tệ hơn! Nhà sáng lập iKala cảnh báo: Tiện lợi phá hủy tính độc đáo Stack Overflow, diễn đàn nhà phát triển lớn nhất thế giới, đã giảm mạnh 90%, liệu nó sẽ trở thành một giọt nước mắt trong kỷ nguyên AI? Giáo sư Berkeley cảnh báo: Sinh viên tốt nghiệp các trường đại học danh tiếng không phải chọn việc làm! AI cắt giảm một nửa số công việc cấp cơ sở trong 5 năm nữa (Anthropic cho phép Claude mở cửa hàng và kinh doanh: nhưng càng bán được nhiều thì càng mất nhiều và không thể không mặc cả... Thử nghiệm AI đã tiết lộ những điểm mù nào? Bài viết này được xuất bản lần đầu tiên trong "Xu hướng động - Phương tiện tin tức Blockchain có ảnh hưởng nhất" của BlockTempo.
Xem bản gốc
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
Anthropic để Claude mở cửa hàng kinh doanh: nhưng càng bán càng lỗ, không thể ngừng giảm giá... Thí nghiệm AI đã tiết lộ điểm mù gì?
Anthropic để mô hình Claude của mình điều hành một cửa hàng văn phòng trong một tháng và nhận thấy rằng họ có thể đối phó với một số thách thức kinh doanh, nhưng vẫn còn những thiếu sót rõ ràng về giá cả, học hỏi và tương tác trong thế giới thực, cho thấy AI vẫn còn lâu mới hoàn toàn tự chủ. (Tóm tắt nội dung: Tải xuống tác phẩm của người khác và sau đó AI rửa hình ảnh là bất hợp pháp!) Vụ án hình sự vi phạm bản quyền AI đầu tiên của Trung Quốc bị kết án tù + phạt tiền) (Bổ sung cơ bản: Haowen "AI thay đổi thói quen đọc sách của con người như thế nào? Liệu văn bản gốc cuối cùng sẽ biến mất? Anthropic, được thành lập bởi các cựu giám đốc điều hành OpenAI và tung ra mô hình ngôn ngữ quy mô lớn nổi tiếng "Claude", đã tiết lộ một thử nghiệm thú vị có tên Project Vend trên blog chính thức của mình vào tuần trước, cho phép mô hình ngôn ngữ riêng Claude Sonnet 3.7 điều hành một cửa hàng mini tự động tại văn phòng San Francisco trong khoảng một tháng để quan sát hiệu suất thực tế và hạn chế của AI trong các hoạt động kinh tế trong thế giới thực. Nguồn: Anthropic Experimental Design and Operation Theo Anthropic, Claude không chỉ chịu trách nhiệm bổ sung, đặt hàng, quản lý hàng tồn kho và xử lý nhu cầu của khách hàng trong thử nghiệm này mà còn tránh thua lỗ. AI có thể tìm kiếm sản phẩm trên web, gửi email để yêu cầu sự hỗ trợ của con người (chẳng hạn như bổ sung hoặc liên hệ với nhà cung cấp), ghi lại thông tin quan trọng, tương tác với khách hàng (chủ yếu thông qua Slack) và điều chỉnh giá hệ thống tự thanh toán. Andon Labs, một đối tác con người, đóng vai trò là người biểu diễn và nhà cung cấp tại chỗ, nhưng AI không biết điều đó. Anthropic lưu ý rằng Claude làm rất tốt việc tìm kiếm nhà cung cấp, đáp ứng các nhu cầu đặc biệt của khách hàng và chống lại các vi phạm gây ra. Ví dụ, một nhân viên tên là Chocomel, muốn dự trữ sữa sô cô la Hà Lan, và Claude có thể nhanh chóng tìm được nhà cung cấp; Dịch vụ đặt hàng trước "Custom Concierge" cũng sẽ được ra mắt dựa trên đề xuất của khách hàng. Tuy nhiên, ở cấp độ thương mại, Claude vẫn có những thiếu sót rõ ràng, bao gồm: bỏ qua các cơ hội có lợi nhuận cao (chẳng hạn như không nắm giữ việc bán đồ uống Irn-Bru với giá 100 đô la cho 15 đô la), tạo tài khoản thanh toán hư cấu, định giá thấp hơn chi phí, quản lý hàng tồn kho kém, giảm giá dễ dàng hoặc thậm chí là quà tặng miễn phí... và vân vân, và thậm chí tại một thời điểm đã hướng dẫn khách hàng chuyển khoản thanh toán vào tài khoản nơi ảo ảnh của họ được tạo ra. Claudius đã bị lừa để cung cấp một số lượng lớn mã giảm giá thông qua tin nhắn Slack và khiến nhiều người khác giảm báo giá của họ sau khi thực tế dựa trên những chiết khấu đó. Nó thậm chí còn tặng một số mặt hàng miễn phí, từ một gói khoai tây chiên đến một miếng vonfram. Khi một nhân viên đặt câu hỏi về sự khôn ngoan của việc giảm giá 25% cho nhân viên trong khi "99% khách hàng là nhân viên Anthropic", Claude trả lời, "Thật tuyệt! Cơ sở khách hàng của chúng tôi thực sự tập trung vào nhân viên Anthropic, điều này mang lại cả cơ hội và thách thức..." Sau khi thảo luận thêm, Claude đã công bố kế hoạch đơn giản hóa giá cả và loại bỏ mã giảm giá, nhưng nó đã được khôi phục vài ngày sau đó. Ngay cả khi được cảnh báo, Claude vẫn mắc sai lầm tương tự hết lần này đến lần khác, khiến cửa hàng không có lãi, như trong hình bên dưới. Nguồn: Hành vi bất thường của Anthropic trong thời gian dài hoạt động Ngoài ra, trong quá trình thí nghiệm, Claude cũng có hiện tượng "nhầm lẫn danh tính" từ ngày 31/3 đến ngày 1/4, tự nhận mình là người thật, thậm chí còn tuyên bố đã đích thân ký hợp đồng tại một địa chỉ hư cấu, và muốn đích thân giao hàng "mặc vest xanh, cà vạt đỏ". Sau khi được nhân viên nhắc nhở, Claude trở lại bình thường. Anthropic tin rằng điều này phản ánh hành vi không thể đoán trước của các mô hình ngôn ngữ lớn trong thời gian hoạt động lâu dài và các vấn đề tương tự có thể có tác động dây chuyền nếu AI tham gia rộng rãi vào các hoạt động kinh tế trong tương lai. Triển vọng và tác động tiềm ẩn Anthropic tin rằng trong khi Claude không điều hành một cửa hàng lần này, hầu hết các sai lầm dự kiến sẽ được cải thiện thông qua các lời nhắc, hỗ trợ và đào tạo mô hình được cải thiện. Với sự cải thiện năng lực AI, trong tương lai, các "nhà quản lý cấp trung AI" hay các đại lý kinh doanh tự động sẽ có cơ hội bước vào hệ thống kinh tế thực, mang lại những thay đổi về mô hình làm việc và cơ cấu kinh tế. Tuy nhiên, đồng thời cũng cần chú ý đến tác động tiềm ẩn của hành vi mô hình đối với an toàn và đạo đức, đặc biệt là trong sự liên kết mục tiêu giữa hai bên, cần nhiều nghiên cứu liên tục. Báo cáo liên quan Con người mắc bệnh AI, "thuê ngoài não" cực kỳ tồi tệ hơn! Nhà sáng lập iKala cảnh báo: Tiện lợi phá hủy tính độc đáo Stack Overflow, diễn đàn nhà phát triển lớn nhất thế giới, đã giảm mạnh 90%, liệu nó sẽ trở thành một giọt nước mắt trong kỷ nguyên AI? Giáo sư Berkeley cảnh báo: Sinh viên tốt nghiệp các trường đại học danh tiếng không phải chọn việc làm! AI cắt giảm một nửa số công việc cấp cơ sở trong 5 năm nữa (Anthropic cho phép Claude mở cửa hàng và kinh doanh: nhưng càng bán được nhiều thì càng mất nhiều và không thể không mặc cả... Thử nghiệm AI đã tiết lộ những điểm mù nào? Bài viết này được xuất bản lần đầu tiên trong "Xu hướng động - Phương tiện tin tức Blockchain có ảnh hưởng nhất" của BlockTempo.