Công ty khởi nghiệp công nghệ pháp lý Đài Loan "Bảy Pháp" (Lawsnote) vì sử dụng web crawler (Web Crawler) để thu thập nội dung từ cơ sở dữ liệu pháp lý, đã bị công ty cung cấp cơ sở dữ liệu pháp lý "Pháp Nguyên Thông Tin" kiện, và cáo buộc Bảy Pháp đã lấy dữ liệu bất hợp pháp để phục vụ cho mục đích kinh doanh, bị nghi ngờ vi phạm bản quyền và cản trở việc sử dụng máy tính. Tòa án Nhân dân thành phố Tân Bắc vừa ra phán quyết mới rằng hai người sáng lập Bảy Pháp là Quách Vinh Hiến và Tạ Phục Nhã phải bồi thường 100 triệu Đài tệ, và mỗi người bị tuyên án 4 năm và 2 năm tù giam. Đối với điều này, Quách Vinh Hiến cũng đã có bài viết trên Facebook nói rằng: "Việc thành lập doanh nghiệp khởi nghiệp tại Đài Loan còn bi thảm hơn cả các nhóm lừa đảo."
Tòa án xác định tội vi phạm bản quyền, nguồn pháp luật sở hữu bản quyền tác giả.
Theo thông cáo báo chí của Tòa án Nhân dân thành phố Tân Bắc, tòa án xác định rằng Công ty Bảy Pháp đã sử dụng các công cụ thu thập dữ liệu trên mạng để lấy nội dung từ các trang web pháp luật, bao gồm "Lịch sử pháp luật" và "Tài liệu pháp luật", nhằm phục vụ cho mục đích kinh doanh trên nền tảng của riêng mình, vi phạm bản quyền và tội phạm xâm phạm sử dụng máy tính. Hai nhà sáng lập của Bảy Pháp lần lượt bị xử án 4 năm và 2 năm tù giam, và phải bồi thường cho pháp luật 154.5 triệu Đài tệ.
Theo thông tin, phán quyết này đã gây chấn động trong ngành, giả sử nếu xác định như vậy:
Tất cả các công ty sử dụng trình thu thập dữ liệu để thu thập thông tin đều có thể vi phạm "tội cản trở việc sử dụng máy tính."
Nội dung quy định, lịch sử, tài liệu đính kèm được công khai bởi chính phủ, nếu được xử lý qua nguồn pháp lý, có thể trở thành "tài sản bản quyền" của nguồn pháp lý.
Pháp nguyên lâu năm đảm nhận hợp đồng của chính phủ, độc quyền duy trì hệ thống quy định.
Sau khi bản án được công bố, Guo Rongyan cũng đã cho biết trên Facebook rằng nguyên đơn "Công ty Thông tin Pháp lý" là một nhà thầu lâu năm cung cấp hệ thống tra cứu pháp luật của chính phủ.
Từ năm 2018 đến năm 2022, đã giành được hơn một trăm hợp đồng từ chính phủ, các dự án duy trì bao gồm cơ sở dữ liệu quy định quốc gia, trang web của Ủy ban Quản lý Tài chính, hệ thống tra cứu phán quyết của Tòa án, dẫn đến việc nhiều cơ quan chính phủ chủ động gửi bản sao cho Pháp Nguyên khi có thay đổi quy định hoặc xử lý công văn. Guō Róngyàn còn cho biết trước năm 2015, Pháp Nguyên gần như độc quyền dịch vụ tra cứu luật pháp tại Đài Loan.
Hình ảnh là trang web của Tòa án và Ủy ban Quản lý Tài chính, xuất hiện màn hình "Xây dựng nguồn pháp lý". Dữ liệu pháp lý công khai cũng có thể sở hữu bản quyền?
Ông Quách Vinh Nhạn trích dẫn Điều 9 của Luật Sở hữu trí tuệ chỉ ra rằng, hiến pháp, luật pháp, công văn, v.v. đều không thể là đối tượng của quyền tác giả, và cũng không bao gồm nội dung tin tức do khu vực công dịch, biên soạn hoặc truyền đạt sự thật.
Tuy nhiên, tòa án lại xác định rằng "quá trình phát triển quy định" và "nội dung dự luật" trên trang web nguồn luật có quyền tác giả chỉnh sửa và được bảo vệ. Anh ấy đặt câu hỏi:
"Nguồn pháp lý tự thừa nhận rằng nội dung của họ được viết theo định dạng tiêu chuẩn thống nhất, vậy thì điều này hoàn toàn không có tính sáng tạo, làm sao lại cấu thành quyền tác giả?"
Điều khiến ông không hiểu hơn nữa là nếu các quy định của Pháp nguồn có quyền tác giả, vậy có phải nghĩa là "Cơ sở dữ liệu quy định quốc gia" của chính phủ cũng phải xin phép từ Pháp nguồn. Và luật sư được ủy quyền của Công ty Bảy Pháp, Yang Zhewai, cũng chỉ ra rằng việc xây dựng cơ sở dữ liệu Bảy Pháp đến từ hàng trăm trang web chính phủ và nền tảng dữ liệu công khai, Pháp nguồn chỉ là một trong những nguồn đó. Ông nhấn mạnh:
"Nếu tất cả các dữ liệu này đều được coi là nguồn luật sở hữu, các doanh nghiệp khác sẽ không thể phát triển dịch vụ quy định riêng của mình, điều này sẽ là một cú sốc lớn đối với toàn bộ ngành công nghiệp thông tin pháp luật."
郭榮彥 vẫn khẳng định sự trong sạch của mình, cảm thán rằng hình phạt còn nặng hơn cả lừa đảo.
Đối với việc tòa án ra phán quyết nặng nề, Quách Vinh Diễn tỏ ra khá ngỡ ngàng nói rằng:
"Tôi không nghĩ rằng mình đã làm điều gì bất hợp pháp. Công cụ thu thập dữ liệu là công cụ được sử dụng phổ biến trên mạng, từ Google đến các trang so sánh giá."
Và nhấn mạnh rằng trong quá trình khởi nghiệp, ông không ngừng suy nghĩ về cách sử dụng công nghệ để giúp dịch vụ pháp lý phổ cập, không ngờ lại gặp phải hình phạt như vậy. Luật sư Yang cũng cho biết hình phạt nặng nhất theo luật bản quyền là 5 năm, nhưng Guo Rongyan lại bị tuyên án 4 năm, gần như đã đạt đến giới hạn, thậm chí cao hơn cả mức án trong các vụ buôn bán hàng giả, lừa đảo, thật khó chấp nhận, và sẽ tiếp tục kháng cáo.
Việc thu thập dữ liệu có vi phạm pháp luật không, vụ án bảy luật đã kích hoạt cuộc tranh luận trong cộng đồng.
Sau khi phán quyết được công bố, nhiều người dùng mạng bắt đầu thảo luận về việc "các công cụ thu thập dữ liệu có vi phạm pháp luật hay không". Một số người dùng mạng cho rằng công nghệ thu thập dữ liệu mà bảy luật áp dụng liên quan đến việc lấy thông tin từ tường phí (Paywall), thậm chí là phá vỡ cơ chế bảo vệ của trang web (Captcha), đây là ranh giới mà các startup AI hoặc Google cũng không dám vượt qua.
Nhưng cũng có người cho rằng thực ra nhiều công ty AI đã hoạt động trong vùng xám này từ lâu, như Meta, OpenAI, Midjourney, chỉ là họ có thể có đội ngũ pháp lý mạnh hơn để chịu rủi ro. Và điểm mấu chốt không phải là vượt giới hạn, mà là sau khi vượt giới hạn có khả năng chịu trách nhiệm hậu quả hay không.
Tuy nhiên, cũng có người dùng mạng cho rằng, chỉ cần bot vượt qua tường phí hoặc cơ chế xác thực, thì coi như đã thu thập dữ liệu một cách bất hợp pháp, thuộc về xâm nhập kỹ thuật. Họ đã trích dẫn vụ kiện giữa New York Times và OpenAI, để chỉ ra rằng các vụ việc tương tự cũng đã xảy ra trên quốc tế.
Cũng có người dùng mạng đã đề cập rằng, nếu nội dung vốn đã có thể xem trên trang web, chỉ là sử dụng chương trình để "sao chép và dán", thì liệu có tính là "thu thập không hợp lý" hay không vẫn còn nhiều không gian để thảo luận. Nhưng nếu trang web đã ghi rõ "cấm bot" mà vẫn cố gắng thu thập, thì thật khó để nói là một sự hiểu lầm. Vụ án này vẫn đang trong quy trình tư pháp, phạm vi dữ liệu và áp dụng pháp luật sẽ chờ phán quyết cuối cùng tiết lộ. Nhưng từ các bình luận trong cộng đồng có thể thấy, về ranh giới giữa kỹ thuật thu thập dữ liệu và quyền cấp phép dữ liệu, vẫn còn nhiều sự khác biệt và không gian thảo luận.
Bài viết này có phải bị phạt một triệu vì web crawler? Người sáng lập Lawsnote: Các startup ở Đài Loan thảm hại hơn cả nhóm lừa đảo, lần đầu xuất hiện trên Tin tức chuỗi ABMedia.
Xem bản gốc
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
Phạt một triệu cho việc thu thập dữ liệu trên mạng? Người sáng lập Lawsnote: Các startup ở Đài Loan thật đáng buồn hơn cả các băng nhóm lừa đảo.
Công ty khởi nghiệp công nghệ pháp lý Đài Loan "Bảy Pháp" (Lawsnote) vì sử dụng web crawler (Web Crawler) để thu thập nội dung từ cơ sở dữ liệu pháp lý, đã bị công ty cung cấp cơ sở dữ liệu pháp lý "Pháp Nguyên Thông Tin" kiện, và cáo buộc Bảy Pháp đã lấy dữ liệu bất hợp pháp để phục vụ cho mục đích kinh doanh, bị nghi ngờ vi phạm bản quyền và cản trở việc sử dụng máy tính. Tòa án Nhân dân thành phố Tân Bắc vừa ra phán quyết mới rằng hai người sáng lập Bảy Pháp là Quách Vinh Hiến và Tạ Phục Nhã phải bồi thường 100 triệu Đài tệ, và mỗi người bị tuyên án 4 năm và 2 năm tù giam. Đối với điều này, Quách Vinh Hiến cũng đã có bài viết trên Facebook nói rằng: "Việc thành lập doanh nghiệp khởi nghiệp tại Đài Loan còn bi thảm hơn cả các nhóm lừa đảo."
Tòa án xác định tội vi phạm bản quyền, nguồn pháp luật sở hữu bản quyền tác giả.
Theo thông cáo báo chí của Tòa án Nhân dân thành phố Tân Bắc, tòa án xác định rằng Công ty Bảy Pháp đã sử dụng các công cụ thu thập dữ liệu trên mạng để lấy nội dung từ các trang web pháp luật, bao gồm "Lịch sử pháp luật" và "Tài liệu pháp luật", nhằm phục vụ cho mục đích kinh doanh trên nền tảng của riêng mình, vi phạm bản quyền và tội phạm xâm phạm sử dụng máy tính. Hai nhà sáng lập của Bảy Pháp lần lượt bị xử án 4 năm và 2 năm tù giam, và phải bồi thường cho pháp luật 154.5 triệu Đài tệ.
Theo thông tin, phán quyết này đã gây chấn động trong ngành, giả sử nếu xác định như vậy:
Tất cả các công ty sử dụng trình thu thập dữ liệu để thu thập thông tin đều có thể vi phạm "tội cản trở việc sử dụng máy tính."
Nội dung quy định, lịch sử, tài liệu đính kèm được công khai bởi chính phủ, nếu được xử lý qua nguồn pháp lý, có thể trở thành "tài sản bản quyền" của nguồn pháp lý.
Pháp nguyên lâu năm đảm nhận hợp đồng của chính phủ, độc quyền duy trì hệ thống quy định.
Sau khi bản án được công bố, Guo Rongyan cũng đã cho biết trên Facebook rằng nguyên đơn "Công ty Thông tin Pháp lý" là một nhà thầu lâu năm cung cấp hệ thống tra cứu pháp luật của chính phủ.
Từ năm 2018 đến năm 2022, đã giành được hơn một trăm hợp đồng từ chính phủ, các dự án duy trì bao gồm cơ sở dữ liệu quy định quốc gia, trang web của Ủy ban Quản lý Tài chính, hệ thống tra cứu phán quyết của Tòa án, dẫn đến việc nhiều cơ quan chính phủ chủ động gửi bản sao cho Pháp Nguyên khi có thay đổi quy định hoặc xử lý công văn. Guō Róngyàn còn cho biết trước năm 2015, Pháp Nguyên gần như độc quyền dịch vụ tra cứu luật pháp tại Đài Loan.
Hình ảnh là trang web của Tòa án và Ủy ban Quản lý Tài chính, xuất hiện màn hình "Xây dựng nguồn pháp lý". Dữ liệu pháp lý công khai cũng có thể sở hữu bản quyền?
Ông Quách Vinh Nhạn trích dẫn Điều 9 của Luật Sở hữu trí tuệ chỉ ra rằng, hiến pháp, luật pháp, công văn, v.v. đều không thể là đối tượng của quyền tác giả, và cũng không bao gồm nội dung tin tức do khu vực công dịch, biên soạn hoặc truyền đạt sự thật.
Tuy nhiên, tòa án lại xác định rằng "quá trình phát triển quy định" và "nội dung dự luật" trên trang web nguồn luật có quyền tác giả chỉnh sửa và được bảo vệ. Anh ấy đặt câu hỏi:
"Nguồn pháp lý tự thừa nhận rằng nội dung của họ được viết theo định dạng tiêu chuẩn thống nhất, vậy thì điều này hoàn toàn không có tính sáng tạo, làm sao lại cấu thành quyền tác giả?"
Điều khiến ông không hiểu hơn nữa là nếu các quy định của Pháp nguồn có quyền tác giả, vậy có phải nghĩa là "Cơ sở dữ liệu quy định quốc gia" của chính phủ cũng phải xin phép từ Pháp nguồn. Và luật sư được ủy quyền của Công ty Bảy Pháp, Yang Zhewai, cũng chỉ ra rằng việc xây dựng cơ sở dữ liệu Bảy Pháp đến từ hàng trăm trang web chính phủ và nền tảng dữ liệu công khai, Pháp nguồn chỉ là một trong những nguồn đó. Ông nhấn mạnh:
"Nếu tất cả các dữ liệu này đều được coi là nguồn luật sở hữu, các doanh nghiệp khác sẽ không thể phát triển dịch vụ quy định riêng của mình, điều này sẽ là một cú sốc lớn đối với toàn bộ ngành công nghiệp thông tin pháp luật."
郭榮彥 vẫn khẳng định sự trong sạch của mình, cảm thán rằng hình phạt còn nặng hơn cả lừa đảo.
Đối với việc tòa án ra phán quyết nặng nề, Quách Vinh Diễn tỏ ra khá ngỡ ngàng nói rằng:
"Tôi không nghĩ rằng mình đã làm điều gì bất hợp pháp. Công cụ thu thập dữ liệu là công cụ được sử dụng phổ biến trên mạng, từ Google đến các trang so sánh giá."
Và nhấn mạnh rằng trong quá trình khởi nghiệp, ông không ngừng suy nghĩ về cách sử dụng công nghệ để giúp dịch vụ pháp lý phổ cập, không ngờ lại gặp phải hình phạt như vậy. Luật sư Yang cũng cho biết hình phạt nặng nhất theo luật bản quyền là 5 năm, nhưng Guo Rongyan lại bị tuyên án 4 năm, gần như đã đạt đến giới hạn, thậm chí cao hơn cả mức án trong các vụ buôn bán hàng giả, lừa đảo, thật khó chấp nhận, và sẽ tiếp tục kháng cáo.
Việc thu thập dữ liệu có vi phạm pháp luật không, vụ án bảy luật đã kích hoạt cuộc tranh luận trong cộng đồng.
Sau khi phán quyết được công bố, nhiều người dùng mạng bắt đầu thảo luận về việc "các công cụ thu thập dữ liệu có vi phạm pháp luật hay không". Một số người dùng mạng cho rằng công nghệ thu thập dữ liệu mà bảy luật áp dụng liên quan đến việc lấy thông tin từ tường phí (Paywall), thậm chí là phá vỡ cơ chế bảo vệ của trang web (Captcha), đây là ranh giới mà các startup AI hoặc Google cũng không dám vượt qua.
Nhưng cũng có người cho rằng thực ra nhiều công ty AI đã hoạt động trong vùng xám này từ lâu, như Meta, OpenAI, Midjourney, chỉ là họ có thể có đội ngũ pháp lý mạnh hơn để chịu rủi ro. Và điểm mấu chốt không phải là vượt giới hạn, mà là sau khi vượt giới hạn có khả năng chịu trách nhiệm hậu quả hay không.
Tuy nhiên, cũng có người dùng mạng cho rằng, chỉ cần bot vượt qua tường phí hoặc cơ chế xác thực, thì coi như đã thu thập dữ liệu một cách bất hợp pháp, thuộc về xâm nhập kỹ thuật. Họ đã trích dẫn vụ kiện giữa New York Times và OpenAI, để chỉ ra rằng các vụ việc tương tự cũng đã xảy ra trên quốc tế.
Cũng có người dùng mạng đã đề cập rằng, nếu nội dung vốn đã có thể xem trên trang web, chỉ là sử dụng chương trình để "sao chép và dán", thì liệu có tính là "thu thập không hợp lý" hay không vẫn còn nhiều không gian để thảo luận. Nhưng nếu trang web đã ghi rõ "cấm bot" mà vẫn cố gắng thu thập, thì thật khó để nói là một sự hiểu lầm. Vụ án này vẫn đang trong quy trình tư pháp, phạm vi dữ liệu và áp dụng pháp luật sẽ chờ phán quyết cuối cùng tiết lộ. Nhưng từ các bình luận trong cộng đồng có thể thấy, về ranh giới giữa kỹ thuật thu thập dữ liệu và quyền cấp phép dữ liệu, vẫn còn nhiều sự khác biệt và không gian thảo luận.
Bài viết này có phải bị phạt một triệu vì web crawler? Người sáng lập Lawsnote: Các startup ở Đài Loan thảm hại hơn cả nhóm lừa đảo, lần đầu xuất hiện trên Tin tức chuỗi ABMedia.