Cơ quan chủ quản: Bộ Khoa học và Công nghệ
Số giấy phép: 09/GP - BTTTT, cấp ngày 07/01/2019
Tổng biên tập: Nguyễn Văn Bá

Liên hệ tòa soạn

Địa chỉ: Tầng 18, Toà nhà Cục Viễn thông (VNTA), 68 Dương Đình Nghệ, phường Yên Hoà, quận Cầu Giấy, TP. Hà Nội.
Điện thoại: 02439369898 - Hotline: 0923457788
Email: vietnamnet@vietnamnet.vn
© 1997 Báo VietNamNet. All rights reserved.
Chỉ được phát hành lại thông tin từ website này khi có sự đồng ý bằng văn bản của báo VietNamNet.

Liên hệ quảng cáo

Công ty Cổ phần Truyền thông VietNamNet
Hotline: 0919 405 885 (Hà Nội) - 0919 435 885 (Tp.HCM)
Email: contact@vietnamnet.vn
Báo giá: http://vads.vn
Hỗ trợ kỹ thuật: support@tech.vietnamnet.vn

Công nghệ

Thứ Năm, 18/07/2024 - 05:21

Apple, Nvidia và Anthropic sử dụng trái phép dữ liệu YouTube để đào tạo AI

Thế Vinh

Xem các bài viết của tác giả

Apple, Nvidia và Anthropic đã sử dụng dữ liệu từ hơn 173.000 video trên YouTube để huấn luyện AI mà không xin phép.

Cuộc điều tra từ Proof News cho thấy, các công ty này đã sử dụng bộ dữ liệu tạo bởi công ty phi lợi nhuận có tên EleutherAI, chứa các bản ghi lại nội dung video YouTube của hơn 48.000 kênh mà không hề có sự xin phép chủ sở hữu hay nhà sáng tạo nội dung.

Mặc dù tập dữ liệu không chứa hình ảnh hay video, song các nội dung được lấy lại từ những nhà sáng tạo nội dung hàng đầu trên nền tảng, chẳng hạn như Marques Brownlee và MrBeast, cũng như các nhà xuất bản tin tức lớn như The New York Times, BBC và ABC News. Ngoài ra, còn có phụ đề từ các video thuộc về Engadget.

8d541010 38d9 11ef b7fd 2183e5dd7ce6.jpg — Apple Intelligence bị tố sử dụng trái phép dữ liệu của cộng đồng sáng tạo trên YouTube. Ảnh: Yahoo Tech

“Apple lấy dữ liệu cho AI của họ từ một số công ty”, Brownlee - một YouTuber nổi tiếng đăng trên X. “Một trong số đó là hàng tấn dữ liệu/bản ghi từ các video trên YouTube, bao gồm cả của tôi”.

Trước đó, CEO YouTube Neal Mohan khẳng định, việc các công ty sử dụng dữ liệu của YouTube để đào tạo các mô hình AI là vi phạm các điều khoản và dịch vụ của nền tảng này.

Hiện các công ty AI vẫn chưa minh bạch về dữ liệu được sử dụng để đào tạo thuật toán. Đầu tháng này, các nghệ sĩ và nhiếp ảnh gia đã chỉ trích Apple vì không tiết lộ nguồn dữ liệu đào tạo cho Apple Intelligence - tính năng AI mới sẽ có mặt trên hàng triệu thiết bị của “nhà táo” trong năm nay.

YouTube, kho lưu trữ video lớn nhất thế giới, cũng là “mỏ vàng” dữ liệu để đào tạo AI, khi bao gồm bản ghi, âm thanh, video và hình ảnh.

Hồi đầu năm, giám đốc công nghệ OpenAI, Mira Murati, đã né tránh các câu hỏi từ The Wall Street Journal về việc liệu công ty có sử dụng video YouTube để đào tạo Sora, công cụ tạo video AI sắp ra mắt của OpenAI hay không.

“Tôi sẽ không đi sâu vào chi tiết về dữ liệu đã được sử dụng, nhưng đó là dữ liệu được cấp phép hoặc có sẵn công khai”, Murati cho biết vào thời điểm đó. Trong khi đó, CEO Alphabet Sundar Pichai cũng nhấn mạnh, các công ty sử dụng dữ liệu từ YouTube để đào tạo các mô hình AI là vi phạm các điều khoản dịch vụ của nền tảng này.

(Theo Proof News, WSJ)

Apple, Samsung vượt mặt các thương hiệu smartphone Trung QuốcDữ liệu từ Counterpoint Research cho thấy thị trường smartphone toàn cầu đã tăng 6% trong quý 2/2024 với việc Apple và Samsung lần lượt chiếm hai vị trí dẫn đầu, xếp sau đó là các thương hiệu Trung Quốc như Xiaomi, Vivo và Oppo.

Xem thêm về:
Nvidia
AI
YouTube
Apple

Apple, Nvidia và Anthropic sử dụng trái phép dữ liệu YouTube để đào tạo AI

Apple, Nvidia và Anthropic đã sử dụng dữ liệu từ hơn 173.000 video trên YouTube để huấn luyện AI mà không xin phép.

Điều gì khiến Apple tự tin iPhone 16 đạt doanh số ít nhất 90 triệu chiếc?

Người dùng iPhone tại 98 nước nhận cảnh báo khẩn từ Apple

Người dùng sắp được chuyển ảnh dễ dàng từ Google Photos sang Apple iCloud

Nvidia

AI

YouTube

Apple

Tin nổi bật