AI tạo sinh (generative AI) là một tập hợp con của công nghệ máy học được hỗ trợ bởi các mô hình ML siêu lớn, bao gồm các mô hình ngôn ngữ lớn (LLM) và các mô hình đa phương thức (ví dụ: văn bản, hình ảnh, video và âm thanh). Các ứng dụng như ChatGPT và Stable Diffusion đã thu hút sự chú ý của đông đảo người dùng. AI tạo sinh đã sẵn sàng để tạo ra tác động sâu sắc đến các ngành nghề, từ y tế và khoa học sự sống, đến truyền thông giải trí, giáo dục, dịch vụ tài chính...
Trên blog cá nhân, ông Swami Sivasubramanian - Phó Chủ tịch phụ trách cơ sở dữ liệu, phân tích và máy học của AWS mô tả về 4 công nghệ đột phá nhằm hỗ trợ ứng dụng AI tạo sinh, sẽ ra mắt thời gian tới.
Amazon Bedrock: Dễ dàng xây dựng và mở rộng các ứng dụng AI tạo sinh
Amazon Bedrock là một dịch vụ mới dùng để xây dựng và mở rộng các ứng dụng AI tạo sinh, đó là những ứng dụng có thể soạn thảo văn bản, tạo hình ảnh, âm thanh và dữ liệu tổng hợp theo yêu cầu.
Amazon Bedrock giúp khách hàng dễ dàng truy cập vào các mô hình nền tảng (FM) - những mô hình ML siêu lớn của các công ty khởi nghiệp cung cấp mô hình AI hàng đầu được AI tạo sinh sử dụng, bao gồm AI21, Anthropic và Stability AI, cũng như cho họ quyền truy cập vào các mô hình nền tảng Titan do chính AWS phát triển. Không một mô hình duy nhất nào có thể làm được mọi việc.
Amazon Bedrock cung cấp một tập các mô hình nền tảng từ các nhà cung cấp hàng đầu, để các khách hàng của AWS có sự linh hoạt và lựa chọn sử dụng các mô hình tốt nhất cho nhu cầu cụ thể của mình.
Dịch vụ máy chủ ảo Amazon EC2 Inf2 chạy trên chip AWS Inferentia2
Dịch vụ này giúp giảm chi phí, mức tiêu thụ năng lượng giúp mở rộng các đối tượng khác hàng tiếp cận AI tạo sinh.
Các mô hình ML siêu lớn yêu cầu năng lực điện toán khổng lồ để vận hành. Chip AWS Inferentia có hiệu suất sử dụng năng lượng cao nhất và chi phí thấp nhất để chạy các loại khối lượng công việc suy luận AI tạo sinh phức tạp (như chạy mô hình và phản hồi truy vấn trong sản xuất) với quy mô lớn trên AWS.
Dịch vụ máy chủ ảo Trn1n mới chạy trên chip AWS Trainium
Chip bán dẫn tùy chỉnh để huấn luyện mô hình nhanh hơn với chi phí thấp hơn.
Các mô hình AI tạo sinh cần được huấn luyện để có thể đưa ra câu trả lời, hình ảnh, thông tin phù hợp hoặc các vấn đề khác mà mô hình đang xử lý. Các dịch vụ máy chủ ảo Trn1n mới (tài nguyên máy chủ nơi diễn ra quá trình tính toán, và trong trường hợp này là chạy trên chip Trainium tùy chỉnh của AWS) cung cấp khả năng kết nối mạng lớn, là chìa khóa để huấn luyện các mô hình này một cách nhanh chóng và tiết kiệm.
Truy cập miễn phí Amazon CodeWhisperer: Hỗ trợ lập trình theo thời gian thực
Hãy hình dung bạn là một nhà phát triển phần mềm với trợ thủ lập trình được AI hỗ trợ, giúp bạn lập trình nhanh và dễ dàng hơn. Đó chính là nhiệm vụ của Amazon CodeWhisperer. Dịch vụ này sử dụng AI tạo sinh để đề xuất mã chương trình theo thời gian thực, dựa trên chú thích của người dùng và mã chương trình trước đó của họ.
Các nhà phát triển phần mềm cá nhân có thể truy cập Amazon CodeWhisperer miễn phí, không bị giới hạn sử dụng (họ có thể chọn các gói trả phí khác nhau để sử dụng các tính năng chuyên nghiệp, ví dụ như khả năng quản trị và bảo mật bổ sung cho doanh nghiệp).
Swami cũng khẳng định thêm trong bài viết của mình: Những dịch vụ này mới là bước khởi đầu, Amazon sẽ tiếp tục phát triển công nghệ này trong tương lai dựa trên nhu cầu của khách hàng hướng tới các ứng dụng AI có trách nhiệm, có lợi ích và nhiều triển vọng nhất. Hiện nay, cuộc cách mạng công nghệ này mới bắt đầu, và sẽ được tiếp tục trong nhiều thập kỷ tới.
(Nguồn: AWS)