66b là một mô hình ngôn ngữ tự động được thiết kế để sinh nội dung, trả lời câu hỏi và hỗ trợ tác vụ đa ngôn ngữ. Với 66 tỷ tham số, nó cân bằng giữa hiệu suất và chi phí tính toán.

Kiến trúc dựa trên transformer, với nhiều lớp tự attention và feed-forward, tối ưu hoá bằng các kỹ thuật như tiền huấn luyện bằng masked language modeling và fine-tuning cho tác vụ. Dữ liệu huấn luyện đa dạng từ sách, trang web, và mã nguồn. Huấn luyện diễn ra trên hạ tầng GPU/TPU và sử dụng các chiến lược giảm thiểu rủi ro như lọc nội dung có hại.

66b có thể tham gia vào viết văn, tóm tắt văn bản, hỗ trợ lập trình, và trợ lý ảo. Tuy nhiên, nó có hạn chế như có thể tạo thông tin sai lệch, nhạy cảm nội dung, và yêu cầu việc giám sát nội dung. Định hướng sử dụng an toàn và đánh giá liên tục là quan trọng.

66b và hành trình khám phá
66b – một mã, một câu chuyện
66b: Khái niệm, kiến trúc và ứng dụng