Bạn có quan tâm đến chúng không ƯU ĐÃI? Tiết kiệm với phiếu giảm giá của chúng tôi trên WHATSAPP o TELEGRAM!

Llama 3 thách thức người khổng lồ: đây là mô hình AI mới của Meta

Gianluca Cobucci

18 tháng tư 2024

Meta đã thêm hai cái mới mô hình ngôn ngữ đến loạt bài của anh ấy: Lạc đà 3 8B e Lạc đà 3 70B. Những điều này hứa hẹn mang lại hiệu suất vượt trội trong thế giới trí tuệ nhân tạo. Tin tức nổi bật nhất? Sự hiện diện của 8 tỷ và 70 tỷ thông số tương ứng. Những con số này thể hiện sự phức tạp và khả năng của mô hình để xử lý và để xử lý thông tin.

Llama 3 không chỉ có hai mẫu: nhiều vật liệu hơn đang được triển khai

Meta không dừng lại ở đó; kế hoạch phát hành thêm nhiều mẫu trong dòng Llama 3, nhưng không chỉ định ngày. Chiến lược này tạo ra sự mong đợi và cũng thể hiện cam kết của công ty trong việc liên tục cải tiến các dịch vụ của mình.

I mẫu La Mã mới chúng được mô tả là một bước nhảy vọt so với các mô hình trước đó. Sự cải thiện này một phần là do việc sử dụng hai cụm GPU tùy chỉnh, mỗi đơn vị có 24.000 đơn vị, cho phép các mô hình được đào tạo hiệu quả và chính xác hơn. Meta tuyên bố rằng, do số lượng tham số mà chúng sở hữu, các mô hình này trong số những thứ tốt nhất hiện có ngày nay cho trí tuệ nhân tạo sáng tạo.

Hiệu suất của Llama 3 được đo thông qua nhiều tiêu chuẩn AI khác nhau, là các bài kiểm tra tiêu chuẩn hóa được sử dụng để đánh giá khả năng của các mô hình AI. Bao gồm các MMLU kiến thức, ARC để tiếp thu các kỹ năng, e Thả để suy luận về các khối văn bản. Mặc dù có nhiều ý kiến khác nhau về tính hữu ích của các điểm chuẩn này, nhưng chúng vẫn là phương pháp chung để đánh giá và so sánh khả năng của các mô hình AI.

Đặc biệt, Llama 3 8B vượt trội hơn các mô hình nguồn mở tương tự với ít tham số hơn, chẳng hạn như Mistral và Google Gemma, trong ít nhất chín điểm chuẩn khác nhau. Điều này bao gồm các bài kiểm tra về kiến thức chung, lý luận và các kỹ năng cụ thể trong các lĩnh vực như sinh học, vật lý, hóa học và thậm chí cả các vấn đề về tạo mã và toán học. Ví dụ, GPT-4 nào không thể hoạt động tốt.

Mẫu lớn nhất là Llama 3 70B không chỉ cạnh tranh mà trong một số trường hợp còn vượt qua các mẫu đầu bảng như Song Tử 1.5 Pro từ Google trong nhiều thử nghiệm khác nhau, chứng minh rằng mặc dù có sự cạnh tranh mạnh mẽ nhưng nó vẫn có thể đứng vững trước cả những gã khổng lồ trong ngành. Tuy nhiên, điều quan trọng cần lưu ý là mặc dù nó hoạt động tốt hơn một số mẫu hàng đầu như Claude 3 Sonnet của Anthropic trong một số thử nghiệm, nó không đạt được hiệu suất của mẫu Claude 3 Opus cao cấp hơn.