Your cart is currently empty!
Gemini 2.5 ra mắt chính thức: Google comeback ngoạn mục trên đường đua AI
Cách đây chưa đầy một năm, cả thế giới công nghệ vẫn đang cười khẩy về việc Google “tụt hậu” trong cuộc đua AI. OpenAI, Anthropic, Mistral, thậm chí cả những “tân binh” như DeepSeek đều chiếm sóng. Google? Lặng thinh.
Và rồi… họ tung Gemini 2.5 – bản stable chính thức, không chỉ một mà hai model mạnh mẽ: Gemini 2.5 Pro và Flash Light.
Tạm biệt bản thử nghiệm – chào mừng bản production
Google công bố rằng Gemini 2.5 Pro và Flash đã chính thức bước ra khỏi giai đoạn thử nghiệm. Điều đó nghĩa là:
- Được dùng cho sản phẩm thực tế.
- Có cam kết hỗ trợ lâu dài.
- Đã sẵn sàng để chiến thực sự.
Gemini 2.5 Flash Light – rẻ, nhanh, mạnh, và… linh hoạt
Đây là model:
- Nhanh nhất trong dòng Gemini 2.5.
- Rẻ nhất: 10¢ input / 40¢ output (cho mỗi triệu token).
- Thông minh vừa đủ cho các tác vụ như dịch thuật, phân loại, xử lý khối lượng lớn.
Flash Light không phải để “thi học sinh giỏi AI”, mà là để chạy được, chạy nhiều, chạy rẻ. Mà vẫn giữ chất lượng đáng nể.
Gemini 2.5 Pro – ứng viên sáng giá cho ngôi vương
Nếu bạn là developer hay researcher, đây là model đáng để thử nhất hiện tại. Vì sao?
- Hiệu suất cao trong lập trình, suy luận, hiểu hình ảnh & video.
- Hỗ trợ multi-modal input (text, audio, image, video, code).
- Có context window 1 triệu tokens – đọc được cả… Moby Dick trong một lần hít thở.
Và đừng quên: nó sử dụng kiến trúc Sparse Mixture of Experts – nghĩa là chỉ một phần nhỏ model được kích hoạt mỗi lần truy vấn → nhanh hơn, rẻ hơn, và hiệu quả hơn.
Vài so sánh nhanh: giá cả & hiệu suất
| Model | Giá Input (triệu tokens) | Giá Output | Hiệu suất |
|---|---|---|---|
| Flash Light | $0.10 | $0.40 | Tốt cho khối lượng lớn |
| Gemini 2.5 Pro | $1.25 | $10.00 | Đỉnh cao reasoning, code |
Flash Light không giỏi trong các bài test logic như Pro (5% vs 21%) nhưng lại rất tốt ở khả năng hiểu hình ảnh, đa ngôn ngữ, và tốc độ xử lý.
Google công bố bản báo cáo kỹ thuật (technical report) – và có gì trong đó?
Bản báo cáo là món quà quý giá cho những ai quan tâm sâu về AI:
- Pre-training với dữ liệu đa dạng: văn bản web, code, ảnh, âm thanh, video.
- Post-training sử dụng reinforcement learning, verifiable rewards, và kỹ thuật tự đánh giá (model-as-a-judge).
- Sử dụng TPU v5p – con chip “cây nhà lá vườn” của Google, cực nhanh.
Google thậm chí dùng mô hình của họ để chơi Pokémon và phá đảo trò chơi, nhờ kết hợp giữa khả năng reasoning và công cụ phụ trợ.
Mô hình còn làm được gì nữa?
- Audio out: Tạo được âm thanh, hội thoại từ văn bản và video (text-to-speech).
- Video understanding: Tạo chapter marker chính xác, trích xuất thông tin từ video dài hàng giờ.
- Code generation: Tái hiện lại mô phỏng Rubik’s Cube, hỗ trợ cả xây dựng web/app end-to-end.
Cẩn trọng với rủi ro – và Google làm gì?
- Red teaming tự động: Dùng mô hình này tấn công mô hình kia để tìm lỗi.
- Giảm thiểu ghi nhớ (memorization): Gần như 0% khả năng mô hình trả lại thông tin cá nhân nhạy cảm hoặc nội dung bản quyền.
- Kiểm soát output bằng thinking budget: Mô hình có thể “nghĩ” nhiều hay ít tùy ngân sách – một tính năng siêu mới.
So sánh thị giác giữa các thế hệ
- Gemini 1.5: Đọc hình ảnh còn mờ.
- Gemini 2.5 Pro: Nhìn ảnh, phân tích chính xác từng đối tượng, thậm chí trích xuất đúng thời gian trong video 46 phút.
Tóm gọn: Google comeback thật rồi
Trong một năm, từ “Google hết thời” → “Gemini là model hàng đầu”. Với:
- Tốc độ xử lý cực nhanh.
- Chi phí cạnh tranh.
- Tính năng mạnh mẽ, đặc biệt cho code, video, và multi-modal input.
- Và quan trọng nhất: họ chịu công bố kỹ thuật chi tiết.